NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
HODNOCENÍ REZONANCE HLASU ŽEN Marek Frič
1 Úvod Tato studie navazuje na předchozí studii (FRIČ a KADLECOVÁ, 2012), kde byly porovnány percepční a akustické vlastnosti hlasu žen v závislosti na pěveckém tréninku. Výsledky ukázaly jako zásadní rozdíly v percepčním hodnocení míry rezonance jak v mluvního řečovém projevu, tak zpěvu lidové písně vlastnosti. Dle přístupů při hlasové edukaci, reedukaci i rehabilitaci poruch hlasu je „správná“ rezonance hlasu jedna ze základních technik tvorby mluvního i zpěvního hlasu (HAVLÍK a FROSTOVÁ, 2007; SELLARS a kol., 2002; SIMBERG a LAINE, 2007; VERDOLINI-MARSTON a kol., 1995; VERDOLINI a kol., 2000). I když je pojem hlasové rezonance velmi často používaný, z akustického ani percepčního hlediska doposud není jednoznačně exaktně vysvětlen. Ve vokologické literatuře často citované definice (VERDOLINI a kol., 1998; TITZE, 2004; SMITH a kol., 2005) popisují rezonovaný hlas jako souhrn vlastností: • percipovaný jako dobře nosný (nesený, „projected“), • lehce tvořený (není tvořený ani s výrazným tlakem, ale ani dyšně), • přiměřeně hlasitý, • s pocitem vibrací v oblasti tváře. Hlasová pedagogická literatura dělí rezonanci hlasu na hrudní, hlavovou a smíšenou (přehled viz.: (KADLECOVÁ a FRIČ, 2012)), tento typ dělení se však výrazně kryje i s rozlišovanými hlasovými rejstříky v tomto oboru. Samotný efekt rezonance se spojuje zejména s taktilní percepcí kmitáním hrudního koše a kostí hlavy (v tzv. „masce“)(BARRICHELO a BEHLAU, 2007; HAVLÍK a FROSTOVÁ, 2007; TITZE, 2004; VERDOLINI-MARSTON a kol., 1995). Schopnost vnímání rezonance a její souvislost s kmitáním hrudního koše v hlubokých frekvencích byla dobře dokumentována (SUNDBERG, 1979; SUNDBERG, 1991), ale uvedený jev nebyl doložen pro hlavový rejstřík kvůli výraznému zvyšovaní prahu detekce vibrací při vyšších frekvencích. Studie (YIU a kol., 2012) dokumentuje možnosti snímání vibrací hrtanu a kostí hlavy pomocí piezoelektrických akcelerometrů. Výsledky potvrdily významnou korelaci vibrací těchto částí s percepcí rezonance hlasu. Na druhé straně však kmitání kořene nosu bylo zjištěné i při tlačené (strained) fonaci a při nazalizovaných zvucích. Studie dále dokumentuje jenom střední shodu dvou hodnotitelů při percepčním hodnocení rezonance. Výše uvedené procesy taktilního vnímaní vibrací různých části těla ale nevysvětlují percepci rezonance hlasu posluchačem. Z percepčního hlediska jsou s rezonancí spojené vlastnosti (BELE, 2005) jako: „sonority“ – do jaké míry je hlas rezonovaný (sonorní hlas je bohatý na vyšší harmonické složky, což je následek rychlého uzávěru hlasivek, nebo následek reaktance vokálního traktu), nebo vlastnost „zvonivost“ (ringing voice quality) – kombinovaný produkt silných vyšších harmonických složek a rezonancí vokálního traktu, kovová (metalic) barva hlasu.
73
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
Studie (BERGAN a kol., 2004) odlišovala percepci ring a pressed kvalit jenom na základě odlišné energie v pásmu základní frekvence a prvního formantu, která byla vyšší u rezonovaného hlasu než u tlačeného. Oba typy byly ale spojeny s nárůstem intenzity v oblasti 2-4 kHz. Při nárůstu „skewing“ koeficientu glottal flow se energie toho pásma zvyšovala, ale při zužování plochy epilaryngální dutiny byla „rezonována“, což je v souladu s (SUNDBERG, 1974; SUNDBERG, 2001)viz níže. Akustické a fyziologické interpretace a teorie rezonance hlasu uvedené jevy vysvětlují na základě různých jevů: 1) Efektivní kmitání hlasivek. Rezonanční efekt hlasu má zpětný vliv na kmitání hlasivek, kterým umožní maximální akustický výkon bez zvýšené addukční tenze (resp. na pomezí mezi addukovanými a abdukovanými hlasivkami) (VERDOLINI a kol., 1998). Studie (DE BODT a kol., 2012) dokumentuje zlepšení hodnocení uzávěru glottis při rezonančním cvičení (využívající hlásku „m“) vůči habituálnímu hlasu. Dle (TITZE, 1988) je kmitání hlasivek ovlivněno i rezonancí subglotického traktu (trachey), kde soufázní pozitivní tlak může podpořit kmitání v hrudním rejstříku a naopak negativní tlak spíše falzetový rejstřík. Vliv subglotické rezonance na amplitudu kmitání hlasivek potvrdila u poloviny excidovaných hrtanů studie (AUSTIN a TITZE, 1997). 2) Vytváření extra-formantů. V klasické pěvecké škole je typická barva profesionálních operních pěvců – spojena s kovovým leskem a zvonivou barvou hlasu – vytvořená pomocí pěveckého (singer´s) formantu, tedy shlukováním 3. až 5. z původních (neškolených) formantů hlasu do jednoho formantu. Výsledkem je výrazné akustické posílení oblasti 2,3 - 3,5 kHz (SUNDBERG, 1974; SUNDBERG, 2001), které se projeví ve velmi citlivé sluchové frekvenční oblasti, čímž se pěvec stává dobře slyšitelný při zpěvu s orchestrem. Uvedené spojení formantů je dosaženo snížením pozice hrtanu, rozšířením hrtanové dutiny, zúžením vchodu do hrtanu současně s rozšířením hltanu. Pomocí modelu vokálního traktu bylo prokázáno, že právě hrtanová dutina nejvíce ovlivňuje 4. formant v oblasti 3 kHz a nezávisle na vokalických formantech umožňuje zesílení této oblasti až o 10 dB (TAKEMOTO a kol., 2006). Studie (LEE a kol., 2008) ale také udává pro hlas profesionálních pěvců zesílení oblasti 9-10 kHz, resp. 8-9 kHz v závislosti na typu hlasu a hlasové kategorii. V případě profesionálních mluvčích byl pozorován podobný efekt tzv. „řečnický“ (speaker´ s / actor´s) formant v mírně vyšší spektrální oblasti 3-4 kHz ale s nižší akustickou hladinou (BELE, 2006; LEINO a kol., 2011). (Leino, T. et al., 2011)vysvětluje tento formant klastrováním zejména 4. a 5. formantu a jeho vyšší spektrální polohu na rozdíl od pěveckého tím, že pěvci výrazně snižují polohu hrtanu. 3) Efekt laděním vokalických formantů, tedy přizpůsobení formantových oblastí 1. a 2. „vokalického“ formantu k výšce hlasu a tedy naladění na jednotlivé harmonické složky. Efekt nelineární interakce mezi kmitáním hlasivek a rezonancí vokálního traktu nastává v případě když základní frekvence (resp. 2. nebo 3. harmonická složka) jsou naladěny těsně pod frekvencí prvního formantu (F1). V takovém případě nastává zvětšení maximálního průtoku přes glottis (peak glottal flow), zesílení amplitudy vibrací hlasivek a parametru MFDR (maximum flow declimation ratio), což umožňuje řízené efektivní kmitání hlasivek se zvýšeným průtokem přes glottis a celkové zesílení hlasu až o 10 dB. Stupeň této interakce je regulovaný plochou průřezu epilaryngeální dutiny, která působí jako „matcher“ (dohazovač) mezi hlasivkami a vokálním traktem. Titze dále hypotetizuje,
74
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
že uvedené podladění F1 a první až třetí harmonické složky (H1, H2, H3) může být podkladem pro pocit vibrací v oblasti tváře. (TITZE, 2001; TITZE, 2004) Fenomén ladění formantu byl v oblasti hlasu spojován taky s přechodem hlasových rejstříků (NEUMANN a kol., 2005; GARNIER a kol., 2010; GARNIER a kol., 2012), je typický pro vyšší část tónového rozsahu klasických zpěváků (HENRICH a kol., 2011; JOLIVEAU a kol., 2004), ale taky jako podklad některých neklasických stylů (BOURNE a GARNIER, 2012; BOERSMA a KOVACIC, 2006). Na druhé straně jsou však studie, které zpochybňují systematické ladění formantů u klasických pěvců (CARLSSON a SUNDBERG, 1992; SUNDBERG a kol., 2013). Z uvedeného je možné předpokládat, že rezonance hlasu má zvukově-barevný podklad, je rozlišována ve spojitosti s hlasovými rejstříky a také s kvalitou hlasu. Cílem studie je hledat akustické koreláty s hodnocením mluvní a pěvecké rezonance hlasu žen.
2 Materiál a metody Podrobný popis subjektů, způsobu poslechového hodnocení a nahrávek je popsaný v (FRIČ a KADLECOVÁ, 2012). Stručně shrnutí: výzkumu se zúčastnilo 16 dobrovolnic, studentek pedagogické fakulty UK v Praze (věk 21-30 let), z toho 7 studentek s edukací zpěvního hlasu (klasický operní styl) na úrovni konzervatoře - trénovaná skupina, 9 netrénovaných studentek (nezpěvaček).
2.1 Nahrávky Akustické nahrávky (zvuková karta M-audio Fast track Ultra, 48 kHz vzorkovací frekvencí a 16 bit rozlišení, kondenzátorový mikrofonu Sennheiser ME2, vzdálenost od úst 30 cm v šikmém směru) a elektroglotografický záznam (Laryngograf EGG-D100) byly pořízeny souběžně v psychoakustické laboratoři HAMU. Ve studii byly analyzovány nahrávky hlasových úkolů: • Habituální mluvní hlas– čtení standardního českého textu („Podzim na starém bělidle“) při normální hlasitosti a volném tempu. • Zpěv lidové písně („Já do lesa nepojedu“) v durové tónině v tónových pozicích (a, d´, fis´).
2.2 Poslechové testy Pro účely studie byly zahrnuty výsledky poslechových testů předchozí studie pomocí seřaďovacích a škálovacích testů (Visual analog ranking and rating test, VARR) pro vlastnosti míra rezonance hlasu a hodnocení na škále světlý ↔ tmavý. U mluvního hlas byla hodnocena jedna úplná věta středové části textu (délka cca 4 vteřiny). Pro zpěvní hlas byly hodnocený dvě tóniny, jedna blízká střední zpěvní poloze hlasu všech žen – d´-dur a jedna o tercii výš s předpokladem technických problémů zpěvu netrénované skupiny – fis´-dur. Pro zjištění opakovatelnosti a stability hodnocení (kromě hodnocení zpěvu ve vyšší tónině) se přibližně za týden po prvním hodnocení opakoval „retest“.
2.3 Akustická měření Všechny nahrávky použité v poslechových testech byly v postprocessingu analyzovány pomocí systému RealVoiceLab (RVL) (FRIČ a kol., 2012), kde byla zvolena délka a posun analyzačního okna 30/10 ms pro mluvní hlas a 40/10 ms pro zpěvní hlasové úkoly.
75
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
Z jednotlivých akustických segmentů kromě základních parametrů hlasového pole (základní frekvence (F0) převedená na půltóny midi stupnice, hladina akustického tlaku (SPL) a z nich odvozené parametry: dynamický, tónový rozsah a plocha hlasového pole) byly vypočteny další akustické parametry: hladina první harmonické složky akustického spektra (H1), rozdíl hladin první a druhé harmonické složky (dHa1Ha2), těžiště spektra (ERICKSON, 2003) (COGamp, COG0k25, COG25k,COGharm), parametry vyváženosti spektra (COLLYER a kol., 2007; COLLYER a kol., 2009) (SPR, ER, Alfa poměr), frekvenční poloha formantů (Fn), jejich zesílení (An), šířka pásma formantů (Bn) dle LPC analýzy, vzdálenost k nejbližší harmonické složce (FTn), z kepstrální analýzy byla vypočtena hladina prvního kepstrálního vrcholu (CP~1). Dále parametry perturbací (KAYPENTAX, 2008; NOVÁK, 1996) periody (základní frekvence) (Jita, Jitt, RAP, PPQ, vF0), amplitudových perturbací (ShdB, Shim), VTI (Voice Turbulence Index) a SPI (Soft Phonation Index). Analýza elektroglotografického signálu byla provedena v postprocessingu pomocí standardizovaného programu Speech Studio verze 4.1.0 dodávaného k zařízení Laryngograf. Uvedený program analyzuje jednotlivé periody EGG signálu a v rámci nich vypočte EGG koeficient zavření hlasivek, resp. kontaktní koeficient hlasivek (CQEGG) na základě určení 30% úrovně jednotlivých period EGG signálu (MA a LOVE, 2010). Pro jednotlivé analyzované segmenty z akustické analýzy RVL byly hodnoty CQEGG zprůměrovány a importovány do systému RealVoiceLab.
2.4 Hodnocení vztahu percepčních vlastností a měřených parametrů Pro porovnání parametrů mezi skupinami a pro hledání vztahů naměřených parametrů s hodnocenými vlastnostmi při zohlednění výšky a pozice v hlasovém poli byly u každého subjektu vybrány segmenty z okolí ±2 půltóny od sledované výšky a při zohlednění pozice v hlasovém poli i z okolí ±2 dB od sledované hladiny akustického tlaku. Z vybraných segmentů nahrávek byly vypočteny průměrné hodnoty parametrů u každého subjektu a tyto hodnoty byly porovnány pomocí t-testu, respektive byla na ně aplikována Pearsonova korelace s hodnotami percepčních vlastností. Protože tímto způsobem bylo současně vyhodnocováno vícero hypotéz (porovnání pomocí ttestu nebo korelace), byla v testech aplikována zjednodušená Bonferroniho korekce, kde byla cílená hladina statistické významnosti (p<0,05) vydělena počtem testovaných hypotéz pro konkrétní vlastnost (HENDL, 2004). Ve výsledcích jsou uvedeny i výsledky, kde vyšla hladina statistické významnosti p<0,05, ale následně nevyhověla Bonferroniho korekci – takové výsledky jsou v práci interpretovány jako trendové. K nalezení souvislostí měřených akustických parametrů s percepčními hodnoceními hlasu byla použita i faktorová analýza a mnohonásobná lineární regrese, obě ve statistickém programu Statistica 6.0. Faktorova analýza je statistická metoda, která pozorované proměnné vyjadřuje pomocí zvoleného menšího množství proměnných - faktorů. Metoda hledá takové faktory, které nejlépe vystihují celkovou variabilitu hodnocených dat. Mnohonásobná lineární regrese je statistická metoda umožňující predikovat hodnoty jediné závisle proměnné pomocí kombinace hodnot více nezávislých proměnných. Metoda hledá takovou nejlepší kombinaci (rovnici přímky), při které je součet čtverců rozdílů jednotlivých hodnot závisle proměnné a předikovaných hodnot nejmenší. Variabilita průměrných hodnot měřených parametrů, tak byla vyjádřena jako kombinace faktorů a parametry byly seskupeny dle podobnosti na základě míry souvislosti jednotlivých faktorů s danou proměnnou (parametrem). Nalezené faktory
76
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
tvoří ortogonální systém, takže hodnoty jednotlivých parametrů v tomto faktorovém systému (hodnoty nezávisle proměnných) již bylo možné použít v mnohonásobné lineární regresi k hledání vztahů s výsledky poslechových testů (hodnoty jednotlivých závisle proměnných).
3 Výsledky
Obrázek 1 Porovnání hodnocení míry rezonance (osa x) a míry tmavosti (osa y) u A) habituálního hlasu, B) zpěvu v tónině d´-dur a C) v tónině fis´-dur mezi trénovanými klasickými zpěvačkami (kolečka) a nezpěvačkami (hvězdičky).
Porovnání rozložení hodnocení subjektů ve vlastnostech světlost – tmavost versus míra rezonance ukazuje Obrázek 1. Při hodnocení tmavosti habituálního hlasu (část A) se ukazuje difúzní rozložení trénovaných zpěvaček a nezpěvaček, tato vlastnost pravděpodobně závisí hlavně na výšce hlasu. Naproti tomu, při hodnocení míry rezonance dosahuje skupina zpěvaček lepší hodnocení. Ve zpěvním hlase v nižší tónině (d´-dur, část B) se umístnily zpěvačky uprostřed mezi velmi světlými a velmi tmavými hlasy netrénované skupiny, avšak s výraznější rezonancí hlasu. Ve vyšší tónině (fis´-dur, část C) již některé nezpěvačky nebyly schopny zazpívat, zpěvačky měly výrazně tmavší i rezonovanější hlas než nezpěvačky.
3.1 Hlasová pole habituálního hlasu a při zpěvu lidové písně Obrázek 2 zobrazuje porovnání obrysů hlasových polí habituálního hlasu a zpěvu písní v různých tónových výškách mezi trénovanou a netrénovanou skupinou žen, jakož i korelaci těchto obrysových křivek s mírou hodnocené tmavosti a rezonance hlasu. U habituálního hlasu nebyly zjištěny žádné statisticky významné rozdíly a ani nebyly nalezeny významné vztahy obrysových kontur s tmavostí a rezonancí. Zpěv písně v nejhlubší tónině (a-dur) byl zaznamenán u 6 ze 7 zpěvaček a u 6 z 8 nezpěvaček, ale nebyl specielně hodnocený v poslechových testech, proto pro korelaci byly použity hodnocené percepční vlastnosti habituálního hlasu a zpěvu v tónině d´-dur. Porovnání SPL kontur hlasových polí zpěvu v tónině a-dur neukázalo žádné statisticky významné rozdíly mezi trénovanými a netrénovanými ženami. Korelace SPL kontur s hodnocením rezonance ve d´-dur neukázaly žádné významné korelace. Tmavost habituálního hlasu naznačovala jenom trendově zesílení spodní části tónového rozsahu. Zpěv v tónině d´-dur (7 ze 7 zpěvaček, 7 z 8 nezpěvaček) ukázala při porovnání kontur hlasových polí významné rozdíly v polohách nad c´´ (C5). Korelace SPL kontur s percepčním hodnocením ukázala nejvýznamnější vztahy s hodnocením tmavosti v d´-dur, kde se významně zesilovaly obě SPL kontury v téměř celém tónovém rozsahu písně. Rezonance hlasu v d´-dur již korelovala jenom se zesílením vyšších části tónového rozsahu obou kontur. Nejvyšší hodnocená tónina fis´-dur byla zaznamenána jenom u 4 z 8 nezpěvaček, kdežto u 6 ze 7 zpěvaček. Porovnání kontur hlasového pole ale ukázala i přesto významné rozdíly v celé
77
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
vyšší polovině tónového rozsahu (resp. nad tón c´´ (C5)) zejména v horní SPL kontuře. Korelace s percepčními hodnocením tmavostí i rezonancí ve fis´-dur kladně korelovala v střední a vysoké části tónového rozsahu horní SPL kontury, střední a hluboké části spodní SPL kontury.
Obrázek 2 Porovnání průměrných obrysů hlasových polí (A) habituálního hlasu a zpěvu písně (D, G, J) mezi zpěvačkami (černá tlustá čára) a nezpěvačkami (šedá přerušovaná čára) v různých tóninách. Korelace obrysových křivek s percepčními parametry pro habituální hlasu (B, C) a tóniny a-dur (E, F), d´-dur (H, I), fis´dur (K, L). Korelace s percepčními parametry: B, E) tmavost habituálního hlasu; C, F) rezonance habituálního hlasu; H) tmavost d´-dur; I) rezonance d´-dur; K) tmavost fis´-dur; L) rezonance fis´-dur. Šedé trojúhelníky s hrotem nahoru označují části SPL kontur s kladnou korelací s hladinou statistické významnosti p<0,05, hvězdičky označují korelace, které vyhověly Bonferroniho korekci.
Shrnutí porovnání parametrů hlasových polí habituálního hlasu a zpěvu lidové písně v různých tóninách mezi trénovanými zpěvačkami a nezpěvačkami dokumentuje Chyba! Chybný odkaz na záložku.. Signifikantní rozdíly se nenašly u habituálního hlasu a
78
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
v nejhlubší tónině, ale pak se rozdíly zvětšovaly s narůstající výškou tóniny, týkaly se jenom parametrů intenzity hlasu průměrné a maximální SPL a dynamického rozsahu. Tabulka 1 Porovnání parametrů hlasových polí lidové písně mezi trénovanými zpěvačkami a nezpěvačkami v různých tóninách, v tabulce jsou uvedeny hodnoty statistické významnosti t-testu (ns –nevýznamné rozdíly, bez hvězdičky jsou uvedeny p<0,05, ** označují p<0,01/10 – Bonferroniho korekci pro 10 porovnání. P – označuje parametry výšky hlasu, VRPArea – plocha hlasového pole. t-test
P.mean
P.min
P.max
TR
SPL.mean
SPL.min
SPL.max
DR
VRPArea
habitual
ns
ns
ns
ns
ns
ns
ns
ns
ns
a-dur
ns
ns
ns
ns
ns
ns
ns
ns
ns
d´-dur
ns
ns
ns
ns
0.0146
ns
0.0003**
0.0006**
ns
fis´-dur
ns
ns
ns
ns
0.0004**
ns
0.0001**
0.0235
ns
Korelace percepčních parametrů s parametry hlasových polí zpěvu lidové písně (viz Tabulka 2) ukazují, že výškové parametry měly významný vztah s tmavostí u habituálního hlasu, ale jinak významně nesouvisely s hodnocením vlastností zpěvu. Hodnocení tmavosti i rezonance zpěvu korelovalo zejména s průměrnou a maximální dosahovanou SPL a to tím výrazněji, čím vyšší byla zpívaná tónina. Tabulka 2 Korelace percepčních parametrů s parametry hlasových polí habituálního hlasu a zpěvu lidové písně v různých tóninách. Uvedeny jsou korelační trendové koeficienty se statistickou významností p<0,05 a *p<0,01, – šedě, při aplikaci Bonferroniho korekce - černou: **p<0,05/10, ***p<0,01/10. VRP habit.
a-dur
Percepční hodn.
SPL.mean
SPL.min
SPL.max
Rez hab
0.90**
0.67
0.85**
Tmav hab
0.72*
0.75**
0.64
Tmav hab
P.mean
P.min
P.max
-0.72**
-0.58
-0.55
TR
VRPArea
Rez hab Tmav d´-dur
0.83***
0.84***
Rez d´-dur d´-dur
DR
0.59
Tmav d´-dur
0.85***
0.81***
0.71**
Rez d´-dur
0.8***
0.56
fis´-dur Tmav fis´-dur Rez fis´-dur
0.64
0.64
0.92***
0.87***
0.9***
0.94***
0.71
0.94***
0.94***
0.71
3.2 Korelace akustických parametrů s hodnocením rezonance při zohlednění výšky Obrázek 3 znázorňuje korelace některých akustických parametrů s percepčním hodnocením rezonance se zohledněním výšky hlasu v různých hlasových úkolech. Hladina akustického tlaku, hladina první harmonické složky a hladina pěveckého formantu ve všech případech významně kladně korelovala s hodnocením jak habituální tak rezonance při zpěvu písní. Nad c´´ (C5) při hodnocení vztahu rezonance při zpěvu ve vyšší tónině a naměřenými parametry u zpěvu stupnic jsou ale korelace jenom trendové. Voice turbulence index (VTI) záporně koreloval s percepcí habituální rezonance ale u zpěvu písní jenom v oblastech nad c´´(korelace parametrizace zpěvu stupnic a rezonancí zpěvu ve vyšší tónině byla jenom trendová). Koeficient uzavření hlasivek (CQEGG) ukázal významnou korelaci s rezonancí jenom u habituálního hlasu.
79
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
Obrázek 3 Korelace průměrů parametrů s percepčním hodnocením rezonance se zohledněním výšky hlasu v úkolech dle sloupců: A) habituální hlas, B) zpěv lidové písně v d´dur tónině, C) zpěv písně v fis´dur tónině. Jednotlivé parametry jsou uvedeny v řádcích: 1) SPL, 2) hladina první harmonické složky, 3) hladina pěveckého formantu, 4) VTI, 5) CQEGG. (Trojúhelníky se vrcholem nahoru označují kladnou, s vrcholem dolů zápornou korelaci s p<0,05, hvězdičky označují korelaci s Bonferoniho korekcí p<0,05/tónový rozsah).
80
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
3.3 Faktorová analýza průměrných hodnot měřených parametrů a mnohonásobná lineární regresní analýza s percepčními vlastnostmi Faktorová analýza (viz Tabulka 3) variability průměrných hodnot měřených parametrů u habituálního hlasu rozdělila sledované parametry do 5 faktorů, které společně vysvětlovaly variabilitu 89% dat. První faktor zahrnoval parametry v kladné korelaci s parametry souvisejícími s nárůstem hladin pásma pěveckého formantu (kladně s SPR, Alfa, A4, COGamp, COG0k25, COGharm a záporném s SPI a ER). Druhý faktor kladně koreloval s celkovou intenzitou (SPL, H1, LFSH, THItilt) a záporně s poruchami stability základní frekvence a turbulentními složkami (vF0, VTI) a s koeficientem uzavření hlasivek (CQEGG). Třetí faktor koreloval jenom kladně s nárůstem frekvenční polohy pěveckého formantu (COG25k a FSH), čtvrtý kladně s polohami 3. a 4. formantu (F3 a F4), pátý byl tvořený jenom výškou hlasu. Mnohonásobná lineární regrese (metoda varimax normalized) ukázala vztahy mezi uvedenými faktory a percepčními vlastnostmi. Dle této analýzy byl tmavost byla predikovatelná 1., 2. a 5. faktorem, tedy tmavost byla souvisela se zvyšováním SPL, H1, sklonu celkového spektra a snižováním CQEGG. Za tmavší byl považován hlas, který byl hlubší a při snižování zesílení 4. formantu polohy těžiště spektra (celkového i v pásmu 0-2,5 kHz). Rezonance habituálního hlasu dle mnohonásobné lineární regrese souvisela jenom s 2. faktorem, což znamená, že zvýšení rezonance hlasu bylo spojeno se zvýšením intenzity hlasu, nárůstem hladiny první harmonické složky a hladiny pěveckého formantu a opačně rezonance se projevovala potlačením variability základní frekvence hlasu, složek turbulencí (VTI) a snížením CQEGG. Druhý faktor však souvisel i s tmavostí hlasu, z toho plyne že uvedené parametry se mění i při změně tmavosti. Variabilita průměrných hodnot akustických parametrů zpěvu v tónině d´dur bylo možno rozdělit do 5 faktorů, které vysvětlovaly variabilitu 92,5 % dat. První faktor kladně koreloval s celkovou intenzitou hlasu, hladinou první harmonické, hladinou prvního kepstrálního koeficientu a zesílením 4. resp. pěveckého formantu a sklonem spektra, záporně s SPI a VTI. Druhý faktor kladně koreloval s Alfa, polohou prvního formantu, polohou těžiště spektra v oblasti 0-2,5 kHz a záporně s rozdílem hladin první a druhé harmonické složky. Třetí faktor koreloval s polohou 4., resp. pěveckého formantu těžištěm spektra v oblasti 2-5 kHz. Faktor 4 lze sumarizovat jako faktor perturbací a pátý faktor byl dán průměrnou výškou hlasu. Mnohonásobná lineární regrese při zpěvu v tónině d´dur ukázala, že rezonance i tmavost souvisely s prvním faktorem, tedy s hladinou pěveckého formantu, celkovou intenzitou a hladinou první harmonické složky, rezonance ale kladně korelovala i s třetím faktorem, tedy s frekvenční pozicí 4. resp. pěveckého formantu, tmavost naopak byla negativně ovlivněna výškou hlasu. Faktorová analýza průměrných hodnot parametrů při zpěvu písně ve fis´dur tónině odhalila 5 faktorů vysvětlujících 95,6 % variability dat. První faktor slučoval parametry popisující zvýšení polohy 4. formantu a zesílení 2. až 4. formantu. Druhý faktor souvisel s potlačením intenzity prvního formantu a zvýšením těžiště spektra v oblasti 0-2,5 kHz. Třetí faktor souvisel s perturbacemi hlasu. Čtvrtý faktor byl daný průměrnou výškou a intenzitou hlasu při zpěvu, hladinou 1. harmonické složky a prvního centrálního koeficientu a polohami 2. a 3. formantu, pátý faktor byl dán jenom snížením polohy 1. formantu.
81
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
Mnohonásobná lineární regrese ukázala, že tmavost i rezonance souvisely s 4 faktorem, tedy hlavně průměrnou výškou a intenzitou hlasu, rezonance souvisela i s 2. a 3. faktorem, tedy konkrétně se zesílením 1. formantu paradoxně i s většími perturbacemi hlasu. Tabulka 3 Výsledky faktorové analýzy průměrných hodnot akustických a EGG parametrů pro habituální hlas a zpěv písně v d´dur a fis´dut tóninách. Mnohonásobná lineární regrese percepčních vlastností s vypočtenými faktory. Faktorová analýza Faktor
habituální hlas fa 1
fa 2
fa 3
fa 4
zpěv fis´dur
zpěv d´dur fa 5
fa 1
fa 2
fa 3
fa 4
0,74
F0x 0.97
SPL
fa 5
fa 1
fa 2
fa 3
0.88
Jitt
0.90
ShdB
0.93
0.85
RAP
0.87
0.92
0.88
0.88
SPI
-0.84 -0.75
VTI
-0.93
-0.95
ER
-0.95
-0.84
SPR
0.99
0.86
Alfa
0.94
-0.86 0.83 0.92
0.71 0.95
H1
-0.82
-0.79 -0.97
0.85
0.92
dHa1Ha2
-0.92
F1
0.87
-0.74 -0.89 0.83
F2 F3
0.86
F4
0.94
0.80 0.83
0.84
-0.72
A1 -0.82
A2
-0.74
A3 A4
0.71
COGamp
0.78
0.72
0.93
0.84
COG25k
0.84
COG0k25
0.81
0.95
0.95
COGharm
0.87
0.88
0.93
0.81
FSH LFSH
0.95
THItilt
0.73
0.79
THItilt4k4
0.80
CP1
0,79
CQEGG
0.94
0.84
0.76
0.72
0.77 0,72
-0.75
Mnohonásobná lineární regrese
fa 1
fa 2
Tmav. hab.
-0.33
0.34
fa 3
fa 4
fa 5
fa 1
fa 2
fa 3
fa 4
fa 5
fa 1
fa 2
fa 3
fa 4
0.43
-0.30
0.42
0.73
-0,75
0.87
Rez. hab. Rez. d´dur Tmav. d´dur
fa 5
0.73
0.85 0.96 0.89
vF0
fa 4
0.78 -0.59
0.38
0.92
-0.29
Rez. fis´
0.74
Tmav. fis´
82
fa 5
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
4 Diskuze Zobrazení rozložení hodnocení tmavosti vs. rezonance odhalily, že v habituálním mluvním hlase jsou náhodně rozptýlené zpěvačky i nezpěvačky. Při zpěvu se však výrazně odlišují zpěvačky od nezpěvaček v rezonanci hlasu. V nižší tónině byly ještě některé nezpěvačky tmavší než zpěvačky, ale ve vyšší tónině byly jednoznačně tmavší hlasy zpěvaček. Výsledky faktorové analýzy ukázaly, že tmavost hlasu je obecně primárně ovlivněná výškou hlasu. Výška hlasu u habituálního čtení ale není ovlivněná trénovaností. Proto můžou být promíchané zpěvačky s nezpěvačkami u tmavosti habituálního hlasu. Ve zpěvu se však situace mění, v zásadě jsou netrénované hlasy světlejší, ale v nižší tónině můžou být i netrénované hlasy velmi tmavé, tato tmavost ale pravděpodobně není dostatečně vyvážena rezonancí hlasu. Protože je tedy obecná tmavost hlasu při zpěvu hodnocená pozitivně u zpěvaček ve spojitosti s vyšší rezonancí, ale u nezpěvaček jsou odděleny dvě skupiny málo tmavých a zároveň málo rezonovaných hlasů od extrémně tmavých ale zároveň málo rezonovaných. Uvedené pozorování implikuje, že tmavost je vhodné rozdělovat na typ „zatmavení“ hlasu ve spojení s vyšší rezonancí – hodnocenou jako technicky lepší a na typ tmavosti, bez zvýšení rezonance hlasu, která je hodnocená jako technicky nevhodná. Technicky výhodnější „zatmavení“ pak pravděpodobně souvisí s vlastnostmi jako „krytí“ (covered) (HERTEGARD a kol., 1990) nebo „kulatost“, typické pro klasický zpěv, které jsou uváděny do souvislosti při překlenování percepčních rejstříku hlasu. Nesprávné „zatmavení“ na druhé straně způsobuje pravděpodobně „zapadnutí“ hlasu. Rozdíly kontur zpěvních hlasových polí písní, spolu s pozorovanými významnými vztahy s percepčními vlastnostmi identifikují jako zásadní zlomový bod u SPL kontur – tón c´´ (C5), od kterého se výrazně projeví rozdílné vlastnosti hlasu zpěvaček a nezpěvaček. Na horní SPL kontuře nad c´´ byla prokázána schopnost dosáhnout významně vyšších maximálních hladin SPL u trénovaných zpěvaček. Uvedená oblast také trendově souvisí s tmavostí zpěvu. Společné vyhodnocení mnohonásobné lineární regrese percepčních parametrů s výsledky faktorové analýzy při hodnocení habituálního hlasu i při hodnocení obou tónin zpěvu dokumentuje, že tmavost hlasu i rezonance ve všech případech souvisely s nárůstem průměrné intenzity hlasu (SPL), nárůstem hladiny první harmonické složky (H1), a také nárůstem hladiny pásma pěveckého formantu (LFSH), negativně souvisely s parametrem VTI (voice turbulence index). Podobně korelovaly tmavost i rezonance u habituálního hlasu a zpěvu v d´dur tónině jenom u parametru celkového sklonu spektra. Na rozdíl od habituálního hlasu, tmavost i rezonance u zpěvu písní kladně korelovaly s hladinou prvního kepstrálního koeficientu. Hodnocení tmavosti se relativně často chovalo protichůdně v závislosti na hodnocení typu hlasu (mluvní nebo zpěvní), konkrétně u parametrů SPI, SPR, a A4, v nejvyšší tónině i s F0. Při hodnocení tmavosti habituálního hlasu byl preferovaný hlubší, „měkčí“ hlas (daný negativní zvyšováním parametru SPI) a nižší relativní maximum pěveckého resp. 4. formantu vůči maximu pásma 0-2 kHz (SPR). Naopak, hodnocení tmavosti zpěvu při tónině d´dur bylo spojeno s poklesem SPI nárůstem SPR, respektive zesílením 4. formantu. Uvedené zjištění potvrzuje obecné předpoklady hodnocení světlosti s nárůstem vyšších spektrálních komponentů u habituálního hlasu. Paradoxní preference nárůstu průměrné výšky s pěveckou tmavostí v nejvyšší tónině lze vysvětlit jako schopnost tmavších hlasů, typických právě ve vyšší tónině pro trénované zpěvačky, déle udržet vysoké tóny, nebo naopak
83
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
neschopností udržet vysoké tón (podladění) u světlých netrénovaných hlasů. Tónina zpěvu byla totiž pro všechny stejná, odlišné mohlo být tempo a výdrž vysokých tónů. Hodnocení rezonance nevykazovalo výrazný rozpor mezi habituálním a zpěvním hlasem. Rozdíl hodnocení se ukázal jenom při některých parametrech, u habituální rezonance byl významný pokles koeficientu uzavření hlasivek (CQEG) a snížení variability základní frekvence, u zpěvu v d´dur byla rezonance spjata s poklesem SPI (poklesem slabosti hlasu), nárůstem SPR, polohy a zesílení 4. resp. pěveckého formantu, tím pádem i zvýšení polohy těžiště v pásmu 2-5 kHz. Při rezonanci ve fis´dur byly zásadní i zvýšené polohy 2. a 3. formantu.
5 Závěr Pěvecký trénink se projevil mezi trénovanými a netrénovanými ženami na subjektivním hodnocení mluvního i zpěvního hlasu v míře vnímané rezonance. Tmavost hlasu se odlišovala mezi zpěvačkami a nezpěvačkami jenom ve vyšší tónině při zpěvu písně. Studie však dokumentuje, že obecnou tmavost hlasu je vhodné rozdělovat na technicky vhodnou a technicky nevhodnou. Na základě mnohonásobné lineární regrese bylo hodnocení rezonance i tmavosti hlasu predikovatelné v prostoru faktorů faktorové analýzy měřených akustických parametrů podobným způsobem jak v mluvním hlase tak i při zpěvu lidové písně v obou hodnocených tóninách. Zvýšení rezonance hlasu a tmavost se projevovaly celkovým zesílením hlasu, které bylo podmíněno zesílením první harmonické složky a spektrální oblasti pěveckého formantu. Potlačení turbulentních složek v hlase bylo taky typické pro rezonovaný a tmavý hlas a souviselo se zlepšením kvality hlasu. U habituálního hlasu rezonance významně korelovala i se snížením kontaktního koeficientu hlasivek, což je projev menší addukce hlasivek.
Poděkování Studie vznikla za podpory projektu Fondu rozvoje CESNET 465R1/2012.
Literatura FRIČ M., KADLECOVÁ K. A. 2012. Porovnání vlastností a parametrů hlasu pěvecky trénovaných a netrénovaných žen, Akustické listy, Vol. 18, No. 2-3, pp. 5-24. HAVLÍK R., FROSTOVÁ J. 2007. Komplexní reedukace hlasu v AFC, Otorinolaryngologie a Foniatrie, Vol. 56, No. 1, pp. 35-8. SELLARS C., CARDING P. N., DEARY I. J., MACKENZIE K., WILSON J. A. 2002. Characterization of effective primary voice therapy for dysphonia, J Laryngol Otol, Vol. 116, No. 12, pp. 1014-8. SIMBERG S., LAINE A. 2007. The resonance tube method in voice therapy: description and practical implementations, Logoped Phoniatr Vocol, Vol. 32, No. 4, pp. 165-70. VERDOLINI-MARSTON K., BURKE M. K., LESSAC A., GLAZE L., CALDWELL E. 1995. Preliminary study of two methods of treatment for laryngeal nodules, J Voice, Vol. 9, No. 1, pp. 74-85. VERDOLINI K., DEVORE K., MCCOY S., OSTREM J. 2000. A guide to vocology. NCVS. VERDOLINI K., DRUKER D. G., PALMER P. M., SAMAWI H. 1998. Laryngeal adduction in resonant voice, J Voice, Vol. 12, No. 3, pp. 315-27.
84
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
TITZE I. R. 2004. A theoretical study of F0-F1 interaction with application to resonant speaking and singing voice, J Voice, Vol. 18, No. 3, pp. 292-8. SMITH C. G., FINNEGAN E. M., KARNELL M. P. 2005. Resonant voice: spectral and nasendoscopic analysis, J Voice, Vol. 19, No. 4, pp. 607-22. KADLECOVÁ K.A., FRIČ M. 2012 Porovnání hlasových přechodů mezi klasicky a neklasicky školenými zpěvačkami a nezpěvačkami. In Nové trendy akustického spektra: proceedings of the 7th International Conference Material-Acourstics-Place 2012, Zvolen – Slovakia. Zvolen: Technická univerzita vo Zvolene, 2012. ISBN 978-80-228-2371-5, p. 11325. BARRICHELO V. M., BEHLAU M. 2007. Perceptual identification and acoustic measures of the resonant voice based on "Lessac's Y-Buzz"--a preliminary study with actors, J Voice, Vol. 21, No. 1, pp. 46-53. SUNDBERG J. 1979. Chest vibration in singers, STL-QPSR, Vol. 20, No. 1, pp. 49-64. SUNDBERG J. 1991. Phonatory vibrations in singers. A critical review, STL-QPSR, Vol. 32, No. 1, pp. 37-51. YIU E. M., CHEN F. C., LO G., PANG G. 2012. Vibratory and perceptual measurement of resonant voice, J Voice, Vol. 26, No. 5, pp. 675-9. BELE I. V. 2005. Reliability in perceptual analysis of voice quality, J Voice, Vol. 19, No. 4, pp. 555-73. BERGAN C. C., TITZE I. R., STORY B. 2004. The perception of two vocal qualities in a synthesized vocal utterance: ring and pressed voice, J Voice, Vol. 18, No. 3, pp. 305-17. SUNDBERG J. 1974. Articulatory interpretation of the "singing formant", J Acoust Soc Am, Vol. 55, No. 4, pp. 838-44. SUNDBERG J. 2001. Level and center frequency of the singer's formant, J Voice, Vol. 15, No. 2, pp. 176-86. DE BODT M. S., CLEMENT G., WUYTS F. L., BORGHS C., VAN LIERDE K. M. 2012. The impact of phonation mode and vocal technique on vocal fold closure in young females with normal voice quality, J Voice, Vol. 26, No. 6, pp. 818-4. TITZE I. R. 1-1-1988. A framework for the study of vocal registers, J Voice, Vol. 2, No. 3, pp. 183-94. AUSTIN S. F., TITZE I. R. 1997. The effect of subglottal resonance upon vocal fold vibration, J Voice, Vol. 11, No. 4, pp. 391-402. TAKEMOTO H., ADACHI S., KITAMURA T., MOKHTARI P., HONDA K. 2006. Acoustic roles of the laryngeal cavity in vocal tract resonance, J Acoust Soc Am, Vol. 120, No. 4, pp. 2228-38. LEE S. H., KWON H. J., CHOI H. J., LEE N. H., LEE S. J., JIN S. M. 2008. The Singer's Formant and Speaker's Ring Resonance: A Long-Term Average Spectrum Analysis, Clin Exp Otorhinolaryngol, Vol. 1, No. 2, pp. 92-6. BELE I. V. 2006. The speaker's formant, J Voice, Vol. 20, No. 4, pp. 555-78. LEINO T., LAUKKANEN A. M., RADOLF V. 2011. Formation of the actor's/speaker's formant: a study applying spectrum analysis and computer modeling, J Voice, Vol. 25, No. 2, pp. 150-8.
85
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
TITZE I. R. 2001. Acoustic interpretation of resonant voice, J Voice, Vol. 15, No. 4, pp. 51928. NEUMANN K., SCHUNDA P., HOTH S., EULER H. A. 2005. The interplay between glottis and vocal tract during the male passaggio, Folia Phoniatr Logop, Vol. 57, No. 5-6, pp. 30827. GARNIER M., HENRICH N., SMITH J., WOLFE J. 2010. Vocal tract adjustments in the high soprano range, J Acoust Soc Am, Vol. 127, No. 6, pp. 3771-80. GARNIER M., HENRICH N., CREVIER-BUCHMAN L., VINCENT C., SMITH J., WOLFE J. 2012. Glottal behavior in the high soprano range and the transition to the whistle register, J Acoust Soc Am, Vol. 131, No. 1, pp. 951-62. HENRICH N., SMITH J., WOLFE J. 2011. Vocal tract resonances in singing: Strategies used by sopranos, altos, tenors, and baritones, J Acoust Soc Am, Vol. 129, No. 2, pp. 1024. JOLIVEAU E., SMITH J., WOLFE J. 2004. Vocal tract resonances in singing: the soprano voice, J Acoust Soc Am, Vol. 116, No. 4 Pt 1, pp. 2434-9. BOURNE T., GARNIER M. 2012. Physiological and acoustic characteristics of the female Music Theater voice, J Acoust Soc Am, Vol. 131, No. 2, pp. 1586-94. BOERSMA P., KOVACIC G. 2006. Spectral characteristics of three styles of Croatian folk singing, J Acoust Soc Am, Vol. 119, No. 3, pp. 1805-16. CARLSSON G., SUNDBERG J. 1992. Formant frequency tuning in singing. 6 ed. p. 256-60. SUNDBERG J., LA F. M., GILL B. P. 27-2-2013. Formant Tuning Strategies in Professional Male Opera Singers, J Voice, Vol. 27, No. 3, pp. 278-288. FRIČ M, KULHÁNEK T, HRB J. 2012 Sytém vzdáleného přístupu k analýze hlasu RealVoiceLab, MARC-Technologický list čís. 46, Výzkumné centrum hudební akustiky HAMU, 2012. ERICKSON M. L. 2003. Dissimilarity and the classification of female singing voices: a preliminary study, J Voice, Vol. 17, No. 2, pp. 195-206. COLLYER S., DAVIS P. J., THORPE C. W., CALLAGHAN J. 2007. Sound pressure level and spectral balance linearity and symmetry in the messa di voce of female classical singers, J Acoust Soc Am, Vol. 121, No. 3, pp. 1728-36. COLLYER S., DAVIS P. J., THORPE C. W., CALLAGHAN J. 2009. Fundamental frequency influences the relationship between sound pressure level and spectral balance in female classically trained singers, J Acoust Soc Am, Vol. 126, No. 1, pp. 396-406. MULTI-DIMENSIONAL VOICE PROGRAM (MDVP), Model 5105 [computer program]. Lincoln Park: KayPentax, A division of PENTAX Medical Company; 2008. NOVÁK A. 1996. Foniatrie. Avicenum Praha; 1996. MA E. P., LOVE A. L. 2010. Electroglottographic evaluation of age and gender effects during sustained phonation and connected speech, J Voice, Vol. 24, No. 2, pp. 146-52. HENDL J. 2004. Přehled statistických metod zpracování dat. Praha: Portál; s. 583. HERTEGARD S., GAUFFIN J., SUNDBERG J. 1990. Open and Covered Singing as Studied by Means of Fiberoptics, Inverse Filtering, and Spectral Analysis, J Voice, Vol. 4, No. 3, pp. 220-30.
86
NOVÉ TRENDY AKUSTICKÉHO SPEKTRA 2013 Vedecký recenzovaný zborník | Peer-reviewed Proceedings
Summary The study follows on from a previous study. It focuses on the assessment and the objectification of resonance and darkness of speaking and singing voice in females. Recordings of 7 classically trained student of opera singing and 8 untrained students of the Pedagogical Faculty of Charles University in Prague were acoustically analyzed and subjectively evaluated by two evaluators. The singing training was reflected in the subjective evaluation of the voice resonance both in habitual speech and in the song singing. Darkness (opposite to brightness) was different only in higher pitch between singers and nonsingers. The study shows that the general darkness of voice is appropriate to divide into the technically appropriate and technically inappropriate. The evaluation of darkness and resonance were expressed similarly in habitual speech and singing based on multiple linear regression of factors of the factor analysis of measured acoustic parameters. Increasing resonance of voice and darkness were manifested by overall amplification of the voice, which was conditioned by the gain of the first harmonic and the spectral band of singer's formant. Suppression of turbulent components in the voice was also typical for dark and resonat voice, and was associated with improvement in voice quality. Resonance significantly correlated with a reduction in vocal fold contact quotient only in the habitual voice, reflecting the smaller adduction of the vocal folds.
Contact address Marek Frič Musical Acoustics Research Centre (MARC) Prague Academy of Performing Arts in Prague Malostranské nám. 13, 11800 Praha 1, Czech Republic
[email protected] http://zvuk.hamu.cz/vyzkum/hlas.php
87