M´ assalhangz´ o-mag´ anhangz´ o kapcsolatok automatikus oszt´ alyoz´ asa szubglott´ alis rezonanci´ ak alapj´ an Csap´ o Tam´ as G´ abor1 , N´emeth G´eza1 1
Budapesti M˝ uszaki ´es Gazdas´ agtudom´ anyi Egyetem, T´ avk¨ ozl´esi ´es M´ediainformatikai Tansz´ek, Budapest, 1117, Magyar tud´ osok krt. 2., e-mail: {csapot,nemeth}@tmit.bme.hu
Kivonat A nemzetk¨ ozi szakirodalom az elm´ ult ´evekben kezdett intenz´ıven foglalkozni a szubglott´ alis rezonanci´ ak vizsg´ alat´ aval, melyek az als´ o l´egutak rezonanci´ ai. Kor´ abbi kutat´ asokban kimutatt´ ak, hogy ezek a mag´ anhangz´ okat term´eszetes oszt´ alyokra tagolj´ ak. A m´ assalhangz´ o-mag´ anhangz´ o kapcsolatokban a mag´ anhangz´ o form´ ans´ert´ekei nem ´ alland´ oak a koartikul´ aci´ o miatt. A z´ arhangok p´eld´ aul k´epz´esi hely¨ ukt˝ ol f¨ ugg˝ oen m´ odos´ıtj´ ak a szomsz´edos mag´ anhangz´ o form´ ansait. A m´ assalhangz´ o v´eg´en ´es a mag´ anhangz´ o k¨ ozep´en m´erhet˝ o m´ asodik form´ ans ´ert´ek´et ¨ osszevetve rajzolhat´ o meg a locus egyenlet t´er, melyben az egyes besz´edhangoszt´ alyok az artikul´ aci´ os hely¨ uk szerint elk¨ ul¨ on¨ ulve jelennek meg. Hipot´eziseink szerint a csoportok elk¨ ul¨ on¨ ul´es´ehez a szubglott´ alis rezonanci´ ak is hozz´ aj´ arulnak, hasonl´ oan a mag´ anhangz´ okban okozott kategorikus elv´ alaszt´ ashoz. Jelen kutat´ as sor´ an egy magyar anyanyelv˝ u besz´el˝ o alapj´ an tov´ abb vizsg´ aljuk a m´ assalhangz´ o-mag´ anhangz´ o kapcsolatok hely´et a locus egyenlet t´erben, valamint a szubglott´ alis rezonanci´ ak csoportelv´ alaszt´ o szerep´et is elemezz¨ uk. Bemutatjuk egy automatikus oszt´ alyoz´ o m˝ uk¨ od´es´et, amely a szubglott´ alis rezonanci´ ak ´es a m´ asodik form´ ans viszonya alapj´ an csoportos´ıtja a m´ assalhangz´ o-mag´ anhangz´ o besz´edhangkapcsolatokat. Kulcsszavak: szubglott´ alis rezonancia, SGR, CV kapcsolat, locus egyenlet
1. Bevezet´ es A nemzetk¨ ozi szakirodalom az elm´ ult ´evekben kezdett intenz´ıven foglalkozni a szubglott´ alis rezonanci´ ak (SGR) vizsg´alat´ aval, melyek az als´ o l´egutak (pl. t¨ ud˝ o, l´egcs˝ o, h¨ org˝ ok, ld. 1. ´ abra) rezonanci´ ai [15]. Ezek a form´ ansokhoz hasonl´ oan alak´ıtj´ ak a z¨ ong´es hangok spektrum´ at, de a form´ ansokkal ellent´etben nem er˝ os´ıtik a rezonanciafrekvencia k¨ or¨ uli harmonikusokat, hanem gyeng´ıtik ˝oket. Mivel az als´ o l´eg´ uti szervek viszonylag keveset mozognak a besz´ed sor´an, a rezonanciafrekvenci´ ak k¨ ozel ´ alland´ oak egy-egy ember besz´ed´eben.
1. ´abra. Az als´ o l´eg´ uti rendszer [4]. Tipikus rezonanciafrekvencia ´ert´ekei 600 Hz, 1400 Hz ´es 2100 Hz k¨ or¨ uliek [15]. 1.1. A szubglott´ alis rendszer rezonanci´ ainak szerepe Kor´abbi kutat´ asokban kimutatt´ ak, hogy a szubglott´ alis rezonanci´ ak a mag´ anhangz´ okat kategorikusan term´eszetes oszt´ alyokra tagolj´ ak [8]. Az angol nyelven v´egzett vizsg´alatok alapj´ an az der¨ ult ki, hogy a m´ asodik szubglott´ alis rezonancia (Sg2) term´eszetes hat´ark´ent (fonol´ ogiai megk¨ ul¨ onb¨ oztet˝ o jegy, [14]) szolg´ al az el¨ ol ´es h´ atul k´epzett mag´ anhangz´ ok k¨ oz¨ ott: ha a m´ asodik form´ ans frekvenci´ aja (F 2) magasabb, mint a m´ asodik als´ o l´eg´ uti rezonancia, akkor el¨ol k´epzett mag´ anhangz´ ok´ent ´erz´ekelj¨ uk, ha alacsonyabb, akkor h´ atul k´epzettk´ent. Az els˝ o (Sg1) ´es harmadik (Sg3) als´ o l´eg´ uti frekvencia elv´ alaszt´ o szerep´ere is utalnak bizonyos eredm´enyek [8]. Az eddigi eredm´enyek szerint a szubglott´ alis rezonanci´ ak a oek form´ ansmenetekben a folytonoss´ ag megszakad´ as´ at okozhatj´ ak [2], ´eszrevehet˝ a besz´edpercepci´ o sz´ am´ ara [7], valamint hasznosak lehetnek a besz´el˝o normaany nyelvre vizsg´alt´ ak a mag´ anhangz´ o liz´ al´ asban [16,17]. Eddig azonban csak n´eh´ form´ ansok ´es SGR-ek kapcsolat´ at. Wang ´es koll´eg´ ai angol-spanyol k´etnyelv˝ u gyermekek besz´ed´evel foglalkoztak [16]. Lulich egy feln˝ ott f´erfi ´es kilenc gyermek amerikai angol besz´el˝ o Sg2 ´es F 2 kapcsolat´ at elemezte [8]. Madsack ´es t´ arsai az Sg1-F 1 ´es Sg2-F 2 k¨ oz¨ otti ¨ osszef¨ ugg´est kutatta k´et n´emet dialektus n´eh´ any ot v´egzett a koreai nyelvre [6]. besz´el˝oj´en [11], Jung pedig hasonl´ A szubglott´ alis rezonanci´ ak mag´ anhangz´ o-elk¨ ul¨ on´ıt˝ o szerep´evel kapcsolatban magyar nyelvre eddig kezdeti kutat´ asok t¨ ort´entek csak. Az els˝ o k´ıs´erletek alapj´ an az Sg1, Sg2 ´es Sg3 szerepet j´ atszhat a besz´edhangok produkci´oj´ aban [3]. Az eredm´enyek szerint az Sg1 az als´ o ´es nem-als´ o, az Sg2 az el¨ol ´es h´ atul k´epzett mag´ anhangz´ ok k¨ oz¨ otti hat´aron tal´ alhat´ o, m´ıg az Sg3 az el¨ol k´epzett ajakr´eses nem-als´ okat k¨ ul¨ on´ıti el a t¨ obbi el¨ol k´epzett mag´ anhangz´ ot´ ol. A magyar mag´ anhangz´ ocsoportok k¨ oz¨ ott felt´etelezett elv´ alaszt´ o szerepet a 2. ´abra mutatja.
A v´ızszintes ´es f¨ ugg˝ oleges vonalak utalnak a szubglott´ alis rezonanci´ ak hely´ere a form´ anst´erben. [3] eredm´enyei szerint k´et f´erfi ´es k´et n˝ o logatom-olvas´ asa alapj´ an nagyr´eszt teljes¨ ulnek ezek a hipot´ezisek.
h9
x9 h
Sg3 d9
t9
x
t
Sg2
19 1
n9 n
Sg1 D
N `9
2. ´abra. A magyar mag´ anhangz´ ok elm´eleti form´ anstere. A v´ızszintes ´es f¨ ugg˝ oleges vonalak a szubglott´ alis rezonanci´ ak ´altal felt´etelezett elk¨ ul¨ on¨ ul´est mutatj´ ak. A k¨ ul¨ onb¨ oz˝ o nyelvekre t¨ ort´ent kutat´ asokat viszonylag kev´es adaton v´egezt´ek el, de az eredm´enyek konzisztensek abban, hogy mindegyik vizsg´alt nyelvben az als´ o l´eg´ uti rezonanci´ ak hat´ark´ent szolg´ alnak k¨ ul¨ onb¨ oz˝ o mag´ anhangz´ o-csoportok k¨ oz¨ ott. 1.2. Form´ ansmenetek m´ assalhangz´ o-mag´ anhangz´ o kapcsolatokban A m´ assalhangz´ o-mag´ anhangz´ o (CV) kapcsolatokban a mag´ anhangz´ o form´ ans´ert´ekei nem ´ alland´ oak a k´et hang k¨ oz¨ otti koartikul´ aci´ o miatt [5]. A z¨ ong´es ´es z¨ ong´etlen z´ arhangok k´epz´esi hely¨ ukt˝ ol f¨ ugg˝ oen kisebb-nagyobb m´ert´ekben m´ odos´ıtj´ ak a szomsz´edos mag´ anhangz´ o form´ ansait. A m´ asodik form´ ans v´ altoz´ asa alapj´ an ezen hangkapcsolatokat regresszi´ os egyenesek (´ un. locus egyenlet) seg´ıts´eg´evel jellemezhetj¨ uk [9]. A regresszi´ os egyenesekb˝ ol megrajzolhat´ o az u ´n. locus egyenlet t´er, mely a z´ arhang v´eg´en ´es a m´ assalhangz´o k¨ ozep´en m´erhet˝ o m´ asodik form´ ans ´ert´ek´et veti ¨ossze [9, 2. ´abra]. Ezen ´abr´ an az egyes besz´edhangoszt´ alyok az artikul´ aci´ os hely¨ uk szerint elk¨ ul¨ on¨ ul˝ o csoportokban jelennek meg az F 2 v´ altoz´ asa miatt. N´eh´ any kor´ abbi k´ıs´erletben kimutatt´ ak, hogy ezen csoportok elk¨ ul¨ on¨ ul´es´ehez a szubglott´ alis rezonanci´ak is hozz´ aj´ arulnak, hasonl´ oan a mag´ anhangz´ okban okozott kategorikus elv´ alaszt´ ashoz [9,10]. Jelen kutat´ as sor´ an tov´ abb vizsg´aljuk a m´ assalhangz´ o-mag´anhangz´ o kapcsolatok hely´et a m´ asodik form´ ans ´ altal meghat´ arozott locus egyenlet t´erben, valamint az als´ o l´eg´ uti rezonanci´ ak csoportelv´alaszt´ o szerep´et is bemutatjuk. A k´ıs´erleteink sor´ an egy magyar anyanyelv˝ u besz´el˝o hangfelv´eteleit ´es szubglott´ alis felv´eteleit elemezz¨ uk. Bemutatjuk egy automatikus oszt´ alyoz´ o elj´ ar´ as m˝ uk¨od´es´et, amely az als´ o l´eg´ uti rezonanci´ ak ´es a m´ asodik form´ ans viszonya
alapj´ an csoportos´ıtja a m´ assalhangz´ o-mag´anhangz´ o besz´edhangkapcsolatokat. Az eredm´enyek seg´ıthetik a fonol´ ogiai megk¨ ul¨ onb¨ oztet˝ o jegyek szerep´enek meg´ert´es´et, illetve alkalmaz´ asra ker¨ ulhetnek a besz´el˝o normaliz´ al´ asban ´es besz´edfelismer´esben.
2. M´ odszerek A k´ıs´erleteink sor´ an egy magyar anyanyelv˝ u besz´el˝o (”B1”, 29 ´eves, f´erfi) besz´edfelv´eteleit ´es szubglott´ alis felv´eteleit elemezt¨ uk. A r¨ ogz´ıtett hanganyagot els˝ osorban akusztikai szempontb´ ol vizsg´altuk. 2.1. Besz´ edfelv´ etelek A felv´etel sor´ an ”B1” besz´el˝o ”OCVbO” t´ıpus´ u logatomokat olvasott fel egy csendesszob´ aban. A logatomok els˝ o m´ assalhangz´ oja az ¨osszes z¨ ong´es ´es z¨ ong´etlen z´ arhangot tartalmazta (labi´ alisok: [b,p], alveol´ arisok: [d,t], vel´arisok: [g,k] ´es palat´ alisok: [é,c]). A k¨ oz´eps˝ o hangs´ ulytalan sz´ otagban mind a 14 magyar mag´ anhangz´ o szerepelt ([O,a:,o,o:,u,u:,E,e:,i,i:,ø,ø:,y,y:]). A logatomokat a besz´el˝o v´eletlenszer˝ u sorrendben olvasta fel, mindegyiket t´ızszer, ´ıgy ¨osszesen 1120 logatomot kiejtve. A besz´edhangot EMC 100 kondenz´ ator mikrofonnal r¨ ogz´ıtett¨ uk, mely a felv´etel sor´ an a besz´el˝o ajkait´ ol kb. 15 cm-re helyezkedett el. Az elhangzott anyagot 48 kHz-es mintav´etelez´essel digitaliz´ altuk Terratex DMX 6 Fire USB k¨ uls˝ o hangk´ arty´ aval, a Wavesurfer programot haszn´ alva [13]. 2.2. Form´ ansm´ er´ esek Az ”OCVbO” logatomok hanghat´ arait a besz´edfelv´etel ´es a felolvasott sz¨ oveg alapj´ an automatikus m´ odszerrel hat´aroztuk meg, egy besz´edfelismer˝ ot asodik form´ ans frekvenci´ akat k´enyszer´ıtett u ¨zemm´ odban haszn´ alva [12]. A m´ Praat seg´ıts´eg´evel [1] m´ert¨ uk automatikusan, a z´ arhang v´eg´en (F 2msh , a hangid˝ otartam 95%-´ an´ al), valamint a m´ asodik mag´ anhangz´ o k¨ ozep´en (F 2mgh , a hangid˝ otartam 50%-´ an´ al). Az automatikus form´ ansm´er´es eredm´eny´en ezut´ an k´ezi ellen˝ orz´est v´egezt¨ unk: manu´ alisan megvizsg´ altuk az ´atlagost´ ol jelent˝ osen elt´er˝ o eseteket, k¨ ul¨ on-k¨ ul¨ on az egyes CV csoportokra. A m´ assalhangz´okban ´es mag´ anhangz´ okban m´ert form´ ans´ert´ekek medi´ anjait az 1. t´ abl´azat tartalmazza. 2.3. Szubglott´ alis felv´ etelek Egy m´ asik felv´etel sor´ an az als´ o l´eg´ uti rendszer jel´et is felvett¨ uk csendes szob´ aban, ”B1” besz´el˝ ot˝ ol. Am´ıg a besz´el˝o felolvasott n´eh´ any mondatot, a besz´edhangj´ at ´es als´ o l´eg´ uti jel´et r¨ ogz´ıtett¨ uk. A besz´edfelv´eteleket jelen k´ıs´erlet sor´an nem haszn´ altuk fel. A szubglott´ alis jelet egy K&K HotSpot gyorsul´ asm´er˝o eszk¨ oz seg´ıts´eg´evel vett¨ uk fel, amely a besz´ed sor´an a besz´el˝o nyak´ ara volt szor´ıtva, a pajzsporc f¨ ol´e. A jelet 8 kHz-es mintav´etelez´essel, Terratex DMX 6 Fire USB k¨ uls˝ o hangk´ arty´ aval digitaliz´ altuk a Wavesurfer programmal.
Els˝ o
H´ ats´ o
1. t´ abl´azat. ”B1” besz´el˝ o besz´edfelv´etelein m´ert F 2msh ´es F 2mgh ´ert´ekek medi´ anjai (az ´ert´ekek Hz-ben ´ertend˝ ok). Az F 2msh ´ert´ekeket a z´ arhangok 95%-´ an´ al, az F 2mgh ´ert´ekeket a mag´ anhangz´ ok 50%-´ an´ al m´ert¨ uk.
O o o: u u: a: E ø ø: y y: e: i i:
Labi´ alis b p 1045 1435 830 1304 817 1374 805 1486 825 1435 1236 1655 1518 1726 1348 1661 1518 1726 1594 1841 1708 1899 1769 1894 1939 2022 2014 2025
F 2msh Alveol´ aris Vel´ aris d t g k 1074 2022 1066 1001 843 1651 878 841 853 1632 782 793 852 1703 807 789 805 1690 784 798 1714 2001 1752 1266 2021 2181 2101 1542 1374 2076 1524 1390 1635 2055 1688 1525 1730 2149 1809 1569 1796 2198 1961 1774 2112 2242 2299 1997 2242 2225 2292 1956 2235 2217 2266 2308
Palat´ alis é c 1560 2058 1514 1714 1499 1860 1587 1899 1526 2035 1638 2106 1753 2179 1695 2018 1729 2007 1860 2116 1934 2149 1880 2264 1947 2244 1945 2309
Labi´ alis b p 1056 1251 797 978 651 691 691 878 619 712 1478 1506 1678 1716 1433 1500 1659 1680 1803 1904 1953 2002 2278 2302 2209 2281 2317 2380
F 2mgh Alveol´ aris Vel´ aris d t g k 1114 1295 1095 1037 875 1003 845 786 675 720 661 633 749 919 712 686 640 691 644 552 1593 1560 1564 1504 1798 1846 1795 1706 1475 1583 1477 1446 1600 1702 1621 1602 1740 1909 1782 1824 1824 1927 1849 1878 2288 2306 2300 2308 2300 2255 2258 2240 2409 2334 2357 2312
Palat´ alis é c 1197 1322 958 1036 674 703 849 976 678 728 1527 1541 1678 1812 1500 1613 1703 1663 1975 1881 1911 1848 2287 2296 2274 2190 2358 2358
2.4. Szubglott´ alis rezonancia m´ er´ es A szubglott´ alis jelb˝ ol manu´ alis m´ odon, a Wavesurfer program seg´ıts´eg´evel m´ert¨ uk az els˝ o h´ arom szubglott´ alis rezonancia ´ert´ek´et. A 3. ´abra egy p´elda spektrumot mutat ”B1” gyorsul´ asm´er˝ o felv´etel´eb˝ ol, melyen l´ athat´ o, hogy az SGR m´er´es a form´ ansm´er´eshez hasonl´ oan, a spektrumbeli cs´ ucsok leolvas´as´ aval t¨ ort´enik. Az SGR meghat´ aroz´ as´ anak m´ odszer´er˝ ol r´eszletesebb le´ır´as olvashat´ o [2,8]-ben. A hull´ amform´ aban 20 helyen m´ert¨ uk meg az SGR ´ert´ekeket, az ¨osszes´ıtett adatok a 2. t´ abl´ azatban tal´ alhat´ oak.
-10 -20 -30 -40 -50 -60 -70 -80 -90 -100 0.5
1.0
1.5
2.0 2.5 Frekvencia (kHz)
3.0
3.5
3. ´abra. P´elda LPC spektrum ”B1” besz´el˝o gyorsul´ asm´er˝ o felv´etel´eb˝ ol. A spektr´ alis cs´ ucsok (454 Hz, 1211 Hz, 2023 Hz ´es 3067 Hz) a szubglott´ alis rezonanci´ak ´ert´ekei. Az ´ abr´ an l´ athat´ o Sg1 ´ert´eke meglehet˝ osen alacsony a szakirodalmi adatokhoz k´epest [15].
2. t´ abl´azat. ”B1” besz´el˝ o gyorsul´ asm´er˝ o felv´etel´eben m´ert SGR ´ert´ekeinek adatai. A tov´ abbiakban a medi´ an ´ert´ekeket haszn´ altuk fel. Sg1 Sg2 Sg3 ´ Atlag 545 Hz 1241 Hz 2027 Hz Medi´ an 554 Hz 1244 Hz 2022 Hz Sz´ or´ as 60 Hz 42 Hz 145 Hz
3. Eredm´ enyek A form´ ansm´er´esek alapj´ an megvizsg´ altuk ”B1” besz´el˝o locus egyenlet ter´et, a szubglott´ alis rezonanci´ ak szerep´et kiemelve. Ezut´ an egy oszt´ alyoz´ o seg´ıts´eg´evel vizsg´altuk a k¨ ul¨ onb¨ oz˝ o CV csoportok elv´ alaszthat´ os´ ag´ at. 3.1. Locus egyenlet t´ er ”B1” besz´el˝ o F 2 ´es SGR adatai alapj´ an elk´esz´ıtett¨ uk a locus egyenlet ter´et, amely a 4. ´ abr´ an l´ athat´ o m´ odon veti ¨ ossze az F 2msh ´es F 2mgh ´ert´ekeket. Amint az ´abra mutatja, a locus egyenletek ter´eben a CV kapcsolatok elk¨ ul¨ on¨ ulnek, az F 2msh -F 2mgh p´ arok a m´ assalhangz´ o ´es a mag´ anhangz´ o k´epz´esi hely´enek megfelel˝ o csoportokban jelennek meg. Ezen csoportokat a szubglott´ alis rezonanci´ ak hat´arolj´ ak: a f¨ ugg˝ oleges Sg2 az el¨ol illetve h´ atul k´epzett mag´ anhangz´ ok k¨ oz´e ´ekel˝odik, az Sg3 az el¨ ol k´epzett ajakr´eses nem-als´ o mag´ anhangz´ okat v´ alasztja el a t¨ obbi el¨ol k´epzett˝ ol. A v´ızszintes Sg2 azokat a labi´ alis ´es vel´aris m´ assalhangz´ okat k¨ ul¨ on´ıti el, amelyeket h´ atul k´epzett mag´ anhangz´ o k¨ ovet. A v´ızszintes Sg3 szerepe kisebb m´ert´ek˝ u. Az ´abr´ an hat tartom´ anyt jel¨ olt¨ unk sz´ amokkal, mindegyik t´eglalap egy-egy CV oszt´ alynak felel meg, melyeket az SGR-ek hat´arolnak: 1. Labi´ alis ´es vel´ aris m´ assalhangz´ ok, h´ atul k´epzett mag´ anhangz´ okkal 2. Alveol´ aris ´es palat´ alis m´ assalhangz´ ok, h´ atul k´epzett mag´ anhangz´ okkal 3. Alveol´ aris, labi´ alis ´es vel´aris m´ assalhangz´ ok, el¨ol k´epzett mag´ anhangz´ okkal, kiv´eve [i, i:, e:] 4. Alveol´ aris ´es labi´ alis m´ assalhangz´ ok, el¨ol k´epzett ajakr´eses nem-als´ o mag´ anhangz´ okkal ([i, i:, e:]) 5. Palat´ alis m´ assalhangz´ ok, el¨ol k´epzett mag´ anhangz´ okkal, kiv´eve [i, i:, e:] 6. Palat´ alis ´es vel´ aris m´ assalhangz´ ok, el¨ol k´epzett ajakr´eses nem-als´ o mag´ anhangz´ okkal ([i, i:, e:]) Ezek a tartom´ anyok r´eszben k¨ ul¨ onb¨ oznek az amerikai angol nyelven v´egzett k´ıs´erletben bemutatotthoz k´epest [10]. Az angol nyelvben a vel´aris m´ assalhangz´ o - el¨ol k´epzett mag´ anhangz´ o kapcsolatokban a F 2msh ´ert´ek nagyobb, mint az Sg3. A magyar nyelvre v´egzett k´ıs´erlet¨ unkben csak az [i, i:, e:] mag´ anhangz´ ok
6
5
2
3
4
1
4. ´abra. ”B1” besz´el˝ o locus egyenlet tere. 1120 adatpont l´ athat´ o, melyek a logatomokban vizsg´alt CV kapcsolatok m´ asodik form´ ansai alapj´ an ker¨ ultek ´abr´ azol´ asra. A k¨ ul¨ onb¨ oz˝ o k´epz´esi hely˝ u m´ assalhangz´ okat ´es mag´ anhangz´ okat elt´er˝ o sz´ınnel ´es alakkal jel¨ olt¨ uk. A CV kapcsolatok F 2msh -F 2mgh p´ arjai a m´ assalhangz´ o ´es mag´ anhangz´ o k´epz´esi hely´enek megfelel˝ oen elk¨ ul¨ on¨ ul˝ o csoportokban jelennek meg, melyeket 1–6 sz´ amokkal jel¨ olt¨ unk. A v´ızszintes ´es f¨ ugg˝ oleges vonalak a m´ert szubglott´ alis rezonanci´ ak hely´et jelzik.
eset´en igaz ez, a t¨ obbi vel´ aris - els˝ o kapcsolatban az F 2msh ´ert´ek kisebb Sg3n´ al. A palat´ alis m´ assalhangz´ okat is vizsg´altuk k´ıs´erlet¨ unkben, amelyek az angol nyelvben nem fordulnak el˝ o. an az SGR-ek j´ ol elk¨ ul¨ on´ıthet˝o csoportokra osztj´ak a CV A 4. ´abra alapj´ kapcsolatokat m´ asodik form´ ansuk alapj´ an. Ez csak n´eh´ any kisebb CV halmaz eset´en nem teljes¨ ul. A palat´ alis - h´ ats´ o kapcsolatok az F 2msh ir´ anyban nagy teret foglalnak el, n´eh´ any adatpont eset´en az F 2msh ´ert´ek magasabb az Sg3-n´ al. A palat´ alisok egy j´ ol elk¨ ul¨ on¨ ul˝ o csoportja tal´ alhat´ o a f¨ ugg˝ oleges Sg2 ´es a v´ızszintes Sg3 k¨ oz¨ ott (melyekre az F 2mgh ´ert´ek nagyobb Sg2-n´el). A legt¨ obb palat´ alis - el¨ol k´epzett CV kapcsolat eset´en az F 2msh nagyobb Sg3-n´ al, m´ıg a ”palat´ alis - els˝ o (kiv´eve [i, i:, e:])” csoportnak k¨ or¨ ulbel¨ ul harmada ny´ ulik Sg3 al´ a. Azokban a CV kapcsolatokban, amelyekben a mag´ anhangz´ o [i, i:, e:] volt, a m´ assalhangz´ ok F 2 ´ert´eke 1600–2600 Hz k¨ oz¨ ott sz´ or´ odik, ´ıgy a 4-es ´es 6-os tartom´ any adatpontjai nehezen elk¨ ul¨ on´ıthet˝ oek (els˝ osorban a labi´ alisok tal´ alhat´ ok meg a tartom´ any sz´els˝ o ´ert´ekein´el is). 3.2. M´ assalhangz´ ooszt´ alyok locus egyenletei A k¨ ul¨ onb¨ oz˝ o artikul´ aci´ os hely˝ u CV hangkapcsolatokra jellemz˝o form´ ansmeneteket line´ aris regresszi´ o seg´ıts´eg´evel vizsg´altuk. Ezen locus abl´azatban egyenletek egy¨ utthat´oi, valamint a korrel´ aci´ os m´er˝ osz´ amok a 3. t´ tal´ alhat´ oak. A line´ aris regresszi´ os vizsg´alatok eredm´enyek´ent kider¨ ult, hogy a form´ ansmenetet le´ır´ o egyenlet meredeks´ege (m) ´es y-metszete (b) elt´er˝o a k¨ ul¨ onb¨ oz˝ o m´ assalhangz´ ocsoportokra. Az alveol´ arisok ´es palat´ alisok meredeks´ege 0,3 k¨ or¨ uli, m´ıg a labi´ alisok ´es vel´arisok eset´eben ez az ´ert´ek 1-hez k¨ ozel´ıt. A labi´ alisok ´es vel´ arisok F 2msh ´es F 2mgh ´ert´ekei k¨ oz¨ ott er˝ osebb a korrel´ aci´ o, abr´ an l´ athat´ o line´ arishoz k¨ ozel´ıt˝ o elhelyezked´es¨ uk is mutat. melyet a 4. ´ 3. t´ abl´azat. A k¨ ul¨ onb¨ oz˝ o artikul´ aci´ os hely˝ u m´ assalhangz´ ooszt´ alyok locus egyenleteinek liner´ ais regresszi´ os egy¨ utthat´oi ´es Pearson-f´ele korrel´ aci´ os m´er˝ osz´ amai. F 2msh = m · F 2mgh + b m Alveol´ aris 0,333 Labi´ alis 0,732 Palat´ alis 0,307 Vel´ aris 0,912
b 1184,350 301,220 1552,820 179,195
R2 0,768 0,915 0,628 0,936
3.3. CV kapcsolatok oszt´ alyoz´ asa A k´ıs´erletek sor´ an a [10]-ben bemutatott oszt´ alyoz´ o algoritmust haszn´ altuk fel, melynek seg´ıts´eg´evel lehets´eges a CV kapcsolatok automatikus oszt´ alyoz´ asa,
szubglott´ alis rezonanci´ ak alapj´ an. Mivel a magyar nyelv m´ assalhangz´ omag´ anhangz´ o kapcsolatai r´eszben k¨ ul¨ onb¨ oznek az angol´et´ ol, az algortimuson kisebb v´ altoztat´asokat v´egezt¨ unk, ´ıgy p´eld´ aul a palat´ alis m´ assalhangz´ okat is abr´ an l´ athat´ o 1–6 tartom´ anyokat vett¨ uk vizsg´altuk. Az oszt´ alyoz´ as sor´an a 4. ´ figyelembe. Ezen r´egi´ ok hat´arait a form´ ansok (F 2msh ´es F 2mgh ) ´es szubglott´ alis rezonanci´ ak (Sg2 ´es Sg3) k¨ oz¨ otti egyenl˝ otlens´egek seg´ıts´eg´evel ´ırhatjuk le, melyek a 4. t´ abl´ azatban tal´ alhat´ oak.
4. t´ abl´ azat. A CV oszt´ alyok hat´arait megad´ o egyenl˝ otlens´egek. Tartom´ any CV oszt´ aly 1. egyenl˝ otlens´eg 2. egyenl˝ otlens´eg 1 Labi´ alis, Vel´ aris + H´ ats´ o F 2msh < Sg2 F 2mgh < Sg2 2 Alveol´ aris, Palat´ alis + H´ ats´ o Sg2 < F 2msh < Sg3 F 2mgh < Sg2 3 Alveol´ aris, Labi´ alis, Vel´ aris + Els˝ o F 2msh < Sg3 Sg2 < F 2mgh < Sg3 4 Alveol´ aris, Labi´ alis + [i, i:, e:] F 2msh < Sg3 Sg3 < F 2mgh 5 Palat´ ais + Els˝ o Sg3 < F 2msh Sg2 < F 2mgh < Sg3 6 Palat´ alis, Vel´ aris + [i, i:, e:] Sg3 < F 2msh Sg3 < F 2mgh
C´elunk az 1–6 tartom´ anyok optim´ alis klasszifik´ aci´ oj´ anak megtal´ al´ asa volt. f ´ert´ek´et 1000 ´es 1500 Hz k¨ Ennek ´erdek´eben az Sg2 oz¨ ott folyamatosan n¨ ovelve f ´ert´ek´et ”B1” vizsg´altuk az oszt´ alyoz´ as tal´ alati ´es t´eves riaszt´ asi ar´ anyait. Az Sg3 f = 1, 6254 · Sg2). f besz´el˝o Sg2/Sg3 ar´ anya alapj´ an sz´ am´ıtottuk (Sg3 abra mutatja az oszt´ alyoz´ as tal´ alati ´es t´eves riaszt´ asi ar´anyait az Az 5. ´ f f¨ Sg2 uggv´eny´eben. Az ¨ osszes CV kapcsolatra vonatkoz´ o optim´ alis klasszifik´ aci´ o 1260 Hz eset´en t¨ ort´enik. Emellett elt´er˝ o a legmagasabb tal´ alati ar´ any a 4-es tartom´ any eset´en. A 4. ´ abr´ at megvizsg´ alva azt l´ athatjuk, hogy a 4-es ´es 6-os tartom´ anyban l´ev˝ o CV kapcsolatok k¨ oz¨ ott sok az ´atfed´es, emiatt fordulhat el˝o, f eset´en (kb. hogy a 4-es tartom´ any eset´en az optim´ alis szepar´aci´ o magasabb Sg2 1350 Hz) megy v´egbe. f Az optim´ alis oszt´ alyoz´ as (Sg2=1260 Hz) eset´en az ¨osszes´ıtett eredm´enyeket abl´azat mutatja. Az ¨ osszes CV kapcsolatra a tal´ alati ar´ any 86,6%, m´ıg a az 5. t´ t´eves riaszt´ asi ar´ any 2,3%. A 4-es tartom´ any eset´en a legalacsonabb a tal´ alati ar´ any, a kor´ abban le´ırtak miatt. Ezut´ an megvizsg´ altuk az oszt´ alyoz´ ast ”B1” besz´el˝o szubglott´ alis jel´eben manu´ alisan m´ert SGR ´ert´ekek medi´ anjai alapj´ an (Sg2=1244 Hz, Sg3=2022 Hz). A tal´ alati ´es t´eves riasz´asi ar´ anyokat a 6. t´ abl´azat mutatja k¨ ul¨ on-k¨ ul¨ on az egyes kateg´ ori´ akra, illetve ¨ osszes´ıtve is. Az ¨ osszes vizsg´alt CV kapcsolatra a tal´ alati ar´ any 85,5%, m´ıg a t´eves riaszt´ asi ar´ any 2,4%. Ezek az ´ert´ekek nagyon k¨ ozel vannak az optim´ alis elv´ alaszt´ ashoz, mivel a m´ert Sg2 ´ert´eke (1244 Hz) szinte f megegyezik az optim´ alis oszt´ alyoz´ as sor´an kapott Sg2-vel (1260 Hz).
75 50 25 0 75 50 25 0 75 50 25 0 75 50 25 0 75 50 25 0 75 50 25 0
25
Összes CV kapcsolat
Összes CV kapcsolat
0 25
1
2 3
4
Téves riasztási arányok (%)
Találati arányok (%)
100 75 50 25 0
1
0 25
2
0 25
3
0 25
4
0
5
25
5
0
6 1100
1200 1300 f (Hz) Sg2
1400
25 0
6 1100
1200 1300 f (Hz) Sg2 Sg2
1400
f f¨ 5. ´abra. Az oszt´ alyoz´ as eredm´enye az Sg2 uggv´eny´eben. A legfels˝ o r´esz´ abr´ ak mutatj´ ak az ¨ osszes´ıtett tal´ alati ´es t´eves riaszt´ asi ar´ anyokat, az als´ obb ´abr´ ak pedig az 1–6 tartom´ anyokhoz tartoz´ o eredm´enyeket. 5. t´ abl´azat. CV kapcsolatok oszt´ alyoz´ as´ anak tal´ alati ´es t´eves riaszt´ asi ar´ anyai, az f ´ert´ekkel sz´ f = 1260 Hz, CV jel¨ optim´ alis Sg2 amolva. (Sg2 oli az ¨osszes eredm´enyt, 1–6 az egyes tartom´ anyokat.) CV 1 2 3 4 5 6 Tal´ alati ar´ any 86,6% 98,5% 88,5% 93,6% 74,2% 69,2% 95,8% T´eves riaszt´ asi ar´ any 2,3% 0% 0,2% 7,1% 1,3% 2,1% 3,2%
6. t´ abl´azat. CV kapcsolatok oszt´ alyoz´ as´ anak tal´ alati ´es t´eves riaszt´ asi ar´ anyai, a m´ert SGR ´ert´ekekkel sz´ amolva. (Sg2=1244 Hz) CV 1 2 3 4 5 6 Tal´ alati ar´ any 85,5% 98,5% 87% 91,7% 65% 74,2% 96,7% T´eves riaszt´ asi ar´ any 2,4% 0% 0,2% 5,7% 1,3% 2,9% 4,3%
4. K¨ ovetkeztet´ esek Jelen kutat´ as sor´ an egy k´ıs´erletsorozatot mutattunk be, amely egy besz´el˝o logatomfelv´eteleib˝ ol sz´ armaz´ o CV kapcsolatok ´altal defini´ alt locus egyenlet teret elemzett, illetve vizsg´alta a szubglott´ alis rezonanci´ ak ´altal okozott elv´ alaszt´ ast. El˝ osz¨ or megvizsg´ altuk ”B1” besz´el˝o locus egyenlet ter´et, majd a CV csoportok artikul´ aci´ os helye alapj´ an hat tartom´ anyt defini´ altunk, melyek hipot´eziseink szerint az SGR-ek seg´ıts´eg´evel elk¨ ul¨ on´ıthet˝oek. A k¨ ul¨ onb¨ oz˝ o m´ assalhangz´ o oszt´ alyok line´ aris regresszi´ os egyenleteit (´ un. locus egyenlet) is vizsg´altuk. A [10]ben bemutatott oszt´ alyoz´ o algoritmust a magyar nyelv hangjainak megfelel˝ oen m´ odos´ıtottuk, ´es alkalmaztuk a CV adathalmazra. A m´ert SGR ´ert´ekek alapj´ an t¨ ort´en˝ o oszt´ alyoz´ ast ¨ osszehasonl´ıtottuk az optim´ alis tal´ alati ar´ anyt ´es t´eves riaszt´ asi ar´ anyt okoz´ o klasszifik´ aci´ oval. A szubglott´ alis rezonancia alap´ u automatikus m´ assalhangz´ o-mag´ anhangz´ o hangkapcsolat oszt´ alyoz´ as ”B1” besz´el˝o eset´en az optim´ alishoz k´epest mind¨ ossze 1%-kal alacsonyabb a tal´ alati ar´ anyt o eredm´enyezett. Ez a [10]-ben bemutatott amerikai angol k´ıs´erlethez hasonl´ eredm´enyt jelent. A tov´ abbi kutat´ as c´elja m´ as SGR m´er´esi lehet˝ os´egek keres´ese. [10] szerint a besz´edfelv´etelb˝ ol is meghat´ arozhat´ o az Sg2 ´ert´eke, de ez viszonylag pontatlan, t´ avol van a gyorsul´ asm´er˝ ovel m´ert SGR ´ert´ekekt˝ ol. [18]-ben egy egyedi eszk¨ ozt k´esz´ıtettek a szubglott´ alis jel felv´etel´ere, ´es az als´ o l´eg´ uti rezonanci´ ak automatikus m´er´es´evel k´ıs´erleteztek, azonban ez t´ avol volt a manu´ alisan m´ert ´ert´ekekt˝ ol. Amennyiben a szubglott´ alis rezonanci´ ak m´er´ese egyszer˝ ubben megoldhat´ o lesz, az itt bemutatott SGR alap´ u CV oszt´ alyoz´ as tetsz˝ oleges besz´el˝o eset´en alkalmazhat´ ov´ a v´ alik. Az itt bemutatott k´ıs´erlet sor´an csak egy magyar nyelv˝ u besz´el˝o felv´eteleit vizsg´altuk. A tov´ abbiakban ´erdemes lenne t¨ obb besz´el˝o hangfelv´eteleit is elemezni, megvizsg´ alva m´ asok locus egyenlet ter´enek ´es szubglott´ alis rezonanci´ ainak kapcsolat´ at. A szubglott´ alis rezonanci´ akat m´ ar sikerrel alkalmazt´ ak a besz´el˝o norul hozz´ aj´ arulhatnak a maliz´ al´ asban [16,17], az eredm´enyeink ezen k´ıv¨ besz´edfelismer´eshez is.
5. K¨ osz¨ onetnyilv´ an´ıt´ as A szerz˝ ok k¨ osz¨ onet¨ uket fejezik ki a t´ amogat´ oknak (NKFP 2/034/2004, Jed´ lik OM-00102/2007, TAMOP-4.2.2-08/1/KMR-2008-0007), a k´ıs´erletben r´eszt vev˝ o adatk¨ ozl˝ onek, valamint B˝ ohm Tam´asnak a hangfelv´etelek rendelkez´esre bocs´ at´ as´ a´ert. K¨ ul¨ on k¨ osz¨ onet illeti Steven M. Lulichot a szubglott´ alis rezonanci´ak t´em´ aj´ anak r´eszletes ismertet´es´e´ert, valamint a cikk jav´ıt´ as´ ara ir´ anyul´ o javaslatai´ert ´es megjegyz´esei´ert.
Hivatkoz´ asok 1. Boersma, P. and Weenink, D.: Praat (Version 5.1.19), http://www.praat.org, (2009). 2. Chi, X. and Sonderegger, M.: Subglottal coupling and its influence on vowel formants, JASA 122, 1735–1745, (2007). 3. Csap´ o, T. G., B´ ark´ anyi, Zs., Gr´ aczi, T. E., B˝ ohm, T. and Lulich, S. M.: Relation of formants and subglottal resonances in Hungarian vowels, Proc. Interspeech, 484– 487, (2009). 4. Gray, H.: Anatomy of the human body, Philadelphia: Lea & Febiger, (1918). 5. G´ osy, M.: Fonetika, a besz´ed tudom´ anya, Osiris Kiad´ o, Budapest, (2004). 6. Jung, Y.: Subglottal effects on the vowels across language: Preliminary study on Korean, JASA 125, 2638, (2009). 7. Lulich, S. M., Bachrach, A. and Malyska, N.: A role for the second subglottal resonance in lexical access, JASA 122, 2320–2327, (2007). 8. Lulich, S. M.: Subglottal resonances and distinctive features, J. Phon., doi:10.1016/j.wocn.2008.10.006, (2009). 9. Lulich, S. M.: On the relation between locus equations and subglottal resonances, POMA 5, 060003, (2009). 10. Lulich, S. M. and Chen, N. F.: Automatic classification of consonant-vowel transitions based on subglottal resonances and the second formant, POMA 6, 060005, (2009). 11. Madsack, A., Lulich, S. M., Wokurek, W., and Dogil, G.: Subglottal resonances and vowel formant variability: A case study of High German monophthongs and Swabian diphthongs, Proc. LabPhon11, 91–92, (2008). 12. Mihajlik, P., R´ev´esz, T. and Tatai, P.: Phonetic Transcription in Automatic Speech Recognition, Acta Linguistica Hungarica, Vol. 49. (3-4), 407–425, (2002). 13. Sj¨ olander, K. and Beskow, J.: Wavesurfer (Version 1.8.5), http://www.speech.kth.se/wavesurfer, (2009). 14. Stevens, K. N.: On the quantal nature of speech, J. Phon. 17, 3–45, (1989). 15. Stevens, K. N.: Acoustic Phonetics, MIT Press: Cambridge, MA, (1998). 16. Wang, S., Lulich, S. M. and Alwan, A.: A reliable technique for detecting the second subglottal resonance and its use in cross-language speaker adaptation, Proc. Interspeech, 1717–1720, (2008). 17. Wang, S., Lee, Y.-H. and Alwan, A.: Bark-shift based nonlinear speaker normalization using the second subglottal resonance, Proc. Interspeech, 1619–1622, (2009). 18. Wokurek, W. and Madsack, A.: Comparison of Manual and Automated Estimates of Subglottal Resonances, Proc. Interspeech, 1671–1674, (2009).