Mérnöki tervezés beszámoló
Dolgozat címe: Taktilis kijelző alkalmazások Konzulens neve: Tihanyi Attila
Hallgató neve: Eszter András Leadás dátuma: 2005. december
Tartalomjegyzék
Feladat rövid ismertetése
4
Bevezetés
5
Tapintás
6
Az ujjak, mint érzékszervek
6
A tapintás tulajdonságai
8
A tapintás érzékenysége és pontossága
8
A tapintási ingerlés lokalizációja
9
Beállítódás és tapintási érzékenység
10
A tapintás élettana
12
A tapintási rostok
12
A rostok tevékenysége és a tapintási élmények
14
Az érintési ingerlés által kiváltott idegi válaszok és észlelési ítéletek
14
Az idegi ingerlés által kiváltott tapintási minőségek
15
A tapintási receptorok
15
Az emberi beszéd
18
Beszédképzés
18
Alaptényezők, építőkockák
19
A beszédhangok osztályozása
21
Magánhangzók
21
Képzés
21
Formánsok
22
Formánsszerkezet
22
Mássalhangzók
23
Osztályozása
23
Zárhangok
23
B
24
D
24
G
25
Gy
26
2
Zár és réshangok
26
Dzs
27
Dz
27
Réshangok
27
S
28
Z
28
V
29
Zs
29
Nazálisok
29
Taktilis kijelző
30
A taktilis kejelzés
30
A tapitás felhasználása
31
Taktilis kijelzőtípusok
32
A rendszer tervezése
33
Az elkészített modell
35
Számítógépes szimuláció
35
Példamondat
38
Programkód
40
Tapasztalatok a taktilis kijelző használatáról
41
Továbbfejlesztési lehetőségek
41
Irodalomjegyzék
43
3
A feladat rövid ismertetése, célkitűzés A feladat olyan vibrotaktilis eszköz elkészítése, amely halláskárosultak és siketek számára nyújt segítséget a távközlésben. A készülék mobil alkalmazásokhoz kapcsolódó használata, megkönnyíti a felhasználót a számukra megfelelően átalakított beszédhang pontosabb felismerésében. A több paraméter kijelzésére alkalmas eszköz megalkotásában törekedni kell a pontos és real-time kijelzésre, a készülék kis, hordoz mérettel kell,hogy rendelkezzen, a csatlakoztatás és alkalmazhatóság tekintetében független és univerzális legyen, kezelése könnyű és egyértelmű legyen.
4
Bevezetés Az emberi élet egyik legalapvetőbb, legrégibb kommunikációs formája a beszéd. Az emberiség története során egyre bővült a beszédre vonatkozó jellemzők, a beszéd tulajdonságainak, formájának spektruma. Nemcsak a különféle nyelvek és kommunikációs formák kialakulása könnyítette meg az ember életét a földön, hanem a technika fejlődésével „korlátlannak” mondható lehetőségek tárulkoztak föl az emberiség számára ezen a téren. Mind a hírközlésben, mind a távközlésben meg vannak azok a technikai vívmányok, amelyek segítségével a ma embere könnyedén élheti az életét, hiszen a rádió, a tv, az Internet percek alatt az információ felfoghatatlan mennyiségét zúdítja a nyakába, a telekommunikáció segítségével pedig olyan térbeli határokat tud átlépni, melyek méreteiben sokszor túl is haladják az ember felfogóképességét. Azonban vannak a társadalomnak olyan szereplői, akik önhibájukon kívül, kimaradnak a kommunikáció egyes, fontosnak rangsorolható részeiből. Ez a réteg a halláskárosultak, illetve a siketek rétege, akik sok esetben csak részben vagy egyáltalán nem tudják használni a fent említett kommunikációs csatornákat. Az ő számukra a megoldás a már létező alkalmazások kibővítése az új technológiák felhasználásával, melyeket a távközlés, az informatika, az információs technológia nyújt az emberiség számára. A siketek szájról olvasási képességei nagyon kifinomultak, a hallók számára elképzelhetetlenül hatékonyak. A szájmozgásról azonban számos beszédinformáció nem olvasható le. A nem látható, de a beszédképzés és beszédmegértés szempontjából alapvető információ a zöngés zöngétlen hangképzés és a nyelv helyzete. A hangszalagok rezgése kívülről nem látható, ezért szájról olvasva az azonos képzésű zöngés és zöngétlen hangpárok nem különíthetők el (például baba-papa, feltölt feldőlt). Hasonlóan a nyelvhelyzettel meghatározott felpattanó zárhangok nem különböztethetők meg szájról olvasással (például tati-kati). Ugyancsak érzékelhetetlen szájról olvasásnál, hogy történik-e adott szájnyílásnál levegő átfúvással keltett zaj vagy sem. Például (sok-ok). A hangjelből kinyerhetők olyan képzéshez kapcsolódó jellemzők, amelyek a nem látható képzési mozzanatokhoz kapcsolódnak és a siketek megértését segítik. Annak érdekében, hogy az alapvető érzékelési csatornát, a látást ne zavarjuk, ezért a többletinformációt más érzékszerv segítségével lehet átadni. Például szóba jöhet a tapintás alapú információ átadás. Az átviendő információ időben változó mennyiségeket jelent, ezért időben változó intenzitású rezgés ezeket közvetíteni képes.
5
A vibrotaktilis ingerlés a hanginformáció, így a beszéd bemutatására is alkalmas siketeknél. Az akusztikus energiát vibrotaktilis ingerek mintázataivá alakítják. A vibrotaktilis ingerlés, amelyet gyors ütögetés sorozatnak lehet érezni a bőrön, kiemeli az akusztikus átmeneteket a hang kezdetén és végén és a beszédhang különböző jellemzőit, tulajdonságait. Amikor ezek a hangok szavak és mondatok, akkor az eszköz viselője könnyebben tudja szegmentálni a beszédfolyamot, ami elősegíti a szájról olvasást. Jelen dolgozat témája egy olyan eszköz kifejlesztése, mely segítséget nyújt a hallássérültek számára készülő beszédfeldolgozó és megjelenítő eszköz használata közben, egyértelműbbé téve a felhasználó számára az eszköz által közvetített információt. A fejlesztés során több tudományterület kapcsolódik össze, a neuróbiológia, a beszédfelismerés, a jelfeldolgozás, a mikroelektronika mind részét képezik a munkának és a készülőben lévő szerkezetnek. Az eszköz alapgondolata a következő: az emberi beszédhangot a készülék átalakítja rezgésekké, melyek a beszédhang egy meghatározott tulajdonságát jelenítik meg mechanikai mozgás formájában. A munkafolyamat során a fent említett tudományágak témához kapcsolódó részeinek bővebb megismerése elengedhetetlen volt. A fejlesztés során az alapok – neuróbiológiai vonatkozások, beszédfeldolgozási és nyevtudományi alapok – tanulmányozása után a már meglévő taktilis kijelzős technológiák vizsgálata következett. A már meglévő technológiák közül lett kiválasztva egy pár a megvalósításra, melyek közül modell elkészítése és tesztelés útján lett kiválasztva a végső megoldás. További célok a kiválasztott megoldás hardveres megvalósítása. A soron következő részek tartalmazzák a témához kapcsolódó háttér információkat, melyek ismerete szükséges az elv és megvalósítási gondolat megértéséhez.
Tapintás Az ujjak, mint érzékszervek A tárgyak detektálásakor és felismerésekor erősen támaszkodunk látásunkra, a tapintásnak megvan a maga megkülönböztető hozzájárulása. A tapintás segít a közeli tárgyak azonosításában azzal, hogy információt nyújt ezeknek a tárgyaknak az alakjáról, méretéről és súlyáról. A tapintás ad információt a tárgy felszínének textúrájáról és mechanikai konzisztenciájáról - nem biztos, hogy ez a két tulajdonság szemmel látható. Például a
6
durvaság, simaság vagy bolyhosság finom perceptuális különbségei a tárgyak textúrájában fizikai különbségeknek felelnek meg. Ehhez hasonlóan, a puhaság, keménység és rugalmasság perceptuális különbségei a tárgy összenyomhatóságának különbségeiből fakadnak. Az érintésnek, a tapintásnak fontos jelentősége van az emberi életében. Vezető szerepet játszik a fejlődésben, a társas kommunikáció univerzális eszköze, a vak, látás –sérült emberek számára a kapcsolatot jelenti a külvilággal. Bizonyos értelemben az érintést fel lehet úgy is fogni, mint a legmegbízhatóbb érzékleti modalitást. Amikor az érzékszervek ellentmondanak egymásnak, akkor általában az érintés a végső döntő bíró. Képzeljük el, hogy kinyúlunk egy látott tárgy felé, de a semmibe nyúlunk. A kezdeti megdöbbenés után valószínűleg úgy döntünk, hogy a látási rendszerünket vezették félre – más szóval, a tapintás sokkal megbízhatóbbnak tűnik, mint a látás. Filozófusok úgy gondolták, hogy a tapintás szolgáltatja az alapot ahhoz, hogy a látási üzeneteket kalibráljuk és értelmezzük. A tapintási érlékelés a testfelszín bármelyik részének ingerléséből fakadhat. Valóban, a bőrt úgy is lehetne jellemezni, mint a tapintás érzékének egyetlen nagy receptorát. De ha megtapintunk egy tárgyat, leggyakrabban a kezünk az ingerlés szerve. Az emberi kéz csodálatos és összetett képességei a test legértelmesebb részei közé emelik a kezet. Az emberi kézen lévő bőr mechanoreceptorok (a mechanikai nyomás vagy a bőr alakváltozására érzékeny receptorok) ezreit tartalmazza, valamint izmok összetett csoportját, amelyek vezetik az ujjakat, ahogy a tárgy télszínét letapogatják. A mechanoreceptorok kulcsszerepet játszanak a tárgyak olyan részleteinek elemzésében, mint a textúra; az izmok főleg akkor járulnak hozzá a tapintáshoz, amikor átfogóbb tulajdonságokat - például méret, súly, alak - kell elemezni. De akár átfogóbb, akár kisebb részleteket kell felfedezni, a kéz és az ujjbegyek közvetítik a leghasznosabb információkat a tárgyakról. A tapintás akkor a legpontosabb, ha az ujjak a szóban forgó tárgyon mozognak. David Katz (1925), a tapintás kutatásának egyik úttörője észrevette, hogy ha az ujjakat mozdulatlanul hagyjuk egy félszínes, akkor ez eltompítja azt a képességet, hogy érezzük a felszín téri ,jellemzőit. Ahogy Katz megjegyezte, ha az ujjainkat végigvisszük egy felszínen, ez fontos,jellegzetességeket árul el a félszín részletes topográfiájáról, olyan jellegzetességekről, amelyek elvesznek, ha az ujjak mozdulatlanok. Ahogy látni fogjuk, a tapintási érzékenységnek ez a javulása valószínűleg egy sor olyan tapintási receptor aktiválódását sót tükrözi, amelyek viszonylag inaktívak, amikor mozdulatlan ujjak érintkeznek mozdulatlan tárgyakkal.
7
A tapintás tulajdonságai
A tapintási élményeket a bőr valamilyen mechanikai megzavarása váltja ki, amit egy tárgyal való fizikai kontaktus okoz. A mechanikai zavar pontos természete az érintett tárgy fizikai tulajdonságaitól, illetve attól függően változik, hogy hogyan tapogatjuk le a tárgyat. Van itt néhány határozott észlelési minőség, amit a tapintási ingerlés okoz; minden minőség a tárgyak valamilyen tulajdonságának felel meg. A bőrben több különböző típusú receptor van, amelyek a bőr mechanikai változásaira érzékenyek. Ezek közül az úgynevezett mechanoreceptorok közül némelyek nagyon alkalmas arra, hogy a felszín durvaságáról vegyen fel információt, míg mások alkalmasabbnak tűnnek arra, hogy a tárgyak keménységét jelezzék. A tapintás érzékenysége és pontossága
Kísérletekkel sikerült meghatározta azt a legkisebb nyomást, amit érezni lehet a bőrön. Felfedezték, hogy a test különböző részeinek tapintási érzékenysége drámaian különbözik egymástól. Például az ajkak és (alig kisebb mértékben) az ujjhegyek rendkívül érzékenyek az érintésre; ezzel szemben a háton és a hason az érzékenység eléggé tompa. Érdekes módon a test minden részén a nők általában érzékenyebbek a könnyű érintésre, mint a férfiak. Az is jól ismert, hogy a tapintási érzékenység tompul, ha a bőrt lehűtik, részben azért, mert alacsonyabb hőfokon a bőr, és így a bőrben lévő receptorok kevésbé hajlékonyak. A tapintási érzékenységet olyan merev pálcával is meg lehet mérni, ami rezgést okoz a bőrön. A vibrotaktilis ingerlés a legerőteljesebb a 200 Hz körüli frekvenciákon (másodpercenként 200 nyomásváltozás). Nagyon alacsony frekvenciájú rezgéseknél (10-30 Hz-es tartományban) az érzékenységet nagyméretű pálcikával mérve kisebb érzékenységet talpasztalunk, mint kisméretű mérőpálcát használva. A mérőpálca méretétől függetlenül a rezgésre a tenyér a legérzékenyebb testrész, és nem az ujjak hegye. A tapintás egy másik tulajdonságát is meg lehet mérni, nevezetesen a tapintási pontosságot. Ezt hagyományosan a kétpont-küszöb teszttel mérik. A teszt megértéséhez képzeljük el, hogy egy körző két hegye a bőr szomszédos területeit ingerli. Azt a minimumtávolságot, amit még két külön pontnak érzékelünk képont-küszöbnek nevezzük. A kétpont-küszöböt alaposan megvizsgálták a test számos területén. Amikor az ujjbegyet vizsgálják, már 2 milliméteres távolságot is könnyen meg lehet különböztetni, a kézfejen 31-32 mm, az alkaron az éppen
8
megkülönböztethető távolság közelebb van a 30 milliméterhez, a háton a legkisebb megkülönböztethető távolság megnő 70 milliméterre. Ez a fajta pontosság erőteljesen csökken az életkorra. Azok a testrészek, melyeknek tapintási pontossága nagyon jó, szintén nagyon ,jó tapintási érzékenységgel rendelkeznek. Ugyanezek a helyek szintén nagyon jó lokalizációs képességgel rendelkeznek: amikor az ingert a bőr ilyen területére helyezzük, a megérintett terület helyét nagyon pontosan meg lehet becsülni. A bőrnek ezek a pontos, érzékeny területei sűrűn tartalmaznak mechanoreceptorokat, ezek a szuperérzékeny bőrterületek aránytalanul nagy képviselettel rendelkeznek az agykéregben.
1. ábra-A kétpont-küszöb meghatározására
2. ábra-Két-pont távolsági értékek
szolgáló eszköz vázlata.
A tapintási ingerlés lokalizációja
Bár úgy tűnik, hogy az érintés lokalizációja és a tapintás pontossága kapcsolódik egymáshoz, egy fontos területen különböznek egymástól: az a képesség, hogy a bőrbe nyomódó két mérőpálca relatív helyzetét megkülönböztessük, sokkal jobb, mint a fent ismertetett kétpont-küszöb módszerével mért téri feloldóképesség. Ennek a mérésére olyan kísérletet végeztek, melyben egyetlen pontot használtak, amit kissé,jobbra vagy balra helyezett el egy, a fémre szerelt referenciavonaltól. Ezzel az ingerléssel a mindössze 0,17 milliméteres oldalirányú eltérést észlelni lehetett. Ez az érték sokad része a kétpontküszöbnek. A két pont megkülönböztetése és a relatív helyzet megkülönböztetése közötti különbség azzal magyarázható, hogy egy pont lokalizációját, és így a relatív helyzet megítélését több receptor egymáshoz viszonyított reakciója irányítja. Egy ilyen rostok közötti
9
kód, sokkal pontosabban képviselheti a cél helyzetét, mint amire egy magában működő receptor lenne képes.
3. ábra-A legkisebb észlelhető elmozdulás mérésére szolgáló kísérleti eszköz Beállítódás és tapintási érzékenység Mindennapi tevékenységeink során néha váratlanul hozzáérünk valamilyen tárgyhoz, vagy az ér hozzánk. Soha nem lehetünk biztosak abban, hogy mikor és hol vagyunk kitéve érintésnek. Milyen észlelési következményei vannak annak, hogy a tapintási inger forrása és helye bizonytalan? Ezt a kérdést boncolgatta James Craig (1985), amikor azt kérdezte, hogyan tudják az emberek megosztani a figyelmüket a sok lehetséges tapintási ingerhely között az ujjukon, illetve a kezükön. Craig kísérletében az inger 108 tompa tűből állt, amelyek téglalap alakban 6 oszlopban és 18 sorban voltak elrendezve. Azt az elrendezést a személy ujjbegyére nyomták; mindegyik tű 230 Hz-es frekvenciával tudott rezegni. Számítógép szabályozta, hogy melyik tű rezegjen, és melyik maradjon stabil. Más-más tűk rezgésbe hozásával különböző téri ingermintázatot lehetett adni a személy ujjhegyére. Például a számítógép olyan tapintási mintázatot tudott előállítani, amely az ábécé különböző betűinek felel meg.
4. ábra-James Craig tapintási ingerője Az egyik kísérletben Craig azt vizsgálta, hogy vajon a tapintási ingerlés helyének bizonytalansága befolyásolja-e a személy ama képességét, hogy azonosítani tudja az ingerlés mintázatát. A személy bal keze a tompa tűkből álló kísérleti eszközön nyugodott, míg a tapintási rezgéseket egy időben adták a mutató- és a középső ujjra; minden egyes próba során
10
a mutatóujj és a középső ujj más-más betű tapintási ingerét kapta. A rövid idejű bemutatás után a személyeknek meg kellett mondaniuk, hogy az egyik ujjukat milyen betű ingere érte. Craig két helyzetben vizsgálta a személyeket. Az egyikben a személlyel az ingerlés előtt közölték, hogy melyik ujjara figyeljen, míg a másikban ezt csak az ingerlés után mondták meg. Az emberek sokkal pontosabbak voltak a betű megnevezésében, ha előre tudták, melyik ujjukra figyeljelek. Egy következő kísérletben Craig azt vizsgálta, hogy az emberek össze tudják-e vonni az egymás melletti ujjak tapintási információit. Néhány esetben a vibrotaktilis mintázat egyetlen ujjat érintett, máskor pedig a mintázat két egymás melletti ujjon oszlott meg. Craig azt feltételezte, hogy a két ujjra kiterjedő mintázat arra kényszeríti a személyt, hogy gyorsan irányítsa figyelmét egyik ujjáról a másikra, ami rontani fogja a teljesítményét. Craig elvárásainak megfelelően jelentősen jobb volt a megnevezés akkor, ha az egész vibrotaktilis mintázat egyetlen ujjat érintett. Általában Craig munkája azt mutatja, hogy a tapintási ingerlés helyének bizonytalansága megnehezíti az inger azonosítását. Mivel az észlelés gyakorlással javítható - ezt hívjuk Perceptuális tanulásnak -, természetesen merül fel a kérdés, hogy milyen fajta tréning tenné ügyesebbé az embert az ingerek tulajdonságainak pontos felismerésére. Néha a süket és vak személy a beszélő arcára teszi a kezét. Ez a mozdulat részben azt az erőfeszítést tükrözi, amit a vak és süket ember tesz annak érdekében, hogy- megértse, mit mondanak. A cél az, hogy érzékelje a beszélő szája, nyaka és állkapcsa által keltett rezgéseket. A tapasztalt és gyakorlott személy számára ez a fortély lehetővé teszi, hogy bámulatra méltóan jól megértse a beszédet, különösen, ha a szavakat közepes sebességgel mondják. Nyilvánvaló, hogy amikor ezt a módszert alkalmazza, akkor a süket és vak embernek meg kell osztania a figyelmét a kezének és ujjainak ingerelt területei között. A bizonyosság hatása az agyi tevékenység változásaiban jelenik meg. Így tehát pusztán annak az elvárása, hogy egy bizonyos ujjat fognak ingerelni, megnöveli az adott ujj képviseletéért felelős agyterület anyagcsere-tevékenységét. Mindezek mellett legalább egy agyterületen, a temporális kéregben bizonyos sejtek egyértelműen különbséget tudnak tenni a várt és a nem várt tapintási inger között. Ezek a sejtek erősen reagálnak, amikor a bőrt váratlanul érintik meg, de nem válaszolnak ugyanerre az érintésre, ha előre tudják, hogy közeleg az érintés.
11
Tekintsük át röviden. A bőr mechanikai megzavarását többféle specializált receptor regisztrálja a bőr különböző rétegeiben. A tapintási ingerlésből származó idegi impulzusokat ezeknek a receptoroknak az afferensei szállítják a gerincvelőbe, ahol az impulzusok olyan rostokra kerülnek át, amelyek felfelé haladnak az agyba. Az agyon belül a tapintási információt több specializált kérgi terület dolgozza fel, amelyek tartalmazzák a testfelszín térképét. A tapintás élettana A tapintási rostok A kéz tapintási ingerléséből származó információt két külön ideg továbbítja a gerincvelőbe, az ulnaris (singcsonti) és a medianus (középső) ideg. Mint minden más ideg, ez a kettő is sok axonból, vagy ahogy másképp is nevezik, rostból áll. Az ulnaris és a medianus idegekben az axonok a kéz különböző területeiről erednek. A medianus ideg, ahogy a neve is mutatja, a kar közepén fut le, és kettéágazik, hogy beidegezze a tenyér egy részét, a hüvelyk-, mutató- és középső ujjat teljes egészében, valamint a gyűrűsujj középső ujj felé néző felét. Az ulnaris (singcsonti) ideg a singcsont latin nevéről kapta a nevét a singcsont az alkar hosszú csontja, ami a könyöktől a csuklóig terjed, a kar külső oldalán. Az ulnaris ideg rostjai a tenyér többi részéből, a kisujjból és a felé néző gyűrűsujjból szállítanak üzeneteket.
5. ábra-A medianus és ulnaris idegek beidegzési mintázata
12
Minden egyes rost tüzelni kezd, ha a bőr egy bizonyos részét megérintik. Az a bőrterület, amelynek az ingerlése befolyásolja egy rost aktivitását, alkotja a rost receptív mezőjét. A rostnak különböző bőringerekre adott válaszmintázatát elemezve az emberi tenyérre és ujjhegyekre adott tapintási információt négy lehetséges kategóriába sorolhatjuk. A négy kategóriát annak alapján lehetett elkülöníteni, hogy mennyire volt éles a rostok receptív mezőjének a határa, és hogy milyen volt a rostok válaszmintázata. Mint látni fogjuk, a téri és idői választulajdonságok lehetővé teszik, hogy minden rostkategória valami egyedit jelezzen a receptív mezőjén belüli ingerforrásról.
Idői jegyek • Képzeljük el, hogy egy kis pálcikát nyomnak könnyedén a bőrre, és ezt rövid ideig ott tartják. Sok különböző rost tevékenységét vizsgálva két rosttípus volt ami az inger feldolgozásáért felelős. Volt olyan rost, amelyik akkor reagált, amikor a pálcikát először helyezték a bőrre, és többé-kevésbé folyamatosan válaszolt, amíg tartott a nyomás. Az ilyen típusú rostokat lassan adaptálódó rostoknak nevezzük. Más rostok csak akkor válaszoltak, amikor a pálcikát először hozzáérintették a bőrhöz; ezek a rostok akkor is adtak egy rövid, erőteljes választ, amikor a pálcikát eltávolították. Az ebbe a kategóriába tartozó rostok a gyorsan adaptálódó rostok. Így tehát a szomatoszenzoros rostok első két kategóriaíja állandó ingerlésre adott időbeni válaszuk alapján megkülönböztethető. Téri jegyek • Most tegyük fel, hogy a pálcikát úgy használjuk fel a receptív mező feltérképezésére, hogy egy sor szomszédos pontot ingerlünk a bőrön. A receptív mező téri elrendezése megmutatja, hogy a lassan adaptálódó rostok és a gyorsan adaptálódó rostok is kétfélék lehetnek. Az egyik típusú rostok: a pontrostok kis, éles határvonalú receptív mezővel rendelkeznek. A mezők leginkább ovális alakúak, és négy-tíz, az ujjbegyen és tenyéren található bőrbarázdát fognak át. Ezen a kis területen belül körülbelül egyforma az érzékenység. A másik rosttípusnak, a diffúz rostoknak nagy receptív mezőjük van, életlen határvonallal. A diffúz rostok receptív mezője néha az egész ujjat vagy a tenyér nagyobb részét fedi. Nagy méretük és életlen határvonaluk miatt a diffúz rostok nem alkalmasak részletes téri diszkriminációra. A négy rostkategória • Ezt a kétféle idői és téri választ kombinálva négyféle rosttípust kapunk: lassan adaptálódó diffúz, lassan adaptálódó pont-, gyorsan adaptálódó diffúz és gyorsan adaptálódó pontrostok. A négy típus mindegyike eltérő üzenetet tud szállítani a központi idegrendszernek, mivel mindegyik egy bizonyosfajta tapintási ingerlés esetén működik a legjobban.
13
A rostok tevékenysége és a tapintási élmények A rosttípusok működésbeli különbségeit magyarázva összehasonlíthatják, hogy milyen válaszokat vált ki mindegyik ingerfajta a bőr körülírt területén. A mozdulatlan ujj egyetlen helyére adott ingerlés idői mintázatának változtatása utánozza a minta - például kidomborodó betűk - fölött mozgó ujjhegy hatását. Például, ha az ujj hegye vízszintesen mozogna a domború O betű közepe fölött, akkor az ujjat két, egymástál egy intervallummal elválasztott inger érné; a két inger közötti intervallum tartamában tükröződne mind a betű szélessége, mind az ujjak mozgási sebessége. Ezért a kutatók rögzítették az afferens rostoknak a különböző domború betűkre adott válaszát, hogy megtudják, milyen hűen regisztrálják a rostok a betűk téri részleteit. Amikor az ingerek Braille jelek kis kiemelkedő pontjaiból álltak, a lassan adaptálódó pontafferenseken belüli válaszok kiválóan reprodukálták a jelek téri részleteit. A gyorsan adaptálódó pontrostok kissé lemaradtak a reprodukció hűségét illetően, míg a másik két kategória rostjai majdnem teljes kudarcot vallottak (ami azt ,jelenti, hogy a különböző betűkre adott válaszaikból nem lehetett rájönni, hogy milyen betűk szerepeltek). Ez határozottan azt mutatja, hogy lassan adaptálódó pontrostok szállítják az elsődleges információt az észlelés számára a tapintási alakról és durvaságról. Az érintési ingerlés által kiváltott idegi válaszok és észlelési ítéletek Amikor egy személy kezét könnyedén megérintik a pálcikával, az egyedi rostok tevékenysége könnyedén mérhető. Amikor az alig észrevehető pálcikát a kéz csupasz, szőrtelen részéhez érintették, akkor a gyorsan adaptálódó rostok megbízhatóan reagáltak, de a lassan adaptálódóak hallgattak. A lassan adaptálódó rostoknak jóval erősebb tapintási ingerre volt szükségük. Tehát ez arra utal, hogy a nagyon enyhe érintést a gyorsan adaptálódó rostok közvetítik. Természetesen a tapintási érzék nemcsak arra való, hogy gyenge, küszöb körüli érintési ingereket jelezzen. Milyen rosttevékenység alakul ki erőteljesebb tapintási ingerlésre? A bőr helyi benyomódása egyike a legmindennapibb ingerforrásoknak. Az erős ingerléseknél az eredmények azt mutatták, miszerint a lassan adaptálódó rostok a tapintás erejével kapcsolatos információkat regisztrálják. Meg kell azonban jegyeznünk, hogy a pszichofizikai és idegi válaszok az idegrostok szintjén nem felelnek meg tökéletesen egymásnak, ami arra ital, hogy a további feldolgozásnak fontos szerepe van.
14
Az idegi ingerlés által kiváltott tapintási minőségek Ha egy adott rost valami meglehetősen konkrét dolgot jelez a tapintási érzékletről, akkor ennek a rostnak elektromos árammal történő közvetlen ingerlése ennek az érzékletnek az illúzióját kellene, hogy keltse a bőr egy adott helyén. Az illuzórikus érintés helye megfelelne az ingerelt rost receptív mezőjének, az érzéklet minősége pedig elárulna valamit a rost által szállított információról. A lassan adaptálódó rost ingerlése minőségileg más érzékletet kelt, mint a gyorsan adaptálódó rost ingerlése. Amikor elektromosan ingereljük a lassan adaptálódó rostot, akkor a személyek jellegzetes válasza enyhe, egyenletes nyomást jelez. Ez ahhoz hasonlítható, mint amikor egy puha ecsetet érintenek stabilan a bőrhöz. Amikor a gyorsan adaptálódó rostokat ingerlik, akkor a személy egyfajta zsongó vagy vibráló bőrérzésről számol be. Összességében az elektromos ingerléses vizsgálatok alátámasztják, hogy a lassan és a gyorsan adaptálódó rostok másfajta információt szállítanak a tapintási ingerről. A tapintási receptorok Minden afferens rost legalább egy mechanoreceptorban végződik, és abból a mechanoreceptorból szállít tapintási információt a központi idegrendszerbe. Kezünkön a sima, csupasz bőr négy különböző mechanoreceptor-típust tartalmaz, összesen mintegy tizenhétezer darabot. Mindegyik receptortípus olyan rostokhoz kapcsolódik, amelyeknek egyedülálló választulajdonsága van: gyorsan adaptálódó diffúz, gyorsan adaptálódó pontrostok, lassan adaptálódó-diffúz és lassan adaptálódó pontrostok. Maguk a receptorok feltűnően változatos szerkezetűek és bonyolultságúak, és ez a változatosság alakítja a különböző rosttípusok működésbeli sajátosságait. A mechanoreceptorok olyan átalakítók, amelyek a bőr benyomódására vagy nyomására válaszolnak. Egyes receptortípusokat speciális tok vesz körül, amelyben összenyomható folyadék vagy zselé van. A tok alakja, mérete és elhelyezkedése határozza meg, hogy milyen tapintási ingerféleség fog a tokban lévő receptorra hatni. Például egy olyan receptor, amely egy nagy, ovális alakú tokban helyezkedik el a bőrben úgy, hogy a hosszanti tengelye párhuzamos a bőr felszínével, a tok feletti bőr viszonylag nagy területét érintő alakváltozására fog reagálni. Ha azonban az ovális tok a bőr felszínére merőlegesen állna, akkor a tapintási ingernek a bőr körülírtabb területén kellene megjelennie ahhoz, hogy a receptort aktiválja.
15
Az ujjhegyek és a tenyér bőre - tapintásra érzékeny területekre itt külön hangsúlyt fektetűnk - kétfajta tokos receptort tartalmaz: ezek a Meissner-testek a bőr felső rétegében és a Pacinitestek a bőr alsó rétegében. Jelenlegi tudásunk szerint a Meissner-testecskéket és a Pacinitesteket gyorsan adaptálódó rostok idegzik be. A 1 1.7.. ábrán két másik, nem tokos mechanoreceptort is láthatunk: a Merkel-korongokat és a Rufini - végződéseket. Ezt a bőr középső rétegében elhelyezkedő két receptortípust a lassan adaptálódó rostok idegzik be. Meissner-testek • Rögtön a bőr felszíne alatt mindegyik Meissner-test egy kis szemölcsbe van ágyazva; ezek a szemölcsök alkotják a tenyér és ujjhegyek barázdáit. A tok úgy helyezkedik el, hogy a hosszanti tengelye merőleges a bőr felszínére. Emberben kettő-hat gyorsan adaptálódó pontrost ered egyetlen Meissner-testben. Mivel ez az afferens egység gyorsan adaptálódik, ez válaszol a legjobban olyan átmeneti ingerekre, amelyek akkor keletkeznek, ha valami a bőrnek dörzsölődik, vagy amikor az ujjunkat egy tárgy felszínén végighúztuk. Fiatal,
tíz
év
alatti
személyeknél
negyven-ötven
Meissner-test
található
négyzetmilliméterenként; ötvenéves korra a testecskék száma negyedére csökken, körülbelül négyzetmilliméterenként tízre. A testecskék számának csökkenése jól korrelál a tapintási érzékenység korral összefüggő csökkenésével, amit tapintópálcikákkal mutatnak ki.
6. ábra-Ember ujjbegyének keresztmetszete Merkel-korongok• Egy kicsit mélyebbre haladva a bőrben, a Merkel-korongokkal találkozunk. Ezt a mechanoreceptor-fajtát, amelyet ötös-tízes csoportokban találunk meg, a lassan adaptáló dó, ponttípusú afferens rostok idegzik be. Úgy tudjuk, hogy ezek az egységek akkor aktiválódnak, amikor a bőrt egy kis tárgy folyamatosan nyomja. 16
Ruffini-végződések • A Ruffini-végződések mélyebben fekszenek a bőrben, hosszúkás alakjuk párhuzamos a bőr felszínével. Minden egyes Ruffini-sejtet egyetlen afferens rost idegez be, és a szomszédos sejtek közösen használhatnak egyetlen rostot. Ennek a bemenetnek az összetartása analóg a szem helyzetével, ahol több pálcika-fényreceptor adja egyetlen retinális ganglionsejt bemenetét. Emlékezzünk rá, hogy a téri konvergencia (összetartás) a fokozott érzékenységet szolgálja a téri felbontóképesség rovására. A Ruffini-végződéseket beidegző rostok lassan adaptálódó diffúz típusúak, és úgy hisszük, ezek az idegi egységek szolgáltatnak információt a bőrre gyakorolt folyamatos nyomásról. Mivel a bőr nyújtására is érzékenyek, ezek a lassan adaptálódó diffúz egységek akkor aktívak, amikor az ujjak vagy más ízületek mozognak, és így nyújtják a bőrt. Pacini-testek • Ezek a legnagyobb méretű, legkisebb számú és legmélyebben elhelyezkedő mechanoreceptorok. Minden egyes testet egyetlen gyorsan adaptálódó diffúz rost idegez be. A Ruffini-végződéshez hasonlóan a Pacini-testnek is a hosszanti tengelye párhuzamos a bőr felszínével. A Pacini-testek rendkívül érzékenyek az érintésre. Az ujjhegy már egészen apró alakváltozása idegi impulzusokat vált ki a Pacini-testben. Álljunk meg egy pillanatra, és fújunk a lehető leggyengédebben a tenyerünkre. A levegő enyhe érzése a bőrünkön valószínűleg a Pacini-testek válaszából ered. A válasz gyorsan adaptálódik. Laboratóriumi körülmények között a kutatók a Pacini-testrendszert úgy különítik el, hogy viszonylag nagy méretű tapintási pálcikákat rezegtetnek magas frekvenciaín. Mivel a Pacini-testek viszonylag mélyen helyezkednek el, a bőr viszonylag nagy területének elváltozása ingerli őket, és térben kiterjedt érzékenységet eredményeznek. Valójában egy Pacini-test receptív mezője akár több négyzetcentiméter nagyságú is lehet. Ugyanakkor a receptorok mélyebb elhelyezkedése a tapintási inger helyéről csak hozzávetőleges információt nyújt. Szabad idegvégződések • A bőr - a csupasz és a szőrrel borított is - szabad idegvégződéseket is tartalmaz. Ezek finom, hajszálvékony struktúrák, amelyek csipkés hálózatot alkotnak a bőr minden rétegében. A szőrrel borított bőrben a szabad idegvégződés a szőrtüsző alapjára tekeredik rá, így a szőrszál kismértékű meghajlása is idegi impulzusokat vált ki ezekből a tapintási afferens egységekből. Ezek a szabad idegvégződések a bőr nyálkahártyával borított részein is igen sűrűn oszlanak el, például az ajkakon és a genitális területen. A szem szaruhártyájában is megtalálhatók, valamint - ahogy a következő fejezetben kiderül - az orrban is.
17
Fontos figyelembe venni, hogy a tapintás, minden más érzékelőrendszertől eltérően, a test egész félszínén megtalálható. Ez azt jelenti, hogy sok különböző, a gerincvelő teljes hosszán belépő afferens idegrost szolgáltat bemenetet az agy tapintási központjának. A bemenetek eme sokasága feltűnő ellentétben áll más modalitásokkal, ahol csak egy pár agyideg (például a bal és jobb oldali hallóideg) vagy legfeljebb három pár agyideg (a nyelvet és szájat beidegző arcideg, nyelv-garat ideg és bolygóideg) szállítja az információkat a perifériás szervektől a központi idegrendszerbe. Ennek következtében a sok tapintási ideg valamelyikének károsodása csak a test azon részén okoz érzékenységkiesést,amelyet az adott ideg érint. Más modalitások esetén az adott idegrost károsodása sokkal lesújtóbb és kiterjedtebb kárt okoz az érzékenységben.
Az emberi beszéd Beszédképzés A beszéd az emberi kommunikáció és az emberi gondolkodás legfontosabb eszköze, a kommunikáció a társadalmi élet és a munkamegosztás alapvető feltétele. A nyelv egy jelrendszer, amelynek elemeihez egy nyelvközösségen belül ugyanaz a jelenség tartozik. A beszéd a nyelv elsődleges megnyilvánulási formája, az egyetlen olyan kommunikációs eszköz, mely önmagában is érthető, ezért a beszédnek az emberi kommunikációban kiemelt szerepe van. A beszéd két nagy folyamatra osztható: a beszédprodukcióra és a beszédfeldolgozásra. Mindkettő számos részfolyamatból épül fel. A beszédprodukció a kódolással kezdődik, amikor a beszélő a gondolatait a megfelelő nyelvi formába önti. Az artikuláció a nyelvi formák hangzó változatainak létrehozása, vagyis a beszéd tulajdonképpeni képzése. Amikor az eredeti gondolatot tartalmazó modulált levegőrezgés elhagyja a beszélő ajkait, és kikerül a légtérbe, akkor mint akusztikai hullámforma az idő, a frekvencia és az intenzitás paramétereivel jellemezhető. Ezek adják a beszéd akusztikumát vagy akusztikai szerkezetét. A beszédet felfogó, hallgató személy ezeket a hullámformákat képes feldolgozni a hallás folyamatában. Ezek a legmagasabb rendű, ún. kognitív folyamatok. A légzőrendszernek a beszéd kialakításában is fontos szerepe van. A tüdő, a gége, a garat, a szájüreg és az orrüreg mind részt vesz az emberi beszédképzés folyamatában .A légzőrendszer által biztosított, a kilégzés folyamán keletkező levegőáram, ami a 18
beszédhangok döntő többségét képezi, és a beszéd során beszédszerveinkkel módosítjuk a tüdőből kifelé áramló levegőben a nyomásviszonyokat. Ez a módosító rész az artikulációs csatorna. Az 'artikulációs csatorna' (más szakkifejezésekkel 'toldalékcső' vagy 'hangképző üregrendszer') a beszédszerveknek a hangréstől az ajkakig terjedő szakasza. A gégéből kiáramló levegő az artikulációs csatornába, egy viszonylag hosszú, bonyolult formájú, de alapvetően cső jellegű térbe jut, amelyben az útja a garat- és szájüregen és (bizonyos esetekben) az orrüregen keresztül vezet. A hangok végleges megformálásához nem elegendő a tüdőből kiáramló levegő, sőt még a hangszalagok ritmikus mozgásával keltett hang, a zönge sem. A beszéd és az ének hanganyagának nagy változatossága, végső minősége az artikulációs csatornában alakul ki. Az artikulációs csatorna alakját, méretét az itt található önálló mozgásra képes (úgynevezett aktív) beszédszervek – elsősorban az ajkak, a nyelv és a lágy szájpad – révén szabályozzuk. Ennek a szerepe kettős: Az artikulációs csatorna, mint rezonáló üregrendszer működik, a rajta átáramló hangjelet formálj, módosítja. A levegő áramlásának megváltozása hangot kelt. A hallássérült emberek számára a szájról olvasás közben pontosan az aktív beszédszervekkel képzett hangok felismerésénél van problémájuk. Sok esetben nem egyértelmű, a hasonlóan képződő hangoknál, hogy mit is takar a látott kép. Alaptényezők, építőkockák Fizikailag a hang három paraméterrel jellemezhető: időtartam, frekvencia és frekvenciaösszetevők, valamint az intenzitás (hangerő). Az időtartam az az időmennyiség, amely a hangrezgés megindulásától a rezgés lecsengéséig, azaz a hang megszólalásától annak elhalásáig eltelik. Egy-egy beszédhang ejtésének időtartamát sok tényező befolyásolja, általánosságban azt mondhatjuk, hogy a beszédhangok ebben az osztályozásban vagy a hanglökések közé tartoznak, vagy a rövid idejű hangok alsó tartományára jellemző értékekkel valósulnak meg. A frekvencia a hangrezgés időegység alatti periódusainak a gyakorisága. Az időegység egyezményesen 1 másodperc, tehát a frekvencia az 1 másodperc alatti teljes periódusok száma. Egy teljes periódus során a nyomás a hanghullámban a légköri nyomással megegyező értékről a maximális értékig nő, majd a nyomásminimumig csökken, s végül ismét a légköri nyomás értékét veszi fel. Periódusidőn (T) azt az időtartamot értjük, amely egy teljes periódus lezajlása alatt eltelik. A hanghullámban energia terjed tova, és az áramló energia mennyisége arányos a hangnyomással. Az intenzitás fogalmával a hangenergia nagyságát, a hangforrás 19
teljesítményét jellemezzük. Az intenzitás a hangterjedés irányára merőleges egységnyi felületen időegység alatt átáramlott energiamennyiség. Mértékegysége a W/m2. A beszédhangokat felépítő akusztikai építőkockákat mutatjuk be, azaz a beszéd általános frekvenciaszerkezetét és intenzitásszerkezetét. Mindkét szerkezeti elem az idő függvényében változik. Ezeknek a változásoknak az idő szempontjából jellemző elemeit az időszerkezet tartalmazza. A frekvenciaszerkezet két komponensre bontható, a formánsokat és zörejgócokat bemutató spektrális komponensre, valamint a hangszalagrezgésből adódó alapfrekvencia (dallam) szerkezetre. A beszédhangok létrehozásának egyik alaptényezője a gerjesztés, vagyis a hangforrás, amiből az artikuláció hatására a tényleges beszédhang kialakul. A gerjesztési hang alapvetően háromféle lehet: zöngés, zörejes és kevert. A zöngés gerjesztés szabályosan ismétlődő hanghullám, azaz periodikus (a gyakorlatban kvázi-periodikus). Ez a jel a hangszalagok működésének eredménye, a szakirodalomban zöngének nevezik. A zörejes gerjesztés aperiodikus rezgés, amely a gége és a szájüreg különböző pontjain keletkezhet. Az úgynevezett kevert gerjesztésről akkor beszélünk, amikor az előbbi kettő keveréke adja a hangképzés alapját. A gerjesztési hang megvalósulásához az energiát a tüdőből kipréselt levegőáram adja. A gerjesztés speciális fajtája az úgynevezett néma fázis (nincs hangzó gerjesztési jel). A néma fázis az egyes beszédhangok (például a zöngétlen zárhangok) fontos eleme.
8. ábra-A légáram útvonala,mozgása 7. ábra-A beszédképzés szervrendzsere
A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága, soros szerkezetű. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel
20
elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. A beszéd szerkezete felülről nyitott, alulról pedig zárt. Egy beszélt nyelv alapegysége a fonéma. Egy fonémakészlet elemek olyan minimális számoságú halmaza, amelyből minden szó helyesen, de csak egyféleképpen állítható el. Az azonos fonémákat képviselő beszédhangok az allofonok. A beszédhangok osztályozása magánhangzók:
a, á, e, é ,i, o, ö, u, ü
mássalhangzók zárhangok
zöngés felpattanó: b, d, g, gy zöngétlen felpattanó: p, t, k, ty
réshangok (frikatívák):
zöngések j, v, z, zs; zöngétlenek h, f, sz, s
zár-réshangok (affrikáták):
zöngések dz, dzs; zöngétlenek c, cs
nazálisok: m,n, ny likvida: l pergő: r
Magánhangzók A magyarban 14 magánhangzó van, amelyeket a következő betűkkel jelölünk: á, a, o, ó, u, ú, ü, ű, i, í, ö, ő, é, e . Képzés A képző mozgások szempontjából 9 magánhangzót különböztetünk meg, közülük 5 rövidhosszú párt alkot. A párok hosszú tagjának képzési helye szinte ugyanaz, mint a rövidé, hangszínezete azonban kissé különbözik. Ez abból adódik, hogy a hosszúakat kissé zártabban ejtjük, mint a rövid párjukat. A magánhangzókat a nyelv vízszintes és függőleges mozgása szerint osztályozzuk. E szerint lehetnek elöl vagy hátul képzettek, illetve különböző nyelvállásúak. Az állkapocs nyitási foka szerint lehetnek zártak, félig zártak és nyitottak. További osztályozási szempont az ajakműködés, amelynek eredményeként lehetnek ajakrésesek és ajakkerekítésesek. Az ajakréses magánhangzók második formánsa magasabb,
21
mint az ajakkerekítéseseké. Nyílt ejtés esetén az első formáns lefelé, a második esetenként felfelé tolódik. A magánhangzók egyszerű szerkezetűek, folyamatosan, önmagukban is ejthetők. A mássalhangzók képzési helye hatással van az őket megelőző, illetve követő magánhangzók képzésére. A magánhangzók akusztikai szerkezetének lényeges eleme az úgynevezett hangátmeneti szakasz, amellyel a szomszédos hangokhoz kapcsolódnak. A magánhangzó artikulációja sok esetben megjelenik a szomszédos mássalhangzó képzésében. Az egymásra hatás ilyenkor kölcsönös. Formánsok A magánhangzók formánsai (az emberi beszédhang jellegzetes színét adó, rezonanciás úton felerősített felhangtartomány) sávokban helyezkednek el. A formánsok egymás közötti relatív távolsága határozza meg a hang karakterét. Ha az F1 (első formáns) magasabban van a sávján belül, akkor az F2 (második formáns) is valószínűleg magasabban lesz a saját sávján belül. A magánhangzók első két formánsának elhelyezkedését az is befolyásolja, hogy előttük, illetve utánuk milyen frekvenciaszerkezetű hang van. Például az o magánhangzó F2-je alacsonyabb, a ko hangkapcsolatban, mint a nyo-ban. Az ny F2-je ugyanis olyan magasan van az o F2-jéhez képest, hogy az ny-ből az o-ba való artikulációs átmenet során az o nem tudja elérni a legoptimálisabb képzési helyzetet, tehát a második formánsa magasabban realizálódik. Egyegy magánhangzónak tehát sokféle hangzása létezik a beszédben, ez egyrészről a hangkörnyezettől, másrészről a beszélő személy ejtésétől függ.
9. ábra-Magánhangzók képzési formái
Formánsszerkezet A magánhangzók frekvenciaszerkezetét általában 3 formánssal szokták jellemezni. Ezek közül az első kettő a lényegesebb. A magánhangzók hangszínezetének kialakításánál a formánsok frekvenciaértékén túl az egyes magánhangzók formánsainak egymástól való úgynevezett távolsága a döntő. A magánhangzók frekvenciaszerkezete nyelvspecifikus.
22
10. ábra-Magánhangzók frekvenciaeloszlása
Mássalhangzók Osztályozása A mássalhangzókat a gerjesztésük szerint 3 csoportba osztjuk: zöngés, zöngétlen, és kevert. Az utóbbi azt jelenti, hogy a zöngés elemre zörej is szuperponálódik. Időszerkezetük szerint lehetnek egyszerűek és összetettek. Artikulációjuk szerint lehetnek stabilak (nem illeszkednek a környező magánhangzókhoz), erősen illeszkedők és kölcsönösen illeszkedők. Akusztikai szerkezetüket formánsokkal és zörejgócokkal jellemezzük. A magyarban a rövid és hosszú mássalhangzók akusztikai szerkezete között nincs lényeges eltérés.
11. ábra-Mássalhangzórendszer
Zárhangok A magyar felpattanó zárhangokat a b-p, d-t, gy-ty, g-k betűkkel jelöljük. Gerjesztésük zöngés, illetve zöngétlen. Belső idő-, frekvencia- és intenzitásszerkezetük két fő részből áll, amelyet 23
az artikuláció határoz meg: zár és zárfelpattanás. A zárképzés az artikulációs csatornában az egyes hangpárokra jellemző helyen jön létre. A g és k hang képzési helye változhat, a többié nem.
12. ábra-Zárhangok
B A b (bilabiális zöngés) zárhang zöngerészből és az azt követő zárfelpattanásból áll. A zárfelpattanás akusztikai szerkezete hasonló hangsorkezdő és hangsorbelseji helyzetben, ettől különböző hangsorzáró pozícióban. A zöngerész általában 15-25 dB-lel kisebb intenzitású, mint a b hangot követő magánhangzó. A zárfelpattanáskor az intenzitás meredeken nő és beleolvad a magánhangzó kezdeti szakaszába. A zárfelpattanás CV helyzetben rövid, 10-15 ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú b hang közel kétszer olyan hosszú zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás időtartama viszont nem változik. A b hang zárfelpattanásának formánsai mozognak a hangot követő magánhangzó függvényében. Ez a mozgás az F2 formánsra a legjellemzőbb: ha VF2 600 és 1600 Hz közé esik, akkor kb. bF2 = VF2 ; ha VF2 nagyobb 1600 Hz-nél, akkor kb. bF2 = (VF2 1600)/2 Hz. Hangsorzáró helyzetben a hang zárfelpattanása határozott formánsszerkezetet mutat: bF1= 400Hz, bF2 = 1200Hz, bF3 = 2300Hz. D A d (dentális) zöngés zárhang zöngeszakaszra és zárfelpattanásra bontható. A zárfelpattanás akusztikai szerkezete hasonló hangsor kezdetén és hangsor belsejében, ettől különböző hangsorzáró helyzetben. A zöngerész általában 15-25 dB-lel alacsonyabb intenzitású, mint a d hangot követő magánhangzó. A zárfelpattanáskor az intenzitás csak kissé növekszik és a hang beleolvad a magánhangzó kezdeti szakaszába. A zárfelpattanás CV helyzetben rövid, 10-15 ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú d hang közel kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás időtartama viszont nem változik. 24
A d hang zárfelpattanásának formánsai elmozdulnak a hangot követő magánhangzó függvényében. Ez a mozgás az F1 és az F2 formánsoknál jelentős: ha VF1 kisebb, mint 400 Hz, akkor dF1 közel megegyezik a VF1-gyel; ha VF1nagyobb, mint 400 Hz, akkor dF1 közelítőleg 400 Hz-en van; ha VF2 kisebb, mint 1300 Hz, akkor dF2 közelítőleg 1300 Hz ; ha VF2 1300 és 1800 Hz közötti, akkor dF2 közel megegyezik VF2-vel; ha VF2 nagyobb, mint 1800 Hz, akkor dF2 közelítőleg 1800 Hz-en van. Hangsorzáró helyzetben a d hang zárfelpattanása kevert gerjesztésűvé válik. A zárfelpattanás formánsszerkezete: dF1: 300 Hz, dF2: 1600 Hz, dF3: 2600 Hz. A zörejelem a hangsorzáró t hang frekvenciakomponenseit tartalmazza. G A g (veláris) zöngés zárhang. A hang zöngeszakaszból és az azt követő zárfelpattanásból áll. A zárfelpattanás akusztikai szerkezete hasonló hangsor kezdetén és hangsor belsejében, hangsorzáró helyzetben azonban más. A zöngerész általában 15-20 dB-lel alacsonyabb intenzitású, mint a g hangot követő magánhangzó. A zárfelpattanáskor az intenzitás csak kissé növekszik és a hang beleolvad a magánhangzó kezdeti szakaszába. A zárfelpattanás CV helyzetben 35-40 ms; hangsorzáró helyzetben hosszú, 40-50 ms. A hosszú g hang közel kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A zárfelpattanás időtartama viszont ilyenkor sem változik. A g hang képzési helye változik a hanghoz kapcsolódó magánhangzó függvényében. A mássalhangzók közül ez a hang rendelkezik a legszélesebb képzési sávval. A hang akusztikai szerkezete tehát erősen magánhangzófüggő. A g hang zöngerészből és az azt követő zárfelpattanásból áll. A zárfelpattanás formánsai, főleg az F1 és az F2 erősen illeszkednek a követő magánhangzóhoz: ha VF1 kisebb, mint 300 Hz, akkor gF1 közel 300 Hz; ha VF1 nagyobb, mint 300 Hz, akkor gF1 közel 450 Hz ; A gF2 mindig követi a VF2-t, annál kissé 10-15 százalékkal magasabb értéket vesz fel. Hangsorzáró helyzetben a g hang zárfelpattanásának formánsszerkezete: gF1: 300 Hz, gF2: 1300 Hz, gF3: 2600 Hz. A zárfelpattanás zöngés eleméhez zörej is járulhat, amely a hangsorzáró k hang frekvenciakomponenseit tartalmazza.
25
Gy A gy (palatális) zöngés zárhang. Ennek a mássalhangzónak az osztályozásában nincs egységes vélemény. Vannak, akik zár-rés hangnak tartják. A hang zöngerészből és az azt követő zárnyitódási szakaszból áll. A zárnyitódás akusztikai szerkezete hasonló hangsor kezdetén és hangsor belsejében, hangsorzáró helyzetben azonban más. A zöngerész általában 15-25 dB-lel alacsonyabb intenzitású, mint a gy hangot követő magánhangzóé. A zárnyitódáskor az intenzitás csak kissé növekszik, és a hang beleolvad a magánhangzó kezdeti szakaszába. A zár nyitódása CV helyzetben 25-30 ms; hangsorzáró helyzetben hosszú, 60-80 ms. A hosszú gy hang közel kétszer akkora zöngeszakasszal rendelkezik, mint a rövid. A zárnyitódásra fordított idő viszont ilyenkor sem változik. A gy hang stabil frekvenciaszerkezettel rendelkezik, a zárfeloldódás formánsai egyáltalán nem illeszkednek a hanghoz kapcsolódó magánhangzóhoz. A gy hang zárfeloldódásának formánsszerkezete a következő: gyF1: 300 Hz; gyF2: 2100 Hz; gyF3: 3500 Hz. A stabil frekvenciaszerkezet azt eredményezi, hogy a gy-hez kapcsolódó magánhangzó formánsai hajlanak a gy formánsaihoz. Ezért a magánhangzóban nagymértékű formánsmozgások jöhetnek létre, ha a két hang formánsai távol vannak egymástól. Ilyenkor a magánhangzóban a hangátmeneti szakasz hosszabb, mint a kölcsönös illeszkedésnél. Zár-réshangok A magyarban négyféle zár-rés hangnak van betűjele: dz, c, dzs, cs. Ezek a hangok összetett szerkezetűek. Zár és rés kombinációjából állnak. Gerjesztésük lehet zöngés-zörejes (kevert), illetve tisztán zörejes. A zár-rés hangok képzésekor a szájüreg adott helyén először zárat képezünk, majd a zárat fokozatosan réssé alakítjuk. A hang frekvenciaszerkezetét a zárképzés helye határozza meg.
13. ábra-Zár-réshangok
26
Dzs A dzs (alveoláris) zöngés-zörejes gerjesztésű zár-rés hang, amely zöngeszakaszra és zöngés-zörejes gerjesztésű zárfeloldódási részre (rés) bontható. A zönge időtartama hosszú, 80-100 ms, a zárfeloldódásé 40-60 ms CV kapcsolatban. A hangsorvégi dzs a magyarban csak a bridzs szóban található meg. A zönge a d-jéhez hasonló szerkezetű, intenzitása 15-25 dB-lel alacsonyabb, mint a követő magánhangzóé. A zár feloldódásakor az intenzitás lassan növekszik, a hangban a zörej válik dominánssá. A hang ezután simán beleolvad a hozzá csatlakozó magánhangzó kezdeti szakaszába. A résszakaszban az s hang zörejes eleméhez hasonló szerkezetű hang keletkezik. A dzs hang utáni magánhangzóban is ugyanolyan formánsmozgások zajlanak le, mint amilyenek a zs-hez való kapcsolódásnál. Dz A dz (dentális) zöngés-zörejes gerjesztésű zár-rés hang, amely zöngeszakaszra és zöngés-zörejes gerjesztésű zárfeloldódási részre bontható. A zönge időtartama hosszú, 120140 ms, a zárfeloldódásé 50-80 ms hangsorbelseji helyzetben. A hangsorvégi dz elemei még ennél is lényegesen hosszabbak lehetnek. A zönge a d-jéhez hasonló szerkezetű, intenzitása 15-25 dB-lel alacsonyabb, mint a követő magánhangzóé. A zár feloldódásakor az intenzitás lassan növekszik és a hang ezután beleolvad a magánhangzó kezdeti szakaszába. A résszakaszban a z zöngés-zörejes eleméhez hasonló szerkezetű hang keletkezik. A dz hang utáni magánhangzóban is ugyanolyan formánsmozgások zajlanak le, mint amilyenek a z-hez való kapcsolódásnál. Réshangok A magyarban nyolcféle réshangnak van betűjele: v, f, z, sz, zs, s, j, h. Ezeken túl a kiejtésben megjelennek a j hang zöngétlen változata és a h különböző változatai is. A réshangok mind egyszerű szerkezetűek, időben nem tagolódnak. Gerjesztésük lehet zöngés, zörejes és kevert. A réshangok képzésekor a szájüreg adott helyén képezzük a rést. A réshang hangzását a résképzés helye és a rés formája határozza meg.
27
14. ábra-Réshangok
S Az s (alveoláris) zöngétlen réshang, egyszerű szerkezetű, időben nem tagolódik, folyamatosan is ejthető. Az s hang intenzitásszerkezet szempontjából három részből áll: kezdeti szakasz, középső, intenzív rész és a hang lecsengési fázisa, amiben az intenzitása szinte nullára csökken. A hang középső részében az intenzitás 10-15 dB-lel kisebb, mint a hanghoz
csatlakozó
magánhangzóé.
Az
s-hez
kapcsolódó
magánhangzó
hirtelen
intenzitásnövekedéssel éri el a normál intenzitásszintjét. A hosszú s hang közel kétszer akkora időtartamú, mint a rövid. Az s hang zörejelemei az 1800-6500 Hz-es sávban találhatók. Ebben a sávban általában egy intenzív zörejgóc alakul ki: sZ1: 2500-3500 Hz. A Z1 zörejkomponensének alsó határa kissé mozog a hanghoz csatlakozó magánhangzó F2-jének a függvényében, hiszen az s képzése közben már erre a magánhangzóra artikulálunk. Tehát az s kissé sötétebb hangzású a só hangkapcsolatban, mint a sí-ben. Az s hangot követő magánhangzó formánsaiban kismértékű mozgás van jelen az átmeneti fázisban. Z A z (dentialveoláris) zöngés-zörejes (kevert gerjesztésű) réshang. A hang egyszerű szerkezetű, időben nem tagolódik, folyamatosan is ejthető. A z hang 10-20 dB-lel kisebb intenzitású, mint a hozzá kapcsolódó magánhangzó. A hang folyamatosan beleolvad a hozzá kapcsolódó magánhangzó kezdeti szakaszába. A z hang, meghatározott formánsszerkezettel rendelkezik, ehhez keverednek a zörejből adódó frekvenciakomponensek. A zöngés elem formánsai: zF1: 250-300 Hz ; zF2: 1300-1800 Hz ; zF3: 2600 Hz. A zF2 frekvenciaértéke (a megadott sávon belül) enyhén követi VF2-jének értékét. Ha VF2 alacsony, akkor zF2 is alacsony és ellenkezőleg. A z hang zörejkomponense ugyanolyan frekvenciaszerkezetű, mint az sz. A z-hez kapcsolódó magánhangzó átmeneti fázisában a formánsok hajlanak a z formánsaihoz. A koartikulációs
28
illeszkedés tehát kölcsönös, de a nagyobb formánsmozgások inkább a magánhangzóban jönnek létre. V Az v (labiodentális) zöngés réshang. A hang egyszerű szerkezetű, időben nem tagolódik, folyamatosan is ejthető. A v hang 10-15 dB-lel kisebb intenzitású, mint a hozzá kapcsolódó magánhangzó. A hang folyamatosan beleolvad a magánhangzó kezdeti szakaszába. A v hang zöngés eleméhez zörej is hozzáadódhat. Ez főleg hangsorvégi helyzetben fordul elő. A zörej hasonló frekvenciaszerkezetű, mint az f hang, csak kisebb intenzitású. A v hang, meghatározott formánsszerkezettel rendelkezik. Formánsai: vF1: 250-300 Hz; vF2: 800-1500 Hz; vF3: 2500 Hz. A vF2 mozog a hozzá kapcsolódó magánhangzó függvényében: ha VF2 kisebb, mint 1300 Hz, akkor vF2 800 Hz körüli; ha VF2 1300 Hz és 1500 Hz közötti, akkor vF2 értékét a (VF2 1500)/2 Hz közelítő képlettel számíthatjuk ki; ha VF2 nagyobb, mint 1800 Hz, akkor vF2 1500 Hz körüli. Zs A zs (alveoláris) zöngés-zörejes (kevert gerjesztésű) réshang. A hang egyszerű szerkezetű, időben nem tagolódik, folyamatosan is ejthető, mintegy 10-15 dB-lel kisebb intenzitású, mint a hozzá kapcsolódó magánhangzó. A zs hang folyamatosan beleolvad a magánhangzó kezdeti szakaszába. A zs hang zöngés eleme meghatározott formánsszerkezettel rendelkezik, ehhez keverednek a zörejből adódó frekvenciakomponensek. A formánsok értékei: zF1: 250-300 Hz; zF2: 1600-2100 Hz; zF3: 2400-2600 Hz. A zsF2 értéke (a megadott sávon belül) enyhén követi VF2-jének értékét. Ha VF2 alacsony, akkor zsF2 is alacsony és ellenkezőleg. A hang zörejkomponense ugyanolyan frekvenciaszerkezetű, mint az s hangé. A csatlakozó magánhangzó átmeneti fázisában a formánsok hajlanak a zs formánsaihoz. A koartikulációs illeszkedés tehát kölcsönös, de a formánsmozgások inkább a magánhangzóban jönnek létre. Nazálisok A magyarban háromféle nazális hangnak van betűjele:m, n, ny. Az ng, nk és mv, mf betűkapcsolatok ejtésekor az n és m képzési helye megváltozik. Ez a hangot is kissé megváltoztatja. A nazális hangok ejtésekor az orrüreg nyitott, a szájüregben viszont akadályt képezünk. Ezért ezeket a hangokat félzárhangnak is nevezhetjük. A zárképzés az artikulációs 29
csatornában mindegyik hangnál más ponton jön létre. Az m, mv, n, ng egyszerű szerkezetű, folyamatosan ejthető. Az ny hang összetett szerkezetű, nazális zöngéből és zárfeloldódásból áll.
15. ábra-Nazális hangok
A felsorolásban kiemelt mássalhangzók fontos szerep töltenek be a beszédhang feldolgozásában a feladat elvégzése során. Mind a zöngéses hangok, mind a frikatívák olyan hangok, amelyek képzésekor sokszor nem elég a vizuális megjelenítés a hallássérültek számára, a zöngés és zöngétlen párok sokszor alig különböztethetőek meg. Ezen hangok frekvenciatartománybeli értékeit kihasználva vibrotaktilis kijelzésre használhatjuk fel ezen hangokat.
Taktilis kijelző A taktilis kijelzés A tapintás alapú információ közlés a tapintó szervek ingerlésével, az úgynevezett taktilis kijelzőkkel lehetséges. A számítógépes kijelzők nagy csoportját alkotják a tapintható kijelzők, melyek segítségével a látás-, illetve halláskárosult emberek képesek a külvilágból származó, hozzájuk érkező információkat kezelni. Legáltalánosabb alkalmazása a vakok számára készült kijelzőknél van, de már készítenek egyéb segédeszközöket is ilyen berendezésekkel ellátva halláskárosult személyek számára is. Taktilis kijelzőket alkalmaznak még a valós világ modellezésére készülő különféle virtuális berendezéseknél is. A vibrotaktilis kijelzők alapelve a következő: a beérkező információt, ami lehet vizuális vagy hang információ, átalakítja megadott paraméterek felhasználásával mechanikai ingerekké. Két nagy csoportra oszthatjuk fel őket, időben statikus és időben dinamikus kijelzők csoportjára. Az elsőbe tartoznak a Braille írást megjelenítő eszközök, a másodikba az egyre 30
inkább elterjedőben lévő beszéd-átalakító eszközök és virtuális valóság megjelenítő berendezések. Másik csoportosíthatóság, ha azt vesszük figyelembe, hogy a használó mozgatja az ujját a szerkezeten, vagy a szerkezet fix ponton rá van erősítve a felhasználóra, és úgy közvetíti a mechanikai ingereket. A cél azonban mindegyiknél, mindkét csoportnál ugyan az: minél érthetőbb rezgési formákat állítsanak elő, több paraméter kijelzésére legyenek alkalmasak, kis fogyasztással rendelkezzenek, könnyen kezelhetőek legyenek, bizonyos fajtáknál a real-time megjelenítés, a méret és az univerzális alkalmazhatóság is fontos szempont.
16. ábra-Taktilis kijelzőtípus 1
17. ábra-Taktilis kijelzőtípus 2
18. ábra-Taktilis kijelzőtípus 3 19. ábra-Taktilis kijelzőtípus 4
A tapitás felhasználása A tapintást, mint érzékelést használja ki ez a kijelzőfajta a bőrben elhelyezkedő érzőreceptorokat ingerlik. A taktilis kijelzők függetlenül vezérelhető mozgató (aktuátor) elemek, amelyek a bőr felületét általában merőleges erőhatásnak teszik ki.
31
A kijelzés frekvenciája, dinamikája, amplitúdója, nyomása, a pontok távolsága határozza meg az átvihető információ jellegét és mennyiségét.
20. ábra-Vibrotaktilis ingerlés
Mint már az a dolgozat elején bemutatásra került, a legérzékenyebb taktilis felvevő pont az ujjak vége. Az ujjak végén 1-2 mm távolságra lévő rezgő pontok jól elkülöníthetők függetlenül attól, hogy a felületre merőleges vagy oldalirányú a gerjesztés. Egy
ponton
vibrálásként
érzékelhető
legmagasabb
frekvencia
1000Hz,
a
legérzékenyebb a bőr a kb 250Hz frekvenciájú rezgésekre. Egy ujjbegy legfeljebb 3,5 mm elmozdulást visel el, a fájdalomküszöb 1,75 mm átmérőjű tüskénél 1,3 MPa. Az érzékelhető legkisebb elmozdulás 2μm abban az esetben, ha az ujj elmozgatását nem engedjük meg. Hiba! A hivatkozási forrás nem található. Moy és szerzőtársai kimutatták, hogy ideális taktilis kijelző 500 mN/mm2 csúcsnyomással, 4 mm lökettel, 50 Hz sávszélességgel, a kijelzők legalább 1 mm-es távolságával jellemezhető. A különféle kijelző technikák a központi vezérlő megoldásokban térnek el. Irodalmi források alapján a különböző fizikai elveken működő taktilis kijelzők jellemzőit az 1. táblázat tartalmazza. Az ott felsorolt megoldások közül, itt csak a legelterjedtebb megoldások kerülnek rövid bemutatásra. Taktilis kijelzőtípusok Termoelektrikus stimulátor A mozgató energiát a mozgatóegységben fellépő termofeszült-ségkülönbség adja. A termoáramot felhasználó berendezés kis frekvenciájú rezgést tud előállítani, továbbá a rezgés útja és az ingerelt felületre kifejtett nyomás is viszonylag alacsony értékeket vesz fel. Kis energia igény jellemző rá, ami a teljesítményt is tükrözi. Elektromágneses stimulátor A szerkezetben az elektromágnes a motor rotációs mozgását lineáris mozgássá alakítja át. Ennél a megoldásnál a széles a megvalósítható rezgetési frekvencia. A stimulátor mozgási 32
tartománya akár 10 mm is lehet. Nincs meghatározva a stimulátor mérettartománya és magas a felületre gyakorolt nyomás értéke is. Pneumatikus stimulátor Alacsony működési frekvencia előállítására alkalmas megoldás. A szerkezet dugattyú elven működő légszelepes megvalósítást alkalmaz. Az alacsony frekvencia ellenére viszonylag erősebb nyomás éték érhető el ezzel a szerkezet-típussal. Piezelektromos stimulátor Működési elve a piezoeffektus. A fordított piezoelektromosságot felhasználva, ha a piezoelektromos kristályra elektromos feszültséget adunk, akkor az elektromos térerősség irányától függően összehúzódik, vagy megnyúlik. Ezt felhasználva a kristálycsíkokra szerelt stimuláló tüskék a váltakozó feszültségre rezegni kezdenek.
A rendszer tervezése Az áttanulmányozott technológiák közül kettő lett kiválasztva, melyek alkalmasak kis energia-befektetés mellett a kívánt paraméterek elérésére. A kiválasztott típusoknál, a piezokristályos és elektromágneses megoldásoknál először is azt kellett megvizsgálni, hogy melyik képes olyan amplitúdójú rezgés előállítására, amely az ember számára használható értékeknek felel meg, és a fentebb meghatározott paraméterek értékei körül mozognak. A National Instruments által gyártott Elvis berendezésén lett megvalósítva a piezokristály szerkezet tesztelése. Kis méretben és alacsony energia felhasználás mellett megvalósítható volt a Piezzó eletromos hatás felhasználásával létrehozott stimuláció. Ebben az esetben viszont a feljebb említésre került ideális paraméterek elérés csak 100V nagyságrendjébe eső meghajtó feszültséggel hozhatók létre.
33
21. ábra-Piezokristályos model tesztelés 1.
22. ábra--Piezokristályos model tesztelés 2.
A méret és energiafelhasználási követelmények alapján lehetséges még az elektromágnesen hatás felhasználásával létrehozott stimuláció, mely valamivel magasabb súlyt eredményez ugyan, de sokkal egyszerűbb kivitelt tesz lehetővé. Kísérletek alapján kiválasztott eljárás az elektromágneses erőhatás kihasználásán alapul, álló állandó mágnest, álló elektromágnest és kis tömegű mozgó horgonyt tartalmaz.
24. ábra Taktilis kijelző 23.
ábra
Elektromágneses
elven
működő
stimulátor
Az elektromágneses elven működő stimulátor szerinti megvalósításon végzett mérések alapján az elrendezés kis energiafelhasználás mellet alkalmas a kívánt hatás, azaz a kéz különböző pontjainak érzékelhető ingerlésére. A szerkezet a beszédhang tulajdonságainak felhasználásával több paraméter kijelzésére kell, hogy alkalmas legyen, így szükséges volt olyan modell elkészítése, melyben azt lehetett megvizsgálni, hogy milyen hangátalakítások menjenek végbe a kívánt eredmény eléréséhez.
34
Az elkészített modell Az elkészített és kipróbált stimulátor vezérlésére egy számítógépes környezetben felépített szimuláció szolgál. A szimuláció a környezetből érkező hanghullámok digitalizálása után a hang jellemzőinek kinyerését valamint a stimulátor vezérlését végzi. Az emberi beszédhang két paramétere lett kiválasztva a mechanikai megjelenítésre: a mássalhangzók kétféle típusa, a zöngés hangok és a frikatív hangok. A hangképzés ennél a két típusnál vizuálisan nem mindig határozható meg könnyedén, így esett a választás ezekre a beszédjellemzőkre. A zöngés hangok frekvenciatartománya 200 – 300 Hz közti érték, a frikatív hangok ennél szélesebb frekvenciaspektrummal rendelkeznek, az 1000 Hz-től 3500 Hz-ig terjedő tartománya esnek bele leginkább. Az első lépés a vezérlés megvalósításánál az analóg jel digitalizálása. Így valósítható meg a kívánt frekvenciaértékek kiszűrése a 0-5000 Hz-ig terjedő emberi beszédjelből. A kívánt szűrt értékek előállítása után frekvenciatartomány modulációt kellett alkalmazni, mert míg a zöngés hangok frekvencia értékei a legérezhetőbb rezgési tartományba esnek, addig a frikatív hangok ötször, hatszor magasabb értékekkel rendelkeznek. A megfelelő moduláció alkalmazása után a jel visszaalakítását kell alkalmazni, olyan formában, hogy, a két különböző paraméter megjelenítése külön-külön jelenik meg ugyanabban az időben a vibrotaktilis szerkezeten. Erre a megoldásra a sztereo hangcsatorna tökéletesen elegendő, így egy egyszerű modulációval a kívánt jel a csatorna egyik, illetve másik oldalába vezérelhető. Ilyen formában tökéletesen adja vissza a taktilis kijelző a megjelenítésre szánt beszédhangot. Számítógépes szimuláció Az elkészült és kipróbált stimulátor vezérlésére egy számítógépes környezetben felépített szimuláció szolgál. A szimuláció a környezetből érkező hanghullámok digitalizálása után a hang jellemzőinek kinyerését valamint a stimulátor vezérlését végzi. A kialakított számítógépes rendszer blokkvázlata a 25. ábrán látható. A rendszerben a beszélő arcáról képet és a hangját felhasználva készítünk egy lejátszható videókódolt állományt mely a sztereó hangcsatornában a normál hang helyett a taktilis kijelző vezérlését tartalmazza, és így lehetőséget teremt arra, hogy könnyen gyorsan tesztelhető legyen az algoritmus.
35
25. ábra-Számítógépes szimláció blokkvázlata
A számítógépes szimuláció megvalósítását Matlab programkörnyezetben végeztem, mely alkalmas az audiófájlok kezelésére is. A szűrők megvalósításához a programhoz tartozó Filter Designe Toolbox-t használtam, mely előre definiált algoritmussal, a kívánt szűrési paraméterek megadásával végzi el a szűrést.
26. ábra-Matlab progrma és a Filter Designe Toolbox
36
A szűrés elvégzése után a magas frekvenciatartományba eső jelet a kívánt 200-300 Hz közötti frekvenciatartományra kell transzformálni, ami a Hilbert transzformációval valósítható meg. 1 1 ⋅ A Hilbert-transzformáció nem más, mint az π t függvénnyel való konvolúció, ami
Fourier-transzformált tartományban - j sgn(f)-fel való szorzást jelent. Összefoglalva:
F
−1
( − j sgn( f ) ) =
11
π t a Hilbert transzformáció súlyfüggvénye,
+∞
H {s(t )} = 1 ∫ s(τ ) dτ π t −τ a Hilbert-transzformáció konvolúciós integrálja. −∞
Sekv(f) Im{}
-B
Re{}
-B
f
S(f)
1 Sekv ( f − f 0 ) 2
1 * Sekv (−( f + f 0 )) 2
-f0-B
f0
-f0+ B
f0-B
f0 f0+ B
f
27. ábra-A jel és alapsávi ekvivalens spektruma A 27. ábra alapján jól látható, hogy a S + ( f ) = S ( f ) + j ( − j sgn( f ) ) S ( f ) szerint definiált pozitív frekvenciájú spektrum az alapsávi ekvivalens spektrumának egyszerű eltoltja (A - j sgn(f) a Hilbert-transzformálás átviteli függvénye), azaz:
S + ( f ) = S ekv ( f − f 0 ) S ekv ( f ) = S + ( f + f 0 ) Innen, felhasználva hogy a frekvenciatartománybeli eltolás időtartományban egy exponenciális taggal való szorzást jelent: s+ (t ) = sekv (t ) e j 2π f 0 t , sekv (t ) = s+ (t ) e − j 2π f 0 t ,
azaz az s+(t) jel előállítható az eredeti jelből a Hilbert-transzformáció segítségével, ebből pedig egy e − j 2π f 0 t -vel való szorzással az alapsávi ekvivalenshez jutunk.
37
Ezt a 90 fokos késleltetésű algoritmust nevezik Hilbert transzformátornak. A szoftverekben kétféle Hilbert transzformátorral találkozhatunk: az egyik jelfolyam típusú szűrő, a másik implementációban pedig a Fourier transzformált együtthatóit módosítják. A megfelelő mátrix műveletek elvégzése után, az elkészült jel adatokat egy hangfáljba írom vissza. Példamondat Klári mindig ráugrik a moziban, amikor jönnek a cápák.
28. ábra-Az eredeti és a modulált jel jelalakja
29. ábra-Eredeti hang frekvenciatartománya
30. ábra-Modulált hang frekvenciatartománya
38
31. ábra-Az eredeti hangfálj jangképe
32. ábra-A modulált hangfálj hangképe
39
Programkód function vege(input,output);
Függvény meghívás, bemeneti és kimeneti hanffájlok megadás,
load low.mat
Aluláteresztő szűrő meghívása
load band.mat
Sávszűrő meghívása
Y = wavread(input);
A megadott hangfájl beolvasása
Y = Y*6;
A
beolvasott
beszédhang
felerősítése,
amplitúdó
moduláció t=(1:length(Y))'/length(Y);
Időtényező deklarálása
z=cos(2000*2*pi*t);
A frekvenciaeltoláshoz szüksége jel deklarálása
B = filter(Hd_low,Y);
A beolvasott fájl aluláteresztő szűrése
B = B*4;
Az eredmény erősítése
B(:,2) = [];
Az eredmény egycstornásssá alakítása
A = filter(Hd_band,Y);
A beolvasott fájl sávszűrése
A(:, 2) = [];
Az eredmény egycstornásssá alakítása
x2=real(hilbert(A)./hilbert(z));
A sávszűrt eredmény Hilbert-transzformációja
yn = x2*2;
Az eredmény erősítése
X = zeros(length(Y),2);
Egy üres mátrix deklarálása, 2 x az eredeti hagfájl hossz
X(:,1) = B;
A mátrix egyik oszlopának feltöltése az aluláteresztő szűrővel késztett eredménnyel
X(:,2) = yn;
A mátrix másik oszlopának feltöltése az sávszűrővel késztett eredménnyel
wavwrite(X,16000,output);
A végeredmény kiíratása hagfájlba
subplot(2,1,1);
A kezdeti fájl hangképének és a megszűrt fájl
plot(Y);
hangképének kirajzoltatása
xlabel('time(s)'); ylabel('relatív hangteljesítmény(db)'); title('Original Signal'); subplot(2,1,2); plot(X); xlabel('time(s)'); ylabel('relatív hangteljesítmény(db)'); title('Modulated Signal');
40
33. ábra-A számítógépes szimulációs rendszer
A számítógépes szimuláció során elkészült állományok bármely számítógépen lejátszhatók és az taktilis kijelzőt a hangszóró kimenetre csatlakoztatva felhasználható. Tapasztalatok a taktilis kijelző használatáról A taktilis kijelző által szolgáltatott információk abban az esetben segítik a beszédmegértésben a felhasználót, ha az megtanulta a taktilis jelek értelmezését. Siketek esetében nem természetes a zöngés/zöngétlen fogalom ezért ennek, illetve az ebből képzett taktilisan átvitt jellemző megtapasztalása csak tanulás után segíti a szájról olvasott beszéd megértését. Továbbfejlesztési lehetőségek Kísérleti lehetőségeket ad még további folyamatok beiktatása a jelfeldolgozásba. Tisztább és érthetőbb taktilis impulzust lehet talán elérni a nullátmenet detekció alkalmazásával. Más szűrési feltételek felhasználásával szintén a tisztább információközlést lehet javítani. A taktilis kijelzővel végzett kísérletek alapján az elrendezés és algoritmus alkalmas arra, hogy önálló megjelenési formában elkészüljön. A taktilis kijelző elkészítésnél hármas célt határoztunk meg: •
Legyen egy számítógépes perifériaként valódi hang kimenetről működő változat;
41
•
Legyen összekapcsolható mobil telefonnnal;
•
Legyen önálló mikrofonnal rendelkező telepes működtetésű változat.
34. ábra Tervezett taktilis kijelző logikai elrendezése
42
Irodalomjegyzék Robert Sekuler – Randolph Blake:
Észlelés, Osiris Kiadó, Budapest, 2000
Szentágothai János – Réthelyi Miklós: Funkcionális anatómia III., Medicina,Budapest,2002 Az emberi test. Medicina - Láng Kiadó, Budapest Matematikai kézikönyv, Typotex Kiadó, Budapest, 2002 Gordos - Takács: Digitális beszédfeldolgozás, Mûszaki könyvkiadó, Budapest 1983. MTA Nyelvtudományi Intézet Fonetikai kutatólaboratóriuma :Magyar nyelvi eszédtechnológiai alapismeretekInterdiszciplináris, multimédiás szakkönyv M. Jungmann, H. F. Schlaak :Miniaturised Electrostatic Tactile Display with High Structural Compliance, Institute of Electromechanical Design / Darmstadt University of Technology Vincent Hayward Juan Manuel Cruz-Hern´andez: TACTILE DISPLAY DEVICE USING DISTRIBUTED LATERAL SKIN STRETCH, Department of Electrical Engineering and Center for Intelligent Machines, McGill University I.Sarakoglou N.Tsagarakis D.G.Caldwell :A Portable Fingertip Tactile Feedback Array – Transmission System Reliability and Modelling, Centre for Advanced Robotics Research, Department of Computing, Science and Engineering, Salford University http://www.mathworks.com/ http://www.mathworks.com/matlabcentral/fileexchange/loadCategory.do
43