INFOKOMMUNIKÁCIÓ
ÚJDONSÁGOK
Vakok tájékozódását segítô eszköz integrált sztereo ultrahangos és rádiós rendszerrel Mihajlik Péter, Tatai Péter, Budapesti Mûszaki és Gazdaságtudományi Egyetem, Balog András, AITIA Informatikai Rt.
A cikkben beszámolunk egy vakok számára készült újszerû eszközrôl, amely a Budapest Mûszaki és Gazdaságtudományi Egyetemen, az AITIA Informatikai Rt.-vel való együttmûködésben lett kifejlesztve. A készülék sztereo ultrahangos visszhanglokációval deríti fel a vak felhasználó elôtti terepet, és speciális hangeffektusokkal jelzi az akadály helyét, megközelítôleg úgy, mintha a hangot maga az akadály adta volna ki. Emellett egy másik komplett rendszer is helyet kap a készülékben: a kiemelt objektumokra szerelt rádió adó/vevôkkel képes kommunikálni és így segíteni a világtalan felhasználót az objektumok megtalálásában. A készülék lelke egy digitális jelprocesszor, amely még az eszköz vezérlésén kívül a beépített kötetlen, magyar nyelvû beszédszintézist is végzi. A cikkben ismertetjük a készülék mûködési elvét és felépítését különös tekintettel az akadálydetekcióra és visszajelzésre, a rádiós rendszerre és a mesterséges beszéd elôállítására. A vakok és csökkentlátók számára rendkívül nehéz a társadalmi beilleszkedés, a közlekedés és szinte minden tevékenység. Az utóbbi években világszerte kutatnak és fejlesztenek a vakok számára korszerû segéd-eszközöket (pl.: [1], [2]), azonban ezek magas ára miatt hazánkban jóformán csak a fehér bot és esetleg a vakvezetô kutya tekinthetô általánosnak. A cikk beszámol egy vakok számára készített új eszközrôl, amely szereo ultrahangos visszhanglokációval deríti fel a vak felhasználó elôtti terepet. A korszerû információtechnológia már ma is számos lehetôséget kínál a vakok életének és beilleszkedésének megkönnyítésére, de ezek terjedése lassú, aminek oka részben anyagi, részben az eszközök korlátozott használhatóságára vezethetô vissza. A kutatások és maguk a hatékonyabb eszközök is költségesek, a vakok anyagi lehetôségei pedig rendszerint még a létezô eszközök vagy programok megvásárlására sem elegendôek. A fentiek alapján rendkívül jelentôs, hogy olcsó, könnyen használható, de a legkorszerûbb tudományos, mûszaki és technológiai lehetôségeket kihasználó eszközöket kutassunk, fejlesszünk és terjesszünk. A projekt egyszerre több probléma megoldását is célul tûzte ki. Egyrészt az önálló közlekedést kívánja támogatni az útba esô akadályok akusztikus jelzésével, továbbá a fontos objektumok (buszmegálló, üzletek és szolgáltatási pontok stb.) megtalálását segíti magyar nyelvû beszédinformációval. Az elsô funkciót – az elkerülendô akadály detektálását – egy sztereo ultrahangos visszhanglokációs
rendszerrel valósítottuk meg, a másodikat – a kiemelt objektumok megtalálását – pedig egy rádiós rendszerrel. A két rendszer vezérlését, irányítását korszerû digitális jelprocesszor végzi, csakúgy, mint a tájékoztató hangeffektusok és a mesterséges beszéd elôállítását.
1. ábra A „Superbat” készülék elve
A készülék akkumulátorról üzemeltethetô, könnyû, kisméretû és egyszerûen használható, hogy a vak felhasználói igényekhez minél jobban igazodjon. MEGVALÓSÍTÁS A következôkben az egyes részegységek, alrendszerek mûködési elvét tárgyaljuk vázlatosan. Kétdimenziós ultrahangos visszhanglokátor
2. ábra A kétdimenziós ultrahangos visszhanglokáció elve
A középen elhelyezett ultrahang adó periodikusan bocsát ki rövid mérôimpulzusokat a hallható hangtartomány feletti szûk frekvenciasávban (40 kHz névleges frekvencián). A visszhangjeleket mindkét oldali vevô érzékeli, és a visszaverôdési idôkbôl mind a távolságot, mind az irányt meg lehet határozni. Ehhez demodulálni kell a jeleket, majd a burkolót mintavételezni és digitálisan feldolgozni a precíz akadálylokáció érdekében
IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS
43
INFOKOMMUNIKÁCIÓ
ÚJDONSÁGOK
Mivel mindenkinek a hallórendszere a saját füléhez és fejéhez alkalmazkodott, ezért egy átlag szûrôkészlettel az érzeti térbe helyezés csak megközelítôleg lesz jó. A problémán egyénre szabott HRIR készletekkel lehet segíteni, pl. megoldható, hogy egy teszt alapján lehessen választani, majd az Interneten keresztül letölteni a kívánt szûrôpárkészletet. 3. ábra A baloldali vevô idealizált burkolójele
A legközelebb lévô akadály távolságának és az irányának közelítô meghatározása: (további részletek a [3]-ban találhatók). A fent meghatározott akadálypozíciót speciális hangeffektusokkal jelezzük vissza a vak felhasználónak, úgy, hogy egyrészt megközelítôleg úgy hallja a hangot, mintha az akadály adta volna ki. Másrészt a távolságot hangmagassággal is érzékeltetjük kellemes gitárpengetés szerû szintetizált hanggal. Ennek a hangnak az elôállítása nem tekinthetô bonyolult feladatnak, azonban az akadály virtuális érzeti térbe helyezését érdemes röviden ismertetni. Kétdimenziós érzeti térbe helyezés
Esetünkben csak a fejhez viszonyított vízszintes síkban detektáljuk az akadályokat a felhasználó elôtt, így elég 5°-os felbontás esetén 18 szûrôpárt eltárolni, amelyeket 128 pontos FIR szûrôk valósítanak meg [5]. Rádiós alrendszer A kiemelt objektumok megtalálását a rájuk szerelt fix telepítésû rádióadó/-vevôk segítik. Ahogy az alábbi ábra is mutatja, a vak felhasználónál lévô mobil egység is rendelkezik rádióadó/-vevôvel, így duplex adatátvitel is megvalósítható a két egység között. Így lehetôvé válik a vak számára a „poll”-ozás, vagyis a közelében levô fix egységek lekérdezése, a kívánt egység kiválasztása, majd ultrahang segítségével a rávezetés is lehetséges. A kétirányú adatátvitel hasznos lehet továbbá buszon a leszállás jelzésére, jelzôlámpáknál és sok egyéb helyen.
Az, hogy térben – fôként az elôttünk lévô vízszintes síkban – viszonylag jól azonosítani tudjuk egy hangforrás helyét, elsôsorban a fejünk és fülkagylónk jellegzetes spektrumformáló tulajdonságainak, és az ehhez fûzôdô tanulási folyamatnak köszönhetô [4]. Vagyis, sztereó fejhallgatóval elvileg tetszôleges érzeti teret hozhatunk létre, hiszen csak két hangcsatorna kódolja mind a forráshangot, mind annak a fejhez viszonyított relatív helyét. Tehát egy hangot úgy tehetünk az érzeti tér egy bizonyos pontjába, hogy a kiválasztott ponthoz tartozó szûrôpárral megszûrjük jobb és baloldalon a hangjelet, és fülhallgatón keresztül a megfelelô fülbe vezetjük az így kapott jeleket. A szûrôk biztosítják a fej és a fülkagyló iránytól függô frekvenciamenetének modellezését. Matematikai szempontból a HRTF (Head Related Transfer Function) idôtartománybeli megfelelôjével, a HRIR-rel (Head Related Impulse Response) végzünk konvolúciót két csatornán.
5. ábra A rádiós alrendszer egyszerûsített blokkvázlata
Amint az illusztráció mutatja, általános soros adatátvitelt valósítunk meg a szabad ISM sávú rádiókommunikációval, így kötetlen szavas beszédszintetizátor esetén bárhol, bármikor felolvashatja a beszédszintetizátor a sugárzott információt. A rádiós összeköttetés távolsága maximum kb. 50 m lehet, amit egyéb technikákkal szükség esetén szûkíteni lehet. Kötetlen beszédszintézis
4. ábra A kétdimenziós érzeti térbe helyezés alapelve
44
IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS
A beszédszintetizátorunk az LSP (Line Spectrum Pair) beszédparaméterek azon tulajdonságait használja ki, hogy azok az idô folyamatos függvényei, azaz sok más beszédparaméterrel ellentétben – mint pl. a formánsok, LPC, vagy kepsztrum paraméterek – nem változnak ugrásszerûen, és nem is szûnnek meg egyes beszédszakaszokban. Így különösen alkalmasak arra, hogy kis hangadatbázis esetén is viszonylag jó beszédhangminôséget adjanak [6].
INFOKOMMUNIKÁCIÓ
ÚJDONSÁGOK
• • • • •
6. ábra A kötetlen beszédszintetizátor egyszerûsített blokkvázlata
A rendszerbe be van építve egy graféma/fonéma átalakító és egy fonémából LSP, hangmagasság, zöngésség, erôsítés-be konvertáló egység, így a rádiós soros összeköttetéssel karakterenként vett szavakat, mondatokat azoknak mennyiségétôl és minôségétôl függetlenül, azaz kötetlen módon fel tudja olvasni. A kísérleti eszköz funkcionális blokkvázlata Az eddig tárgyalt funkciókhoz egy kisméretû, hordozható jelprocesszor (DSP) alapú készüléket terveztünk. Az eszköz funkcionális blokkvázlata az alábbi ábrán látható.
Analóg burkoló-demoduláció Ultrahang-frekvencia: 40 kHz Ultrahang-impulzus generálás: az egyik idôzítô (timer) kimenetét felhasználva A rádiós modul oldható kötéssel illeszkedik Személyi számítógéphez soros v. párhuzamos porton kapcsolódik.
Számítógéprôl a készülék mûködtetô programja frissíthetô, (akár interneten keresztül is), és a flash-memóriában tárolható. Az analóg interfészek segítségével pedig sztereó visszajelzô hang generálható, valamint az ultrahangos modul felôl érkezô visszhang-burkoló jelek digitalizálhatók be. A saját fejlesztésû kártya tehát alkalmas arra, hogy a készülék magja legyen, a perifériák könnyen cserélhetôk, párhuzamosan tesztelhetôk, feljeszthetôk.
EREDMÉNYEK A projekt eredményeként elkészült egy egybeintegrált kísérleti eszköz, amelyet gyakorlatilag a létrehozandó termék prototípusának tekinthetünk. A készüléket elsôsorban a mûködtetô programjának írásával, bôvítésével folyamatosan fejlesztjük, a DSP-t tartalmazó központi hardvert véglegesnek tekintjük.
8. ábra A készülék központi, DSP-s modulja
7. ábra A kísérleti eszköz funkcionális blokkvázlata
Rövidítések feloldása, a rendszer legfontosabb jellemzôi: • • •
HPI: interfész a hoszt (PC) felé (program frissítés stb. céljából) DSP: alacsony fogyasztású, 16 bites fix pontos, 100 MIPS jelprocesszor AIC-k: Analóg interfész áramkörök: 16 bit, 22 KSPS DAC-ADC
A készülék minden funkciója, és azoknak beállítása – a mobiltelefonokéhoz hasonlóan – négy vezérlôgombbal lehetséges. A rádiós modul nem látható a képen, de szintén a fenti készülékbe helyezhetô, avagy igény szerint elhagyható. Az ultrahang szenzoros modul egy külön hardver egység, melyet a fülhallgatókhoz hasonlóan célszerû a fejjel egy koordinációs rendszerbe helyezni (pl. baseball-sapkára, szemüvegre), hogy a rendszer képességeit maximálisan ki lehessen használni. A készülék egyes funkcióit külön teszteltük, különös tekintettel a teljesen újszerû sztereo visszhanglokációs akadálydetektoros rendszerre, melynek eredményét több helyen is publikáltuk [3], [7].
IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS
45
INFOKOMMUNIKÁCIÓ
ÚJDONSÁGOK
átfogó tesztelése jelen tanulmány megírásának pillanatában zajlik, az eredményeket publikálni fogjuk.
ÖSSZEFOGLALÁS
9. ábra Vak programozó tesztelés közben
Az elkészült egybeintegrált készüléket több konferencián is bemutattuk, ahol a vak illetve látó érdeklôdôk ki is próbálhatták az éppen aktuális szoftverváltozattal. A rendszer
A vakok és gyengénlátók társadalmi beilleszkedését, mindennapi életét segítô speciális készüléket fejlesztettünk. Az eszköz prototípusa csaknem teljesen elkészült; az ultrahangszenzoros modul sorozatgyárthatósághoz való formálása és a szoftver fejlesztésének befejezése van csak hátra. Mivel a szükséges alkatrészek ára viszonylag alacsony, fôként sorozatgyártás esetén jó eséllyel érhetjük el a célunk, hogy a vakok számára fejlesztett eszközt ôk maguk is meg tudják vásárolni. Azonban a fix telepítésû rádiós egységek tekintetében az állami, önkormányzati szerepvállalás nélkülözhetetlennek látszik, és természetesen a mobil egységek elterjesztésében is számítunk erre. A készülék rádiós interfésze kompatíbilissá tehetô más hazai rendszerekkel pusztán a mûködtetô szoftver módosításával, így az országhatáron belül – vagy akár azon kívül is – bárhol használható lehet.
IRODALOMJEGYZÉK [1] J. Borenstein, I. Ulrich, A. Arbor: The GuideCane – A Computerized Travel Aid for the Active Guidance of Blind Pedestrians, Proceedings of the IEEE International Conference on Robotics and Automation, Al-buquerque, NM, Apr. 21-27, 1997, 1283-1288. [2] Tony Heyes: An Electronic Travel Aid for the Vision Impaired, http://www.sonicpathfinder.org/ [3] Mihajlik Péter, Tatai Péter: Ultrahangos tájékozódó eszköz vakok számára, Hiradástechnika – Journal on C5, 1999, Vol. 50, 64-72 [4] Jens Blauert, Spatial Hearing: The MIT Press, Cambridge, MA, 1983, 171-182
[5] Bill Gardner, Keith Martin: HRTF Measurements of a KEMAR Dummy-Head Microphone, MIT Media Lab Perceptual Computing – Technical Report #280, May, 1994, http://sound.media.mit.edu/KEMAR.html [6] Lükô Bálint: A Low-Cost Speech Synthesis Method, Proceedings of 2003 Polish-Hungarian-Czech Workshop On Circuit Theory, Signal Processing, And Applications, Prague, Czech Republic, 11-13 Sept. 2003. [7] Mihajlik Péter, Guttermuth Mária, Seres Krisztián, Tatai Péter: A DSP-based Ultrasonic Navigation Aid for the Blind, Proceedings of IEEE Instrumentation and Measurement Technology Conference, Budapest, Hungary, 2001, 1535-1540.
A SZERZÔK BEMUTATÁSA Tatai Péter 1964-ben végzett a BME Villamosmérnöki Karának híradástechnika szakán. 1964-tôl 1986-ig a Távközlési Kutató Intézetben dolgozott, ahol digitális átviteltechnikai és automatikus mérô rendszerek kutatásával és fejlesztésével foglalkozott. 1976-tól 1986-ig a Kódmodulációs Rendszerek osztályát
46
IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS
vezette. Összesen kb. 2 évet töltött tanulmányutakon japán, angol, svéd és német egyetemeken. 1986 óta a BME-n dolgozik, és részt vesz a távközlés oktatásában. Idejének nagyobb részét azonban a kutatás, valamint több kutatási téma irányítása tölti ki. Jelenleg fôként digitális jelfeldolgozással, távközlési mérésekkel és beszédfelismeréssel foglalkozik. Több mint 90 publikációja jelent meg.
INFOKOMMUNIKÁCIÓ
ÚJDONSÁGOK
Mihajlik Péter 1999-ben végzett a BME Villamosmérnöki és Informatikai Karán távközlési fôszakirányon és orvosbiológiai technika mellékszakirányon. 1999tôl 2002-ig villamosmérnöki PhD képzé-
sen vett részt a BME Távközlési és Médiainformatikai Tanszékén, majd ugyanott ügyvivô szakértôként dolgozott. 2004tôl tudományos segédmunkatársként foglalkozik a tanszéken kutatással, oktatással, és disszertációja elkészítésével, melyet automatikus beszédfelismerés témában ír.
Balog András 2002-ben végzett a BME Villamosmérnöki és Informatikai Karán mûszaki informatikusként. Utolsó egyetemi éveitôl kezdve digitális jelfel-
dolgozással és jelfeldolgozó rendszerek alacsony szintû programozásával foglalkozik. Jelenleg a vakok tájékozódását segítô eszköz szoftverének fejlesztését végzi az AITIA Informatikai Rt.-nél.
Átadás Parádfürdôn 2004. február 6-án, ünnepélyes keretek közt adták át a Parádfürdôi Kórház betegfelvételi egységét. A közel egy évig tartó beruházás keretében nemcsak a hotel szárny új bejárata és recepciós része valósult meg, hanem egy teljesen újszerû hálózati megoldással kiépült a most bevezetett integrált informatikai rendszer infrastruktúrája, valamint a betegágynál is használható telefonálási és internetezési lehetôség. Az ünnepélyes megnyitón Rácz Jenô, az ESZCSM helyettes államtitkára elmondta, hogy az országos intézetek fejlesztési elképzeléseiben a Parádfürdôi Kórház – Hévízzel és a Sportkórházzal együtt – kiemelt helyet foglal el. Sós Tamás, a Heves Megyei Közgyûlés elnöke, a térség országgyûlési képviselôje köszöntôjében kiemelte, hogy a Mátra és környéke az európai-uniós csatlakozás után is a régió egyik legjelentôsebb idegenforgalmi területe, melyben fontos szerepet kap a gyógyturizmus. Zámbó László kórházi fôigazgató hangsúlyozta, hogy a megújult és megszépült épületrészek ugyanúgy a betegek komfortérzetét és gyógyulásukat támogatja, mint az ezzel egy idôben elkészült informatikai és kommunikációs rendszer. A kórházban elsôként épült ki egy olyan kábeltelevíziós hálózat, amely lehetôvé teszi, hogy a betegágyak mellôl közvetlenül lehessen a telefon hálózatot és az intranet szolgáltatásokat használni. A korszerû számítástechnikai lehetôségek igénybevételéhez szintén a kábeltelevíziós hálózat biztosít hátteret. A kórházi informatikai rendszert (MedSolution) rekord gyorsasággal telepítették és januártól a kórház teljes betegadminisztrációját e rendszerrel végzik.
(Tudósítónktól)
IME III. ÉVFOLYAM 2. SZÁM 2004. MÁRCIUS
47