VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY
FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV TELEKOMUNIKACÍ FACULTY OF ELECTRICAL ENGINEERING AND COMMUNICATION DEPARTMENT OF TELECOMMUNICATIONS
PANORÁMOVANÍ ZDROJE ZVUKU V NESTANDARDNÍCH REPRODUKTOROVÝCH TOPOLOGIÍCH SOUND SOURCE PANNING IN NON-STANDARD SPEAKER TOPOLOGIES
BAKALÁŘSKÁ PRÁCE BACHELOR'S THESIS
AUTOR PRÁCE
ROMAN DOLEŽEL
AUTHOR
VEDOUCÍ PRÁCE SUPERVISOR
BRNO 2012
Ing. KRISTIÁN ORLOVSKÝ
VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ Fakulta elektrotechniky a komunikačních technologií Ústav telekomunikací
Bakalářská práce bakalářský studijní obor Teleinformatika Student: Ročník:
Roman Doležel 3
ID: 120592 Akademický rok: 2011/2012
NÁZEV TÉMATU:
Panorámovaní zdroje zvuku v nestandardních reproduktorových topologiích POKYNY PRO VYPRACOVÁNÍ: Cílem bakalářské práce je nastudovat metodu pro vícekanálové panorámovaní zdroje zvuku pro nestandardní reproduktorové topologie ve tvaru pravoúhelníku. Zvolenou metodu pak nasimulujte v prostředí Matlab pro volitelnou polohu zdroje zvuku a posluchače. V simulaci bude možné měnit počet a polohu jednotlivých reproduktorů vzhledem k poloze posluchače. Součástí výsledků budou zpracovány poslechové testy na srovnání metody s vektorovou metodou (VBAP). DOPORUČENÁ LITERATURA: [1] Lossius T., Baltazar P., d. l. Hogue T., "DBAP - Distancebased amplitude panning," in International Computer Music Conference (ICMC). Montreal, 2009. [2] D. Kostadinov, J. D. Reiss and V. Mladenov, "Evaluation of distance based amplitude panning for spatial audio", Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal (ICASSP) , Dallas, March 2010 Termín zadání:
6.2.2012
Termín odevzdání:
31.5.2012
Vedoucí práce: Ing. Kristián Orlovský Konzultanti bakalářské práce:
prof. Ing. Kamil Vrba, CSc. Předseda oborové rady UPOZORNĚNÍ: Autor bakalářské práce nesmí při vytváření bakalářské práce porušit autorská práva třetích osob, zejména nesmí zasahovat nedovoleným způsobem do cizích autorských práv osobnostních a musí si být plně vědom následků porušení ustanovení § 11 a následujících autorského zákona č. 121/2000 Sb., včetně možných trestněprávních důsledků vyplývajících z ustanovení části druhé, hlavy VI. díl 4 Trestního zákoníku č.40/2009 Sb.
ABSTRAKT Tato práce je zaměřena na panorámování zvukového zdroje v dvourozměrném prostoru. V první části je pospáno vnímání zvuku lidským sluchovým orgánem a prostorové slyšení člověka. Další kapitola se věnuje běžně používaným metodám panorámování VBAP a ambisonii a nové metodě DBAP, která je hlavním předmětem této práce. Všechny metody jsou vysvětleny na základě teoretických poznatků. Ve třetí části se práce věnuje poznatkům o amplitudové metodě DBAP, které byly získány na základě simulací v prostředí Matlab pro různé reproduktorové topologie. Poslední část se věnuje srovnání metod DBAP a VBAP na základě poslechových testů.
KLÍČOVÁ SLOVA binaurální slyšení, panorámování, vektorová metoda panorámování, VBAP, ambisonické panorámování, amplitudové panorámování na základě vzdálenosti, DBAP, poslechové testy
ABSTRACT This work is aimed to sound source panning in two-dimensional space. The first part describes sound sensation by human auditory organ and spatial hearing. Next aim of the work is to describe commonly used panning methods VBAP and Ambisonics and newly introduced method DBAP, which is the main subject of this work. All methods are explained based on theoretical information. The third part of the work deals with knowledge of the amplitude method DBAP obtained by simulation in Matlab for various speakers topologies. The last section is focused on listening tests for comparison of methods DBAP and VBAP.
KEYWORDS binaural hearing, panning, vector baseb amplitude panning, VBAP, ambisonics panning, distance based amplitude panning, DBAP, listening tests
BIBLIOGRAFICKÁ CITACE
DOLEŽEL, R. Panorámovaní zdroje zvuku v nestandardních reproduktorových topologiích. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2012. 54 s. Vedoucí bakalářské práce Ing. Kristián Orlovský.
Prohlášení Prohlašuji, že svou bakalářskou práci na téma Panorámovaní zdroje zvuku v nestandardních reproduktorových topologiích jsem vypracoval samostatně pod vedením vedoucího bakalářské práce a s použitím odborné literatury a dalších informačních zdrojů, které jsou všechny citovány v práci a uvedeny v seznamu literatury na konci práce. Jako autor uvedené bakalářské práce dále prohlašuji, že v souvislosti s vytvořením této bakalářské práce jsem neporušil autorská práva třetích osob, zejména jsem nezasáhl nedovoleným způsobem do cizích autorských práv osobnostních a/nebo majetkových a jsem si plně vědom následků porušení ustanovení § 11 a následujících zákona č. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o změně některých zákonů (autorský zákon), ve znění pozdějších předpisů, včetně možných trestněprávních důsledků vyplývajících z ustanovení části druhé, hlavy VI. díl 4 Trestního zákoníku č. 40/2009 Sb.
V Brně dne 31.5.2012
............................................ podpis autora
PODĚKOVÁNÍ Děkuji vedoucímu práce Ing. Kristiánu Orlovskému za velmi užitečnou metodickou pomoc a cenné rady při zpracování bakalářské práce a hlavně za pomoc s organizací poslechových testů. Velký dík patří i všem posluchačům, kteří se poslechových testů zúčastnili, a také dvěma pomocníkům, Pavlovi a Petře, kteří mi při testech asistovali.
V Brně dne 31.5.2012
............................................ podpis autora
Obsah Obsah ................................................................................................................................................ 7 Seznam použitých obrázků ...................................................................................................... 8 Úvod .................................................................................................................................................. 9 1. Binaurální slyšení ......................................................................................................... 10 1.1 1.2
Lokalizace zdroje zvuku ........................................................................................ 10 Interaurální časová diference.............................................................................. 11
1.3
Interaurální intenzitní diference. ....................................................................... 13
1.4
Určování pozice zdroje zvuku v mediální rovině ......................................... 14
1.5
Přenosová funkce hlavy ......................................................................................... 15 Panorámování zvukového zdroje ........................................................................... 16
2.1
Úvod............................................................................................................................... 16
2.
2.2 Dvourozměrné amplitudové panorámování ................................................. 16 2.2.1 Základní popis .................................................................................................... 16 2.2.2 Odvození metody a výpočtu zesilovacích činitelů ................................ 17 2.2.3 Použití VBAP pro více, než dva reproduktory ....................................... 19 2.3 Ambisonické panorámování ................................................................................ 21 2.3.1 Základní popis .................................................................................................... 21 2.3.2 Odvození výpočtů metody ambisonie ....................................................... 22 2.4 Amplitudové panorámovaní DBAP ................................................................... 24 2.4.1 Základní popis .................................................................................................... 24 3.
2.4.2 Odvození metody a výpočtu zesilovacích činitelů ................................ 25 Simulace metody DBAP v prostředí MATLAB ................................................... 29
4.
Poslechové testy ............................................................................................................ 36 4.1
Příprava a parametry testu .................................................................................. 36
4.2
Testovací místnost ................................................................................................... 38
4.3 4.4
Průběh testů ............................................................................................................... 39 Výsledky poslechových testů ............................................................................... 40
Závěr .............................................................................................................................................. 47 Použitá literatura ...................................................................................................................... 48 Seznam použitých zkratek .................................................................................................... 50 Seznam příloh ............................................................................................................................ 51
7
Seznam použitých obrázků Obr. 1.1: Definice rovin ......................................................................................................................... 10 Obr. 1.2: Rozdíl vzdáleností zdroje zvuku od obou uší ............................................................ 11 Obr. 1.3: Body v se stejným rozdílem vzdáleností od obou uší a) v rovině, b) v prostoru ......................................................................................................................... 12 Obr. 1.4: Směrová charakteristika pravého ucha [4]. ............................................................... 13 Obr. 1.5: Přenosová funkce zvukovodu (a) a vnějšího ucha (b) [5]. ................................... 14 Obr. 1.6: Přenosová funkce hlavy pro levé a pravé ucho pro daný azimut a elevační úhel [1]. ................................................................................................................................... 15 Obr. 2.1: Dvoukanálová stereofonní soustava ............................................................................. 17 Obr. 2.2: Vektorové výjádření dvoukanálového rozložení ..................................................... 19 Obr. 2.3: Dvourozměrné VBAP pro pět reproduktorů. Vektory ln směřují k reproduktorům, vektorové základny Lnm jsou tvořeny sousedícími reproduktory ........................................................................................................................ 20 Obr. 2.4: Polární tvar snímáčů Blumleinové stereofonní techniky pro pravý a levý reproduktor ........................................................................................................................... 22 Obr. 2.5: Příklady různých polárních tvarů dostupných mikrofonních charakteritik u ambisonie prvního řádu ................................................................................................... 23 Obr. 2.6: Příklad rozmístění čtyř reproduktorů. Hodnoty dn udávají vzdálenost virtuálního zdroje zvuku k jednotlivým reproduktorům .................................... 25 Obr. 2.7: Příklad rozmístění čtyř reproduktorů. Hodnoty Dn udávájí vzdálenost posluchače od jednotlivých reproduktorů ................................................................ 27 Obr. 3.1: Kruhová topologie s pěti reproduktory dle ITU-R BS.775 ................................... 29 Obr. 3.2: Vizualizace rotujícího zvuku kolem posluchače ....................................................... 30 Obr. 3.3: Pěti-kanálová obdélníková topologie ........................................................................... 31 Obr. 3.4: Porovnání signálů jednotlivých kanálů při R = 4 dB pro rozptylový faktor rS = 2,5 (vlevo) a faktor rS = 0,5 (vpravo). .................................................................. 32 Obr. 3.5: Porovnání signálů jednotlivých kanálů při rS = 1,5 pro hodnty R = 6 (vlevo) a R = 2 (vpravo).................................................................................................................... 32 Obr. 3.6: Nestandardní šesti-kanálová reproduktorová topologie ...................................... 33 Obr. 3.7: Qadrofonní topologie a z ní odvozená 6-ti kanálová .............................................. 33 Obr. 3.8: Šesti-kanálová topologie s rovnoměrně rozloženými reproduktory ............... 34 Obr. 4.1: Směry panorámovaných zdrojů zvuku pro poslechové testy (T - tréninkové) .................................................................................................................................................... 37 Obr. 4.2: Schéma místnosti, kde probíhaly poslechové testy ................................................ 38 Obr. 4.3: Srovnání hodnot RMS chyby u obou metod ............................................................... 41 Obr. 4.4: Polohy aritmetického průměru, směrodatné odchylky a intervalu spolehlivosti u metody DBAP ......................................................................................... 42 Obr. 4.5: Polohy aritmetického průměru, směrodatné odchylky a intervalu spolehlivosti u metody DBAP ......................................................................................... 42 Obr. 4.6: Poloha aritmetického průměru metod DBAP a VBAP vzhledem k poloze reproduktorů ........................................................................................................................ 43 Obr. 4.7: Poloha mediánu, 1. a 3. kvartilu a minimální a maximální hodnoty metody DBAP ........................................................................................................................................ 44 Obr. 4.8: Poloha mediánu, 1. a 3. kvartilu a minimální a maximální hodnoty metody VBAP......................................................................................................................................... 44 8
Úvod Vícekanálové a prostorové zvukové systémy pronikají do stále většího počtu nejen běžných spotřebitelských aplikací, ale i do profesionálního hudebního odvětví. Jejich rozvoj dělá tyto systémy mnohem dostupnějšími, a tím se stávají čím dál rozšířenějšími. V dnešní době jsou už samozřejmostí filmy s multikanálovým zvukem, záznamy koncertů, počítačové hry a mnoho dalšího. Tato bakalářská práce je v první části zaměřená na samotnou podstatu prostorového slyšení člověka. Jsou zde popsány jednotlivé podněty, na základě kterých určujeme směr přicházejícího zvuku. Druhá kapitola představuje nejprve dvě nejrozšířenější metody panorámování v horizontální rovině, amplitudovou metodu VBAP a metodu ambisonickou, a jako třetí je uvedena amplitudová metoda DBAP, která byla představena teprve v nedávné době. Vše je shrnuto do teoretických poznatků. Třetí část práce je věnována popisu poslechových simulací, které byly vytvořeny pro metodu DBAP v prostředí Matlab. V poslední části je popsána realizace poslechových testů pro srovnání metod DBAP s VBAP.
9
1. Binaurální slyšení 1.1 Lokalizace zdroje zvuku Binaurální slyšení, tj. vnímání zvuku dvěma ušima, je základní předpoklad pro prostorový poslech. Existuje více podnětů, podle kterých sluchový vjem vyhodnocuje příchozí zvuk. Jejich spojením dochází k více či méně přesnému určení polohy zdroje zvuku tj. jeho lokalizaci. Člověk je schopen lépe rozeznat složené zvuky nebo hluky, než čisté tóny. Dalším důležitým faktorem jsou zkušenosti, které se vyvíjí během života a znalost poslechového prostoru.
Obr. 1.1: Definice rovin V třírozměrném prostoru je směr popsán horizontálním úhlem (azimut) a vertikálním úhlem (elevace). Pro určování polohy zdroje zvuku definujeme dvě roviny – horizontální a mediální, které prochází osou souměrnosti hlavy. Tyto roviny jsou znázorněny na obr. 1.1. Nyní se podrobněji zaměříme na jednotlivé podněty umožňující prostorového slyšení.
10
1.2 Interaurální časová diference Z důvodu různé vzdálenosti zdroje zvuku od obou uší dochází k časovému rozdílu zvukových vln. Tento rozdíl je nazýván interaurální časová diference (Interaural Time Difference, ITD). Pokud je zdroj zvuku umístěn v mediální rovině, jsou vzdálenosti k oběma uším vždy stejné. Při přemístění zdroje zvuku mimo mediální rovinu se vzdálenosti od zdroje k oběma uším liší, proto zvuk dorazí do jednoho ucha dříve než do druhého. Na obr. 1.2. je zobrazen posluchač a objekt ležící mimo mediální rovinu. Objekt je vychýlen od mediální roviny pod azimutem α a tím vzniká binaurální rozdíl vzdáleností Δl, který lze popsat rovnicí[1]: (1.1) kde
jsou odchylky od mediální roviny a d je vzdálenost obou uší. Při výpočtech
se používá průměrná hodnota d = 15 cm.
Obr. 1.2: Rozdíl vzdáleností zdroje zvuku od obou uší Vzdálenost od obou uší není bod v horizontální rovině ani v prostoru definovaný jednoznačně. V horizontální rovině si lze tyto body představit na dvou párech polopřímek, které vychází z každého ucha ke zdroji zvuku. V prostoru tyto body tvoří kužel vzniklý rotací těchto polopřímek čímž vzniká tzv. kužel konfúze (Viz obr. 1.3) [1]. Kdyby byla interaurální časová diference jedinou metodou
11
lokalizace, nebyly bychom schopni např. určit, zda-li zvuk přichází ze strany zepředu nebo zezadu či shora nebo zdola. U krátkého ostrého impulzu rozeznáme časový posun 0,1 ms. Bude-li se tento interval zvětšovat nad hodnotu 2 ms, jsou již vnímány dva rozdílné impulzy, každý v jiném uchu. Přesnějším měřením bylo zjištěno, že dva rozdílné zvuky může člověk vnímat už u časového posunu 630 µs. Rozdíly jsou pravděpodobně způsobené tvarem zvukové vlny zkoumaného impulzu[2].
Obr. 1.3: Body v se stejným rozdílem vzdáleností od obou uší a) v rovině, b) v prostoru U periodických zvuků se interaurální časová diference projeví jako fázový rozdíl. Při rozdílu fází v obou uších je zvuk vnímán tím uchem, kde fáze zvuku předbíhá. Když se však fáze posune více než o polovinu periody, dojde k tomu, že se původně fázově zpožděný zvuk změní na fázově předbíhající, a proto zvuk převládne ve druhém uchu. Směrový účinek tohoto principu se plně projevuje u čistých tónů asi do 800 Hz. V případě tónů s vyšším kmitočtem je polovina vlnové délky kratší nebo rovna vzdálenosti obou uší, není dosaženo dostatečného časového rozdílu v obou uších, a tím se stává odchylka směru velice malou a dochází ke konfuzím – zvuky nepatrně kolísají kolem střední roviny nebo se zdá, že v jeden okamžik přichází z více míst[2]. Tento princip (ITD) je efektivně využit zejména u blízkých zdrojů tj. řádově vzdálenost obou uší, kdy se projeví fázový rozdíl. Další podnět umožňující prostorové slyšení je princip založený na rozdílu intenzit.
12
1.3 Interaurální intenzitní diference. Je-li zdroj zvuku umístěn mimo mediální rovinu, jak bylo zmíněno v předchozí kapitole, dojde k časovému rozdílu v obou uších, ale navíc ještě k rozdílu intenzity zvuku v obou uších. Tento jev nazýváme interaurální intenzitní diference (Interaural Intensity Difference, IID). Rozdíl intenzit je způsoben jednak různou vzdáleností zdroje zvuku od obou uší, ale hlavně akustickým stínem hlavy. Intenzitní diference se na rozdíl od časové projevuje především u vyšších kmitočtů. U hlubokých tonů asi do 200 Hz není hlava dostatečná překážka, a proto ji zvuková vlna „obejde“ a zvuk dorazí do obou uší se stejnou intenzitou. S narůstajícím kmitočtem se rozdíl intenzit při změně azimutu zvětšuje (Viz obr. 1.4) [2].
Obr. 1.4: Směrová charakteristika pravého ucha [4]. Akustický stín hlavy mění spektrum vnímaného signálu, což také napomáhá k přesnějšímu určení polohy zdroje a to hlavně u zvuků, u kterých známe ze zkušeností jejich spektrální skladbu. Na základě tohoto poznatku lze pozorovat schopnost určování směru zdroje zvuku i u lidí, kteří jsou již delší dobu odkázáni na poslech jen jedním uchem. Experimentálně byla zjištěna přesnost lokalizace v horizontální rovině při binaurálním poslechu v průměru 3° a při monaurálním poslechu 30°, jestliže má posluchač možnost pohybovat hlavou, čímž může porovnávat změny. Minimální poslechový úhel (minimální postřehnutelná změna 13
v úhlu dopadající zvukové vlny) je malý (kolem 1°) pro nízké a vysoké kmitočty a velký (vetší než 10°) pro kmitočty mezi 1,5 – 2 kHz. Také je menší pro zvukové zdroje nacházející se vepředu než pro zdroje umístěné po stranách hlavy[2].
1.4 Určování pozice zdroje zvuku v mediální rovině Jak bylo zmíněno v předchozí kapitole, pro tóny s nízkým kmitočtem (cca do 200 Hz) není hlava dostatečnou překážkou, a proto je zejména u čistých tónů těžší určit, přichází-li zvuk zepředu, nebo zezadu. Při experimentech je chyba při určení směru téměř ve 40 %. U harmonických tónů nad 300 Hz klesá chyba úsudku zhruba na 15 %, protože se už u těchto kmitočtů projeví, důsledkem akustického stínu ušního boltce, pokles intenzity u zvuku, který přichází zezadu. Akustický stín ušního boltce značně napomáhá k lokalizaci složených tónů tím, že odfiltruje složky vyšších kmitočtu zvuku přicházejícího zezadu. Tento princip lokalizace se vyvíjí především na základě zkušeností spojených se zrakovým vjemem[3].
Obr. 1.5: Přenosová funkce zvukovodu (a) a vnějšího ucha (b) [5]. Dalším faktorem, který nám pomáhá při lokalizaci, jsou odrazy od ramen a změna tvaru časového průběhu signálu, zejména jeho přechodných dějů[4]. Změny tohoto typu jsou způsobeny především díky odrazům ve vnějším uchu a ve zvukovodu. Tuto vlastnost popisuje přenosová funkce zvukovodu a vnějšího ucha, které jsou na obr. 1.5. Vrcholy přenosové funkce zvukovodu jsou kolem kmitočtů 5 kHz a 10 kHz, což je dáno fyzikálními rozměry zvukovodu. Maxima přenosové funkce vnějšího ucha leží v oblasti mezi 1 kHz a 5 kHz v závislosti na směru příchozího zvuku. Na obr. 5b je zobrazena závislost přenosové funkce vnějšího ucha 14
na elevačním úhlu zdroje zvuku. Pro lokalizaci jsou podstatné polohy minim těchto přenosových funkcí[5]. Přínosem pro lokalizaci je také případ, kdy se zdroj zvuku pohybuje nebo má-li posluchač možnost pohybovat hlavou. Dochází tím ke změně intenzity a fázového posuvu v obou uších a srovnáním lze snáze určit polohu. Při natočení hlavy se zdroj ocitne blíže k jedné straně hlavy, což také napomůže správné lokalizaci.
1.5 Přenosová funkce hlavy Přenosová funkce hlavy (Head-Related Transfer Function, HRTF) je funkce popisují přenos zvuku od zdroje v dané pozici v prostoru až do lidského ucha. Uplatňuje se především při modelování akustických vlastností místností a tvorbě prostorových efektů. Přenosová funkce hlavy je závislá na fyzických proporcích každého jedince, proto neexistuje žádná univerzální funkce. Měření přenosové funkce hlavy probíhá v bezodrazové komoře za pomocí reproduktoru a umělé hlavy. Reproduktor přehrává zvukový signál (nejčastěji pseudonáhodný šum) z daného směru v prostoru. Výstupem je soubor impulzních odezev hlavy (Head-Related Impulse Responce, HRIR). Fourierovou transformací těchto odezev se získá přenosová funkce hlavy pro dané azimuty a elevační úhly[1]. Příklad takové funkce pro levé a pravé ucho s azimutem a elevací jako parametrem je znázorněn na obr. 6.
Obr. 1.6: Přenosová funkce hlavy pro levé a pravé ucho pro daný azimut a elevační úhel [1]. 15
2. Panorámování zvukového zdroje 2.1 Úvod Prostorové slyšení je přirozenou vlastností člověka. Proto vývoj audiotechniky směřoval od prvních monofonních nahrávek k vícekanálové (stereofonní) reprodukci. Nejprve k reprodukci dvoukanálové, kdy bylo zvukové pole rozšířeno na linii mezi dva reproduktory. Tento typ reprodukce je stále nejrozšířenější jak u běžných uživatelů, tak v profesionálním prostředí. Dalším vývojovým stupněm bylo rozšíření reprodukce do prostoru, ať už v horizontální rovině, nebo dokonce do celé trojrozměrné sféry. Ve většině dnešních systémů se jedná o horizontální rozložení reproduktorů. Tato kapitola se věnuje dvěma nejrozšířenějšími metodami panorámování zdroje zvuku a dále jedné nové metodě, která byla představena v nedávné době.
2.2 Dvourozměrné amplitudové panorámování 2.2.1 Základní popis Nejznámější
panorámovací
metoda
je
dvourozměrné
amplitudové
panorámovaní (Vector-Based Amplitude Panning, VBAP), také nazývané intenzitní panorámování. Tato metoda se uplatňuje jak v malých domácích stereofonních soustavách, tak i v profesionálních mixážních pultech. Jedná se však pouze o jakési napodobení lokalizace reálného zvukového zdroje. Při jednoduchém amplitudovém panorámování vyzařují dva reproduktory souvislé signály, které mohou mít rozdílnou amplitudu. Posluchači se pak jeví pouze jeden zvukový zdroj (virtuální zdroj zvuku), který leží někde v horizontální rovině určené polohou reproduktorů a posluchače, v závislosti na poměru amplitud v jednotlivých reproduktorech. Na obr. 2.1 můžeme vidět příklad virtuálního zdroje zvuku. Dva reproduktory jsou symetricky umístěné kolem středové roviny a jsou polohované pod úhlem φ0 = ±30°. Amplitudy signálů pro jednotlivé reproduktory jsou řízené danými zesilovacími činiteli g1 a g2. Směr virtuálního zdroje je dán poměrem amplitud vyzařovaných signálů. Aby byla zachována konstantní hlasitost u pohybujícího se 16
zdroje zvuku, musí být zesilovací činitele normalizovány. Zvukový výkon vyzařovaný tímto zdrojem je nastaven na konstantní hodnotu C: (2.1) Parametrem C (C>0) lze nastavit celkovou hlasitost a tím do jisté míry ovlivníme vnímání vzdálenosti virtuálního zdroje. Jelikož nepotřebujeme řešit vzdálenost, zdroj bude umístěn na oblouku mezi reproduktory (poloměr daný vzdáleností reproduktorů od posluchače) nazývaný aktivní oblouk. Viz obr. 2.1. V další podkapitole je uvedeno odvození metody a postup výpočtů zesilovacích činitelů metody VBAP.
Obr. 2.1: Dvoukanálová stereofonní soustava
2.2.2 Odvození metody a výpočtu zesilovacích činitelů Směrový vjem virtuálního zdroje zvuku tvořený amplitudovou metodou panorámování vyplývá ze stereofonní sinusové věty[6]:
kde
. V této rovnici (2.2) značí φ úhel mezi směrem virtuálního zdroje a osou x a
±φ0 je úhel mezi jednotlivými reproduktory a osou x (Viz obr. 2.1). Rovnice platí za 17
předpokladu, že posluchač je otočen hlavou přímo vpřed. Pokud posluchač otočí hlavou nebo sleduje virtuální zdroj zvuku, je správnější použít tangentovou větu[7]:
kde
. Rovnice (2.2) a (2.3) počítají s předpokladem, že je příchozí zvuk rozdílný jen
ve velikosti (časová diference se neprojeví), která je platná pro kmitočty pod 500–600 Hz. Kombinací jedné z těchto rovnic s rovnicí (2.1) lze za předpokladu konstantní úrovně zvukového výkonu vypočítat zesilovací činitele[7]. V dvojrozměrném
prostoru
si
lze
představit
stereofonní
rozmístění
reproduktorů jako dvojrozměrnou vektorovou základnu, která je definovaná jednotkovými vektory: (2.4) které směřují k příslušným reproduktorům. Situace je zobrazena na obr. 2.2. Index T značí transponovanou matici. Jednotkový vektor p, který směřuje k virtuálnímu zdroji, lze popsat jako lineární kombinaci reproduktorových vektorů l1 a l2. Platí pro něj: (2.5) (2.6) V rovnici (2.6) vystupují zesilovací činitele g1 a g2, které je možné chápat jako skalární nezáporné proměnné. Rovnice lze vyjádřit v maticové podobě: (2.7) (2.8) (2.9) Tato rovnice má řešení, pokud existuje
: (2.10)
18
Tato inverzní matice
musí splňovat podmínku: (2.11)
kde I je jednotková matice.
existuje, když
. U obou těchto
krajních pozic se jedná o nezajímavé případy, kdy jde od jednorozměrnou VBAP, čímž dochází k pohybu zdroje jen po jedné z os, tj. mění se jeho vzdálenost regulací zesílení.
Obr. 2.2: Vektorové výjádření dvoukanálového rozložení Výpočet zesilovacích činitelů g1 a g2 podle rovnice (2.10) splňuje tangentovu větu v rovnici (2.3). Pokud nemáme pravoúhlou vektorovou základnu (φ0 ≠ 45°), musíme normalizovat zesilovací činitele podle rovnice[7]:
Nyní už zesilovací činitele gnorm splňují podmínku v rovnici (2.1).
2.2.3 Použití VBAP pro více, než dva reproduktory V dnešní době je ve většině zvukových systémů (např. Dolby Surround) více, než dva reproduktory v horizontální rovině. I tyto systémy je možné pospat pomocí 19
vektorové základny. V každém čase je signál použitý právě na jeden pár reproduktorů, který je vybrán systémem. Tím je systém složen z více vektorových základen, které si vzájemně konkurují. Na obr. 2.3 je znázorněn systém složený z pěti reproduktorů při použití dvojrozměrné VBAP. Virtuální zdroj zvuku může být vytvořený reproduktorovou základnou na aktivním oblouku, na kterém je umístěný. Spojením všech aktivních oblouků jednotlivých párů reproduktorů pokryjeme celý prostor
zvukového
pole.
Nejjednodušší
a
nejlepší
způsob
výběrů
dané
reproduktorové základny je použít k vytvoření sousedící reproduktory. Z obr. 2.3 je patrné, že mohou být vytvořené vektorové základny L12, L23, L34, L45 a L51. Tím nedochází k překrývání aktivních oblouků a je dosaženo plynulé změny zesilovacích činitelů při panorámování pohyblivého zdroje zvuku. Když zvuk přechází z jednoho páru na druhý, zesilovací činitel reproduktorů, který po přechodu nebude použitý,
Obr. 2.3: Dvourozměrné VBAP pro pět reproduktorů. Vektory ln směřují k reproduktorům, vektorové základny Lnm jsou tvořeny sousedícími reproduktory budu postupně snížen na nulu. To je důležité proto, aby tento reproduktor nadále neovlivňoval polohu zdroje na dalším aktivním oblouku. Vhodný pár lze vybrat výpočtem nekalibrovaných zesilovacích činitelů v rovnici (2.10). Daná vektorová základna nevykazuje žádné záporné činitele, přičemž ostatní záporné činitele musí být nastaveny na nulu, aby neovlivňovaly polohu virtuálního zdroje[7]. 20
2.3 Ambisonické panorámování 2.3.1 Základní popis Druhou rozšířenou metodou pro panorámování zvuku je metoda ambisonie, která je založena na harmonickém rozkladu zvukového pole. Metoda byla průkopnickým systémem hlavně Michaela Gerzona. Hlavním specifikem této metody je separace počtu kanálů pro přenos zvuku a počtu reproduktorů potřebných pro reprodukci. Proto je často počet reproduktorů větší než počet přenosových kanálů. Se zvyšujícím se množstvím reproduktorů roste i stabilita zvukového pole. Ambisonie je logické rozšíření Blumleinova binaurálního reprodukčního systému. Základem této poměrně jednoduché metody je myšlenka, že pokud použijeme při snímání zvukového pole dvě mikrofonní pouzdra s osmičkovou charakteristikou umístěné kolmo na sebe, můžeme z nich vytvořit každou další osmičkovou charakteristiku. V případě použití dvou mikrofonů s osmičkovou charakteristiku (obr. 2.4) je možné každou osmičkovou charakteristiku vytvořit pomocí rovnic[8]:
kde Θ je požadovaný úhel charakteristiky a L a R je levé a pravé obložení osmičkového mikrofonu. Gerzon tuto teorii rozšířil, aby bylo možné použít ambisonii pro obnovení úplného trojrozměrného zvukového pole. Další podstatnou změnou je fakt, že dekódovací frekvenční charakteristika může být dle potřeby modifikována, tudíž lze použít i jiné, nejen osmičkové, charakteristiky[8]. V případě ambisonie prvního řádu poskytují zvukové pole čtyři signály (známé jako B- formát). W signál je signál všesměrového tlaku reprezentující složku nultého řádu zvukového pole a signály X, Y, Z představují signály mikrofonů (s osmičkovou charakteristikou) použitých při snímaní zvuku v každé ze tří dimenzí.
21
Obr. 2.4: Polární tvar snímáčů Blumleinové stereofonní techniky pro pravý a levý reproduktor
2.3.2 Odvození výpočtů metody ambisonie Pro úplnou trojrozměrnou reprodukci jsou u ambisonie potřeba čtyři signály (W, X, Y, Z). Pokud je přehrávací soustava pouze horizontálního charakteru, stačí k její reprodukci pouze signály tři – W, X a Y. Následující rovnice (2.14) vyjadřují čtyři mikrofonní charakteristiky. Rovnice lze použít také na kódování zvukového zdroje a vyjadřují zesílení použitého zvuku pro každý kanál signálu B- formát[8].
(2.14)
kde Θ je azimut zdroje zvuku a α je elevační úhel zdroje. Podle pořadí přehrávání signálu B- formát jsou vypočítány virtuální mikrofonní charakteristiky a dodány do každého reproduktoru. Nasměrováním lze při použití signálu B- formát získat charakteristiku mikrofonu prvního řádu. Jak bylo uvedeno v předchozí kapitole, je tato teorie velmi podobná Blumleinovu stereo s tím rozdílem, že si můžeme vybrat jakýkoliv tvar virtuální mikrofonní charakteristiky
22
prvního řádu (od všesměrové po osmičkovou). Lze toho dosáhnout použitím jednoduchých vztahů[8]:
(2.15)
kde W, X, Y a Z jsou signály B- formátu popsané rovnicí (2.14), Θ a α je azimut resp. elevace reproduktoru a S je výstup konkrétního reproduktoru. Směrový faktor d je z rozsahu 0 až 2, čímž máme možnost upravit frekvenční charakteristiku pro každý reproduktor dekodéru. Příklady různých charakteristik jsou na obr. 2.5.
Obr. 2.5: Příklady různých polárních tvarů dostupných mikrofonních charakteritik u ambisonie prvního řádu Na závěr uvedu příklad kódovacího a dekódovacího procesu ambisonické metody pro monofonní zdroj zvuku umístěným pod azimut 60° a elevačním úhlem
23
0° pro jeden reproduktor. Dle rovnice (2.14) budou signály B- formátu složeny z amplitudových váhových signálů uvedeny v následující rovnici:
(2.16)
kde msound je monofonní panorámovaný zvukový zdroj a W, X, Y, Z jsou výsledné složky signálu B- formát, kdy zvukový zdroj mono dosáhl směrové závislosti amplitudové váhy. Pro dekódování takto zakódovaného signálu B- formátu pro jakoukoliv polohu reproduktoru využijeme rovnice (2.15). Pro tento příklad je použita kardioidní charakteristika pro dekódovaný reproduktor, která je porovnána se směrovým faktorem 1. Další rovnice ukazuje buzení reproduktoru, který je umístěn pod azimutem 30° v horizontální rovině, tedy s elevačním úhlem 0°:
(2.17) Složky W, X, Y a Z představují kódovaný signál B- formát a S je výsledný výstup pro konkrétní reproduktor. Frekvenční charakteristiku lze zvolit buď podle subjektivního pohledu (na základě nějakého empiricky odvozeného tvaru nastavení) nebo dle teoretických výpočtů pro dosažení optimálního dekódovacího systému.
2.4 Amplitudové panorámovaní DBAP 2.4.1 Základní popis Výše zmíněné dvě nejrozšířenější metody panorámování trpí některými omezeními. Hlavním problémem je u obou metod předpoklad, že pozice posluchače je známa a omezena na relativně malou oblast, přičemž reproduktory jsou umístěny kolem posluchače v dvourozměrném prostoru na kružnici (v třírozměrném na kouli). V praktických aplikacích nemusí být tyto požadavky dosažitelné, což velice často nebývají.
24
Distance-based amplitude panning (DBAP) je maticově založená technika panorámování, která uvažuje pozici reproduktorů v prostoru jako výchozí bod a přitom neklade žádné požadavky na pozici posluchače. DBAP rozšiřuje princip intenzitního panorámování od dvojice reproduktorů na libovolné reproduktorové pole, které nemá žádné omezení pozice jednotlivých reproduktorů v prostoru nebo jejich vzájemném rozmístění. Pro jednoduchost bude metoda dále vysvětlena pro dvourozměrný prostor (snadno ji lze rozšířit pro trojrozměrný prostor).
2.4.2 Odvození metody a výpočtu zesilovacích činitelů Metoda uvažuje rozmístění zdroje zvuku a reproduktorů v kartézském souřadnicovém systému. Poloha virtuálního zdroje zvuku je dána souřadnicemi (
). V případě počtu reproduktorů N je dána pozice i-tého reproduktoru
souřadnicemi (
). Vzdálenost
mezi zdrojem zvuku a daným reproduktorem je
dána rovnicí: (2.18) pro
Příklad je znázorněn na obr. 2.6.
Obr. 2.6: Příklad rozmístění čtyř reproduktorů. Hodnoty dn udávají vzdálenost virtuálního zdroje zvuku k jednotlivým reproduktorům 25
DBAP dále uvažuje dvě vlastnosti. První z nich je předpoklad, že intenzita tj. hlasitost je konstantní nezávisle na poloze virtuálního zdroje zvuku. Proto musí být zesilovací činitele normalizovány, tj. musí vyhovovat rovnici:
kde
je zesílení i-tého kanálu. Druhou podmínkou je, že všechny reproduktory
budou aktivní po celou dobu a relativní amplituda i-tého reproduktoru (vztažená ke vzdálenosti od virtuálního zdroje zvuku) bude dána zesilovacím činitelem[9]:
kde k je koeficient závislý na pozici zdroje a všech reproduktorů. Koeficient a je vypočten z hodnoty poklesu hladiny akustického tlaku na zdvojnásobené vzdálenosti při šíření zvuku v prostoru R rovnicí:
Hodnota
odpovídá zvukovému šíření ve volném prostoru. Pro uzavřené
a polozavřené prostředí je hodnota R obecně nižší, v rozmezí 3-5 dB v závislosti na odrazech a dozvuku prostředí [11]. Spojením rovnice (2.19) a (2.20) lze získat vyjádření koeficientu k:
Nyní lze kombinací rovnic (2.20) a (2.22) vyjádřit zesilovací činitele reproduktorů:
26
V případě, kdy je virtuální zdroj zvuku přesně na pozici některého reproduktoru, dojde podle předchozí rovnice k dělení nulou. Z této rovnice lze dokázat, že: (2.24) Pokud virtuální zdroj bude na přesné pozici některého reproduktoru, bude vyzařovat zvukový signál pouze tento reproduktor. To by způsobilo nežádoucí změny při šíření zvuku v prostoru. Pro odstranění tohoto jevu doplníme rovnici (2.18) o tzv. rozptylový faktor
Vztah pro výpočet vzdálenosti od zdroje k reproduktoru má
nyní tvar: .
(2.25)
V dvojrozměrném prostoru lze rozptylový faktor chápat jako vertikální posunutí mezi zdrojem a reproduktorem. Čím je rozptylový faktor větší, tím méně bude zvukový zdroj tíhnout jen k jednomu reproduktoru. Praktické zkušenosti ukazují, že je určitý limit pro hodnotu
, protože by přišel v potaz tzv. precedence effect [12], který by
měl za následek přitahování zvukového zdroje k reproduktoru, který je nejblíže k posluchači.
Obr. 2.7: Příklad rozmístění čtyř reproduktorů. Hodnoty Dn udávájí vzdálenost posluchače od jednotlivých reproduktorů 27
Jak bylo uvedeno v úvodu, zesílení pro jednotlivé reproduktory nejsou závislá na poloze posluchače; důležité jsou pouze vzdálenosti od virtuálního zdroje zvuku k reproduktorům. Je-li však posluchačova poloha známa, lze provést ještě zlepšení přesnosti metody. Vzorový příklad je znázorněn na obr. 13. Aby bylo zajištěno, že zvuk dorazí od každého reproduktoru k posluchači ve stejný okamžik, aplikujeme na každý kanál příslušné zpoždění. Pro zpoždění
(vyjádřeném ve vzorcích, pro i-tý
kanál) platí[10]:
kde je
vzdálenost od posluchače k reproduktoru i,
vzorkovací frekvence reprodukovaného zvuku.
28
je rychlost zvuku a
je
3. Simulace metody DBAP v prostředí MATLAB Jedním z cílů této práce bylo prostudovat a experimentálně zhodnotit amplitudovou metodu panorámování DBAP, popsanou v kapitole 2.4. DBAP se jeví jako alternativa k nejpoužívanějším dvěma metodám VBAP a ambisonické. Jak už bylo zmíněno, je u těchto dvou metod předpoklad, že posluchačova pozice je známa a omezena na relativně malý prostor a reproduktorové pole je umístěno na kružnici (kouli) kolem posluchače, což představuje největší problém při použití v běžných podmínkách, kde se takové topologie běžně nevyskytují. DBAP tyto požadavky nemá. U této metody je důležitá pouze poloha jednotlivých reproduktorů v prostoru a poloha virtuálního zdroje zvuku. Na základě poznatků o této metodě jsem realizoval simulaci panorámování zvukového zdroje v prostředí Matlab. Pro dílčí simulace jsem uvažoval jak statický virtuální zdroj (tj. jeho poloha byla jednoznačně definovaná a neměnná), tak pohyblivý zdroj zvuku, který rotoval po zadané kružnici kolem posluchače. Simulace probíhaly na několika různých topologiích (se čtyřmi, pěti a šesti reproduktory). Jako zásadní se ukázala volba vhodného rozptylového faktoru rS a hodnota poklesu akustického tlaku R (viz kapitola 2.4.1).
Obr. 3.1: Kruhová topologie s pěti reproduktory dle ITU-R BS.775 29
Pro prvotní simulace bylo použito kruhové rozmístění reproduktorů, které je znázorněné na obr. 3.1. Virtuální zdroje zvuku byly umístěny v několika statických pozicích jak na aktivním oblouku reproduktorů, tak i uvnitř tohoto kruhu. Jako výchozí byla hodnota R nastavena na 6 dB. Různé hodnoty rozptylového faktoru rS se ukázaly jako zásadní pro hodnoty zesilovacích činitelů jednotlivých reproduktorů, čímž je ovlivněna správná lokalizace zvukového zdroje. Při simulacích bylo využito hodnot rozptylového faktoru z rozmezí od 0 do 3 a jako zvukový signál posloužil vygenerovaný bílý šum. Z experimentálních výsledků vyplývá, že čím je rozptylový faktor menší, tím je relativní poměr zesilovacích činitelů větší (rozdíl při různých hodnotách je zobrazen na obr. 3.4). Zvukový signál je při malých hodnotách rS vyzařován převážně z reproduktoru, který je nejblíže virtuálnímu zdroji. To vede k chybné lokalizaci v případech, kdy je zdroj zvuku umístěný v blízkém okolí jednoho reproduktoru. Hodnoty blížící se horní hranici rozmezí zkoušených rozptylových faktorů měly za následek, že se srovnávaly velikosti zesilovacích činitelů pro jednotlivé kanály. V praxi to znamená, že zvuk byl více vyzařován i reproduktory vzdálenějšími od virtuálního zdroje, což zapříčinilo těžší a méně přesnou lokalizaci. Nalezení optimální hodnoty rozptylového faktoru bylo předmětem dalších simulací.
Obr. 3.2: Vizualizace rotujícího zvuku kolem posluchače
30
Dalším krokem bylo simulování pohyblivého virtuálního zdroje, konkrétně zvuku pohybujícího se po kružnici. Délka jednoho oběhu byla nastavena na 15 s (150 kroků, každý trval 100 ms, Obr. 3.2). Nejvěrnější se jevil zvuk s hodnotami rozptylového faktoru v rozmezí 1-2, avšak i tak se projevovaly velké nedostatky při pohybu zvuku po stranách posluchače a za ním. V prostoru před posluchačem byla přesnost znatelně lepší. Nepřesnost po stranách posluchače je daná nejen horší rozlišovací schopností lidského sluchu pro zvuky přicházející ze strany, ale také větší vzdáleností mezi reproduktory v této topologii.
Obr. 3.3: Pěti-kanálová obdélníková topologie
Další reproduktorová topologie byla tvaru obdélníka, jak je naznačeno na obr. 3.3. Byly opět provedeny simulace jak s různými pozicemi statického virtuálního zdroje, tak se zvukem pohybujícím se po kružnici a to pro různé hodnoty rS a R. Jako příklad uvedu panorámování statického zdroje, který je umístěný vůči posluchačovi o 90° vpravo, přesně na spojnici reproduktorů 2 a 3. Zesílení jednotlivých reproduktorů, tj. zesilovací činitele, vypočteme na základě vzdálenosti virtuálního zdroje zvuku od těchto reproduktorů. Jak bylo uvedeno výše, hodnota zesilovacího činitele reproduktoru je značně závislá na volbě jak rozptylového faktoru rS, tak
31
hodnoty R. Pro názornost jsou znázorněny na obr. 3.4 a obr. 3.5 signály jednotlivých kanálů s rozdílným rozptylovým faktorem resp. s různou hodnotou R.
Obr. 3.4: Porovnání signálů jednotlivých kanálů při R = 4 dB pro rozptylový faktor rS = 2,5 (vlevo) a faktor rS = 0,5 (vpravo).
Obr. 3.5: Porovnání signálů jednotlivých kanálů při rS = 1,5 pro hodnty R = 6 (vlevo) a R = 2 (vpravo) Při třetí zkoušené topologii (obr. 3.6) bylo použito 6 reproduktorů. Pro toto rozmístění byly provedeny simulace s pohybujícím se zdrojem zvuku po kružnici s různými hodnotami rozptylového faktoru rS. Umístění dalšího reproduktoru za posluchačem mělo za následek zlepšení přesnosti lokalizace zvukového zdroje v této oblasti. Vlivem posunutí zadních krajních reproduktorů směrem dopředu se nepatrně zlepšila i lokalizace po stranách posluchače. 32
Obr. 3.6: Nestandardní šesti-kanálová reproduktorová topologie Simulace probíhaly také na čtyř-kanálové čtvercové sestavě reproduktorů. Doplněním předního a zadního centrálního reproduktoru vzniklo další zkoumané šesti-kanálové rozestavění. Obě tyto topologie znázorňuje obr. 3.7. V obou těchto případech byla dosažena přesnější postranní lokalizace, ale při použití pouze 4 reproduktorů nebyla dostatečná přesnost při určování směru zvuku před posluchačem (způsobeno absencí předního centrálního reproduktoru).
Obr. 3.7: Qadrofonní topologie a z ní odvozená 6-ti kanálová 33
Poslední uvedená šesti-kanálová topologie, a pro další testování nejdůležitější, má rovnoměrně rozmístěny reproduktory na kružnici pod úhly 60°. Toto rozložení, zobrazené na obr. 3.8, zajišťuje stejné rozestupy mezi všemi reproduktory a tím i nejlepší pokrytí zvukového pole kolem posluchače. Lokalizace ze všech směrů byla dostatečně přesná a závěrečné simulace pro určení parametrů rS a R probíhaly na této reproduktorové topologii.
Obr. 3.8: Šesti-kanálová topologie s rovnoměrně rozloženými reproduktory Při testování metody panorámování DBAP na všech zmíněných topologiích se ukázalo, že volba hodnoty rozptylového faktoru rS a hodnoty poklesu akustického tlaku R (viz kapitola 2.4.2) měla podstatný vliv na výsledné zvukové pole a následnou přesnost lokalizace virtuálního zdroje zvuku. Kontaktoval jsem proto opakovaně emailem autory článků [9] a [10] s prosbou o informace ohledně jejich experimentů s touto metodou panorámování, bohužel odpověď nedorazila ani od jednoho. Hodnoty parametrů jsou proto stanoveny dle subjektivního poslechu při testování na všech zkoušených reproduktorových sestavách. Hodnota R je různá v závislosti na prostoru (místnosti), kde se zvuk šíří (odrazy zvuku, dozvuk [11]). Ze všech simulací byla stanovena jako nejvhodnější hodnota R = 6 dB.
34
Jak již bylo zmíněno, při malých hodnotách rS je zvukový signál vyzařován hlavně reproduktorem, který je nejblíže virtuálnímu zdroji zvuku. To má za následek, že i když je virtuální zdroj umístěn někdy mezi dva reproduktory, vnímaný směr zdroje směřuje více k bližšímu reproduktoru. V opačném případě, kdy je rozptylový faktor příliš velký, je směrový vjem zvuku špatně lokalizovatelný, protože v zesílení jednotlivých reproduktorů nejsou velké rozdíly. Na základě simulací statického i pohybujícího se virtuálního zdroje bylo zjištěno, že nejlepší výsledky byly dosaženy při použití rozptylového faktoru 1,7. Těchto hodnot bylo využito pro přímé porovnání metod panorámování DBAP a VBAP formou poslechových testů, kterým je věnována následující kapitola.
35
4. Poslechové testy V předchozí kapitole jsou uvedeny poznatky ze všech provedených simulací a jejich subjektivní posouzení. Pro objektivní zhodnocení amplitudové metody panorámování DBAP byly provedeny poslechové testy, ve kterých je tato metoda porovnána s další metodou – VBAP.
4.1 Příprava a parametry testu Každý psychoakustický experiment je nutné předem velice pečlivě naplánovat, aby se předešlo chybám jak při samotném měření, tak i interpretaci dosažených výsledků. Jedna z nejdůležitějších otázek je volba správné psychoakustické metody. Pro vyhodnocení a srovnání metod panorámování zdroje zvuku je nejvhodnější metoda nastavování zvukových podnětů (označována také jako metoda průměrné chyby nebo metoda ekvivalentních podnětů). Při této metodě má pokusná osoba možnost určitým způsobem kontrolovat a ovlivňovat velikost proměnné podnětu. Posluchači jsou předkládány vždy dva podněty: standardní podnět SS a variabilní podnět SV. Oba podněty se na začátku měření výrazně liší vzhledem k předem definované subjektivní proměnné. Pokusné osoby mají následně možnost plynule měnit velikost proměnné variabilního podnětu SV do té doby, kdy se oba podněty SS i SV zdají být z hlediska sledované proměnné ekvivalentní [13]. Právě tato metoda byla použita při poslechových testech. Standardní podnět představovala poloha virtuálního zdroje zvuku simulovaná danou panorámovací metodou na šesti-kanálovou reproduktorovou sestavu a variabilní podnět zastupoval pohyblivý referenční reproduktor na pohyblivém stojanu s kolečky. Úkolem testovaných posluchačů bylo směrově sjednotit vjem ze soustavy reproduktorů a z reproduktoru na pojízdném stojanu, tj. aby oba zvukové signály slyšeli ze stejného směru. Poslechové testy probíhaly na topologii s šesti reproduktory rozmístěnými v pravidelných rozestupech na kružnici po 60° (viz kap. 3, obr. 3.8). Posluchač seděl na ideálním poslechovém místě ve středu kružnice, tudíž všechny reproduktory 36
ležely od posluchače ve stejné vzdálenosti, proto nebylo nutné upravovat zpoždění jednotlivých kanálů. Poloměr kružnice s reproduktory měřil 2,3 m. Reproduktor přímo před posluchačem ležel pod azimutem 0° (tzn. ostatní reproduktory 60°, 120°, 180°, 240° a 300°). K dispozici byly dvoupásmové aktivní reproduktory GENELEC 1032A s certifikací THX pm3. Z důvodu velké časové náročnosti poslechových testů nebyly další topologie do testů zahrnuty. K testům pro obě metody sloužil jako testovací zvukový signál růžový šum. Jde o signál, jehož výkonová spektrální hustota je přímo úměrná převrácené hodnotě frekvence, což při zdvojnásobení frekvence znamená pokles energie o 3 dB. Při logaritmických souřadnicích je ve stejně velkých pásmech (např. oktávách) energie konstantní. Z tohoto důvodu se hodí pro testování většiny zvukových systému, protože
koresponduje
s
logaritmickým
charakterem
lidského
sluchového
vnímání[16]. Signál střídavě přehrávala reproduktorová soustava a referenční pohyblivý reproduktor.
Obr. 4.1: Směry panorámovaných zdrojů zvuku pro poslechové testy (T - tréninkové) Poslechové testy byly rozděleny na dvě části, kdy v každé byla zkoušena jedna panorámovací metoda. Pro obě metody bylo vybráno shodných 10 směrů virtuálního zdroje zvuku k lokalizaci, které rovnoměrně pokrývaly celý prostor kolem posluchače 37
a ležely v různých rozestupech mezi reproduktory (žádný neležel na stejném azimutu jako jeden z reproduktorů). Testované směry ležely pod azimuty: 18°, 30°, 79°, 135°, 158°, 212°, 263°, 290°, 316° a 355°. Každé sérii deseti vzorků předcházely 3 tréninkové sekvence dané zkoumané metody, které sloužily k zacvičení posluchače a tím k omezení chyby lokalizace. K tomuto účelu byly použity směry virtuálního zdroje zvuku s azimuty 100°, 220° a 330°. Všechny směry k lokalizaci znázorňuje obr. 4.1. Simulace obou metod byly vytvořeny v prostředí Matlab (k simulaci metody VBAP bylo využito funkcí z [17]). K samotnému přehrávání sloužil program Cubase 4, který je svou snadnou implementací na vícekanálovou soustavu vhodným nástrojem.
Obr. 4.2: Schéma místnosti, kde probíhaly poslechové testy
4.2 Testovací místnost Veškeré simulace a následné poslechové testy probíhaly v laboratoři zvukových systémů. Místnost je vybavena akustickými obklady na stěnách, čímž s dalšími akustickými úpravami zaručuje velmi kvalitní akustické podmínky, jako je např. velmi krátká doba dozvuku s kmitočtově vyrovnanou charakteristikou. Další předností je vysoka neprůzvučnost a potlačení venkovních hluků. Místnost je vybavena již zmíněnou reproduktorovou sestavou GENELEC, dále externí zvukovým 38
rozhraním MOTU 896mk3, pracovním stolem s PC s potřebným softwarovým vybavením a MIDI controllerem MACKIE pro snadné ovládání Cubase. Kružnice s reproduktory je označena body na podlaze v rozestupech po 10°, které slouží k přesnému odměření lokalizovaného azimutu. Pohyblivý reproduktor byl umístěný na stojanu s kolečky, kterým šlo manipulovat a pohybovat se po celé místnosti. Rozestavení místnosti je zobrazeno na obr. 4.2.
4.3 Průběh testů Poslechové testy probíhaly ve dvou dnech. Celkem se zúčastnilo 20 osob (18 mužů a 2 ženy) ve věku přibližně 20 až 30 let. Žádný z posluchačů nevykazoval jakékoliv vady sluchu. Po příchodu byla osoba usazena do křesla tak, aby její hlava byla přesně ve středu kružnice reproduktorů, které byly umístěny ve výšce hlavy posluchače. Účastníkům byly povoleny pouze mírné pohyby hlavou pro zlepšení lokalizace zdroje zvuku; otáčet celým tělem nebylo dovoleno. Při příchodu a úvodní instruktáži mohli posluchači vidět reproduktorovou topologii, ale samotné testy probíhaly se zavřenýma očima. Po krátkém úvodním poučení a vysvětlení byly posluchačům přehrány 3 tréninkové ukázky dané metody panorámování pro zacvičení. Poté následovala série 10 sekvencí pro lokalizaci. U každé nahrávky byl nejprve přehrán panorámovaný signál reproduktorovou soustavou, poté co posluchač ukázal přibližný směr, odkud zvukový vjem vnímá, byl do této pozice přesunut pohyblivý referenční reproduktor. Poté byl zvukový signál střídavě přepínán i do referenčního reproduktoru. Posluchač ústně nebo gesty korigoval obsluhu pohyblivého reproduktoru do té doby, než se mu směr panorámovaného signálu a signálu z referenčního reproduktoru zdál shodný. Následně byl odečten a zaznamenán do připraveného formuláře azimut referenčního zdroje dle značek na podlaze a byla přehrána další ukázka. Po celou dobu testování byly přítomny pouze dvě osoby obsluhy a samotný posluchač. Testy byly koncipovány do dvou částí, první pro metodu DBAP a druhá pro VBAP. Každý posluchač absolvoval nejprve jednu metodu (3 + 10 sekvencí) a po přestávce, během které byl testován další posluchač, metodu druhou. Takto se 39
testované osoby střídaly po celou dobu. V průměru trvalo testování jedné metody včetně zaškolení necelých 20 minut. Jednotlivé směry simulací po sobě následovaly v nahodilém pořadí, avšak pro každou metodu bylo pořadí jiné.
4.4 Výsledky poslechových testů Z poslechových testů lze vyvodit mnoho závěrů. Všechny naměřené hodnoty jsou uvedeny v tabulce v příloze A. Vyhodnocovalo se pouze 10 testovaných směrů, 3 tréninkové sekvence nebyly brány v úvahu. Postupně se budu věnovat jednotlivým aspektům výsledků. Celkovou přesnost panorámovací metody lze vyjádřit RMS chybou (Root mean square error), česky nazývanou jako střední kvadratická chyba nebo efektivní chyba. Pro tento test ji můžeme vypočítat podle rovnice [19]:
kde x je simulovaná hodnota směru a xM je hodnota uvedená posluchači. Jedná se tedy o odmocninu z průměru kvadrátů odchylek od požadovaného směru v jednotlivých testech. Vždy je vztažena k jednomu určitému směru. Tyto hodnoty jsou shrnuty v tab. 1. Tab. 1: Hodnoty RMS chyby pro obě metody Azimut zdroje zvuku RMS chyba [ °]
DBAP VBAP
18°
30°
79° 135° 158° 212° 263° 290° 316° 355°
12,6 15,7 21,1 20,1 25,3 17,1 28,3 24,9 35,0 12,1 15,0 12,4 14,0 14,5 21,1 18,0 25,3 24,2
5,0 5,1
Celkový průměr 22,2 16,2
Je zde vidět srovnání obou metod pro každý směr i celkovou průměr hodnotu RMS. Lze tedy odvodit, že panorámovací metoda VBAP je přesnější (RMS = 16,2°) než metoda DBAP, u které je průměrná RMS = 22,2°. Tuto skutečnost také ilustruje obr. 4.3. Je patrné, že hodnoty RMS u metody DBAP jsou větší než u VBAP u většiny ze zkoumaných směrů. Největší chyba u DBAP metody byla dosažena u virtuálního zdroje zvuku pod azimutem 316°. U tohoto úhlu docházelo ke zkreslení směrem k blízkému reproduktoru, ale také vliv tzv. kuželu konfúze (viz kap. 1.2) lidského 40
sluchu způsoboval výrazné chyby, kdy se některým posluchačům místo zleva zepředu jevil zvuk spíše zezadu. Ze stejného důvodu byly i nejvyšší hodnoty u metody VBAP u azimutů 290° a 316°.
Obr. 4.3: Srovnání hodnot RMS chyby u obou metod Další charakteristickou veličinou popisující vlastnosti zkoumaných metod jsou aritmetické průměry hodnot nastavených posluchači a související směrodatné odchylky a intervaly spolehlivosti. Obecně představuje interval spolehlivosti tu oblast hodnot
měřené
proměnné,
ve které
s velkou
statistickou
jistotou
(velkou
pravděpodobností) leží hodnota odhadovaného statistického parametru[19]. Tab. 2: Hodnoty aritmetického průměru, absolutní a směrodatné odchylky Azimut zdroje zvuku Aritmetický průměr [ °] Absolutní odchylka [ °] Směrodatná odchylka [ °]
18°
30°
79° 135° 158° 212° 263° 290° 316° 355°
DBAP 6 16 71 138 VBAP 8 24 70 127 DBAP 11,9 13,6 7,6 3,0 VBAP 10,3 6,5 9,5 8,2 DBAP 4,2 7,9 19,6 19,9 VBAP 6,4 13,5 8,1 11,3
175 169 16,9 11,0 18,9 9,4
41
210 218 2,2 5,7 17,0 20,3
249 250 14,5 12,9 24,3 12,6
290 285 0,2 5,5 24,9 24,7
303 356 302 359 12,9 1,3 14,4 3,9 32,6 4,8 19,5 3,3
Celkový průměr
8,4 8,8 17,4 12,9
Obr. 4.4: Polohy aritmetického průměru, směrodatné odchylky a intervalu spolehlivosti u metody DBAP
Obr. 4.5: Polohy aritmetického průměru, směrodatné odchylky a intervalu spolehlivosti u metody DBAP
42
Na obr. 4.4 a obr. 4.5 jsou pro obě metody znázorněny pomocí krabicového grafu aritmetické průměry se směrodatnými odchylkami (obdélníky) a po stranách vyznačenými intervaly spolehlivosti s pravděpodobností P = 0,95. Na horizontální ose jsou vyznačeny reálné simulované směry. U metody VBAP je většina hodnot směrodatné odchylky menší než u metody DBAP, což opět potvrzuje větší přesnost vektorového panorámování při lokalizaci. Dalším zajímavým poznatkem je poloha aritmetického průměru vzhledem k poloze blízkého reproduktoru. Jak je patrné z obr. 4.6, leží výrazná většina aritmetických průměrů obou metod blíže k reproduktoru, který je blíže k simulovanému virtuálnímu zdroji zvuku. Směr virtuálního zdroje zvuku je tedy přitahován k dominantnímu reproduktoru.
Obr. 4.6: Poloha aritmetického průměru metod DBAP a VBAP vzhledem k poloze reproduktorů Hodnoty průměrů a směrodatné odchylky jsou zapsány v tab. 2. V tabulce jsou uvedeny i absolutní odchylky aritmetického průměru od simulovaného směru zvukového zdroje. Celková průměrná absolutní odchylka metody DBAP je 8,4° a 8,8° u metody VBAP. V tomto ohledu je tedy DBAP nepatrně lepší. To lze interpretovat tak, že i když byly hodnoty daného směru od jednotlivých posluchačů u metody DBAP rozesety ve větším rozmezí od aritmetického průměru (směrodatná odchylka), tak průměr samotný byl nepatrně lepší, než u metody VBAP. Rozložení hodnot získaných z poslechového testu nejlépe znázorňuje další krabicový graf na obr. 4.7 a obr. 4.8.
43
Obr. 4.7: Poloha mediánu, 1. a 3. kvartilu a minimální a maximální hodnoty metody DBAP
Obr. 4.8: Poloha mediánu, 1. a 3. kvartilu a minimální a maximální hodnoty metody VBAP
44
Zde jsou obdélníky vyznačeny 1. a 3. kvartil a mezi nimi medián. 1. kvartil odděluje spodních 25 % hodnot od zbytku, podobně 3. kvartil odděluje 75 % horních hodnot a medián (2. kvartil) rozděluje získané hodnoty přesně na poloviny. V grafech jsou také vyznačeny hranice minimální a maximální naměřené hodnoty. Vše je shrnuto v tab. 3. Velikosti obdélníku nám udává mezikvartilové rozpětí, tj. rozdíl 3. a 1. kvartilu, tedy rozmezí, kde leží centrálních 50 % hodnot. Toto rozmezí je znatelně menší u většiny směrů vektorového panorámování, než u DBAP. Vektorová metoda má kvartilové rozmezí menší než 10° u všech virtuálních zdrojů umístěných před posluchačem (tj. ±90°). Této přesnosti dosahuje metoda DBAP pouze u směrů přímo před posluchačem (355° a 18°) a za posluchačem (158°). Průměrné mezikvartilové rozpětí dosahuje u metody DBAP hodnoty 17,7°, kdežto u VBAP je tato hodnota 9,5°, tedy téměř poloviční. Tab. 3: Hodnoty mediánu, 1. a 3. kvartilu a mezikvartilového rozmezí Azimut zdroje zvuku
18°
30°
DBAP VBAP DBAP VBAP DBAP VBAP DBAP VBAP
5 3 6 6 10 11 5,5 8
10 63 16 65 17 68 20 69 20 77 26 72 10,3 13,8 9,8 6,5
1. kvartil [ °] Medián [ °] 3. kvartil [ °]
Rozmezí kvartilů
79° 135° 158° 212° 263° 290° 316° 355° 130 122 138 126 156 129 26,8 7,3
168 165 171 174 177 175 9,5 10,3
198 205 209 214 225 225 27,3 20
234 241 246 247 259 255 25,3 14,3
285 290 297 294 307 300 22,3 10
295 305 318 308 325 310 30 5
354 356 356 358 360 360 6 4,3
Celkový průměr
17,7 9,5
Za zmínku stojí také poloha kvartilového rozmezí vůči reproduktorům. U vektorové metody leží všechna rozmezí (tj. obdélníky v grafu) v oblasti ohraničené vodorovnými čárami, což mj. označuje polohu reproduktorů. Nedocházelo tedy k výraznému umístění virtuálního zdroje zvuku posluchači mimo příslušné reproduktory, mezi kterými se zdroj nacházel. U DBAP k tomuto jevu docházelo častěji, jak je patrné u zdrojů s azimuty 263°, 290° a 316°, kde leží mezikvartilové rozmezí i přes hranici jednotlivých reproduktorů. Po stranách posluchače, tj. rozmezí mezi reproduktory 60° a 120° a hlavně 240° a 300°, jsou patrné u obou metod velmi dlouhé úsečky značící extrémní hodnoty určování směru. To ukazuje opět na vliv kužele konfúze, kdy docházelo k nesprávnému vnímání směru zvuku posluchači. 45
Při testování panorámovací metody DBAP většina posluchačů uvedla, že slyší panorámovaný zvuk výše, než byla umístěna reproduktorová topologie i referenční reproduktor. Tuto iluzi pravděpodobně způsobuje fakt, že panorámovaný zdroj zvuku vysílají všechny reproduktory, čímž se k posluchači dostává zvuk ze všech stran. U této metody panorámování docházelo k mnohem větším chybám při lokalizaci než u vektorového panorámování a posluchačům také lokalizace trvala delší dobu. Průměrné hodnoty jak chyby RMS, tak i směrodatné odchylky jsou u DBAP větší. Tím je dána menší přesnost lokalizace virtuálního zdroje zvuku. Fakt, že byly aritmetické průměry hodnot u DBAP o málo lepší než u VBAP, není pro přesnost lokalizace rozhodující. Proto lze usoudit, že při dané reproduktorové topologii se lépe osvědčila pro panorámování zdroje zvuku vektorová amplitudová metoda VBAP.
46
Závěr Tato
práce
se
zabývá
problematikou
panorámování
zdroje
zvuku
v horizontální rovině, a to zejména u nestandardních reproduktorových topologií. Na úvod je uvedena kapitola o binaurálním slyšení člověka. Jsou zde zmíněny podněty, na základě kterých vnímá lidský sluch zvuky ze svého okolí. Druhá kapitola se věnuje technikám panorámování zdroje zvuku v dvourozměrném prostoru. Dnes patrně nejrozšířenější metoda, vektorové amplitudové panorámování, je teoreticky popsána jak pro dva reproduktory, tak i pro vícekanálovou reprodukci. Dále je rozebrána metoda ambisonie, která je založena na harmonickém rozkladu zvukového pole. Třetí, a pro tuto práci nejdůležitější, metodou je amplitudové panorámování DBAP. V textu je základní myšlenka metody a odvození všech potřebných výpočtů. Třetí kapitola je věnována poslechovým simulacím DBAP metody. V prostředí Matlab byly vytvořeny simulace pro statický i pohyblivý virtuální zdroj zvuku, a to pro různé topologie. V kapitole jsou dále shrnuty subjektivní poznatky z těchto testů. Poslední část práce rozebírá poslechové testy, které slouží ke srovnání dvou metod panorámování, DBAP a VBAP. Nejprve je popsána příprava samotných testů, metoda měření, zvolená topologie a testovací zvukový signál. Na závěr jsou zveřejněny výsledky. Z testů vyplývá, že u metody DBAP byla lokalizace méně přesná a obtížnější. Napovídá tomu jak větší RMS chyba (střední kvadratická odchylka), tak i větší mezikvartilové rozmezí. U metody DBAP docházelo k větším chybám při lokalizaci virtuálních zdrojů zvuku po stranách posluchače. Je tedy patrné, že pro danou topologii je vhodnější a přesnější vektorové amplitudové panorámování VBAP.
47
Použitá literatura [1] Schimmel, J. Směrové a prostorové slyšení. Učební text předmětu Elektroakustika, VUT v Brně, 2010. [2] Merhaut, J. a kol. Příručka elektroakustiky. Státní nakladatelství technické literatury, Praha 1964. [3] Smetana, C. a kol. Praktická elektroakustika. Státní nakladatelství technické literatury, Praha 1981. [4] Syrový, V. Hudební akustika. Akademie múzických umění v Praze, Praha 2003. ISBN 80-7331-901-2. [5] Blauert, J. Spatial Hearing. The MIT Press, 1997. ISBN 0-262-02413-6 [6] B. B. Bauer, "Phasor Analysis of Some Sterephonic Phenomena," J. Acoust. Soc. Am., vol. 33, pp. 1536-1539 (1961 Nov.). [7] Pulkki V. Virtual Sound Source Positioning Using Vector Base Amplitude Panning. J. Audio Eng. Soc., vol. 45, no. 6, pp. 456-466 (1997 June). [8] Bruce Wigins, “An investigation into the real –time manipiulation and kontrol of tfree- dimensional sound fields“ University of Derby (2004) [9] Lossius T., Baltazar P., d. l. Hogue T., "DBAP - Distancebased amplitude panning," in International Computer Music Conference (ICMC). Montreal, 2009. [10] D. Kostadinov, J. D. Reiss and V. Mladenov, "Evaluation of distance based amplitude panning for spatial audio", Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal (ICASSP), Dallas, March 2010 [11] A. F. Everest, Master handbook of acoustics. 4th edition. McGraw-Hill/TAB Electronics, September 2000. [12] R. Y. Litovsky, H. S. Colburn, W. A. Yost, and S. J. Guzman, “The precedence effect.” Journal of the Acoustical Society of America, vol. 106, no. 4 Pt 1, pp. 1633–1654, October 1999. [13] MELKA, Alois. Základy experimentální psychoakustiky. 1. vyd. Akademie múzických umění v Praze, 2005. 327 s. ISBN 8073310430. [14] OTČENÁŠEK, Zdeněk. O subjektivním hodnocení zvuku . Praha : Akademie múzických umění, 2009. 141 s. [15] V. Pulkki and T.Hirvonen "Localization of Virtual Sources in Multichannel Audio Reproduction" IEEE Transactions on Speech and Audio Processing, vol 13, no. 1, 2005
48
[16] Dutta, P. and Horn, P. M. "Low-frequency fluctuations in solids: 1/ƒ noise". Reviews of Modern Physics 53 (3): 497–516. Bibcode 1981RvMP.53.497D. doi:10.1103 (1981). [17] ORLOVSKÝ, K. Simulace poslechového prostoru, azimutu a vzdálenosti zvukového zdroje pro vícekanálové ozvučovací systémy. Brno: Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií, 2011. 67 s. Vedoucí diplomové práce Ing. Miroslav Balík, Ph.D. [18] Zpracování akustických signálů – laboratoř PA – 136. Dostupné z URL:
. (26.5.2012) [19] W. Hartmann, “Localization of sound in rooms,” J. Acoust. Soc. Amer., vol. 74, no. 5, pp. 1380–1391, 1983.
49
Seznam použitých zkratek ITD – Interaural Time Difference
Interaurální časová diference
IID – Interaural Intensity Difference
Interaurální intenzitní diference
HRTF – Head-Related Transfer Function
Přenosová funkce hlavy
HRIR – Head-Related Impulse Responce
Impulzní odezva hlavy
VBAP – Vector-Based Amplitude Panning
Vektorové amplitudové panorámování
DBAP – Distance-Based Amplitude Panning
Amplitudové panorámování založené na vzdálenosti
RMS – Root Mean Square Error
Střední kvadratická odchylka
50
Seznam příloh Příloha A
Naměřené hodnoty z poslechových testů………………………………………. 53
Příloha B
Stručný popis funkcí a skriptů vytvořených pro simulace v prostředí Matlab…………………………………………………………………………………………… 54
Příloha C
Obsah přiloženého CD……………………………………………………………………. 55
51
Příloha A
Naměřené hodnoty z poslechových testů
Tréninkové Osoby 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
100° 220° 330° 85 218 350 135 215 335 115 235 340 110 190 335 85 205 315 135 235 335 95 245 343 140 195 350 140 195 335 125 212 325 143 210 330 128 190 340 80 230 331 97 115 340 129 220 342 90 345 105 235 335 134 210 342 100 198 340 127 215 335
DBAP 18° 3 5 12 355 8 5 10 8 12 1 5 2 5 3 5 6 12 10 10 6
30° 2 7 25 5 15 15 10 16 21 10 20 7 20 18 18 27 35 18 25 15
79° 38 57 105 50 50 94 70 65 76 65 90 127 63 68 67 68 68 63 65
135° 158° 212° 263° 290° 316° 355° 140 168 202 262 295 330 5 140 190 207 238 310 248 358 135 172 230 245 315 305 4 160 165 185 200 292 294 1 135 175 198 218 305 315 355 115 190 230 245 320 330 3 125 148 189 278 248 255 355 140 170 225 225 270 230 352 161 172 210 230 232 240 355 163 168 211 235 255 295 350 160 182 200 230 298 320 356 155 170 190 235 295 295 350 150 180 225 247 310 330 358 78 162 225 307 307 322 356 160 175 220 252 245 315 348 128 245 245 290 308 323 355 130 166 225 258 295 322 354 121 154 185 252 306 335 359 130 176 197 269 290 323 2 134 170 198 255 300 336 350
Tréninkové Osoby 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.
100° 220° 330° 123 231 345 115 225 328 120 245 320 110 212 348 125 225 330 112 245 338 114 234 330 125 232 330 110 225 325 115 232 330 125 225 325 103 224 325 105 230 338 88 245 356 171 247 325 120 270 335 116 232 332 114 227 323 124 250 325 106 228 326
VBAP 18° 5 3 10 359 13 15 6 10 15 1 6 1 1 2 17 5 8 8 25 5
30° 12 18 45 70 20 35 29 20 25 17 22 10 19 14 29 11 21 20 20 13
79° 70 65 70 73 65 70 95 70 78 67 74 68 80 54 64 62 66 65 64 71
135° 158° 212° 263° 290° 316° 355° 127 175 215 250 310 310 355 130 175 205 240 295 305 1 125 175 230 235 290 305 357 122 176 194 245 290 307 358 128 165 200 247 292 305 355 127 150 225 250 293 310 3 122 173 204 255 303 308 356 133 167 205 247 290 297 352 117 145 215 255 295 310 355 125 175 222 241 301 310 358 170 175 210 238 235 307 359 122 177 195 238 300 304 2 111 164 225 260 243 245 1 123 162 292 289 303 310 359 129 175 212 247 230 244 4 132 174 222 255 237 320 358 127 155 211 236 294 310 5 118 170 212 260 300 309 1 118 182 235 270 296 307 357 130 170 225 244 293 310 1
52
Příloha B
Stručný popis funkcí a skriptů vytvořených pro simulace v prostředí Matlab
panning Jedná se o skript, který slouží k vytvoření statického virtuálního zdroje zvuku. Nejprve se v něm nastaví všechny potřebné parametry tj. polohy reproduktorů, zdroje zvuku a posluchače, rozptylový faktor a hodnota útlumu R. Lze také volit, bude-li použit načtený soubor WAV nebo generovaný bílý šum. Poté je volána funkce picture, která vykreslí polohu zdrojů zvuku, posluchače a reproduktorů. Následují cykly for (pro zadané zdroje zvuku a rozptylového faktoru), které volají funkci DBAP pro samotný výpočet signálu pro jednotlivé kanály. Výsledný panorámovaný signál se uloží do souboru typu WAV s požadovaným počtem kanálů. picture (p, s, l) Tato funkce slouží k vykreslení zadaných parametrů o poloze reproduktorů, polohy zdroje zvuku a polohy posluchače. Vstupní proměnné: p – vektor polohy reproduktorů; s – vektor polohy virtuálního zdroje zvuku; l – vektor polohy posluchače. DBAP (mono, p, s, l, sb, R, fvz) Tato funkce slouží pro výpočet signálů pro jednotlivé kanály na základě vstupních parametrů. Z polohy reproduktorů a virtuálního zdroje vypočítá vzájemné vzdálenosti. Dále po výpočtu vzdálenosti posluchače od jednotlivých reproduktorů je případně aplikováno zpoždění pro jednotlivé kanály funkcí delay. Poté následuje výpočet zesilovacích činitelů a jednoduchým vynásobením získáme signály pro dané kanály. Vstupní parametry: mono – monofonní signál pro panorámování; p – vektor polohy reproduktorů; s – vektor polohy zdroje zvuku; l – vektor polohy posluchače; sb – rozptylový faktor; R – hodnota poklesu hladiny akustického tlaku; fvz – vzorkovací frekvence. delay (dl, fvz) Aplikuje zpoždění jednotlivých kanálů, v případě, kdy jsou reproduktory v různé vzdálenosti od posluchače. Vstupní parametry: dl – vektor vzdáleností posluchače od jednotlivých reproduktorů; fvz – vzorkovací frekvence. surround Jde o skript pro rotující zdroj zvuku. Obdobně jako u skriptu panning nastavujeme potřebné parametry, navíc ještě počet kroků při rotaci a délku jednoho kroku. Ještě před spuštěním funkce DBAP_SUR je vytvořen jeden signál o dané délce. Funkce DBAP_SUR je poté opakovaně aplikována pouze na část celého signálu, čímž docílíme efekt rotujícího zdroje zvuku. Pak se aplikuje případně zpoždění kanálů. Opět je vytvořen soubor typu WAV. DBAP_SUR (mono, p, s, l, sb, R) Funkce DBAP pro rotující zdroj, má stejnou funkci, jen zpoždění kanálu se provádí přímo ve skriptu surround. 53
Příloha C
Obsah přiloženého CD
Adresář „Bakalarska prace“: Elektronická verze práce ve formátu pdf
Adresář „Matlab“: soubor funkcí a skriptů použitých při simulacích
54