Děkujeme paní profesorce Klimkové a panu Milanu Jaklovi za vedení a odborné poradenství.
Prohlašujeme, že jsme práci vypracovali samostatně s využitím uvedených pramenů a literatury.
Obsah 0. Úvod 1. Zvukové nosiče 1.1 Fonografické válečky 1.2 Gramofonové desky 1.2.2 Typy vinylových desek
1.3 Audiokazety 1.3.1 Druhy audiokazet
1.4 Kompaktní disky 1.4.1 Druhy CD
2. Digitální zpracování zvuku 2.1 Signál 2.2 Rozdíl mezi analogem a ditigálem 2.3 Princip digitalizace 2.3.1 Příklady
2.4 Pojmy 2.4.1 Bitová hloubka 2.4.2 Vzorkovací frekvence 2.4.3 Aliasing 2.4.4 Fourierova analýz 2.4.5 A/D konverze 2.4.6 D/A konverze, interpolace
2.5 Rekapitulace 2.5.1 Srovnání
2.6 Audio formáty 2.6.1 Nekomprimované 2.6.2 Komprimované
3. Psychoakustika 3.1 Úvod 3.2 Člověk a zvuk 3.2.1 Lidské ucho
3.3 Kvalita zvuku 3.4 Definice psychoakustiky 3.4.1 Psychoakustické veličin 3.4.2 Psychoakustické maskování
4. Vlastní výzkum 5. Diskuze 6. Závěr 7. Zdroje
0. Úvod Ten, kdo trochu sleduje nová hudební vydání, si nemůže nevšimnout, že v posledních letech se vedle CDček navrací gramofonové desky. Ty, kterým byl ještě v první polovině posledního desetiletí předpovídán zánik a které jistou dobu přežívaly snad jen v regálech fajnšmekrů, se opět vrací. Je to jenom móda bez reálného podkladu, nebo doopravdy přinášejí lepší kvalitu zvuku oproti CDčkám? A vůbec, jak je to se všemi těmi audio formáty a proč se o některých tvrdí, že jsou kvalitnější, než jiné? To jsme se rozhodli v našem projektu prozkoumat. Práce obsahuje popis a historii zvukových nosičů a jejich členění. Dále se věnuje digitálnímu zpracování zvuku a rozdílu mezi analogovým a digitálním signálem. Představeny jsou i zvukové formáty. Na závěr pojednává o psychoakustice, vnímání zvuku a psychoakustickém maskování.
1. Zvukové nosiče 1.1 Fonografické válečky Fonografické válečky byly vůbec první zvukové nosiče. Fonograf vynalezl roku 1877 Thomas Alva Edison. Princip fonografu je stejný jako u gramofonu, rozdíl je pouze v médiu, na kterém je uchováván zvukový záznam. Zatímco u gramofonových desek je drážka konstantně hluboká a zvuk je zachycen odchylkami do stran, u válečku se záznam provádí změnou hloubky drážky. Válečky byly produkovány do roku 1929, kdy přestala jejich masová výroba a byly nahrazeny gramofonovými deskami. Největší výhodou gramofonu bylo, že záznam zvukové stopy v podobě stranových odchylek se již v době vzniku gramofonu dařilo kopírovat pomocí pákového mechanismu. To umožnilo snadno vyrábět kopie gramofonových desek z jednou provedené nahrávky a prodávat desky se záznamem ve větších sériích a levněji, než fonografické válečky. U fonografu se tehdejšími technologiemi záznam kopírovat nezdařilo. Nahrávání na fonograf se obvykle provádělo tak, že zpěvák zpíval před několika fonografy a po skončení písně nahrával tutéž píseň na dalších několik válečků. Plochý tvar desky navíc později umožnil gramofonové desky již se záznamem ve velkých sériích zhotovovat lisováním.
1.2 Gramofonové desky Gramofonová deska je zvukový nosič používaný od konce 19. století pro analogový záznam zvuku. Od konce 80. let 20. století byla postupně nahrazována digitálním záznamem na CD a DVD discích. Dnes se vydávají gramofonové desky pouze jako doplněk vedle digitálních hudebních nosičů a slouží zejména pro sběratelské účely a pro tzv. DJing. Při použití velmi kvalitních reprodukčních HIFI zařízení mnozí nároční posluchači stále ještě preferují původní gramofonové desky oproti moderním digitálním CD a DVD nosičům zvukového záznamu. 1.2.1 Historie První desky vynalezl Emil Berlinger v roce 1896, které vymyslel jako náhradu za voskový válec, používající se v té době do Edisonova fonografu. Desky byly vyráběny z šelaku a s průměrem 13cm.V roce 1901 byly představeny desky s průměrem 25cm, v roce 1903 s průměrem 30 cm. V roce 1905 se začala vyrábět deska se záznamy na obou stranách. Za standart byla prohlášena deska s průměrem 25 cm a s rychlostí 78 otáček za minutu, obsahovala asi 3 minuty zvuku. V roce 1931 na trh vstoupily první desky z vinylu s průměrem 30 cm, které s rychlostí 33 otáček za
minutu přinesly kapacitu 20 minut. V únoru 1949 byly oznámeny první desky s průměrem 17.5 cm a 45 otáčkami za minutu. Tyto desky s kapacitou 8 minut byly používány převážně pro singlové skladby. Během 50. a 60. let se standardizovaly formáty 30 cm s rychlostí 33 otáček za minutu pro LP nahrávky a 17.5 cm s rychlostí 45 otáček za minutu pro singlové nahrávky.
1.2.2 Typy vinylových desek ●
SP (single play) menší typ vinylových desek obvykle na rychlost 45 otáček za minutu (rpm), výjimečně na rychlost 33. Obvykle jedna strana desky obsahovala jednu hudební skladbu resp. písničku. Průměr desky 17,5 cm.
●
LP (long play) dlouhohrající deska s průměrem 30cm, obvykle na rychlost 33,1/3 otáček za minutu zpočátku výjimečně i na rychlost 16+2/3otáček za minutu. V případě populární hudby většinou obsahovala celé jedno album jednotlivé skupiny, u vážné hudbypak jakoukoliv jinou nahrávku v celkové délce až 45 minut.
●
GL – zvláštní typ gramofonové desky. Průměr 25 cm, 33+1/3 rpm Na "rychlosti" 16+2/3 rpm bylo vydáváno jen mluvené slovo.
nebo 16+2/3 rpm.
1.3 Audiokazety Audiokazeta je typ nosiče, zaznamenávající zvuk na magnetickou pásku. Byla poprvé byla představena nizozemskou firmou Philips v roce 1963 v Berlíně. Byla zamýšlena pro využití v přenosných magnetofonech pro záznam mluveného slova nebo hudby bez požadavku na věrnou reprodukci, který v té době zprostředkovávali cívkové magnetofony. Kazety postupně získaly na popularitě díky snadné manipulaci, uplatnily se nejen v přenosných přístrojích, ale i v autorádiích, přenosných přehrávačích (Walkmanech) a domácích sestavách. Audiokazety se přehrávaly oboustranně (kazetu bylo možné po dohrání na konec otočit a nahrávat na druhou stranu). Vyráběly se různých délkách, nejkratší byla kazeta C30 s dobou nahrávky půl hodiny a nejdelší C120 s dvěma hodinami. K sehnání byly i atypické délky, např. C45; C50; C74; C80 a C110. Kazety s délkou nad 100 minut měly velmi tenký pásek, proto se mohly používat jen v kvalitních a dobře seřízených přístrojích, jinak hrozilo přetržení pásku. Digitální i analogové kazety postupně z trhu mizí, neboť jejich výroba je nákladná (zavádění a navíjení pásku, drahé lisovací formy) a magnetofony se již delší dobu neprodávají. Audiokazeta ve své době odolala konkurenci v podobě systému ELCASET (Sony) v 70. letech, nebo minidisku (Sony) v 90. letech 20. století. Začátkem 21. století kazety postupně vytlačily digitální formáty CDR/RW a MP3. Nenahrané kazety lze v roce 2013, tedy padesát let od představení CC kazety stále zakoupit v omezeném sortimentu např. trafikách, velkoprodejnách elektro apod. Jde zejména o značku Sony a Maxell s pásky typu I o délce 60 a 90 minut. Typy II, III a IV již nejsou v prodeji. V rámci zlepšení kvality zvuku byly vylepšovány i samotné kazety, resp. na trhu se objevily pásky s lepším chemickým složením. Kvůli lepší kompatibilitě s parametry magnetofonů byly kazety rozčleněny do 4 skupin:
1.3.1 Druhy audiokazet TypI základní typ pásku z oxidu železitého.
TypII pásek z oxidu chromičitého. Menší šum, resp. větší dynamika a kmitočtový rozsah (ve prospěch vysokých kmitočtů) než u předešlého typu. Nutnost vyššího předmagnetizačního proudu při záznamu a jiné snímací charakteristiky při přehrávání. TypIII pásek ze směsi Fe2O3 a CrO2. Na trhu se udržel jen krátce, trpěl minimální odolností vůči přebuzení při záznamu a kvalitami nepřevyšoval Typ II. TypIV nejkvalitnější pásek z chemicky čistého železa. Dynamický rozsah, kmitočtová charakteristika a malý šum dovolovaly pořídit záznam srovnatelný s kvalitou CD. Nutnost ještě vyššího předmagnetizačního a mazacího proudu než u pásku typu II (snímací charakteristika naopak stejná).
1.4 Kompaktní disky Historicky první album vyrobené ve formě kompaktního disku bylo The Visitors od skupiny ABBA, a to 17. srpna 1982. Na přelomu 80. a 90. let spolu s klesající cenou přehrávačů a disků kompaktní disk zcela vytlačil předtím rozšířené dlouhohrající gramofonové desky s analogovým záznamem zvuku. CD se také brzy začala používat ve světě počítačů jako obecné datové médium, s kapacitou původně 656 MB (74minutová), dnes nejčastěji 700 MB. Menší osmicentimetrové disky mají kapacitu 184210 MB, tzn. 2124 minut. Na CD se dají ukládat i informace v podobě referátů, prezentací, tabulek, atd. CDROM zařízení na čtení CD, jehož autory byly firmy Philips a Sony, je určeno pouze ke čtení informací. Dovoluje uložení až 650MB programů a dat. CDformát začíná být vytlačován diskem DVD, s jeho klesající cenou a klesající cenou rekordérů. DVD disk je přímým pokračovatelem CD nejen svojí vnější podobou (CD je od DVD laickým pohledem prakticky nerozeznatelné), ale i digitální technologií záznamu dat. Kapacita běžných DVD je oproti klasickému CD zhruba šestinásobná. Životnost zapisovatelného (CDR) media se udává v průměru asi 8 let. 1.4.1 Druhy CD Červená kniha CDDA Nejrozšířenější a nejstarší typ, používaný pro klasické hudební CD. Z tohoto standardu se vyvinuly všechny ostatní používané standardy. Začátek stopy disku začíná u středu disku tabulkou obsahu disku. V tabulce jsou uloženy počátky záznamů ve formátu minuty:sekundy. Po tabulce následují jednotlivé záznamy a ukončovací oblast. Záznamů může být až 99 v celkové délce až 74min.
Žlutá kniha CDROM Tento standard používá dělení disků vycházející ze standardu CDDA. Záznam na disku je rozdělen na minuty a sekundy, každá sekunda ale obsahuje navíc 75 sektorů a každý sektor má kapacitu 2352B. Tento standard je univerzální a používá jej téměř každý typ počítače a herní konzoly. Vyjímkou jsou počítače Macintosh, které používají vlastní systém označený HFS a HFS+. Standard 9660 poskytuje kompatibilitu médií. Tím je myšlena schopnost číst soubory na jakémkoliv disku CDROM pomocí téměř libovolné jednotky CDROM. Oranžová kniha CDR Formát CDR umožňuje pomocí CDR jednotek na médium obdobné klasickému CD zapsat data u uživatele. Data lze zapsat pouze jednou. Po zapsání těchto dat je možné vložit disk do jakékoliv jednotky CDROM, která jej přečte. Pomocí této jednotky lze vytvořit téměř všechny typy CD: zvuková CD, IBM nebo MAC CDROM, CDI a Video CD. Zápis dat
CDR touto metodou může sloužit k vytváření buď multimediálních prezentací nebo zálož ních kopií důležitých dat. Další formáty: • Bílá kniha Video CD • Zelená kniha CDI • modrá kniha Enhanced CD • béžová kniha PhotoCD • šarlatová kniha SACD
2. Digitální zpracování zvuku 2.1 Signál Abychom lépe porozuměli digitálnímu zpracování signálu, je třeba vysvětlit základní pojmy. Signál je formální popis fenoménu (jevu) vyvíjejícího se v čase či v prostoru. Například pokud vezmeme jako fenomén dešťové srážky za měsíc březen, zaznamenáváním srážek v milimetrech (popis fenoménu) získáme něco, co můžeme nazvat “dešťovým signálem”.
2.2 Rozdíl mezi analogem a ditigálem Zamyšlení nad tím, co jsme právě udělali, nám pomůže porozumět rozdílu mezi spojitými (analogovým) a nespojitými (diskrétním) signály, který vyplývá z vnímání světa poprvé rozšířeného kolem 6. století př.n.l. Právě tou dobou, kdy se vše měřilo celými čísly a zpravidla to stačilo (počítání kusů dobytka ve stádu, například), Pythagoras zjistil, že strana a uhlopříčka čtverce nejsou proporcionální, a že druhá odmocnina ze 2 není jen tak ledajaké číslo. Objev iracionálních čísel odstartoval pohled na svět dnes nazývaný jako kontinuum, podle kterého jsou čas a prostor nepřerušovaný “proud”, který můžeme podle libosti rozdělit na libovolně (klidně nekonečně) malé úseky. Zpět ke srážkám. Dešťové srážky za měsíc březen (funguje i v dubnu) jsou kontinuální fenomén. Zní to složitě? Ale není. Trik je v tom, že v každém okamžiku mezi 1. a 31. březnem se fenomén (srážky) vyvíjel. Buď pršelo, nebo nepršelo. Nebo pršelo hodně. Nebo málo. Nebo málo a potom hodně, potom zase málo, potom vůbec atd. Ať to bylo jakkoliv, v každém okamžiku mezi 1. a 31. březnem se námi studovaný fenomén nějak vyvíjel. 4. března v 5:33h a také 27. března v 16:26h. Řekněme, že jsme každý den v poledne zapsali stav srážek. Na konci měsíce máme tabulku (třeba s grafem), která nás informuje o stavu srážek za měsíc březen toto je náš dešťový signál.
2.3 Princip digitalizace Tímto způsobem se dostáváme k pojmům vzorkování (samplování) a kvantování. Náš dešťový signál je nespojitým (diskrétním) popisem kontinuálního (spojitého) fenoménu. Stav srážek jsme totiž zaznamenávali každý den ve 12h, ale fenomén se ve skutečnosti vyvíjel i mezi těmito daty. Náš signál je stvořen za dodržení vzorkovací frekvence 1 zaznamenání za den. Pokud chceme vylepšit přesnost našeho měření, můžeme zvolit vyšší vzorkovací frekvenci, třeba 2x za den, nebo i 4x za den.
Přesnost ale nezávisí pouze na frekvenci měření, ale i na způsobu kvantování. Odborná definice ho popisuje jako “diskretizaci oboru hodnot signálu”. Pro nás z toho vyplývá, že z nekonečného množství možných hodnot (srážek v mm) budeme brát v potaz pouze některé. Nejlépe je to vidět při porovnání stupnic teploměrů jeden model může mít stupnici rozdělenou po desítkách stupňů (10 st, 20 st…), kdežto druhý po stupních (10 st, 11 st, 12 st…). Když chceme zjistit teplotu, podíváme se na výšku rtuťového sloupce a poté na nejbližší čárku na stupnici, z čehož teplotu vyvodíme z toho vyplývá, že druhý model teploměru je mnohem přesnější. Množství srážek můžeme také zaznamenat v milimetrech, desetinách, setinách milimetru a tak dále (... teoreticky v nekonečně malých úsecích.), což je další faktor ovlivňující přesnost měření. Právě jsme si popsali princip digitálního signálu, který získáme kombinací vzorkování a kvantování; vrátíme se k němu později. Pro zajímavost, první dochovaný digitální signál je egyptská Palermská deska (25002000 př.n.l.), každoročně zaznamenávající Nilské záplavy záznam výšky hladiny jednou za určité období.
Nabízí se otázka proč děláme nespojité záznamy spojitých fenoménů? Protože dělat kontinuální záznam je často složité, neli rovnou nemožné, nebo dnešní možnosti nespojitého záznamu dokážou podat informace s dostatečnou přesností jednodušším způsobem, než kdybychom se snažili o spojitý záznam.
2.3.1 Příklady: Spojitý signál zaznamenáván v každém Nespojitý signál zaznamenáván ve momentě vybraných momentech Seismograf
Videokamera Film 24 snímků/sek
Plechovkový
telefon
Kouřové signály v čase t, hodnota 1 nebo 0 (ano či ne, nebo cokoliv jiného)
Gramofonová deska vyrytá kontinuální CD nespojitá série informací, podle CD informace jehlou přímo přeměňovaná na variace standardu možnost 2^16 hodnot (16bitová elektrického proudu audio signál hloubka) a vzorkovací frekvence zpravidla 44.1kHz přečteny, zprůměrovány, přepočteny na variace elektrického proudu audio signál
Jak již bylo řečeno, digitální signál získáme kombinací vzorkování a kvantování analogového signálu. Pro lepší představu, viz obr. níže:
2.4 Pojmy K digitálně zaznamenanému zvuku se váže několik pojmů: 2.4.1 Bitová hloubka Bitová hloubka úzce souvisí s kvantováním a má vliv na výslednou dynamiku zvuku. Určuje, kolik bitů (informace, buď 1 nebo 0) připadne na jeden vzorek. Pokud je hloubka 2 bity, máme 2^2 (=4) možné hlasitostní úrovně (viz příklad s teploměrem). V případě CDček je standardem 16bitová hloubka, tzn 2^16 možných hodnot. Větší bitová hloubka také přináší nižší práh šumu. 2.4.2 Vzorkovací frekvence U CDček bývá standardně 44.1kHz. Proč? Pan Nyquist vymyslel ve třicátých letech teorém, kterým v podstatě umožnil digitální zpracovávání signálů. Aby podle něj bylo možné věrně reprodukovat signál, je třeba zvolit vzorkovací frekvenci, která je minimálně 2x vyšší, než nejvyšší frekvence obsažené v signálu. Člověk je schopen slyšet frekvence přibližně od 20Hz do 22kHz, proto je právě v nahrávání zvuků nejnižší přípustná vzorkovací frekvence 44.2kHz (= 2x22kHz). 2.4.3 Aliasing Pokud se Nyquistův teorém nedodrží, dochází k tzv. aliasingu. Typickým příkladem jsou podivně se točící kola vozů ve starších filmech, kdy vůz jede jedním směrem, ale my máme dojem, že se kola točí opačným směrem a ještě k tomu podivně pomalu. To proto, že staré kamery zaznamenávaly cca 2030 snímků za sekundu, kdežto kola dostavníku udělala dejme tomu 60 otáček za sekundu, tudíž kamera nemohla věrně zaznamenat otáčení kol. Tato metoda převodu analogového signálu na digitální se nazývá PCM neboli pulzně kódová modulace. 2.4.4 Fourierova analýza Jedná se o matematický proces vycházející z úvahy, že periodická funkce (či signál) by se dala zapsat jako součet nekonečného množství goniometrických funkcí sinus a kosinus. Jednodušeji řečeno, že zvuk lze rozložit na hodně sinusovek o různých frekvencích, jejichž součtem se získá původní zvuk. Fourierova analýza je jedním ze základních stavebních kamenů zpracování signálů. Běžný smrtelník se s její aplikací může setkat např. u grafického ekvalizéru, který rozděluje frekvenční spektrum zvuku do “pruhů” podle skupin frekvencí (basy, středy, výšky…), se kterými se dá samostatně manipulovat.
2.4.5 A/D konverze Tu jsme si právě popsali. Analogový signál je “roztříštěn” na malé kousíčky, které se uloží jako série informací o něm v daných momentech. 2.4.6 D/A konverze, interpolace Ta funguje obráceně. Důležité je zmínit, co to je interpolace. Digitální signál uložený na CDčku je série informací, která je “nadčasová”. D/A převodník musí tuto sérii přečíst a mezi každý vzorek přiřadit pauzu tak, aby byla dodržena původní vzorkovací frekvence 44.1kHz. Digitální signál nikdy není přesnou kopií analogového originálu. Je jako film, tzn vlastně iluze.
2.5 Rekapitulace Jak to funguje v praxi? Gramodeska
CD
Zvuk se nahraje pomocí mikrofonu, který mění … změny tlaku vzduchu (=zvuk) na elektrický el. proud se dostane do A/D převodníku, který proud měnící se analogicky ke zvuku (=zvukovýzapíše informace (2^16 možných hodnot v signál). případě 16bit hloubky) o signálu přesně 44100x Dále krajně zjednodušeně, tento proměnlivý el. za sekundu (v případě CD, podle Nyquistova proud rozkmitá jehlu, která vyryje drážky do teorému o věrné reprodukci signálů). Tyto gramodesky. Tyto drážky jsou stále analogická informace se poté, krajně zjednodušeně, vypálí reprezentace původního zvuku. na CD. Doma nažhavíme gramofon jehla sledující CD přehrávač čte sérii dat uloženou na CD a drážku na desce kmitá nahoru a dolů podle tvaru posílá jí do D/A převodníku, který informace drážky a svůj pohyb mění (pomocí cívky a přemění na el. proud, který je dále zesílen a magnetu pravděpodobně) na elektrický proud, přeměněn na zvuk. který je teoreticky stejný, jako ten, který vznikl při nahrávání. Tento proud je potom zesílený a reproduktory přeměněn zpět na variace tlaku vzduchu (=zvuk). Teoreticky tedy slyšíme tentýž zvuk, žádná informace se neztratila. 2.5.1 Srovnání Gramodeska
CD
Teoreticky nám dá zvuk, ze kterého se neztratila Teoreticky produkuje zvuk, který nikdy není žádná informace (pominemeli pozemské faktory věrný originálu. S vyšší vzorkovací frekvencí se jako kvalita aparatury atp.) věrnost reprodukce zlepšuje, ale nikdy není tak dokonalá jako v případě nekonečně vysoké vz. frek. jako v případě gramodesky. Teoreticky. Náchylná na degradaci poškrábání, opotřebení Může být přehráváno donekonečna, chybějící atp data lze dopočítat.
Obecně, pro každý druh analogového záznamu Obecně, digitální data mohou být uložena v potřebujeme jiný druh média i přehrávacího podstatě v jakékoliv formě, na CDčku, flešce zařízení, navíc je daleko obtížnější i nákladnějšínebo třeba disketě můžete mít uložený tentýž na zpracování. soubor informací, který můžete zpracovat na v podstatě jakémkoliv počítači. S digitálním signálem se oproti analogovému dá pracovat velmi jednoduše.
2.6 Audio formáty Když už zvuk jednou zdigitalizujeme, chceme získaná PCM data také uložit. Způsobů jejich uspořádání je ale celá řada. Buďto si můžeme ponechat soustavu nul a jedniček tak, jak je, nebo můžeme využít některý z formátů, který usnadňuje (v případě většiny spotřební elektroniky de facto umožňuje) jejich čtení. Formáty digitálního zvuku jsou: 2.6.1 Nekomprimované (nejběžnějsí WAV, AIFF), výpočetně nenáročné na zpracování, ale vytváří velké soubory; 2.6.2 Komprimované rozlišujeme ○ bezztrátovou kompresi zpracování dat s cílem snížení jejich objemu při zachování informací; ○ ztrátovou kompresi komprese nenávratně mazající informace, které kódovací algoritmus vyhodnotí jako nerelevantní pro posluchače. Říká se, že bezztrátové formáty jsou vyvíjeny s cílem zachytit veškeré informace, zatímco ztrátové se snaží zaznamenat zvuk tak, jak zní (nebo by měl znít lidskému uchu).
3. Psychoakustika 3.1 Úvod V roce 1995 byla nalezena 45 000 let stará flétna. Tento nález dokazuje, že nás hudba v různých formách provází lidstvo již hezkých pár let. Biblický David je vylíčen, jak díky hudbě zaháněl chmury Egyptskému králi a o hudbě se také zmiňuje Řecký básník Homér při popisování slavné bitvy u Troji. Rytmický zvuk hudby působí na naše city a emoce. Hudbu najdeme v jakékoli kultuře, náboženství, nebo společenské skupině. V dnešní době je velmi úspěšná léčba pomocí hudby. Touto léčbou jsou léčeni například pacienti trpící Alzheimerovou, nebo Parkinsonovou nemocí. Spadají sem také lidi, kteří s rakovinou či AIDS. Vědecké výzkumy ukazují, že hudba může mít pozitivní efekt na snižování tlaku, zlepšování dýchání, nebo na pokles cholesterolu v krvi.
3.2 Člověk a zvuk Člověk je schopen vnímat zvukové signály na škále přibližně v rozsahu 16 HZ – 20kHZ. Každý člověk má dolní i horní hranici nepatrně odlišnou avšak hodnoty 16HZ a 20kHZ byly určeny na základě dlouhodobého měření a zkoumání. Hodnoty pod 16HZ se nazývají infrazvuk, tyto hodnoty lze za určitých okolností také rozeznávat (jejich slyšitelnost je například jedním z hlavní rozlišovacích parametrů mezi kvalitní a nekvalitní reprosoustavou). Hodnoty nad 20kHZ se nazývají ultrazvuk, tyto hodnoty jsou pro člověka nemožné zachytit, avšak některá zvířata v čele s netopýry, kteří jsou podle ultrazvuku schopni orientace v naprosté tmě, jsou schopny ultrazvuk rozeznat a zpracovat ho. Tabulka toho, jaký zvuk můžeme zachytit (v dB) a jak na nás působí
3.2.1 Lidské ucho
Dělí se na Vnější ucho, Střední ucho a Vnitřní ucho Vnější ucho Hlavní části vnějšího ucha je boltec, zvukovod a bubínek. Zvuk nejprve dorazí k boltci, který ho směřuje do zvukovodu. Zvukovod je chrupavčitá trubice spojující boltec s bubínkem. Zvukovod také vytváří přepážku mezi vnějším a středním uchem. Po tom co zvuková vlna projde zvukovodem, narazí na jeho konci na ušní bubínek, který pomocí rozechvění přeposílá informaci o zvuku dál do středního ucha Střední ucho Systém dutin, který začíná bubínkem na který jsou napojeny tři kůstky, třmínek, kladívko a kovadlina. Jakmile se k nim dostane informace o zachycení zvukového signálu přenášejí za pomoci tlakových vln signál do vnitřního ucha. Vnitřní ucho Třmínek přiléhá ke kulatému okénku . Vnitřní ucho je tvořeno hlemýžděm, což je spirála vyplněná tekutinou. Zvukové vlnění se ve vnitřním ucho přeměňuje na elektrické impulzy, které poté cestují dále do mozku.
3.3 Kvalita zvuku Nepostradatelným parametrem každé hudební nahrávky je kvalita zvuku. Největší vliv na kvalitu nahrávky má zvukové zkreslení. V nejideálnějším případě bude mít zkreslení podobu neměnné lineární funkce, míru zkreslení zvuku určujeme pomocí velikosti odchylky od této neměnné lineární funkce.
3.4 Definice psychoakustiky Ačkoli žijeme v době vyspělých technologií, stále je potřeba při zpracování digitálního zvuku obrovské množství místa a dat ke zpracování tohoto signálu. Zpracování probíhá za pomoci komprimace. Aby bylo možné tento signál vůbec zpracovat, je potřeba odstranit, nebo změnit části zvuku, které pro komprimaci nejsou důležité. V tomto okamžiku nastupuje do celého děje psychoakustika. Psychoakustika se dá definovat jako model, který funguje na matematických algoritmech podle kterých je člověk, který zvuk zpracovává schopen určit, které části může odstranit, nebo změnit bez toho, aby ovlivnil kvalitu, nebo podobu záznamu zvuku. Psychoakustika je tedy soubor postupů a metod, které mechanicky nahrazují lidský sluch a určují schopnost vnímání. 3.4.1 Psychoakustické veličiny Při posuzování kvality hudby používají vědci zabývající se psychoakustikou veličinami, jako hlasitost, ostrost, tvrdost a další. Protože určování těchto veličin u každého zvukového záznamu znovu a znovu, byly vymyšlené takzvané veličinové modely, které dokáží určit velikost dané veličiny podle přesně
stanovených algoritmů. 3.4.2 Psychoakustické maskování Psychoakustické maskování se dá demonstrovat na jednoduchém příkladu z praxe. Při naprostém tichu uslyšíme i nepatrný zvuk, jako například tikání ručičkových hodin. Naopak když stojíme na stanici metra v ranní špičce, máme kolikrát problém slyšet i vlastní konverzaci. Tento jev se nazývá maskováním a v psychoakustice funguje naprosto stejně jako v příkladu s hodinami a stanicí metra. Maskování je jednou z nejčastěji používaných metod psychoakustiky. Člověk pracující se signálem při tomto ději cíleně odstraňuje, nebo překrývá části signálu, které jsou přebytečné. Signálu, který překrývá jiný signál nazýváme maskující prvek, naopak prvek, který je maskován se nazývá maskovaný prvek. Maskování lze rozdělit do dvou hlavních skupin. Dělení probíhá podle vzájemné časové pozice maskujícího a maskovaného prvku. Když se v signálu vyskytují ve stejný okamžik nazýváme je souběžným maskováním. Pokud nejsou ve stejný čas nazýváme je časovým maskováním. Souběžné maskování Tento jev nastává když probíhají oba zvukové signály ve stejný okamžik. Silnější signál překrývá ten slabší (stejně jako na příkladu z úvodu do Psychoakusického maskování). Po překrytí přestává být slabší signál slyšet a zůstává pouze signál silnější. Demonstrace souběžného maskování je na obrázku, kde máme dva slabé signály a jeden dominantní (s největší amplitudou). Pokud tedy chceme přehrát pouze dominantní ton, tak se na vnímání celkového zvuku nic nemění a ušetříme díky souběžnému maskování spoustu dat. Časové maskování Lidský mozek nemůže zachytit velmi tichý zvuk znějící těsně po, nebo před zvukem hlasitým. Postmasking, až do 50 MS po zaznění hlasitého zvuku nemůžeme slyšet zvuk tichý. Premasking, 10ms před hlasitým zvukem také nezaregistrujeme tichý zvuk.
4. Vlastní výzkum V rámci našeho projektu jsme se rozhodli pro uskutečnění praktické části v hlavním zvukovém studiu České televize na Kavčích horách.
Naše návštěva byla velmi obohacující, jak informačně, tak co se získaného materiálu týče. Pod taktovkou sympatického pana zvukaře se nám podařilo udělat rip části desky “The Dark Side of the Moon” od jedné z nejslavnějších rockových skupin všech dob, Pink Floyd. Ačkoliv získaný obraz desky již prošel digitalizací, stále byl zaznamenán kvalitněji, než CD, tudíž jsme měli při porovnávání z čeho vycházet. Rip byl proveden se vzorkovací frekvencí 48kHz (oproti 44.1kHz u běžných CD) a s bitovou hloubkou 24 bitů (oproti 16 bitům u CD), obsahoval tedy nutně více informací než CDčka či soubory Mp3, se kterými se běžně setkáváme. Dále jsme získali záznam Simple Symphony op. 4 Boisterous Bourrée skladatele Benjamina Brittena, taktéž 48kHz/24bit (přesamplováno z 96kHz kvůli nedostatku výpočetního výkonu). Nejkvalitnější záznamy budeme dle uvádět jako 48/24, záznamy v CD kvalitě jako 44.1/16. Abychom mohli zjistit, k čemu dochází, když používáme dnes běžné formáty, získané záznamy jsme rozstříhali a každý kousek jsme zkonvertovali, viz V PŘÍLOZE. Ze záznamu desky jsme vytvořili smyčku z části skladby Money, ze záznamu Simple Symphony op. 4 jsme použili úvodní část.
Spektrogramy nám ukazují, že 48/24 záznamy obsahují všechny frekvence, které je spektrograf schopen detekovat. 44.1/16 záznamy obsahují frekvence do cca 22kHz, což je nejvyšší slyšitelná frekvence pro člověka, naměřená v laboratorních podmínkách. U záznamů ve formátu Mp3 můžeme pozorovat, že kompresní algoritmus se snaží tlačit signál pod hranici 16kHz, nad níž podle zvoleného bitratu (datového toku) propouští čím dál méně frekvencí, s cílem šetřit daty a zmenšit výsledný soubor. V praxi, mimo laboratoř moc zvuků nad 16kHz neslyšíme. Nejnižší bitrate u Mp3, který se považuje za rozumně poslouchatelný, je 128kbps, pod touto hranicí je ztráta informací na první poslech slyšitelná (viz konce souborů V PŘÍLOZE).
5. Diskuze Na místě je položit si otázku, jestli má smysl honba, či lpění na bezztrátových formátech. Jedním z argumentů, proč ano, je, že vyšší vzorkovací frekvence, které tyto formáty umožňují, umožňují zachytit ultrazvuky nad běžných 22kHz. Hudební nástroje tyto zvuky (které jsou pokračováním řady alikvótních tónů, které tvoří barvu zvuku nástroje) běžně vydávají a my, ač je neslyšíme, cítíme je skrz vibrace v našem těle, což umocňuje náš požitek z poslechu. Dalším argumentem je, že informace ztracené ztrátovou kompresí se již nedají nahradit. Co když v příštích letech přijde dostupná technologie, která každou chybějící informaci hned vystaví na odiv, jako to dělají dražší analytická sluchátka/reprosoustavy? Na druhou stranu, běžný smrtelník na běžné spotřební elektronice zpravidla nepozná rozdíl mezi 44.1/16 záznamem a 128kbps Mp3 souborem. Ta ani z konstrukčních důvodů většinou nedokáže zvuky nad 22kHz přehrát.
6. Závěr Jako nejrozumnější “rozuzlení” se nám jeví přístup, podle kterého by nás tato rozmanitost neměla omezovat, ale dávat nám možnost volby. Komu stačí hudba v Mp3, pro toho je skvělé, že ji může mít stále v kapse a kdo si potrpí na kvalitu, ten může sáhnout po některém ze SACD, či Pure Adio BluRay vydání. Anebo po gramodesce.
7. Zdroje Signal Processing for Communications by Paolo Prandoni and Martin Vetterli http://www.guitarvolumeright.com/index.php?option=com_content&view=article&id=284:bitd epthbitovahloubka&catid=62:zakladyrecordingu&Itemid=197 http://jlswbs.wordpress.com/2009/05/18/fourierovaanalyza/
http://fu.ff.cuni.cz/vyuka/akustika/3_psychoakustika.pdf http://www.vutbr.cz/www_base/zav_prace_soubor_verejne.php?file_id=42960 http://zvuk.atrip.sk/index.php?site=2_2 http://cs.wikipedia.org/wiki/Ucho http://www.eng.auburn.edu/users/crockmj/Fastl_acta_acustica.pdf http://www.mmk.ei.tum.de/~tal/Literatur/PDF/1013.pdf http://www.yamahaproaudio.com/europe/en_gb/training_support/selftraining/audio_quality/ch apter1/06_sound_quality/
http://dspace.k.utb.cz/bitstream/handle/10563/5093/bedna%C5%99%C3%ADk_2008_bp.pdf ?sequence=1 http://standardvinyl.com/vinylpressing/ http://www.tinfoil.com/