Bankovní institut vysoká škola Praha Katedra matematiky, statistiky a informačních technologií
Analýza a rozbor audio formátů Bakalářská práce
Autor:
Milan Jůza Informační technologie
Vedoucí práce:
Praha
Ing. Bohuslav Růžička, CSc.
Duben 2012
Prohlášení: Prohlašuji, že jsem bakalářskou práci zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu. Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Praze, dne 28.4.2012
Milan Jůza
Poděkování:
Děkuji panu Ing. Bohuslavu Růžičkovi, CSc, za jeho trpělivost, konzultace a odborné rady spojené s vypracováním této bakalářské práce.
Anotace: Význam této bakalářské práce spočívá v seznámení čtenáře s vývojem hudby a analogových záznamů zvuku. Vysvětluje převod analogového signálu na digitální a dále popisuje současné digitální audio formáty. Součástí je i popis softwaru, potřebného pro běžnou i poloprofesionální práci s nimi.
Anotation: The aim of this thesis is to introduce the evolution of music and ways of analogue sound record to the readers. It explains the conversion from analog signals to digital and describes current digital audio formats. It also includes a description of software reguired for common and semiprofessional work with them.
Obsah Obsah .................................................................................................................................... 5 Úvod ...................................................................................................................................... 7 1. Vývoj hudby a analogových způsobů záznamu ............................................................ 8 1.1. Zvuk jako fyzikální veličina ........................................................................................ 8 1.2. Vývoj hudby .................................................................................................................. 9 1.3. Analogové záznamy zvuku ......................................................................................... 11 1.3.1. Mechanický záznam ............................................................................................ 11 1.3.2. Optický záznam zvuku ........................................................................................ 15 1.3.3. Magnetický záznam zvuku ................................................................................. 17 2. Digitalizace zvuku .......................................................................................................... 20 2.1. PCM ............................................................................................................................. 20 2.2. Vzorkování .................................................................................................................. 21 2.2.1. Aliasing ................................................................................................................. 21 2.3. Kvantování .................................................................................................................. 22 2.4. Kódování ..................................................................................................................... 23 3. Digitální audio formáty ................................................................................................. 25 3.1. Bezztrátové hudební formáty .................................................................................... 25 3.1.1. WAV ..................................................................................................................... 25 3.1.2. AIFF ...................................................................................................................... 27 3.2. Bezztrátové hudební formáty s kompresí................................................................. 28 3.2.1. WavPack ............................................................................................................... 28 3.2.2. FLAC .................................................................................................................... 29 3.2.3. Apple Lossless ...................................................................................................... 30 3.2.4. MP3HD ................................................................................................................. 30 3.2.5. Monkey's Audio ................................................................................................... 31
3.2.6. MPEG-4 SLS ........................................................................................................ 31 3.3. Ztrátové kompresní hudební formáty ...................................................................... 32 3.3.1. MP3 ....................................................................................................................... 32 3.3.2. MPEG ................................................................................................................... 37 3.3.3. Vorbis.................................................................................................................... 39 3.3.4. AAC ...................................................................................................................... 39 3.3.5. WMA .................................................................................................................... 40 4. Software .......................................................................................................................... 41 4.1. Přehrávače................................................................................................................... 41 4.1.1. WinAmp ............................................................................................................... 41 4.1.2. Foobar2000 ........................................................................................................... 42 4.1.3. MediaMonkey ...................................................................................................... 43 4.2. Editory ......................................................................................................................... 45 4.2.1. GoldWave ............................................................................................................. 45 4.2.2. Audacity................................................................................................................ 46 4.2.3. Adobe Audition .................................................................................................... 47 Závěr:.................................................................................................................................. 49 Seznam použité literatury ................................................................................................. 50 Seznam obrázků................................................................................................................. 53
Úvod Cílem mé bakalářské práce je analyzovat současné audio formáty a jejich možnosti. V první kapitole práce je uveden popis zvuku z fyzikálního hlediska a velice stručně nastíněn vývoj hudby, s kterým dále souvisí i vývoj různých způsobů analogového záznamu zvuku. Další kapitola popisuje principy procesu digitalizace zvuku a jeho možné problémy. Třetí kapitola již představuje samotné digitální formáty, jejich dělení podle typu a zevrubný popis těch nejpoužívanějších a nejznámějších z nich. Závěrečná kapitola se zaměřuje na popis zajímavých programů a jejich nástrojů, potřebných pro přehrávání a úpravu hudby. Práce se snaží docílit uceleného obsahu, který bude informačně přínosný a poučný pro čtenáře neznalého problematiky hudebních audio formátů. Měla by být zajímavá i pro pokročilejší čtenáře, pracující s hudebními audio formáty dennodenně a snad jim pomůže ujasnit si základní principy zpracování zvuku. Důvodem výběru tohoto tématu bakalářské práce je můj velice kladný vztah k hudbě. Mým koníčkem je DJing, kde při reprodukci hudby používám analogové i digitální hudební technologie zároveň, a proto jsem toto téma rád zkoumal a zpracoval.
7
1. Vývoj hudby a analogových způsobů záznamu 1.1. Zvuk jako fyzikální veličina Zvuk lidstvo provází již od počátku věků. Zprostředkovává člověku informace o okolním světě, pomocí sluchového ústrojí. Z fyzikálního hlediska je zvuk definován jako mechanické vlnění, nebo kmitání, které je schopné vyvolat v našem sluchovém ústrojí sluchový vjem. Kmity vytvářejí v molekulách vzduchu vlny střídavě vysokého tlaku (zhuštění) a nízkého tlaku (zředění). Vodičem zvuku je tedy typicky vzduch, ale zvuk se šíří i ve vodě, nebo v pevných látkách. Čím je prostředí hustší, tím se zvukové vlny šíří rychleji. Zdrojem zvuku je tedy každé chvějící se těleso. O tom, zda je těleso dobrým, nebo špatným zdrojem zvuku, rozhoduje především jeho geometrický tvar. Dokonalým zvukovým izolátorem je vakuum, protože v něm nelze rozkmitat žádné molekuly. Jako všechny formy vlnového pohybu má i zvuk svou vlnovou délku. Je to vzdálenost mezi vrcholy následujících vln. Počet vln vzniklých za sekundu představuje frekvenci zvuku. Frekvence takového vlnění, které je schopné v lidském uchu vyvolat sluchový vjem, se pohybuje u zdravého člověka přibližně od 16 Hz do 20 kHz. Frekvence nižší než 16 Hz se nazývá infrazvuk a frekvence vyšší než 20 kHz se nazývá ultrazvuk. Tyto frekvence sice neslyšíme, ale nějakým způsobem je vnímáme a mohou i negativně působit na naše lidské zdraví. Fyzikální veličina, která charakterizuje zvuk, se nazývá hladina intenzity zvuku a udává se v dB. Práh bolesti se pohybuje kolem hodnoty 140 dB. U každého člověka je spodní i horní hranice frekvence, kterou slyší, značně pohyblivá. S přibývajícím věkem se náš sluch opotřebovává a klesá právě horní hranice slyšitelných frekvencí. Zvuk se dá rozdělit na tóny a hluky. Tóny vznikají jako zvuky se stálou frekvencí, říká se jim také hudební zvuky. Vlastnosti takového tónu jsou výška, délka, síla a barva tónu. Výška je určená především frekvencí. Délka tónu udává, jak dlouho bude tón znít. Síla závisí na amplitudě zvuku a barvu určuje spektrální složení zvuku, tvar kmitů a podobně, což určuje především sám hudební nástroj. Hluky jsou následkem složitého, nepravidelného vlnění. Mohou to být třeba rány, praskání, šumění nebo skřípot. Hluků se ale v hudbě také hojně využívá. Například perkusové nástroje, nebo bicí.
8
Obrázek 1. Slyšitelné zvukové pole
Zdroj: http://homen.vsb.cz/~ber30/texty/varhany/anatomie/obrazky/akustika_sluchove_pole.gif
1.2. Vývoj hudby Tímto jsme se dostali až k hudbě, která se zvukem samozřejmě úzce souvisí. Slovo hudba má původ od slova housti, hráti, což označovalo hru na strunný nástroj. Později se tento termín začal používat ve stejném kontextu jako muzika. Jak ale samotná hudba vznikala, nikdo vlastně přesně neví. Existují tři názory o prvotním vzniku hudby. První hovoří o napodobování přírodních zvuků. Zpěv ptáků, řev zvířat, zvuky bouřky a podobně. Pro tento názor hovoří některé primitivní kultury a jejich pojetí hudby. Druhý názor zastává teorii o vzniku hudby jako o rytmickém doprovodu ke společné lidské práci. Lidé tak společně udržovali správné pracovní tempo. Třetí názorový směr vysvětluje vznik hudby společně s vývojem řeči. Tato teorie je založena na povaze tzv. tónových jazyků, kdy tón jakým je slovo proneseno, má zásadní význam pro rozlišení významu různých slov, která jinak znějí stejně. V zásadě jde o to, jakou melodií proneseme dané slovo, nebo jak budeme intonovat. Mezi takové jazyky patří na příklad čínština, vietnamština, mandarínština, nebo některé jazyky v subsaharské Africe.
9
Pro žádnou z těchto teorií nejsou přesvědčivé důkazy, ale je třeba si uvědomit, že se vzájemně nevylučují. Je tedy možné, že platí i více než jedna z těchto teorií. Počátky vývoje hudby nejsou nikde zaznamenány. Její vývoj je v každé geografické oblasti naší Země dost odlišný, proto se omezím jen na hodně obecné členění. O tom že by hudba mohla mít nějakou minulost a mohla by podléhat nějakému historickému vývoji, se v dávných dobách vůbec neuvažovalo. Ve starověku dobové písemnosti obsahovaly vždy nanejvýš jen zmínku o původu hudby. A to podle Bible. Ta definuje hudbu jako výtvor a dar Boží. Duchovní hudba byla taky v této době ústředním motivem pro rozvoj hudby. Hudbou se v této době mínila především hudba jednohlasná, vokální. Instrumentální hudba byla považována spíše za méněcennou. Jednohlasné vyjádření hudby, takzvaný rytmicko monomelodický sloh, začal ve starověkém Řecku a končí někdy kolem roku 1300 a představují ho například trubadúři a minnesängři. Postupem času se začaly vyskytovat nové formy vícehlasu, doprovázené ústřední melodií. Toto představuje období gotické a renesanční hudby. S vývojem knihtisku a rozvojem záznamu hudby pomocí not, se začaly hudební styly rychle šířit a vznikaly první mezinárodní hudební styly a formy. V této době vznikaly duchovní mše a sborové písně. Ze světských forem vznikli v této době například frottola (zpěv za doprovodu loutny), nebo chanson. Toto období zaniká zhruba kolem roku 1600. Dalším významným obdobím ve vývoji hudby je baroko. Tento směr se začal více soustředit na zřetelnost zpívaného slova, která se v polyfonii ztrácela. Do popředí se dere instrumentální hudba a melodie, doprovázená akordy. Duchovní hudba má stále velký vliv, ale velmi oblíbené jsou i lidové a světské písně, vznikly první opery a rozvíjí se také improvizace. Konec baroka je udáván kolem roku 1750. Další období bych charakterizoval jako období tonality. Je to období kdy se opustilo od klasického modálního způsobu skládání hudby (využívání půltónových a celotónových intervalů) a začalo se využívat tonálního způsobu. Tonalita je způsob skládání hudby pomocí tóniky, dominant a subdominant v durových a mollových stupnicích Do tohoto období tedy patří rokoková hudba, zaměřená na dekorativní detail a francouzskou šlechtu. Na ní navazuje klasicistní hudba, která nám přinesla velikány jako je Beethoven, nebo Mozart a jejich sonáty, symfonie a concerta. Dále do tonální hudby patří Romantická hudba, představovaná Wagnerem, Verdim, nebo naším Dvořákem, která se stala 10
emotivnější a expresivnější. Orchestr se dramaticky rozšířil a významně vzrostl význam koncertů v městské společnosti. Posledním zástupcem tonální hudby je hudba impresionistická, která neměla dlouhého trvání, ale uzavírá nám tonální hudbu rokem 1910. Dostali jsme se až na začátek 20. století. V tomto období vzniklo nepřeberné množství hudebních forem a snah o nové vyjadřovací možnosti. Přineslo do hudby experimenty s novými žánry, styly a formami, které bourají všechny známá hudební pravidla. Takto jsme se přenesli do současnosti, kde jsou stěžejními žánry klasická hudba, folková hudba, ale především hudba populární, neboli pop. Populární hudba je určená širokým masám posluchačů a vznikla s rozšířením rozhlasu a gramofonové techniky. Již nebylo třeba, aby byl posluchač přítomen na koncertě. Každý člověk si mohl pustit v pohodlí svého domova, co se mu líbilo a tak začalo vznikat ohromné množství žánrů. Od jazzu, swingu, blues, přes soul, funk, disco, metal, rock and roll, salzu, až po punk, hiphop, techno, drum and bass a spoustě dalších a dalších.
1.3. Analogové záznamy zvuku Rozvoj techniky v 19. a 20. století s sebou přinesl spoustu nových objevů a vynálezů. Mimo jiné důležité objevy se vynálezci věnovali i způsobům, jak zaznamenat zvuk, potažmo řeč a hudbu. V této kapitole si přiblížíme známé analogové způsoby záznamu. Jsou to mechanický, optický a magnetický záznam zvuku. Uvedu je zde v chronologickém pořadí tak, jak byly světu představeny.
1.3.1. Mechanický záznam Fonograf Známý vynálezce Thomas Alva Edison, na jehož jméno je vedeno více než 1000 patentů, vymyslel roku 1877 první zařízení schopné zaznamenat a reprodukovat zvuk. Patentoval jej o rok později a zařízení pojmenoval fonograf. Fonograf byl zkonstruován jako přístroj, který by byl schopný zaznamenat telegrafní zprávy a ty pak opakovaně znovu odesílat. Edison se zřejmě nechal inspirovat přístrojem fonautograf, který vymyslel v roce 1857 León Scott. Fonautograf uměl zaznamenávat akustické kmity na skleněný váleček pokrytý sazemi. Záznam ale nebylo možné nikterak přehrát. Fonograf fungoval na jednoduchém principu. Kovový trychtýř, který zesiloval zvuk, měl na svém dně přilepenou membránu. Na původním fonografu to byla blána z rybího 11
plynového měchýře. Membrána měla na konci připevněnou jehlu a ta byla vedena ve šroubovici na kovovém válečku. Váleček byl pokrytý tenkou staniolovou fólií. Byl připevněn na šroubu, který zajišťoval, že při otáčení se váleček pohyboval ve směru své osy. Při záznamu se akustické kmity zesílené trychtýřem přenášely na membránu, ta rozpohybovala jehlu, která vyryla záznam na rotující kovový váleček. Reprodukce fungovala přesně obráceně. Pohybující se jehla rozpohybovala membránu a z trychtýře vycházel monofonní zvuk. Takový záznam se nazývá hloubkový. Jehla mění hloubku drážky, která vede jehlu po válečku a tato hloubka odpovídala okamžité hodnotě akustického tlaku zaznamenávané zvukové vlny. Kvalita záznamu nebyla zvláště dobrá, další nevýhodou byla nemožnost vytváření kopií válečků a celková doba záznamu byla jen 2 minuty.
Obrázek 2. Fonograf Zdroj: http://inthehallofmirrors.typepad.co.uk/.a/6a00d8341c345453ef014e86ca067e970d-popup
Gramofon 10 let po vynálezu fonografu, přišel němec Emile Berliner s novým „mluvícím přístrojem“. Byl jím gramofon. Gramofon je kombinací dvou, v té době již známých, přístrojů. Edisonovu fonografu a hracího strojku se záznamem hudby na děrovaném kotouči. Jednoduše je to přístroj na přehrávání gramofonových desek. Původní gramofony byly
12
čistě mechanické, s natahovacím pérovým strojkem, natahovaným pomocí kliky. Skládaly se z pohonného mechanismu, který otáčel talířem pro otáčené desky a snímacím hrotem. Hlavní rozdíl oproti fonografu je záznam zvuku na plochou, kruhovou, gramofonovou desku. Ta se původně vyráběla ze šelaku. Materiál to byl velmi tvrdý a křehký a přehrávací jehly se velmi rychle opotřebovaly a poté zkreslovaly nahrávku a ničily desku. Oproti válečku fonografu, se dala gramofonová deska pomocí pákového mechanismu snadno kopírovat a to umožnilo vyrábět desky ve větších sériích, tudíž i levněji Plochý tvar desek později umožnil i výrobu lisováním. Na jednu stranu původních šelakových desek se vešly 3 minuty záznamu, na větší typ téměř 5 minut. Jehly potřebné pro přehrávání byly hrubší a i drážky v deskách širší, než jak je známe dnes. Rychlost otáčení byla 78 otáček za minutu. Postupem času byly desky zdokonalovány a výrobci střežili svá tajemství výroby jako oko v hlavě. Před nástupem magnetického a digitálního záznamu, byly materiály na výrobu desek převážně kopolymer, vinylchlorid a vinylacetát a další utajované přísady. Gramofonové desky byly vydávány v různých verzích. Single play (SP), přehrávané rychlostí 45 otáček za minutu (rpm), o průměru 17 cm, obsahovaly většinou jen dvě písně (jednu z každé strany) – single. Long play (LP), přehrávané rychlostí 33,1/3 rpm o průměru 30 cm, obsahovala většinou celé album. Vzácněji vycházely extended play (EP) desky. Velikostně byly shodné s SP typem, ale obsahovaly 2 nebo i 3 písně na jedné straně, pokud měly zmenšený střed. Mívaly také speciální obaly. Posledním typem gramodesek byl typ GL. Přehrávací rychlost byla 33,1/3 rpm, nebo 16,2/3 rpm, používaná výhradně pro mluvené slovo. Průměr GL desky byl 25 cm. Způsob zápisu na gramofonové desky byl jiný než u fonografu. Jednalo se zde o stranový záznam zvuku. Stranová výchylka rycího zařízení byla úměrná okamžité hodnotě akustického tlaku zaznamenávané akustické vlny. Takto se na gramodesky zaznamenávalo téměř celé 20. století. Roku 1920 byl gramofon vylepšen o snímací hrot s mechanicko-elektrickým měničem, který byl umístěn v přenosce. Zde se mechanický signál měnil na elektrický. Snímací systém byl založen na piezoelektrickém, nebo magnetodynamickém principu. Elektrický signál byl pomocí ovládacích obvodů zesílen a poté transformován zpět na akustický signál pomocí reproduktorů. S rozvojem stereofonie se začal používat stereofonní mechanický záznam, vyvinutý v Británii roku 1933 firmou EMI. Tento způsob záznamu se nazývá 13
stranově-hloubkový. Využívalo se obou způsobů záznamu najednou. Aby se hloubkový záznam neopotřeboval více, pootočily se sklon záznamu pod úhlem 45 stupňů. Signál každého kanálu se takto ryl do boku drážky. Při přehrávání se pak pohyb snímacího hrotu mechanicky rozděloval na dva pohyby, odpovídající signálům z levého a pravého kanálu. Postupem času se měnil i materiál v použitých hrotech. Od ocelových jehel, přes safírové, až po dnešní diamantové. Gramofony překvapivě přežily až do dnešních dnů. Může za to určitou měrou nostalgie, která s těmito přístroji souvisí. Mnoho lidí má ještě dnes doma své staré sbírky gramofonových desek z mládí a s tím souvisí potřeba je na něčem přehrát. Alba již na gramodeskách u nás v ČR téměř nevycházejí, ale ve světě je trend spíše vzrůstajícího charakteru. Mnoho lidí nedá na analogový zvuk dopustit. Kupují si drahé audio vybavení a relaxují při poslechu gramofonových desek. Gramofony se vyvíjely a stále se ještě dál vyvíjet budou. Zajímavostí je, že Česká republika je leader v tomto průmyslu. Respektive firma GZ Loděnice je dnes největším a také nejstarším výrobcem a exportérem vinylových desek na světě. Rozmach CD nosičů výrobu téměř zničil, na čas se všech 60 lisů dokonce zastavilo. Výroba ale přežila a to díky DJům, metalovým fanouškům a undergroundovým kapelám, kteří si nechávali lisovat svá díla ve vlastních, limitovaných, sběratelských nákladech. Dnes tato firma spolupracuje se světovými vydavateli, jako jsou Universal, Sony, Warner EMI a spousta dalších, ale většinu produkce tvoří malonákladové zakázky pro kapely z celého světa. V roce 2006 bylo do světa expedováno 4,5 milionu vinylových, v roce 2010 už to bylo 5,5 milionu desek a každý rok toto číslo stoupá. Nejmenší možný náklad na výrobu je 250 desek, ale pokud člověk opravdu chce vyrobit zvláštní a unikátní kusy, rádi mu zde vyhoví. I dnes je český vinyl ekvivalent pro nejlepší možnou kvalitu. Pozadu v ČR nezůstává ani výroba samotných gramofonů. Tradice produkce v Litovli začala po válce a po různých změnách vlastníků pokračuje úspěšně dodnes. Nyní litovelské gramofony vyrábí firma Pro-Ject. Nabízí modely od 5000 Kč za běžný model, do 50 000 Kč za nejvyšší modelovou řadu. Ve srovnání s ostatními značkami, vyrábějící gramofony, mají ty tuzemské nejlepší poměr cena/výkon. Paradoxem je, že odbytiště obou firem je po celém světě a zájem je velký. Tuzemský trh se ale pořád jaksi brání a snad ještě přijde doba, kdy v obchodech budeme moci koupit kvalitní český výrobek a ne čínskou náhražku. 14
Obrázek 3. Vlevo původní gramofon His masters voice, Obrázek 4. Vpravo gramofon od české firmy Pro-Ject Audiosystems – RPM 10.1 Evolution
Zdroje: http://www.creativelydifferentblinds.com/BlindImages/1683.jpg a http://www.project-audio.com/main.php?prod=rpm101&cat=turntables&lang=en
1.3.2. Optický záznam zvuku Optický záznam zvuku nám přinesl filmový průmysl. Tato metoda záznamu byla vyvinuta pro ozvučení němého filmu. Do té doby u filmu hrála jen živá hudební produkce. Klavírní doprovod, nebo malý orchestr, který reagoval na dění na filmovém plátně. Dialogy a komentáře obstaraly titulky. Zkoušelo se doprovázet film i hudbou z gramofonu, ale obtížná synchronizace zapříčinila, že se tento způsob neuchytil. Začal se tedy hledat způsob jak uložit záznam zvuku přímo na filmový pás. Tuto metodu záznamu vyvinul Lee de Forest v roce 1920 a už roku 1928 byl promítán první ozvučený film s touto technologií. Princip takového ozvučení filmu spočívá v přeměně elektrického signálu na světelný, který je časově zaznamenán na filmu. Po straně filmového pásu, mezi perforací a snímky filmu, vznikl oddělený pás pro zvukovou stopu. Přehrávání této stopy funguje tak, že stopáž je prosvětlována z jedné strany úzkým pruhem světla. Na druhé straně je fotobuňka, která snímá prošlé světlo a podle intenzity tohoto světla vyšle odpovídající elektrický signál. Ten je následně zesílen a odeslán do reproduktorů. Při pohybu filmového pásu se pohybuje i zvuková stopa, která svým pohybem mění intenzitu procházeného světla do fotobuňky.
15
U tohoto řešení se ale objevil zásadní technologický problém. Pohyb filmu v promítačce není spojitý, ale krokový. Zobrazuje se vždy jen jedno okénko filmu, které je zrovna v klidu. Zvuk oproti tomu je nutné přehrávat kontinuálně, spojitě. To se řeší tak, že filmový pás nejprve projde uklidňovací smyčkou a teprve poté se zvuk snímá. Proto je zvuková stopa oproti filmovému pásu posunuta o 21 obrazů. Optický zvukový záznam se pořizoval vzorkovací frekvencí do 12 kHz. Způsobů optického záznamu bylo více. První byl hustotní záznam, nazývaný i intenzitní. Při něm byla na zvukové stopě zaznamenávána hustota zčernání. Kvůli potížím při kopírování se ale přešlo na kvazihustotní (dnes běžně používáno hustotní) záznam. Zde byl akustický tlak zvuku zaznamenán v různé hustotě příčných kontrastních čárek ve zvukové stopě. Hustotní záznam se používal běžně do roku 1950. Nahradil ho modernější plochový záznam, též zvaný amplitudový. U tohoto typu záznamu byla část plochy stopy bílá a část černá. Poměr mezi těmito plochami vyjadřoval okamžitou hodnotu akustického tlaku. Plochový záznam mohl být jednostranný, dvoustranný, nebo víceřádkový dvoustranný. To, že je zvukový pás oddělený od obrazu, umožnilo jednoduše měnit zvukové stopy, respektive film opatřit dabingem v jiné řeči, nebo třeba komentářem. Obrázek 5. Vlevo ukázka optického zvukového záznamu na filmovém pásu; Obrázek 6. Vpravo typy optických zvukových záznamů (nepředstavují stejný zvuk)
Zdroj: http://fyzika.jreichl.com/main.article/view/1345-druhy-optickych-zaznamu-zvuku
16
1.3.3. Magnetický záznam zvuku Magnetický záznam je nejdokonalejší analogový záznam zvuku, který známe. Jeho nesporně největší výhoda je v tom, že je možné ho okamžitě reprodukovat, mazat, nahrazovat jiným záznamem a při správném zacházení má i velice dlouhou životnost. První magnetický záznam zvuku byl pořízen již roku 1900 Valdemarem Poulsenem. Jeho záznamové zařízení používalo jako nosič ocelový drát s průměrem 1 mm, který se pohyboval rychlostí 20 m/s. Tato technologie se používala jen k záznamu řeči a trpěla nízkou kvalitou záznamu. S mechanickým a optickým záznamem nemohla soupeřit a takto to zůstalo až do roku 1935. Namísto ocelového drátu se začal využívat plochý papírový nosič, jehož povrch byl pokrytý železitým práškem. Brzy poté papír nahradila acetylcelulóza. Tento nový nosič bylo možné stříhat a lepit bez zhoršení jeho parametrů, nehledě na lepší možnosti ukládání informací. Nový nosič a zdokonalení záznamové hlavy do tvaru prstence umožnilo snížit záznamovou rychlost na 72 cm/s. 1940 přišlo další významné zdokonalení. U záznamového média se začala používat předmagnetizace vysokofrekvenčním signálem, který se míchal se zaznamenávaným signálem. To přineslo velké zlepšení odstupu rušivých napětí a zmenšení nelineárního zkreslení. Další zdokonalení v podobě třímotorového transportního systému, který se vlastně používá dodnes, přineslo své ovoce. Kvalita záznamu se tím hodně zlepšila a takto se stal magnetický záznam akustických signálů konkurenceschopným proti ostatním druhům záznamu. Jak kvalitativně, tak i z ekonomického hlediska. Pro zařízení, které magnetické pásky umělo přehrávat, se vžil název magnetofon. Původně byl ale magnetofon chráněná obchodní značka firmy Telefunken Magnetického záznamu se začalo využívat v rozhlasovém a studiovém provozu. Díky snadné manipulaci s nahrávkami a možností opravy, přišla éra studiových magnetofonů. Po dobu druhé světové války a po ní, se vývoj v Evropě hodně zpomalil. V USA ale nelenili a vyvíjeli nové technologie a systémy. Magnetický záznam tak nakonec pronikl do hudebního i filmového průmyslu. Princip magnetického záznamu je založen na střídavém magnetování záznamového materiálu (magnetofonový pásek) elektromagnetickým polem záznamové hlavy. Záznamovou hlavu tvoří jádro, složené z tenkých plechů magneticky měkkého materiálu. 17
Toto jádro je v místě styku s magnetickou vrstvou záznamového média přerušeno štěrbinou. Šířka této štěrbiny se pohybuje v rozmezí 1 až 5 µm a aby byla šíře přesně definována, vkládá se do ní fólie z nemagnetického materiálu. Jádro záznamové hlavy je opatřeno cívkou, někdy i dvěma. Do cívky se při záznamu přivádí proud a v jádru hlavy vzniká magnetické pole. Toto pole v místě štěrbiny z hlavy vystupuje, protože je zde magnetický odpor největší a magnetuje aktivní vrstvu záznamového pásku. Ten se před štěrbinou rovnoměrně posouvá. V aktivní vrstvě záznamového materiálu pak zůstane zbytkový magnetický tok, jehož průběh by měl v ideálním případě odpovídat průběhu proudu v cívce hlavy. Magnetofon může mít jednu až tři různé hlavy v závislosti na jeho kvalitě. Nejhorší možná varianta je, pokud jedna hlava zajišťuje záznam, mazání a přehrávání. Proto se používá spíše pro každou funkci samostatná hlava (u špičkových přístrojů), nebo alespoň dvě hlavy. Jeda mazací a druhá univerzální pro záznam a reprodukci. Při reprodukci takového záznamu je postup opačný. Střídavě zmagnetovaný záznamový materiál probíhá přes snímací hlavu a magnetické silové čáry se uzavírají jádrem hlavy. V cívce hlavy se pak indukuje střídavé napětí, které by po zesílení a korekčních úpravách mělo být shodné s tvarem i průběhem signálu, který byl původně zaznamenán. Abychom zajistili co nejkvalitnější záznam, musí se splnit několik podmínek a tou nejdůležitější je předmagnetizace. Obstarává jí mazací hlava, která má oproti záznamové a snímací hlavě nejširší štěrbinu, až 0,5 mm. Zjednodušeně je předmagnetizace proces, kdy se magnetická vrstva „narovná“ do původního stavu, aby se na ní mohlo znovu zaznamenávat. Nejdříve se používala předmagnetizace stejnosměrným proudem, ale ta způsobovala následnou vysokou hladinu šumu. Tato metoda se již nepoužívá. Při druhé světové válce se náhodou přišlo na to, že se předmagnetizace dá provést i vysokofrekvenčním, střídavým proudem. Ten je aspoň 5x větší, než nejvyšší mezní frekvence
zaznamenaného
signálu.
Mazání
předmagnetizace.
18
záznamu
funguje
podobně
jako
Shrnutí Zde bych si dovolil shrnout všechna pro a proti analogového záznamu. Analogový záznam má tu největší výhodu ve svém spojitém průběhu signálu. Pro naše ucho je takový průběh zvuku přirozený. Proto ještě dnes existují lidé, kteří na analogový záznam, nedají dopustit. Především na gramofon a gramofonové desky. Nevýhodou analogového záznamu je opotřebení záznamových médií a s tím související ztráta kvality a věrné reprodukce. A to ať se záznamová média používají, nebo ne. Díky amplitudové modulaci se zde vyskytuje i poměrně vysoká hladina šumu.
19
2. Digitalizace zvuku Pokrok v elektronice a informačních technologiích přinesl nové možnosti záznamu zvuku a hudby. Na všech analogových nosičích se časem projevuje opotřebení a zde nastupuje právě digitální technologie. Největší její výhodou je, že tu neexistuje opotřebení. Jakmile je zvuk v digitální podobě zachycen a uložen, může být opakovaně přehráván a jeho kvalita se nezmění. Záznam lze zpracovávat na počítačích, kde ho lze velmi jednoduše přehrávat, upravovat a kopírovat. Digitální nosiče jsou také skladnější a dnes existuje nepřeberné množství zařízení, ve kterých je možné digitální nahrávky přehrát. V této kapitole objasním, jak k samotné digitalizaci signálu dochází.
2.1. PCM Pulzně kódová modulace je metoda převodu analogového (spojitého) zvukového signálu na signál digitální (diskrétní). Patentoval ji roku 1938 britský vědec Alec Harley Reeves, jako způsob komunikace bez chyb a s vysokou přesností. Tento patent ale nenašel reálné uplatnění, byl ve své době velice technicky náročný. Podílel se také na vývoji prvních transatlantických telefonních linek a dalších vynálezech z oblasti rádiové, telefonní a záznamové technologie. Byl vlastníkem více než 82 patentů. PCM ale našla reálné uplatnění až po vynálezu tranzistoru v 50. letech 20. století. Vlastní metoda PCM spočívá v pravidelném odečtu hodnot signálu za pomoci A/D převodníku. A/D převodník je součástka, která zajišťuje převod vstupního analogového signálu – nejčastěji napětí, na výstupní číslicový signál – datové slovo o stanoveném počtu bitů. Důvodem pro převod do digitální podoby je umožnění zpracování na číslicových počítačích. Digitální signály se snadno zaznamenávají a lze je také velmi přesně zrekonstruovat i při přenosu na velkou vzdálenost. Specializovaná zařízení na zpracování digitálního signálu se nazývají digitální signálové procesory. Jsou to mikroprocesory optimalizované pro algoritmy používané při zpracování digitálně reprezentovaných signálů. Hlavním nárokem na DSP je schopnost průběžně zpracovávat velké množství dat, protože často pracují v reálném čase. Například v mobilních telefonech bývají dvě až čtyři samostatná DSP jádra a veškeré algoritmy potřebné pro zpracování hovorového signálu na GSM signál.
20
Převod vlastního signálu probíhá ve třech krocích:
2.2. Vzorkování Každý úsek spojitého signálu zvuku jde donekonečna zvětšovat a všímat si tak všech nejjemnějších detailů průběhu signálu. Počítače zpracovávající tento signál mají ale omezenou kapacitu paměti a výkonu, proto se musí vzorkování omezit jen na nezbytně nutné množství vzorků. Vzorkování probíhá tak, že se osa signálu rozdělí na rovnoměrné úseky a z každého úseku se odebere vzorek. Na našem obrázku jsou vzorky reprezentovány červenými body. Je evidentní, že z původního signálu kvantováním ztratíme mnoho dat, protože namísto spojité čáry signálu dostaneme množinu diskrétních bodů, odpovídajícím užité vzorkovací frekvenci. Obrázek 7. Vzorkování signálu
Zdroj: http://cs.wikipedia.org/wiki/Soubor:Vzorkov%C3%A1n%C3%AD.png
2.2.1. Aliasing Aliasing lze do češtiny přeložit jako „zcizování“. Je to jev, který způsobuje překrytí frekvenčních spekter vzorkovaného signálu. K aliasingu dochází, pokud nedodržíme Shannon–Nyquistův teorém. Ten zní: „Přesná rekonstrukce spojitého, frekvenčně omezeného, signálu z jeho vzorků je možná tehdy, pokud byl vzorkován frekvencí alespoň dvakrát vyšší, než je maximální frekvence rekonstruovaného signálu.“ Citováno z: http://cs.wikipedia.org/wiki/Shannonův_teorém.
21
V praxi to znamená, že musíme volit vzorkovací frekvenci alespoň dvakrát vyšší, než je maximální požadovaná přenášená frekvence. Pokud by se tak nestalo, zaznamenané hodnoty by již nestačily k rekonstrukci průběhu původního signálu. Vyšší kmitočty se „překládají“, ve zrekonstruovaném signálu se poté jeví jako kmitočty nižší. V hudbě s aliasingem souvisí i zajímavý jev, zvaný zázněje. Využívá se ho třeba při hraní na varhany s výchvěvným rejstříkem. Pokud zazní z dvou píšťal tón s jen mírně odlišnou frekvencí, vnímáme to jako vibrující tón. Aliasingu lze zabránit jedině anti-aliasing filtrem. Je to součástka postavená před samotný převodník, která je schopna odfiltrovat frekvence vyšší, než je Nyquistova frekvence. S aliasingem se můžeme setkat i ve filmu nebo grafice. Typický příklad je otáčení vrtule letadla, nebo kola jedoucího auta. Většinou se točí nepřirozeně pomalu, nebo dokonce v protisměru. Správně by byl pohyb zachycen jen tehdy, pokud by frekvence snímání byla dvojnásobná oproti frekvenci otáčení. Kamera by musela za jedno otočení vrtule zaznamenat nejméně 2 obrázky, aby byl pohyb plynulý. V grafice se tomuto jevu říká moaré. Dochází k němu při překrytí dvou pravidelných, jen málo odlišných rastrů. Typický příklad je třeba košile s jemně pruhovaným vzorem. Takové oblečení je v televizním přenosu zakázané, protože košile vypadá, jako by hrála všemi duhovými barvami.
2.3. Kvantování Kvantování je v podstatě zaokrouhlování hodnot signálu, získaných při vzorkování, na předem definované kvantizační úrovně. Počítače umí zpracovávat čísla s omezenou přesností, proto se musí vzorkované body upravit kvantováním na celočíselné hodnoty. Abychom zjistili, jakých hodnot mají po kvantování vzorky nabývat, musíme vymezit prostor kolem celočíselných hodnot na toleranční pásy. Vzorku, který se objeví v daném tolerančním pásu, je přiřazena jeho celočíselná hodnota. Tento způsob kvantování, kdy jsou rozhodovací úrovně přesně v poloviční vzdálenosti mezi kvantizačními hladinami, se nazývá lineární kvantování. Na obrázku jsou kvantované hodnoty znázorněny zelenými body a toleranční pásy jsou naznačeny kolem hodnoty 0. Je na první pohled zřejmé, že kvantované hodnoty se liší od těch vzorkovaných a právě rozdíl vzdálenosti mezi těmito hodnotami se nazývá kvantizační chyba. Pokud tedy kvantování není dostatečně jemné a je přítomno hodně kvantizačních chyb, dochází ke kvantizačnímu šumu.
22
Obrázek 8. Kvantování
Zdroj: http://cs.wikipedia.org/wiki/Soubor:Kvantov%C3%A1n%C3%AD.png
2.4. Kódování Jednotlivé kvantované úrovně se přeloží do číslicové podoby, aby s nimi bylo dále možné manipulovat. Shrnutí Hlavními parametry při digitalizaci zvuku jsou tedy vzorkovací frekvence u vzorkování a bitová hloubka u kvantování. Budeme-li mít digitalizovaný zvukový vzorek o frekvenci 44,1 kHz, znamená to, že vzorkovací algoritmus odebíral při digitalizaci 44 100 vzorků za jednu sekundu. Tato frekvence se používá pro záznam na CD a není zvolena náhodně. Lidské ucho vnímá zvuk do 20 kHz a kvůli Shannon-Nyquistovu teorému je zvolena frekvence dvakrát vyšší, plus docela vysoká rezerva. Takováto vzorkovací frekvence by měla zrekonstruovat signál, který naše ucho není schopné rozeznat od původního analogového záznamu. V profesionální praxi ve studiích se používají i vyšší frekvence, například 48 kHz, 88,2 kHz i 96 kHz, ale s tím samozřejmě i roste nárok na hardware. Jak z hlediska náročnosti zpracování, tak z hlediska obřího objemu ukládaných dat. Bitová hloubka určuje, jaké množství napěťových úrovní hlasitosti převodník rozliší na jeden vzorek signálu. Čím více jich bude, tím bude lepší dynamika zvuku, méně šumu a kvalitnější reprodukce. 8 bitová hloubka znamená 28 = 256 takovýchto úrovní. To není 23
zrovna mnoho. Při 16 bitové hloubce je to už 65536 napěťových úrovní. Tato hodnota se běžně užívá a je považována za dostačující. Pro běžnou potřebu posluchače většinou stačí běžná kvalita CD Audio, což je 16 bit/44,1 kHz. Pro opravdového hudebního labužníka je tu i DVD Audio formát s parametry 24 bit/192 kHz, ale reálný rozdíl v kvalitě je spíše relativní a je otázka zda jsme schopni vnímat nějaký rozdíl. Dalším důležitým pojmem je počet bitů za sekundu (bitrate). Označuje se b/s, nebo bps a označuje průtok dat za sekundu. Při 16 bit/44,1 kHz je tento průtok roven 1,35 Mb/s. Došli jsme k tomu výpočtem 16 (bitů) x 44100 (Hz) x 2 (kanály) = 1411200 b/s = 1,34 Mb/s a u DVD Audio je to 8,97 Mb/s.
24
3. Digitální audio formáty V této kapitole uvedu jednotlivé druhy existujících digitálních formátů a jejich nejznámější zástupce.
3.1. Bezztrátové hudební formáty U bezztrátových hudebních formátů při kódování nedochází k žádné ztrátě kvality hudby, ani ke kompresi. Výsledný signál odpovídá signálu, z kterého byl pořízen. Tyto formáty se používají v profesionálních produkčních aplikacích. Uložení bez komprimace umožňuje aplikacím mnohem rychleji přistupovat k datům z disku, při potřebě přenosu více zvukových souborů najednou. Jejich velikost je ale obrovská.
3.1.1. WAV Waveform audio file format, označován i zkráceně WAV, je standart digitálního audio formátu, který společně vyvinuli firmy Microsoft a IBM v roce 1991. Je to nativní souborový formát, pro ukládání většinou „surových“, nekomprimovaných hudebních dat, pro platformu systému Windows. Poprvé se objevil s příchodem Windows 3.1. WAV je také historicky první zástupce bezztrátových formátů a pro mnohé ekvivalent pro hudební formát použitý v CD Audiu. S příchodem Windows 2000 byl WAV upraven a rozšířen o možnost ukládat vícekanálový zvuk. Díky celosvětovému rozšíření operačního systému Windows a ohromnému množství programů napsaných pro tuto platformu se WAV rychle dostal do celého světa. Z hlediska objemu je to nejnáročnější hudební formát vůbec. Z důvodu obsahu nekomprimovaných dat má 1 minuta záznamu při vzorkovací frekvenci 44,1 kHz a 16 bity na vzorek (CD Audio kvalita) něco málo přes 10 MB. To je i na dnešní poměry celkem velké sousto, natož v roce 1991. Proto se tento formát používá jen jako pracovní formát ve studiích při zpracování zvuku, nebo jako výchozí formát před konverzí do dalších formátů. Nebo pokud chceme opravdu kvalitní zálohu svých hudebních alb. K tomu se ale používají spíše jiné bezztrátové formáty s kompresí. Kvůli své jednoduché vnitřní struktuře je používán i pro přenos mezi různými systémy. WAV je varianta obecnějšího multimediálního kontejnerového formátu RIFF vyvinutý opět Microsoftem a IBM. RIFF formát v sobě může uchovávat řadu různých druhů dat.
25
Původně byl určen pro multimediální soubory, ale tato specifikace je tak otevřená, že umožňuje uložit jakýkoliv soubor, který jsou programy schopné přečíst. Wave formát používá právě RIFF datové struktury. Jsou to shluky, bloky (chunks). Každý blok začíná hlavičkou (header) – čtyřznakovou identifikací a délkou bloku. Pokud je délka dat v bloku lichá, doplňuje se blok na konci nulou, aby byla délka sudá. Bloky je do sebe možné vnořovat a vytvářet stromovou strukturu, ale většinou se nepoužívají více než tři úrovně. Nadřazené bloky (parent chunks), obsahují mimo informace o identifikaci a délky ještě identifikaci typu bloku. Poté následují jednotlivé podřízené bloky (sub chunks). Délka nadřazeného bloku obsahuje tím pádem i identifikaci typu a délky všech podřízených bloků, včetně záhlaví. Názvy nadřazených bloků se píší velkými písmeny, podřízené bloky malými. Struktura WAV souboru Stromová struktura v sobě obsahuje nadřazené a podřízené bloky. V této podkapitole se seznámíme pouze s těmi nejdůležitějšími. Nadřazený blok WAVE obsahuje samotná audio data, informace o formátu a další doplňkové informace. Jsou mu podřízené bloky format – označován „fmt“; factual lenght – „fact“; data – „data“; sampler – „smpl“ a cue – „cue“. Blok souhrnných informací, nadřazený blok INFO, obsahuje sub chunky s textovými informacemi o souboru. Řetězec znaků je vždy zakončen nulou. Posledním nadřazeným blokem je blok regionů a triggerů ADLT. Tento blok obsahuje detailní informace o regionech. Jejich jména, způsoby spouštění a přehrávání. Doplňuje informace bloku cue. Jsou mu podřazeny bloky label text – „ltxt“; label – „labl“; trigger list – „tlst“; playlist – „plst“ a instrument – „inst“. Blok format obsahuje informace o formátu zvukového souboru. Patří sem informace o způsobu kódování audio dat, počtu bitů na vzorek a počtu kanálů. Použitelné formáty kódování jsou PCM, Microsoft ADPCM, ITU G.711 A-law, ITU G711 µ-law, IMA ADPCM, GSM 6.10, ITU G.721 ADPCM, MPEG. Blok factual length obsahuje informace o skutečné délce audio dat. U některých způsobů kódování totiž délka zvukových dat neodpovídá počtu vzorků.
26
Blok data obsahuje vlastní audio data a způsob jejich uložení. Kanály vzorků jsou sloučeny, to znamená, že po jednom celém vzorku kanálu následuje vzorek z druhého kanálu, až po poslední kanál. Pak následují druhé vzorky ze všech kanálů atd. Pokud je vzorek více jak 8 bitový, používá se pro ukládání jednotlivých bytů vzorku řazení dle little endian. To znamená, že jako první se řadí nejméně významný byte a jako poslední nejvýznamnější byte. Blok sampler specifikuje informace pro soubory, používané elektronickými hudebními nástroji nazývanými samplery. Sampler umí přehrát navzorkované signály a podle zahrané noty jim měnit výšku. Dále jsou zde informace o smyčkách. Blok cue obsahuje údaj o počtu markerů / regionů a po něm následuje jejich seznam. Je svázán s blokem regionů a triggerů.
3.1.2. AIFF AIFF (Audio Interchange File Format) je formátem pro ukládání zvuku a hudby na osobních počítačích a jiných elektronických hudebních zařízeních Byl vyvinut firmou Apple Computers roku 1988 a jeho základem je, podobně jako u WAV souborů platformy Windows, kontejnerový formát. Ten představila v roce 1985 firma Electronic Arts v koprodukci s Commodore-Amiga, pod názvem Interchange File Format, zkráceně IFF. IFF je tvořen, stejně jako RIFF formát pro Windows, systémem datových bloků a práce s nimi je naprosto shodná. Rozdíl je jen v řazení souborů. Zde je použit systém řazení BigEndian (nejdůležitější bajt se ukládá na začátek, nejméně důležitý na konec) a bloky nadřazené i podřazené se píší velkými písmeny. Standardně AIFF obsahuje hudební data v nekomprimované PCM podobě, existuje ale i varianta AIFF-C, která umožňuje kompresi. Předchůdce tohoto formátu je formát 8SVX (8-Bit Sampled Voice) od EA a Amigy, je to podtyp IFF formátu a také obsahoval zvuk bez komprese. Zanikl ale společně s platformou Amigy a jeho další varianty se nedočkaly žádné hardwarové podpory.
27
3.2. Bezztrátové hudební formáty s kompresí Bezztrátové kompresní formáty také nevynechávají žádná potřebná data. Jsou přeložena speciálním algoritmem, který neporuší jejich kvalitu, ale zredukuje jejich velikost. Většině těchto formátů se daří dosáhnout poloviční velikosti, oproti nekomprimovaným bezztrátovým formátům. S rostoucí rychlostí internetu a velikostí úložných médií v domácnostech, kde se počítá už řádově v TB, sílí poptávka po kvalitnější hudbě. Ta se dá přehrávat na moderních přístrojích, které již podporují, nebo začínají podporovat bezztrátové kompresní formáty. Jsou to třeba DVD nebo Blue-ray přehrávače s prostorovým domácím kinem, herní konzole, moderní autorádia i přenosné hudební přehrávače. Všechna tato zařízení nám umožňují si užít perfektní zvuk. Musíme ho ale získat v podobě správného a zařízením podporovaného formátu.
3.2.1. WavPack WavPack je bezztrátový, open-sourcový formát, vytvoření Davidem Bryantem roku 1998. Aktuální verze je WavPack 4.60.1. Tato poslední verze dosahuje podobného kompresního poměru jako ostatní podobné formáty. Dokáže se dostat zhruba na 30 až 60 % původní velikosti nekomprimovaných souborů, při kódování populární hudby. Trochu lepších výsledku dosahuje při klasické hudbě a jiných dynamičtějších žánrech. Rychlost dekódování není tak rychlá jako u FLAC formátu. Podporuje RIFF datové bloky, MD5 hashovací algoritmus, který kontroluje integritu, umí kódování ve vysokém rozlišení, vícekanálový zvuk a dále podporuje také ReplayGain technologii, která zaručuje, že přehrávané skladby nebudou různě hlasité (defaultní nastavení RG je 89 dB). Největší zajímavostí tohoto formátu je jeho schopnost kódování v hybridním režimu, který poskytuje všechny výhody bezztrátové komprese s dalším bonusem. WavPack vytvoří dva relativně docela malé soubory. Jeden je ztrátový hudební soubor, s příponou .wc, který funguje 100% samostatně jako ztrátový hudební formát. Druhý je soubor korekční, s příponou .wvc. Ten obsahuje záznam s daty ztracenými při kompresy. Z těchto dvou souborů lze jednoduše zpětně obnovit původní nekomprimovaný záznam.
28
3.2.2. FLAC FLAC (Free Lossless Audio Codec) je v dnešní době asi nejoblíbenější bezztrátový hudební formát. Jeho tvůrce John Coalson chtěl vytvořit výpočtově nenáročný a volně šiřitelný kodek, s plnou zpětnou kompatibilitou. První verze se objevila v roce 2001, pak se vývoj zastavil. Až do roku 2003, kdy se FLAC projekt začlenil pod organizaci Xiph.org, která měla na svědomí už několik úspěšných formátů. Jmenovitě ztrátový kompresní formát Vorbis, formát pro kódování hlasu Speex, video kodek Theora a kontejnerový formát Ogg. FLAC spadá pod licenci GNU GPL a BSD. Jednoduše řečeno, jsou to licence pro svobodný software, které zaručují, že odvozená díla budou dostupná pod stejnou licencí a přitom volně šiřitelná. Tento bezztrátový kodek zajišťuje stejnou kvalitu poslechu jako WAV formát, při redukci své velikosti až na 60 %. Toho je docíleno pomocí podobné komprese, jaká je užívaná v klasických komprimačních programech typu ZIP, nebo RAR. Ty umí zmenšit audio data o 10 – 20 %, FLAC to díky své optimalizaci na komprimaci hudby dokáže až o 30 – 50 % u většiny hudby a ještě lepších výsledků dosahuje při komprimaci hlasových záznamů. FLAC kodek používá pro konverzi lineární predikci zvukových vzorků do série reziduálů (malých čísel) a ty jsou dále uloženy pomocí efektivního Riceova kódování, které se hodí pro zpracování v binární podobě. Tento způsob kódování rozděluje vstupní hodnotu na dvě, pomocí volitelného vstupního parametru. První hodnota je výsledek po dělení parametrem a druhá hodnota je zbytek po dělení. Tyto dvě hodnoty jsou kódovány samostatně za sebou. Dá se použít i RLE komprese, kdy se posloupnosti stejných hodnot kódují do dvojic, ta je ale využitelná jen při kódování v nízkém, 8 bitovém rozlišení a ten se u FLAC formátu téměř nepoužívá. Technická síla FLACu, ve srovnání s ostatními bezztrátovými formáty, je ve schopnosti rychlého dekódování a streamování, které je nezávislé na úrovni komprese. Další výhoda je podpora flac tagů, které slouží jako popisky všech potřebných detailů o hudebním díle. Podporují i vkládání originálních obrázků použitých pro obal alba (cover art). Umí kódovat signál ve vysokém rozlišení (vzorkovací frekvence vyšší než 48 kHz a bitová hloubka vyšší než 16 bit) a kóduje i vícekanálový zvuk (více než 2 kanály – stereo). Hodí se pro ukládání do Ogg a Matroska souborových kontejnerů, Je velice dobře softwarově i hardwarově podporován. Lze ho přehrát na všech operačních systémech 29
FLAC se dále používá i k archivaci hudebních alb. Protože nedochází ke ztrátám, lze si vytvořit zálohu CD Audio disku. Při záloze je možné vygenerovat i CUE soubor, který obsahuje CD text a přesné rozložení stop. Když se CD zničí nebo opotřebí, je možné z FLAC zálohy udělat jeho identickou kopii.
3.2.3. Apple Lossless Apple Lossless Audio Codec, neboli ALAC (nebo ALE), představil Apple Inc. v roce 2004 společně s Quick Time 6.5.1. Z názvu je patrné, že je to bezztrátový formát rodiny Apple. Používá kontejner typu MP4 a má příponu .m4a. Tuto příponu používá i formát AAC, který je ztrátovým formátem firmy Apple. Soubory kódované ALE kodekem mohou dosahovat až poloviční velikost, oproti nekomprimovaným souborům. ALE používá lineární predikci jako ostatní bezztrátové kodeky jako například FLAC. Ostatní bezztrátové kodeky nejsou nativně podporovány v Apple iTunes ani v jejich počítačích a zařízeních podporující iOS. Uživatelé těchto Apple zařízení, kteří chtějí používat bezztrátový formát s podporou přidávání metadat, musejí sáhnout právě po Apple Lossless formátu. Ten je na druhou stranu všemi zařízeními od Apple mohutně podporován. ALE je oproštěno od jakékoliv DRM kontroly, ale díky povaze Quick Time kontejneru ji lze jednoduše aplikovat. Roku 2005 David Hammerton a Cody Brocious, zvaný PyMusique, prolomili tento formát reversním inženýrstvím. Povedlo se jim to bez jakékoliv dokumentace, protože Apple žádnou nikdy nezveřejnil. Hammerton poté napsal v programovacím jazyce C jednoduchý open-source dekodér. Oficiální open-source kodek byl vydán až nedávno, v roce 2011.
3.2.4. MP3HD Tento relativně nový formát vznikl jako odpověď na formáty FLAC, WawPac, Apple lossless a další. Vyvinula ho v roce 2009 společnost Technicolor (Thomson). Skvělou vlastností tohoto formátu je zpětná kompatibilita se zařízeními a aplikacemi, které jsou schopné přehrát běžný ztrátový MP3 formát. Má také stejnou příponu .mp3. Kompatibility je docíleno tím, že soubor je rozdělen na 2 částí. První část je shodná s běžnou MP3 se ztrátovými daty. Druhá část s bezztrátovými daty, je uložena v ID3v2 tagu. Chceme-li MP3HD přehrát v požadované bezztrátové kvalitě, je potřeba mít kompatibilní MP3HD přehrávač, nebo nainstalovaný správný kodek ve svém počítači. Pokud ne, byla by
30
přehrávána jen ztrátová část dat. MP3HD soubor má srovnatelnou velikost s ostatními bezztrátovými kompresními formáty. Od roku 2009 Technicolor aktualizoval svůj formát i nástroje kódování, pro zvýšení jejich účinnosti. Přinesl také plugin pro hudební přehrávač Winamp a direkt show filtr potřebný pro přehrání ve Windows Media Playeru. V dnešní době je možné je MP3HD přehrát i v iPodu, ale neočekává se žádné velké další rozšíření hardwarové a softwarové podpory, kvůli povinnosti tento kodek licencovat.
3.2.5. Monkey's Audio Monkey's Audio je další z řady bezztrátových kompresních formátů. Má příponu .ape a první verze vyšla v roce 2000. Při svém uvedení na světlo světa, tomuto formátu nebylo co vytknout. Rychlost komprese i komprimační výsledky byly dobré. Podporoval tagování a je to open-source. Dlouho byl formát použitelný jen pro platformu Windows, ale dnes už se dá přehrát i na LINUXových distribucích i MACích. Poslední aktuální verze je z roku 2011. Verze 4.10.
3.2.6. MPEG-4 SLS SLS v názvu tohoto formátu znamená Scalable Lossless Coding (škálovatelné bezztrátové kódování) Je to rozšíření standardu MPEG-4 Part 3 (část MPEG-4 audio) a je to také opensource. Vyvíjí ho společně firmy Infocom research a Frauenhofer a připojili ho jako podmnožinu ke standardu HD-AAC. MPEG-4 SLS umožňuje přeškálovat bezztrátovou část i na ztrátovou, podobně jako to umí WavPack. Umožňuje to zpětnou kompatibilitu se ztrátovým formátem AAC a může se tak použít pro archivaci hudby, ale zároveň i pro streaming na internetu.
31
3.3. Ztrátové kompresní hudební formáty Ztrátové kompresní formáty jsou i dnes pořád ještě nejrozšířenější formou šíření hudby. Audio CD je pořád standardem kvality a většina těchto formátů vzniká právě z něj. Všechny tyto formáty používají nějakým způsobem kompresi, která nenávratně zredukuje obsažené informace. Informace o signálu, které nepotřebujeme, nebo je z fyziologického hlediska ani slyšet nemůžeme. Signál se z těchto formátů již nedá zpět zrekonstruovat do původní podoby.
3.3.1. MP3 MP3 je zkratka pro MPEG-1 Audio Layer 3. V této podkapitole si tento nejznámější a nejpoužívanější ztrátový formát přiblížíme podrobněji. 3.3.1.1. Historie MP3 Historie dnes tak známého formátu MP3 začíná v Německu roku 1970. Prof. Dieter Seitzer se na Norimberské univerzitě zabývá problémem přenosu hlasu po telefonních linkách. Po vynalezení ISDN linek a optických kabelů výzkum přešel na kódování hudebních signálů. V roce 1979 tým Prof. Seitzera vyvinul první digitální signálový procesor, který byl schopný digitální komprese zvuku. Tým se začal zabývat psychoakustickými principy vnímání lidského ucha a díky těmto důležitým poznatkům se celému týmu daří nepřetržitě vylepšovat jejich kódovací algoritmus. V roce 1987 vznikl projektu Evropské Unie – EUREKA projekt EU147 pro digitální rozhlasové vysílání (DAB). Podíleli se na něm Norimberská universita a Frauenhofer ISS, kde výzkum vedl specialista na matematiku a elektroniku Karlheinz Brandenburg, také zvaný „otec MP3 formátu“. Roku 1988 vznikla pod záštitou organizací ISO (mezinárodní organizace pro normalizaci) a IEC (mezinárodní elektro-technická komise) pracovní skupina MPEG (Moving Picture Experts Group), která vyvíjí standardy používané pro kódování audiovizuálních informací, pomocí digitálního kompresního algoritmu. 1991 celý projekt téměř ztroskotal. Během modifikačních testů kódování nepracovalo správně. Pouhé 2 dny před představením první verze MP3 kodeku, se našla chyba v kompilátoru a vše se nakonec povedlo.
32
1992 dochází k integraci hudební kódovacího algoritmu, který vyvinul prof. Seitzer společně s Fraunhofer institutem, do připravovaného standardu MPEG-1 1993 je publikován MPEG-1. 1994 vydala společnost Frauenhofer první kodér zvaný l3enc. V druhé polovině téhož roku se MP3 začala rozšiřovat i na internet 1995 byla přijata přípona souboru .mp3 (do té doby se používala přípona .bit). S prvním real-time softwarovým přehrávačem Winplay3 bylo konečně možné přehrávat MP3 soubory na počítačích. 1997 oblíbenost formátu MP3 rapidně rostla s představením hudebního přehrávače Winamp, od společnosti Nullsoft. Webová stránka www.mp3.com začala zadarmo nabízet tisíce MP3 skladeb vytvořených nezávislými interprety. Rozmohlo se také ripování (ripping), nebo grabování (grabbing) audio CD. Znamená to převod z původního formátu uloženého na CD, do jiného formát (převážně MP3). 1998 představila jihokorejská firma SaeHan Information Systems první přenosný MP3 přehrávač. Byl to MPMan MP F-10 a byl vybaven 32MB pamětí. Cena byla 250 dolarů. 1999 byla spuštěna první velká P2P (peer-to-peer) síť Napster. Překlad P2P je rovný s rovným. Je to síť, kde klienti spolu komunikují a sdílejí data přímo, bez použití serveru. Napster sloužil primárně pro výměnu MP3 souborů, převážně bez souhlasu držitelů práv. Snadné vytváření a sdílení MP3 vyústilo v rozsáhlé porušování autorských práv. Nahrávací společnosti přicházejí o prodeje a označili tento způsob šíření hudby jako „hudební pirátství“. Začaly soudní procesy s Napsterem a jednotlivými uživateli, kteří porušovali autorská práva. Napster byl následně vypnut a prodán. Poté sloužil jako on-line obchod s hudbou a nedávno se spojil s projektem rhapsody.com, který nabízí online streamovanou hudbu. On-line prodejci hudby začali kvůli nelegálnímu získávání hudby prosazovat DRM (Digital Rights Management). Přeloženo jako „Správa digitálních práv“. Jsou to způsoby jak omezit nebo kontrolovat používání obsahu digitálních médií. Cílem DRM je zajistit používání těchto médií v souladu s autorskými právy. Záměr zabránit nelegálnímu kopírování obsahu se ale minul účinkem a lidé spíše hledali jiné způsoby jak se k těmto obsahům dostat. DRM například nedovoluje vytvořit záložní kopii zakoupeného CD, na 33
kterou má spotřebitel své právo. Od DRM se v poslední době upustilo a on-line prodej závratně stoupá. Při rozumné ceně si album rádo koupí mnohem více lidí. Je to jednodušší než složitě překonávání ochrany. Charakteristika MP3 Formát MP3 způsobil v posledních dvaceti letech v hudebním průmyslu doslova revoluci. Hlavně v tom, jak lidé začali hledat, získávat, organizovat a poslouchat hudbu. Hlavní síla MP3 formátu tkví v jeho velmi úsporné velikosti. Zabírá podstatně méně místa na harddiscích nebo přenosných médiích, oproti audio CD, nebo WAV souborům na počítačích. Přitom zachovávají dostačující kvalitu poslechu. MP3 je patentovaný, digitální audio formát, využívající ztrátové komprese. MP3 kodek při kompresi vypouští nedůležitá data. Jsou to ty části hudebního signálu, které z principu fyziologie ucha nejsme schopni vnímat. Využívá se při tom technologie frekvenčního a časového maskování. Frekvenční maskování využívá nedokonalosti lidského ucha. Pokud zaznějí dva tóny zvuku současně, může jeden z nich potlačit slyšitelnost toho druhého. Například zazní-li tón o frekvenci 5000 Hz a současně s ním slabší tón s frekvencí 6000 Hz, nebude lidské ucho schopno druhý tón rozpoznat. Časové maskování se uplatňuje před a po silném zaznění zvuku. Využívá se toho, že ucho neslyší několik desítek až stovek milisekund po zaznění silného tónu. Doba, kdy nic neslyšíme je přímo úměrná na době hraní silného zvuku. Takové maskování se nazývá postmasking. Zajímavé je, že díky složitému vnímání našeho mozku, neslyšíme ani pár milisekund před zazněním silného tónu. Tomuto jevu se říká premasking. Při vlastním kódování si lze vybrat bitrate (přenosovou rychlost), kterou bude vstupní signál kódován. Lze si vybrat datové toky od 32 kbit/s do 320 kbit/s a vzorkovací frekvence 32, 44,1 a 48 kHz. Nejlepších výsledků dosahuje kodek při použití přenosové rychlosti kolem 160 kbit/s a vzorkovací frekvence 44,1 kHz. Poměr velikosti originální nahrávky, ku velikosti vzniklé MP3, je v tomto případě 9:1. Můžeme si vybrat i ze tří možných datových toků (bitrate). Konstantní přenosová rychlost (Constant Bitrate, CBR) znamenám, že přenosová rychlost bude každou sekundu stejná. Ať už je v signálu ticho nebo hraje orchestr. 34
Proměnlivá přenosová rychlost (Variable Bitrate, VBR) se snaží šetřit místo tím, že při pasážích kde není třeba vysokého datového toku, použije datový tok menší. Existuje ještě průměrná přenosová rychlost (Average Bitrate, ABR), toto nastavení se chová jako VBR, ale snaží se pohybovat kolem střední hodnoty, nastavené uživatelem. Velikost výsledné komprese lze ovlivnit ještě počtem kanálů a jejich kvalitou. Lze pro ně nastavit 4 různé módy jejich kódování. Mono – Jednokanálový zvuk. Je úsporný, ale kvalita je špatná. Stereo – Tento mód kódování přiděluje různým kanálům podle potřeby více bitů z celého bitového toku. Pod módem stereo se kódují i vícekanálové záznamy. Dual – Každý kanál je kódovaný zcela samostatně a je mu přidělena přesně polovina bitrate. Kvalita je horší než u stereo módu. Joint stereo – Nejpoužívanější mód. Tento mód kódování využívá toho, že v pravém a levém kanálu se často vyskytují stejné informace. Levý (L) a pravý (R) kanál se přepočítá na středový M=L+R a na postranní S=L-R. Větší bitrate je přidělen středovému kanálu, který obsahuje důležitější informace. Při přehrávání jsou obsahy levého a pravého kanálu zpětně dopočítány. S MP3 přišla i technologie ID3 tagů. Jsou to připojitelná metadata, která podávají informace o názvu alba, interpreta, jednotlivých písní, jejich číslování, rok vydání, obrázek alba a podobné detaily. Původní ID3v1, se připojoval na konec souboru a jeho velikost musela být 128 Byte. Dnes už se používá verze ID3v2, nebo obě verze najednou. ID3v2 má již velikost proměnlivou a připojuje se na začátek souborů. Může obsahovat nesrovnatelně více informací. Skládá se z rámců, které mohou dosahovat velikosti 16 MB, celkově až 256 MB na tag. 3.3.1.2. LAME enkoder Tento projekt odstartoval v roce 1998. Stojí za ním skupina vývojářů, kteří se snaží vytvářet open-source kodek pro MP3. Tvůrci svůj software prezentují jako otevřený výukový nástroj, pro pochopení kvalitního kódování MP3. Nejlepší kvalita, stálé zlepšování psychoakustického modelu a rychlost kódování způsobila, že se LAME kodek, stal téměř jediný používaný a stále se rozvíjející kodek ve světě. Jeho implementace jsou ve všech komerčních i nekomerčních hudebních programech.
35
3.3.1.3. Struktura MP3 Struktura MP3 souboru je rozdělená do rámců (frames). Každý frame je na sobě nezávislý a obsahuje hlavičku, za ní následují vlastní audio data. Hlavička je reprezentována prvními 4 Byty každého framu a obsahuje důležité informace o souboru. Jaké to jsou, je vidět na obrázku a jsou popsány níže. Obrázek 9. Hlavička MP3 souboru
Zdroj: http://checkmate.gissen.nl/mp3header.png
Frame synchronization, představující prvních 11 bitů, slouží k rozpoznání hlavičky. MPEG version, určuje typ MPEG, většinou MPEG-1. Layer určuje jakou vrstvou MPEG je kódováno, bývá to Layer 3. Protection prozrazuje, zda je připojena CRC kontrola integrity. Pokud ano, následuje 16 bitů dlouhý záznam za hlavičkou. Bitrate udává datový tok. Nabývá hodnot od 32 kb/s do 320 kb/s. Sampling rate prozrazuje, v jaké frekvenci je soubor vzorkován. Padding určuje, zda je přítomen „vyplňovací“ bit pro zachování správné velikosti framu. Private je rezervní bit pro specifickou potřebu aplikací. Channel mode definuje kanály. Mono, Stereo, Dual, nebo Joint Stereo.
36
Mode extension určuje, jaký mód Jiont Sterea je použit, pokud je použit. Copyright určuje, zda je MP3 chráněn copyrightem, nebo ne. Original určuje, zda je MP3 originál, nebo kopie originálu Emphasis určuje, zda je kladen důraz na frekvence vyšší než cca 3,2 kHz
3.3.2. MPEG MP3 vychází z multimediálních standardů MPEG. V této podkapitole popíši 4 nejznámější a nejpoužívanější. MPEG obecně popisuje kódování videa. Je však možné použít jen část, například pouze tu část pro kompresi zvuku. MPEG má tyto standardy: 1, 2, 2.5, 4, a 7. Všechny realizují ztrátovou kompresi a určují formát ukládaných informací. Každý standard obsahuje části, které popisují kódování audia, videa, synchronizačních dat a formáty uložení kódovaných dat. MPEG standard obsahuje 3 vrstvy (Layer), které popisují kódovací schémata. Layer 1, 2 a 3. Od Layeru 1 do Layeru 3 roste komplexnost a efektivita komprese zvuků, ale klesá rychlost kódování a dekódování. Layer 1 je nejjednodušší, hodí se nejvíce pro datový tok od 128 kb/s na kanál a původně byl určen pro kódování DCC (Digital Compact Cassette) Layer 2 je kompromis mezi kvalitou, rychlostí a kompresním poměrem. Původně určený pro digitální rozhlasové celoplošné vysílání (Digital Audio Broadcasting, DAB) a pro DVD, nebo CD-I (Compact Disc Interactive). CD-I je multimediální CD přehrávač značky Philips. Layer 3 je od počátku vyvíjen pro nízké datové proudy. Hlavně pro použití v ISDN síti, satelitním rozhlasu a pro přenos po internetu. Tato vrstva má nejúčinnější kompresní poměry. Pro danou úroveň zvukové kvality, vyžaduje nejnižší paměťové nároky. MPEG-1 MPEG1 primárně slouží ke kódování obrazu a přidruženého zvuku pro digitální datové nosiče s rychlostí přenosu 0,9 – 1,5 Mbit/s. Z toho je 1,2 Mbit/s pro video a 0,3 Mbit/s pro audio data. Tato specifikace je ušitá na míru kompaktnímu disku, ale MPEG-1 zvládne i mnohem vyšší datové toky. Používal se pro Video CD, SVCD a pro méně kvalitní video na DVD Video disku. Před vydáním MPEG-2 standardu se používal i v digitálních satelitních, nebo kabelových televizích. Aby bylo možné vyhovět nízkým bitovým tokům, MPEG-1 používal downsampling obrazů, což mělo za následek horší kvalitu. Používané vzorkovací frekvence jsou 32 kHz, 44.1 kHz a 48 kHz. Počet komprimovaných kilobitů za 37
sekundu (bitrate) je od 32 kb/s až k 448/384/320 kb/s, v závislosti na použité vrstvě. Jeho součástí je i MPEG Audio Layer 3 (MP3). MPEG-2 Tento standard rozšiřuje možnosti MPEG-1. Je do něj možné zaznamenávat více kanálů a do nich případně i více jazykových variant. Je zde možné vybírat z více samplovacích frekvencí: 16, 22, 24, 32, 44.1 a 48 kHz. Díky vícekanálovému zaznamenávání lze použít tyto módy záznamu: 3/2, 3/0+2/0, 3/1, 2/0+2/0, 3/0, 2/2, 2/1, 2/0 stereo a 1/0 mono, kdy tyto dvojice čísel A/B znamenají A kanálů pro přední reproduktory a B pro zadní surroundové reproduktory. Krom těchto standardních kanálů lze použít i jeden LFE (low frekvency) kanál. MPEG-2 byl vybrán jako kompresní schéma pro kompresi digitálního pozemního vysílání DVB, ATSC, nebo digitálního kabelové vysílání. Lze ho použít i v Blue-ray discích. MPEG-2.5 Tento standard není klasickým ANSI standardem. Vyvinul ho Frauenhoffer ISS jako rozšíření stávajícího MPEG-2. Díky tomuto rozšíření se významně rozšířily možnosti používaných bitratů a samplovacích frekvencí, hlavně v nižších hodnotách. MPEG-3 Standard MPEG-3 byl vyvíjen za účelem používání v HDTV, ale nestalo se tak a byl připojen ke standardu MPEG-2. MPEG-4 MPEG-4 zdědil vlastnosti standardů MPEG-1 a 2 a přidal k němu řadu vylepšení, které umožňují ukládat obraz ve stejné kvalitě při násobně menšímu objemu dat. Rozšiřuje MPEG-1 o podporu audio/video objektů, 3D obsahu a DRM specifikované třetími stranami. Obsahuje také vlastní kontejner založený na formátu Quick time. MPEG-4 má řadu profilů a úrovní, které určují specifické části standardu. Záleží na vývojářích, jaké způsoby implementace zvolí, pro různé účely aplikací. Nejvýraznější částí je MPEG-4 part 2, kterou využívají známe video kodeky DivX, Xvid, nebo Quick Time 6. Další výrazná část tohoto standardu je MPEG-4 part 10. Jeho součástí je specifikace AVC/H.264, která je použita v HD TV, Blue-ray discích a všech digitálních kabelových a satelitních a pozemních HD vysíláních. Používá se i při přehrávání streamovaného obsahu z internetu, jako jsou videa z Youtube nebo Vimeo webových stránek.
38
3.3.3. Vorbis Vorbis je open-source formát, který má na svědomí nadace Xiph.org. Tato organizace se snaží vyvíjet komponenty pro kódování a dekódování multimediálního obsahu, které budou svobodně implementovatelné a dostupné pod BSD licencí. Tento kompresní formát byl jejich prvním a také dlouho jediným počinem. Intenzivně se na něm začalo pracovat, když společnost Frauenhofer oznámila záměr vybírat poplatky za MP3 licence. Vorbis byl představen roku 2002 a měl se stát nástupcem MP3 formátu. Jeho komprimační algoritmy a kvalita zvuku byla lepší než u MP3 a navíc byl zadarmo. Jeho použitelné vzorkovací frekvence jsou od 8 do 192 kHz a bitová hloubka může být 16 nebo 24 bitů. Nevýhodou je, že Vorbis nemá žádnou ochranu proti chybám při samotném kódování. V poslední době se Vorbis začal hodně využívat pro ukládání zvuku v počítačových hrách a herních konzolích. Mnoho rádiových stanic a online služeb streamuje hudbu ve formátu Vorbis. Mnoho lidí zaměňuje spojení Ogg Vorbis se samotným Vorbis formátem. Ogg je také otevřený a svobodný software od Xiph.org, je to ale kontejnerový formát. Dnes už se nepoužívá, nahradil ho modernější, veřejnosti také otevřený, kontejner Matroska.
3.3.4. AAC Advanced Audio Coding (AAC) je ztrátový formát, jehož první verze vyšla v roce 1997. Vyvíjen byl společnostmi AT&T Bell Laboratories, Fraunhofer IIS, Dolby Laboratories, Sony Corporation a firmou Nokia. Byl prohlášen jako mezinárodní standard a součást MPEG-2 part 7 a MPEG-4 part 3 standardů. AAC má být nástupcem MP3 formátu. Podporuje až neuvěřitelných 48 audio kanálů s vzorkovací frekvencí do 96 kHz. Použitelná bitová hloubka je 8, 16 a 24 bitů. Využívá pokročilé kompresní metody a výborných výsledků dosahuje hlavně při nízkých datových tocích. Soubory mají přípony .MP4; .M4A a nebo .M4P. Tyto přípony se používají, pokud jsou uloženy dle MPEG-4 standardu. Soubory uložené dle specifikací MPEG-2, používají příponu .AAC. AAC se stal také výchozím formátem pro prodej hudby přes službu Apple iTunes, která obsahuje i jeho nejznámější a nejpoužívanější kodek.
39
3.3.5. WMA Windows Media Audio (WMA) je ztrátový, komprimovaný zvukový formát, vyvíjený jako součást Windows Media. Díky tlaku a lobby firmy Microsoft je formát skvěle hardwarově podporován. Původní záměr byl vytvořit náhradu za MP3 formát, za který musel Microsoft při začlenění do svého OS platit licenční poplatky. První verze byla představena v roce 2000 a aktuální verze je integrována do Windows Media Playeru 12 ve Windows 7. WMA konkuruje především formátu AAC. WMA je uložen v kontejneru Advanced System Format (ASF), používá se tedy přípona .WMA, nebo .ASF. Nevýhodou WMA je jeho samotný kodek. Jde nastavit pouze variabilné bitrate (VBR) a 3 pevné profily kódování . Low bitrate, Medium bitrate a High bitrate. Existují další tři jeho varianty. Windows Media Audio Proffesional, který používá jiné kompresní metody a není kompatibilní s WMA. Windows Media Lossles, který je bezztrátovou variantou formátu WMA a Windows Media Audio Voice, používaný pro ukládání hlasu.
40
4. Software Softwaru potřebného pro práci s audio formáty je obrovské množství. V této kapitole jsem je obecně rozdělil podle účelu, pro který je chceme použít, a popsal několik nejpoužívanějších z nich.
4.1. Přehrávače Přehrávače audio formátů slouží primárně k přehrání hudby uložené na PC. Vývoj jde ale dopředu a s postupem času přibývají různé přídavné funkce
4.1.1. WinAmp WinAmp je nejznámější a nejpoužívanější frewarový hudební přehrávač. Vyvinuli ho v roce 1997 Justin Frankel a Dmitry Boldyrev původně jen pro systém Windows 95 a NT. Vznikl hlavně pro potřebu přehrání MP3 formátu a ostatních základních formátů. Rychle si ho všimla vznikající společnost Nullsoft a s tím přišla i podpora a rychlejší vývoj. Roku 1999 koupila Nulsoft společnost AOL. Za 80 milionů dolarů. WinAmp ale dál vznikal pod štítkem Nulsoftu a získal si spoustu přívrženců hlavně díky své hardwarové nenáročnosti, množstvím užitečných funkcí a rostoucímu trendu sdílení hudby v MP3 formátu. Od verze 1.8 přibyla podpora úpravy vzhledu pomocí skinů. S verzí 2 přišel přesnější ekvalizér a použitelnější playlist. Verze 3 byla vyvíjena souběžně s verzí 2 a moc se neujala, byla nestabilní a zpětně nekompatibilní se skiny pro starší verze. Od verze 5 WinAmp podporuje synchronizaci s Apple iPod .V roce 2010 byla uvedena verze i pro zařízení s operačním systémem Android 2.1, ta umožňuje synchronizaci s desktopovou verzí přes USB port, nebo WiFi připojení k internetu. Podpora pro Apple Mac platformu přišla až v roce 2011 a je určena pro verzi OS X 10.6 a vyšší. Aktuální verze 5.62 (na obrázku 10) vyšla v prosinci 2011. Lze jí stáhnout jako freeware verzi, nebo jako PRO verzi za 20 dolarů. Verze PRO umožňuje navíc přehrávat i HD video formáty a vypalovat CD s maximální možnou rychlostí. Podporuje přehrávání formátů MP3, MOD, MPEG-1 Layer 2 i 3, AAC, M4A, FLAC, Vorbis, WAV a WMA. Má integrovaný rádio a TV tuner. Podporuje vkládání ID3 tagů přímo v playlistu. Vypaluje i ukládá stopy CD Audio. Podporuje prostorový 5.1 zvuk.
41
Obsahuje i množství různých digitálních vizualizací přehrávané hudby. Umožňuje ripovat CD do různých formátů a ty dále konvertovat Obrázek 10. Grafické rozhraní programu WinAmp 5.62
Zdroj: http://3.bp.blogspot.com/-pZOXv03kCXg/TyFuCN9MUGI/AAAAAAAAAfQ/4Lnhn7amSM/s1600/Winamp.png
4.1.2. Foobar2000 Foobar2000 je další freeware přehrávač pro platformu Windows. První verze vyšla v roce 2002 a dnešní aktuální verze z února 2012 má číslo 1.1.11. Tento přehrávač je populární svým strohým, minimalistickým designem a hlavně velmi širokou škálou nastavení. Díky tomu se těší velké oblíbenosti u počítačových a hudebních nadšenců, kteří chtějí kvalitní program za rozumnou cenu (zadarmo). Umí přehrávat většinu základních formátu. Například MP3, MP4, MPC, AAC, Ogg Vorbis, FLAC, ALAC, WavPack, WAV, AIFF, AU, SHN, SND, a samozřejmě CD Audio. CD lze i snadno ripovat do všech uvedených formátů a není problém si na domovské stránce stáhnout plugin, který umožní přehrávání i méně známého formátu. Přehrávač Foobar2000 je software pro pokročilé uživatele, kteří si přehrávač upravují různými pluginy k dokonalosti. V základní verzi je hodně strohý. 42
Pluginů pro tento přehrávač existuje velké množství a lze je stáhnout z domovské stránky programu. Zajímavý je například plugin HTTP Control, který dovoluje v lokální síti ovládat Foobar2000 webovým prohlížečem přes http protokol. Lze si zvolit z několika vzhledů layoutu (šablony vzhledu), optimalizované i pro chytré mobilní telefony. Přehrávač je poté možno ovládat odkudkoliv v dosahu sítě. Obrázek 11. Foobar2000 s upraveným vzhledem Dark One
Zdroj: http://www.zive.cz/ShowArticleImages.aspx?id_file=284773353&article=157817
4.1.3. MediaMonkey MediaMonkey není přehrávačem v pravém slova smyslu. Kvalitní přehrávač je jeho nedílnou součástí, ale MediaMonkey je určený primárně pro správu velkých hudebních sbírek. Lze ho získat zdarma jako freeware verzi, nebo ve verzi GOLD za 600 Kč. Prodává se i GOLD lifetime verze za 1230 Kč, která zaručuje přístup ke všem funkcím i v příštích verzích vydání MediaMonkey. Původně byl vyvíjen Jiřím Hájkem pod názvem Songs-DB. Vývoj Songs-DB začal v roce 2001 a až jeho verze 2,0 byla přejmenována na MediaMonkey verze 2. To už byl program vyvíjen společností Ventis Media Inc. Ve verzi 2.2 přibyla podpora synchronizace zařízení, které využívají Apple iTunes. Verze 2.5 umožnila práci s FLAC formátem a podporu synchronizace se všemi v té době aktuálními zařízeními iPod, Creative Labs a iRiver.
43
Verze 3 už byla stavěná na práci s velkou hudební knihovnou. Umožňovala správu až 100 000 + položek (do té doby uměl MM spravovat sbírky „jen“ do 50 000 položek). Aktuální verze MediaMonkey je 4.0.3.1476 z února 2012 a umožňuje pracovat s hudebními formáty MP3, AAC, M4A, OGG, WMA, MPC, APE, FLAC, WAV a i video formáty WMV, AVI, MP4, MKV. Mezi jeho funkce tedy patří skvělá správa všech multimediálních souborů, které lze řadit dle zvolených kritérií. Automatické organizování a přejmenování písní. Automatické identifikování písní z online databází Amazon nebo freeDB. Pokročilé tagování u formátů, které to podporují. Přehrávání se stovkami dsp audio efektů a výkonným equalizérem. Vytváření vlastních, nebo automatických playlistů. Ripování CD na harddisk v různých formátech. Vypalování CD. Konvertování mezi formáty. Synchronizace se všemi běžnými přenosnými hudebními zařízeními. Sdílení hudebních knihoven do domácích multimediálních center a zařízení, podporující PUnP / DLNA protokol. Vizualizace. Reportování a export statistik o do excel, html, nebo xml souborů. Funkce jukebox, která dovoluje přidávat písně do playlistu bez možnosti poškodit celou hudební sbírky a v neposlední řadě velké možnosti úprav vzhledu. Obrázek 12. Grafické rozhraní MediaMonkey 4.
Zdroj: http://cybernetnews.com/wp-content/uploads/2007/12/mediamonkey-overview.jpg
44
4.2. Editory Hudební editory slouží k úpravě nahraných zvuků, nebo hudby.
4.2.1. GoldWave GoldWave je populární komerční audioeditační program, který vyvinula společnost GoldWave Inc v roce 1993. Tento komerční program se používal ve stovkách škol a univerzit po celém světě a je zmíněn v mnoha odborných článcích. Byl používán americkou pobřežní stráží pro čištění nahrávek od šumu, nebo americkým námořnictvem pro vytváření vysílání podcastů. Byl využit i pro analýzu zvukového záznamu historicky prvního přistání na měsíci. Neil Armstrong byl dlouho obviňován, že svůj památný výrok pronesl gramaticky nesprávně a právě GoldWave po 40 letech prokázal, že tomu tak nebylo. GoldWave pracuje se všemi známými formáty. Snadno zvuk a hudbu stříhá, spojuje, mixuje, masteruje a to bez jakékoliv ztráty kvality zvuku. Má vlastní parametrický ekvalizér a úpravy hlasitosti. Základní i pokročilé efekty a filtry. Umí potlačit hudbu i zpěv, nebo vyčistit šum a praskání z nahrávek pořízených z gramofonu nebo magnetofonu. Obsahuje pokročilé vizualizace zvuku, jako jsou spektrogramy, vlnové křivky, VU metry a podobně. Umí aplikovat množství efektů, konvertovat mezi formáty, nebo editovat více souborů najednou. Dokáže se vrátit i o mnoho kroků zpět, má konfigurovatelný interface a umožňuje si nastavit i vlastní klávesové zkratky. Podporuje ID3 tagování a přidávání metadat. Je podporován ve Windows a Linux distribucích. Aktuální GoldWave je z března 2012, verze 5.67. Je to shareware, takže funguje s omezením. Všechny funkce má kompletně dostupné, ale po určité době se objeví okno s požadavkem na zakoupení licence. Frekvence objevovaní tohoto okna se stále zvyšuje, až je neúnosná. Roční licence stojí 19 dolarů. Za doživotní licenci se platí 49 dolarů
45
Obrázek 13. Grafické rozhraní GoldWave editoru 5.67
Zdroj: http://www.goldwave.com/images/gwmain.png
4.2.2. Audacity Audacity je další známý hudební editor. Jeho vývoj začal Roger Dannenberg a Dominic Mazzoni v roce 1999 na univerzitě Carnegie Mellon a v roce 2000 byl vydán jako opensource pod licencí GNU GPL. Je to spolehlivý audio editor a nahrávací program pro Windovs, Linux i Mac OS X distribuce a je přeložen do více než 20 jazyků. Mimo jiné i do češtiny. Poslední verze 2.0 je z března 2012. Audacity je nejlepší volně dostupný program tohoto typu. Umí nahrávat až 16 stop najednou a to z mikrofonu, linkového vstupu, nebo jiných zdrojů (pokud to umožňuje hardware). Monitoruje úrovně hlasitosti před nahráváním, při nahrávání i po něm. Při nahrávání zvuku lze nastavit 16, 24, nebo 32 bitovou hloubku a vzorkovací frekvenci do 96 kHz. Umí importovat i exportovat formáty WAV, AIFF, AU, FLAC, Vorbis, MP3, MP2, AC3, AAC a WMA. Umožňuje všechny základní editace jako stříhání, kopírování, vkládání a odstranění. Zvládá neomezené krokování zpět, editace a mixování více stop najednou, manuální ovládání stopy klávesnicí, odstraňování ruchů a šumu. Má množství nastavitelných klávesových zkratek, vestavěných efektů a funkce jako jsou ztišení nebo 46
odstranění hlasu z nahrávky. Umí automaticky rozdělovat stopy na základě hlasitosti, při nahrávání z gramofonu, nebo magnetofonu a snadno tyto stopy konvertovat do požadovaných formátů. Nevýhodou Audacity je, že pokud chceme konvertovat do MP3 formátu, musí se dodatečně stáhnout LAME kodek a občas je program nestabilní a spadne. Obrázek 14. Grafické rozhraní Audacity 2.0.0
Zdroj: http://freewareupdate.com/images1/screenshots/audio-video/Audacity-screenshots-2.jpg
4.2.3. Adobe Audition Adobe Audition je profesionální editační nástroj, nebo spíše osobní nahrávací studio, jak ho prezentuje firma Adobe. Jeho historie začala jako úspěšný editační nástroj pod jménem Cool Edit, který vydala 1990 společnost Syntrillium Software. Program měl úspěch a zlom nastal v roce 2003, kdy ho za 16,5 milionů dolarů koupila společnost Adobe. V té době aktuální Cool Edit Pro v2.1 přejmenovali na Adobe Audition. Adobe Audition je kompaktní nástroj pro profesionální nahrávání hlasu i nástrojů, míchání hudebních stop i projektů, komponování hudby, stříháním hudby do videoklipů a filmů, 47
vytváření profesionálních nahrávek do her, upravování a čištění zvuku a mnoho dalšího. Je možné ho spustit na platformách Windows a Linux. Využívá se převážně ve studiích, rádiích, ale najdeme ho i u muzikantů, kteří produkují vlastní hudbui a v profesionální kvalitě. Umí vše, co výše popsaný Audacity a GoldWave a ještě spoustu věcí navíc. Například umožňuje editaci tolika stop, kolik zvládne vlastní procesor počítače, má intuitivní interface a rychlý audio engine, metronom, profesionální efekty jako součást programu a podpora VST (Virtual Studio Technology) i novějšíchVST3 audio syntezátorů, efektů, a ASIO (Audio Stream Input Output) ovladačů pro profesionální hudební hardware. Má spoustu automatických předvoleb, které jdou měnit i manuálně, například redukce hluků a šumů, přesné vkládání studiové nahrávky zvuku do videa a synchronizaci s pohybem rtů, automatické korekce pitch a tempa a spoustu dalších. Aktuální verze programu je CS5.5 a během dubna 2012 vyjde verze CS6. Adobe Audition je součástí kompletního produkčního balíku Adobe Creative Suite 5.5. Samostatnou (stand alone) verzi lze vyzkoušet na 30 dní zdarma a cena plné verze je přes 10 000 Kč Obrázek 15. Grafické rozhraní Adobe Audition CS 5.5
Zdroj: http://www.legal-soft.ru/upload/iblock/60e/Adobe%20Audition%20CS5.5-1.jpg
48
Závěr: Cílem této bakalářské práce bylo analyzovat digitální audio formáty. V úvodní kapitole jsou nastíněny principy zvuku a jeho vnímání, obecné dějiny hudby a způsoby záznamů zvuku v analogové podobě. Poté následuje část o převodu analogového signálu na digitální. Hlavní část práce je věnovaná digitálním hudebním formátům, jejich přehlednému rozdělení a popisu jednotlivých formátů. Závěrečná kapitola popisuje běžné i poloprofesionální programy pro práci s hudebními formáty. Z přehledu, který je v práci uveden, vyplývá, že je problematické určit, který formát pro digitální záznam zvuku je pro posluchače nejlepší. Vždy záleží na účelu, pro který jej chceme využít i na možnostech použitého hardwarového nebo softwarového přehrávače. Dalším faktorem je samotný sluch posluchače, protože každý máme sluchové ústrojí jinak vyvinuté, tudíž každý vnímá stejný zvuk trochu odlišně. Důležitým prvkem je i hardware použitý pro reprodukci hudby. U něj vždy platí, že kvalita reprodukce závisí na nejslabším článku hudebního řetězce. Lze konstatovat, že náročný posluchač, s kvalitním hudebním řetězcem a vhodnými akustickými podmínkami (vhodně upravená poslechová místnost), zvolí bezztrátový hudební formát, nebo bezztrátový kompresní formát s vysokým bitrate. Méně náročný posluchač, využívající přenosný hudební přehrávač a běžná sluchátka, si vystačí se ztrátovým kompresním formátem. Poslech hudby na cestě je vždy zatížen vysokou úrovní okolního šumu a nižší kvalita zvuku tak není na závadu. S vývojem stávajících, nebo nových audio formátů, přichází také nové programy pro záznam, digitalizaci a úpravu zvukových záznamů. Zde uvedený výčet je jen stručnou ukázkou těch nejzajímavějších. Z bohaté palety všech dostupných programů si určitě každý vybere program vyhovující jeho potřebám a finančním možnostem.
49
Seznam použité literatury Tištěná literatura [1] WATKINSON John: An introduction to digital audio. Oxford: Focal press, 2002, ix, 419 s. ISBN 0-240-51643-5. [2] POHLMANN Ken C: Principles of digital audio. New York: McGraw-Hill, 2005, xx, 842 s, ISBN 0-07-144156-5
Zdroje dostupné z www [3] Wikipedie: Zvuk. [online]. [cit. 2012-03-12]. Dostupné z: http://cs.wikipedia.org/wiki/Zvuk [4] BERNAT Petr: Akustika, vznik a šíření zvuku, frekvenční analýza a syntéza, sluchový vjem zvuového signálu. [online]. [cit. 2012-03-12]. Dostupné z: http://homen.vsb.cz/~ber30/texty/varhany/anatomie/pistaly_akustika.htm [5] Wikipedie: Hudba. [online]. [cit.2012-03-15]. Dostupné z: http://cs.wikipedia.org/wiki/Hudba [6] KINDLOVÁ Irena: Dějiny hudby. [online]. [cit. 2012-03-15]. Dostupné z: http://www.violinschool.eu/download/dejinyhudby/cast_1.pdf [7] Wikipedie: Phonautograpf. [online]. [cit. 2012-03-18]. Dostupné z: http://en.wikipedia.org/wiki/Phonautograph [8] KROULÍK Ladislav: Svět gramofonů: vynáleza historie. [online] 24.9.2009 [cit. 201203-18]. Dostupné z: http://avmania.e15.cz/svet-gramofonu-vynalez-a-historie [9] PROTIVÁNEK Petr; KROPÁČEK Jiří: Speciál o gramofonech a gramofonových deskách. [online].25.2.2011 [cit. 2012-03-19]. Dostupné z: http://aktualne.centrum.cz/domaci/grafika/2011/02/25/special-o-gramofonech-agramofonovych-deskach/ [10] REICHL Jaroslav: Mechanický záznam zvuku. [online]. [cit. 2012-03-19]. Dostupné z: http://fyzika.jreichl.com/main.article/view/1343-mechanicky-zaznam-zvuku [11] REICHL Jaroslav: Optický záznam zvuku. [online]. [cit. 2012-03-19]. Dostupné z: http://fyzika.jreichl.com/main.article/view/1344-opticky-zaznam-zvuku 50
[12] REICHL Jaroslav: Magnetický záznam zvuku. [online]. [cit. 2012-03-19]. Dostupné z: http://fyzika.jreichl.com/main.article/view/1348-magneticky-zaznam-zvuku [13] Elektronika, teoretické základy a cvičení: Magnetofony: Předmagnetizace. [online]. [cit. 2012-03-20]. Dostupné z: http://elnika.sweb.cz/magnetofony/predmag.html [14] Wikipedie: A/D převodník. [online]. [cit. 2012-03-22]. Dostupné z: http://cs.wikipedia.org/wiki/A/D_převodník [15]Wikipedie: Anti-aliasing [online]. [cit. 2012-03-22]. Dostupné z: http://cs.wikipedia.org/wiki/Anti-aliasing [16] MAREK Pavel: Zázněje a jejich využití ve varhanářství. [online]. [cit. 2012-03-23]. Dostupné z: http://www.mmspektrum.com/clanek/zazneje-a-jejich-vyuziti-vevarhanarstvi.html [17] Quantium plus: Alec Harvey Reeves: PCM. [online]. [cit. 2012-03-24].Dostupné z: http://www.quantium.plus.com/ahr/main.htm [18] WEBER Tomothy John: The WAVE file format. [online]. [cit. 2012-03-28]. Dostupné z: http://www.lightlink.com/tjweber/StripWav/WAVE.html [19] Sonicspot: Wave file format.[online]. [cit. 2012-03-28]. Dostupné z: http://www.sonicspot.com/guide/wavefiles.html [20] Sonicspot: MP3. [online]. [cit. 2012-03-28]. Dostupné z: http://www.sonicspot.com/guide/mp3/index.html [21] SCHIMMEL Jiří: Formáty zvukových souborů na PC: Formát souborů WAV. [online]. [cit. 2012-03-30]. Dostupné z: http://www.elektrorevue.cz/clanky/01007/index.html#wav [22] COALSON Josh: Flac.[online]. [cit. 2012-03-30]. Dostupné z: http://flac.sourceforge.net/documentation_format_overview.html [23] Wikipedie: Interchange File Format.[online]. [cit. 2012-03-31]. Dostupné z: http://en.wikipedia.org/wiki/Interchange_File_Format [24] Wikipedie: Audio Interchange File Format.[online]. [cit. 2012-03-31]. Dostupné z: http://en.wikipedia.org/wiki/Audio_Interchange_File_Format#cite_note-2 [25] Wavpack: Hybrid Lossless Audio Compression. [online]. [cit. 2012-03-31]. Dostupné z: http://www.wavpack.com/#Features 51
[26] FOUKAL Jiří: MPEG Audio Layer 3.[online]. [cit. 2012-04-4]. Dostupné z: http://www.fi.muni.cz/~qruzicka/Foukal/mp3.htm [27] ASHLAND, Matt. Monkey`s audio. [online]. [cit. 2012-04-5]. Dostupné z: http://www.monkeysaudio.com/theory.html [28] Wikipedie: Apple lossless. [online]. [cit. 2012-04-8]. Dostupné z: http://en.wikipedia.org/wiki/Apple_Lossless#cite_note-4 [29] Apple Lossless Audio Codec. [online]. [cit. 2012-04-9]. Dostupné z: http://alac.macosforge.org/trac/wiki [30] Hydrogenaudio: Wavpack. [online]. [cit. 2012-04-12]. Dostupné z: http://wiki.hydrogenaudio.org/index.php?title=WavPack [31] Microsoft: WMA [online]. [cit. 2012-04-15]. Dostupné z: http://msdn.microsoft.com/enus/library/gg153556(v=vs.85).aspx#windows_media_audio_10_professional [32]Wikipedie: Advanced Audio Coding. [online]. [cit. 2012-04-16]. Dostupné z: http://en.wikipedia.org/wiki/Advanced_Audio_Coding [33] WinAmp. [online]. [cit. 2012-17-]. Dostupné z: http://www.winamp.com/help/Player_Features [34] Foobar2000. [online]. [cit. 2012-04-20]. Dostupné z: http://www.foobar2000.org/components [35] MediaMonkey. [online]. [cit. 2012-04-22]. Dostupné z: http://www.mediamonkey.com/information/free/ [36] GoldWave. [online]. [cit. 2012-04-23]. Dostupné z:. http://www.goldwave.com/ [37] Wikipedie: GoldWave. [online]. [cit. 2012-04-23]. Dostupné z: http://en.wikipedia.org/wiki/GoldWave [38] Audacity. [online]. [cit. 2012-04-22]. Dostupné z: http://audacity.sourceforge.net/about/features [39] Adobe Audition. [online]. [cit. 2012-04-24]. Dostupné z: http://www.adobe.com/products/audition/features.html
52
Seznam obrázků Obrázek 1. Slyšitelné zvukové pole ................................................................................................. 9 Obrázek 2. Fonograf ...................................................................................................................... 12 Obrázek 3. Vlevo původní gramofon His masters voice, ............................................................ 15 Obrázek 4. Vpravo gramofon od české firmy Pro-Ject Audiosystems – RPM 10.1 Evolution 15 Obrázek 5. Vlevo ukázka optického zvukového záznamu na filmovém pásu; ......................... 16 Obrázek 6. Vpravo typy optických zvukových záznamů (nepředstavují stejný zvuk) ............ 16 Obrázek 7. Vzorkování signálu ..................................................................................................... 21 Obrázek 8. Kvantování .................................................................................................................. 23 Obrázek 9. Hlavička MP3 souboru .............................................................................................. 36 Obrázek 10. Grafické rozhraní programu WinAmp 5.62 .......................................................... 42 Obrázek 11. Foobar2000 s upraveným vzhledem Dark One ..................................................... 43 Obrázek 12. Grafické rozhraní MediaMonkey 4. ....................................................................... 44 Obrázek 13. Grafické rozhraní GoldWave editoru 5.67 ............................................................ 46 Obrázek 14. Grafické rozhraní Audacity 2.0.0............................................................................ 47 Obrázek 15. Grafické rozhraní Adobe Audition CS 5.5 ............................................................. 48
53