Definice stylu: Nadpis obsahu: Mezera Za: 12 b.
Bankovní institut vysoká škola Praha Katedra informatiky a kvantitativních metod
Současné formáty pro záznam zvuku Bakalářská práce
Autor:
Daniel Falout Informační technologie, Manažer projektů IS
Vedoucí práce:
Praha
Ing. Bohuslav Růžička, CSc.
2016
Prohlášení Prohlašuji, že jsem závěrečnou práci zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu.
Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Praze, dne 25.4.2016
Daniel Falout
Poděkování Rád bych tímto poděkoval mému vedoucímu práce panu ing. Bohuslavu Růžičkovi, CSc. za odborné vedení, za cenné rady a vstřícnost při konzultacích, které mi byly velkým přínosem a důležité pro dokončení mé práce.
Anotace Cílem mé bakalářské práce bylo popsat používané technologie pro záznam zvuku a uvést přehled současných zvukových formátů, včetně příkladů použití. V úvodní části jsem popsal, jak zvuk vzniká, jaké jsou jeho zdroje a vlastnosti. Dále jsem se věnoval průběhu záznamu zvuku a používaným technologiím. Podrobně jsem definoval rozdíl mezi ztrátovou a bezeztrátovou kompresí, díky čemuž jsem mohl popsat jednotlivé formáty a jejich využití.
Klíčová slova zvuk, formát, komprese, frekvence, digitalizace, signál, modulace
Annotation The aim of my thesis was to describe the technology used to record sound and give an overview of current audio formats, including application examples. In the first part, I discussed how sound actually arises, what are its sources and properties. I also dealt with the process of sound recording and the technology used. I outlined in detail the difference between lossy and lossless compression, due to which I was able to describe various formats and their usage.
Key words sound, format, compression, frequency, digitalization, signal, modulation
OBSAH 1.
ZVUK .............................................................................................................................. 8 1.1
Zdroj zvuku ................................................................................................................ 8
1.2
Vznik zvuku ............................................................................................................... 9
1.3 Tón a hluk, základní fyzikální veličiny ......................................................................... 10 1.4 jak člověk vnímá zvuk .................................................................................................. 10 1.4.1 Frekvenční rozsah .................................................................................................. 11 1.4.2 Dynamický rozsah ................................................................................................. 11 1.4.3 Rozlišování frekvence............................................................................................ 11 1.4.4 Frekvenční maskování ........................................................................................... 12 1.4.5 Časové maskování ................................................................................................. 12 1.5 Zvukové vlnění, akustický tlak ..................................................................................... 12 1.6
Efektivní akustická rychlost a efektivní akustický tlak ............................................ 14
1.7
Vlastnosti zvuku....................................................................................................... 15
1.7.1 Výška zvuku (tónu)................................................................................................ 15 1.7.2 Barva zvuku ........................................................................................................... 15 1.7.3 Hlasitost a intenzita zvuku ..................................................................................... 16 1.8 Dopplerův jev ............................................................................................................... 17 1.9 Ochrana před hlukem.................................................................................................... 18
2. ZÁZNAM ZVUKU ........................................................................................................... 19 2.1 Mechanický záznam zvuku ........................................................................................... 19 2.2 maGnetický zánam zvuku............................................................................................. 21 2.3 optický záznam zvuku .................................................................................................. 24 2.4 HI-FI technologie ......................................................................................................... 25 3. DIGITALIZACE ANALOGOVÉHO SIGNÁLU .......................................................... 26 3.1 výhody digitálního záznamu ......................................................................................... 26
5
3.2 digitalizace analogového signálu .................................................................................. 26 3.2.1 Vzorkování signálu ................................................................................................ 26 3.2.2 Kvantování signálu ................................................................................................ 29 3.2.3 Kódování signálu ................................................................................................... 29 3.3 Digitální záznam zvuku ................................................................................................ 30 3.3.1 Historie CD a jeho technická data.......................................................................... 30 3.3.2 Audio CD .............................................................................................................. 31 3.3.3 Technologie MIDI ................................................................................................. 32 4
KOMPRESE DAT ........................................................................................................ 33 4.1 důvody komprese.......................................................................................................... 33 4.2 kompresní poměr .......................................................................................................... 34 4.3 vliv hudebního žánru na kompresi ................................................................................ 34
5. ZVUKOVÉ FORMÁTY BEZEZTRÁTOVÉ ................................................................. 36 5.1 Apple Lossless .............................................................................................................. 36 5.2 Formát flac ................................................................................................................... 36 5.3 Formát APE .................................................................................................................. 37 5.4 formát wma .................................................................................................................. 37 5.5 Formát WAV ................................................................................................................ 38 6. ZVUKOVÉ FORMÁTY ZTRÁTOVÉ ........................................................................... 39 6.1 formát AaC ................................................................................................................... 39 6.2 Formát dolby digital ..................................................................................................... 39 6.3 kodeky amr ................................................................................................................... 41 6.3.1 Kodek AMR-WB ................................................................................................... 41 6.3.2 Kodek AMR-WB+ ................................................................................................ 42 6.4 Formát ATRAC ............................................................................................................ 42 6.5 formáty skupiny G ........................................................................................................ 42 6.5.1 Formát G.711 ......................................................................................................... 42 6
6.5.2 G.711.0 .................................................................................................................. 43 6.5.3 G.711.1 .................................................................................................................. 43 6.5.4 g.729 .......................................................................................................................... 44 6.6 formát mp3 ................................................................................................................... 44 6.7 Formát MP3Pro ............................................................................................................ 45 6.8 formát mod ................................................................................................................... 45 6.9 formát musepack .......................................................................................................... 46 6.10 formát OPUS .............................................................................................................. 46 6.11 formát Speex............................................................................................................... 47 6.11.1 Voice Activity Detection ..................................................................................... 47 6.11.2 Discontinuous Transmission ................................................................................ 47 6.11.3 Perceptual enhancement....................................................................................... 47 6.12 Formát Vorbis............................................................................................................. 47 7. MODULACE SIGNÁLU ................................................................................................. 49 7.1 amplitudová modulace .................................................................................................. 49 7.2 Frekvenční modulace .................................................................................................... 50 7.3 fázová modulace ........................................................................................................... 50 7.4 modulační a přenosová rychlost.................................................................................... 50 ZÁVĚR .................................................................................................................................. 52 SEZNAM ZDROJŮ ............................................................................................................. 54 Knižní zdroje ...................................................................................................................... 54 Internetové zdroje ............................................................................................................... 56 SEZNAM POUŽITÝCH ZKRATEK ................................................................................. 61 SEZNAM POUŽITÝCH TABULEK .................................................................................. 62 SEZNAM POUŽITÝCH OBRÁZKŮ ................................................................................. 62
7
1. ZVUK Zvukový signál je vlnění vzduchu (případně pevného nebo kapalného prostředí) přijímané lidským uchem1. Z fyzikálního hlediska je zvuk mechanické vlnění v látkovém prostředí. Toto mechanické vlnění je schopno vyvolat tzv. sluchový vjem, který je u člověka značně individuální. Individualita se projevuje ve vnímání prahových frekvencí, které se uvádí v literaturách v rozsahu 16 Hz až 16 000 Hz (někde až 20 000 Hz). Frekvence za těmito hranicemi je pro člověka neslyšitelná (nevyvolává sluchový vjem), nicméně se také označuje jako zvuk. Pod hranicí 16 Hz se jedná o infrazvuk, který ale vnímají někteří živočichové, například sloni, a nad hranicí 20 000 Hz se hovoří o ultrazvuku, který vnímají například netopýři, delfíni, psi nebo hlodavci. Ději, které jsou spjaty se vznikem, šířením a také vnímáním zvuku, se zabývá akustika.2
1.1 ZDROJ ZVUKU Za zdroj zvuku lze považovat zdroj zvukového vlnění. Hmotné prostředí, ve kterém se zvuk šíří, se nazývá jeho vodič. Nejčastějším vodičem je vzduch. Zprostředkovává spojení od zdroje zvuku směrem k jeho přijímači neboli detektoru.3 V praxi se nejčastěji jedná o lidské ucho, ale může to být také mikrofon, nebo obecně jakýkoli jiný snímač (přijímač). Zvuk se nešíří pouze vzduchem, ale také i kapalinami jako je například voda, a také pevnými látkami, jako je například stěna domu. Nejdokonalejší zvuková izolace je vakuum4, tedy vzduchoprázdno, protože v takovém prostředí se nemá zvuk jak šířit, nemá tam co kmitat. Zdrojem zvuku může tedy být jakékoliv těleso, které se chvěje. To samo o sobě však nerozhoduje o jeho šíření v okolí. Záleží také na tom, jaké je dané těleso tzv. zářičem. Tedy je-li dobrým, či špatným zářičem zvuku. Tato vlastnost závisí na geometrickém tvaru zářiče a směru jeho kmitání. Příkladem je struna napnutá mezi dvěma pevnými body. Její chvění je
1
MALINA, Václav. Poznáváme elektroniku V. České Budějovice: KOPP, 2001. Str. 60. Technimanie Science Center. Akustika – metodiky a pracovní listy. In techmania.cz [online]. Dostupné z WWW: http://techmania.cz/wp-content/uploads/2015/07/techmania_metodika_AKUSTIKA_cz.pdf 3 Asociace akustiky č.s. Akustický slovník. In asociaceakustiky.cz [online]. Dostupné z WWW: http://www.asociaceakustiky.cz/akusticky-slovnik 4 Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk 2
8
oboustranné, vždy na jedné straně vznikne přetlak (ve směru pohybu struny) a na druhé straně podtlak. Chvění tedy může mít opačnou fázi. Tomuto jevu se říká interference a interferencí se vlnění ruší, i když v určitých případech ho může i zesilovat.5 Dalším zdrojem zvuku jsou tzv. ozvučnice. Jedná se o tělesa, která nekmitají svévolně, ale jsou ke kmitání přinuceny. Používají se u reproduktorů, sluchátek a u obecně vzato měničů zvuku. Tato tělesa generují nebo reprodukují zvuk.6 Akustický signál se snímá mikrofonem a převádí se na elektrický signál. Z elektrického signálu vytváříme zvukový signál pomocí reproduktoru nebo piezoměniče7.
1.2 VZNIK ZVUKU Zvuk může vznikat různými způsoby. Mezi nejčastější patří: a) Prouděním zvuku okolo ostré hrany – například hra na žesťové nástroje. S tímto efektem se ale můžeme setkat i ve větším měřítku, například když fouká silný vítr kolem vysokého komína. b) Rychlým pohybem – například bič nebo střela. Tyto zvuky jsou krátkodobé a projeví se zpravidla velmi intenzivně. c) Prudkou změnou tlaku – exploze, výbuch nebo třeba otevření limonády. I zde se jedná zpravidla o velmi krátké, ale velmi intenzivní zvuky. d) Drnkáním, smýkáním – tyto zdroje využívají strunné hudební nástroje, může pocházet i od spalovacích motorů, nevyvážených elektromotorů apod.8
5
Otevřená škola. Dj za 10 dní – pracovní sešit. In otevrena-skola.cz [online]. Dostupné z WWW: www.otevrena-skola.cz/cms/get/file.php?id=446 6 Otevřená škola. Dj za 10 dní – pracovní sešit. In otevrena-skola.cz [online]. Dostupné z WWW: www.otevrena-skola.cz/cms/get/file.php?id=446 7 MALINA, Václav. Poznáváme elektroniku V. České Budějovice: KOPP, 2001. Str. 61. 8 Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk#Vznik_zvuku
9
1.3 TÓN A HLUK, ZÁKLADNÍ FYZIKÁLNÍ VELIČINY Zvuky se dělí na dvě skupiny: tóny a hluky.9 Tóny neboli zvuky hudební, vznikají při pravidelném a v čase periodicky probíhajícím pohybu tzv. kmitání. Pro člověka při jejich poslechu vzniká zpravidla příjemný vjem tónu určité výšky, a proto se tónů využívá především v hudbě. Zdrojem mohou být pochopitelně hudební nástroje, ale třeba i lidské hlasivky.10 Hluky neboli zvuky nehudební, vznikají nepravidelným vlněním a složitým kmitáním. Může se také jednat o krátké rozruchy nepravidelných příčin. To může být vyvoláno střetnutím dvou či více těles, elektrickým výbojem nebo třeba střelou. Zajímavé je, že i hluky jsou dnes často využívány i v hudbě, například u bicích nástrojů, a jsou součástí moderních syntetizátorů.11 Každý zvuk se vyznačuje svojí fyzikální intenzitou, jejíž veličina se nazývá hladina intenzity zvuku. Udává se v dB (decibelech). Jedná se o bezrozměrnou jednotku, která vyjadřuje poměr podílu dvou akustických tlaků. Pokud hladinu akustického tlaku označíme Lp, pak:
10 . log 20 . log
[dB; Pa, Pa], po = 2 . 10-5 [Pa]
Tomu odpovídá další veličina, kterou je tzv. hlasitost. Další fyzikální veličinou, jak již bylo uvedeno, je frekvence, které odpovídá výška tónu. Poslední základní veličinou je barva (zabarvení) tónu, která je dána průběhem kmitání. Můžeme ještě také hovořit o délce zvuku, která je závislá na jeho trvání.
1.4 JAK ČLOVĚK VNÍMÁ ZVUK Vnímání zvuku je velice složitý proces. Zjednodušeně řečeno, zvukové vlny rozechvějí ušní bubínek, který toto chvění přenese přes kovadlinku a třmínek na ušní nerv. Vnímání zvuku je u každého člověka zcela individuální. Je to dáno fyziologickými vlastnostmi každého člověka jako jedince a také procesem stárnutí. S rostoucím věkem horní hranice slyšitelných tónů výrazně klesá a může vést až k úplné hluchotě. 9
Reichl, Jaroslav, Všetička,Martin. Základní dělení zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/186-zakladni-deleni-zvuku 10 Otevřená škola. Dj za 10 dní – pracovní sešit. In otevrena-skola.cz [online]. Dostupné z WWW: www.otevrena-skola.cz/cms/get/file.php?id=446 11 Otevřená škola. Dj za 10 dní – pracovní sešit. In otevrena-skola.cz [online]. Dostupné z WWW: www.otevrena-skola.cz/cms/get/file.php?id=446
10
Vnímáme především vlastnosti zvuku, které jsou12: a) Frekvenční rozsah b) Dynamický rozsah c) Rozlišovací frekvence d) Frekvenční maskování e) Časové maskování
1.4.1 Frekvenční rozsah Jak už bylo uvedeno, rozsah zvukových frekvencí, které člověk vnímá, je obvykle mezi 16 Hz a 16 kHz, někteří slyší až 20 kHz. Významným rozsahem je však oblast mezi dvěma až čtyřmi kHz, která je důležitá pro srozumitelnou řeč.13 Na tyto frekvence je také lidské ucho nejcitlivější a nejlépe ho vnímá. Frekvenci 1 kHz vnímá člověk vůbec nejcitlivěji. I zde se pochopitelně jedná průměrnou hodnotu, která se v praxi u každého jednice může lišit.
1.4.2 Dynamický rozsah Dynamickým rozsahem rozumíme vnímání rozdílu mezi nejhlasitějším a nejtišším zvukem. Jeho střed je v oblasti kolem 120 dB. Směrem k okrajům pásma se výrazně citlivost zmenšuje.14 I tento vjem je také významně závislý na věku člověka a s přibývajícím věkem vnímání zvláště tichých zvuků velmi klesá.
1.4.3 Rozlišování frekvence Člověk je schopen rozeznávat frekvenci, čili výšku tónu. Opět lze konstatovat, že uprostřed slyšitelného frekvenčního pásma je citlivost lidského ucha daleko větší, než na jeho okrajích. Každý ale vnímá frekvenci jinak a s tím souvisí lidově řečeno hudební sluch. Člověk, který navenek zpívá falešně, zpívá vlastně vůči svému vnitřnímu já čistě právě vzhledem k jeho například posunuté frekvenční vnímavosti vzhledem k tomu, že člověk se slyší jednak ušima, ale zároveň se jeho řeč přenáší tělem a zvláště kostmi. Vnímá svůj vlastní 12
Akustika [online], poslední aktualizace 7. 3. 2016. [cit. 25. 4. 2016], WikiSkripta. Dostupné z WWW: http://www.wikiskripta.eu/index.php/Akustika 13 Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk 14 Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk
11
hlas jinak, než ho slyší jeho okolí. Člověk se na zvukové nahrávce svého záznamu obvykle nepozná.
1.4.4 Frekvenční maskování Frekvenční maskování je ovlivnění schopnostíi člověka odlišit dva tóny, které jsou frekvenčně blízké. Pokud vnímá dva tóny, může se stát, že dojde k potlačení jednoho tónu druhým, takže slyší pouze jeden tón. Tato neschopnost člověka vnímat oba tóny najednou je označována jako frekvenční maskování. Je závislé na frekvenční vzdálenosti obou tónů a úrovni maskujícího signálu. Vnímání tónů s blízkou frekvencí je tedy ovlivněno šířkou tzv. kritického pásma. Pro běžného člověka se uvádí tato frekvenční hodnota pro nízké frekvence kolem 100 Hz a u vyšších frekvencí dosahuje až hranice 4 kHz. Tohoto maskování se ale využívá při kompresi zvuku (zvukových dat).
1.4.5 Časové maskování Z hlediska časového algoritmu může po hlasitém tónu následovat tón tichý, ale se stejnou frekvencí. Jeho vnímání je zpravidla potlačeno. Stejné potlačení může nastat, když tichý tón předchází tónu maskovacímu.
1.5 ZVUKOVÉ VLNĚNÍ, AKUSTICKÝ TLAK Při opakovaném a periodickém stlačování a rozpínání hmotného prostředí vzniká zvuková vlna. V tomto prostředí postupuje rychlostí, která závisí na momentálních fyzikálních podmínkách. Jedná se například o vlhkost, tlak nebo teplotu. V různých prostředích se vlny šíří různou rychlostí, ale v každém případě dochází k jejich postupnému zeslabování. Rychlost zvuku lze pro šíření ve vzduchu vypočítat dle vzorce15: 331,82 0,61 kde v je rychlost zvuku a t je teplota, která se udává ve oC. 15
Reichl, Jaroslav, Všetička,Martin. Rychlost zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/189-rychlost-zvuku
12
V tabulce 1 jsou uvedeny příklady rychlosti vlnění v různých materiálech a při různých teplotách16.
Prostředí
Rychlost zvuku (m/s)
vzduch 0 oC
332
o
Prostředí beton
Rychlost zvuku (m/s) 1700
o
vzduch 20 C
344
led 0 C
3200
vodík
1270
guma
1440
o
1441
dřevo
4000
o
1484
ocel
5000
voda 13 C voda 20 C
Tabulka 1 Šíření zvuku v některých materiálech a teplotách
Zvuk se šíří tzv. podélným vlněním, kdy jednotlivé částice kmitají uspořádaně kolem svých středních poloh. Pokud dojde k vychýlení ze střední polohy, dojde k akustické (vlnové) výchylce. Tuto výchylku matematicky zapisujeme jako:
!" . sin &
!" . sin2'(
kde amax je amplituda kmitavého pohybu a f je frekvence, veličina ω = 2πft je úhlová frekvence. Akustická rychlost (okamžitá rychlost) se vypočítá jako:
!" . cos &
!" . cos 2'(
kde vmax je maximální hodnota okamžité rychlosti. Ta nabývá kladných i záporných hodnot v intervalu < - vmax, vmax >. Rychlost je posunuta oproti výchylce o čtvrt periody, tedy ve fázi o π/2. Pokud kmitající bod má maximální výchylku, má nulovou rychlost a naopak. Tuto rychlost nelze zaměňovat s rychlostí šíření vlny v prostředí. Jedná se o rychlost kmitání bodu kolem své rovnovážné polohy. Prouděním vzduchu vzniká kmitáním molekul daného prostředí. V místě jejich střetů se vyvolávají malé tlakové změny, které jsou nazývány akustickým tlakem. Jsou ve fázi 16
Akustika [online], poslední aktualizace 7. 3. 2016. [cit. 25. 4. 2016], WikiSkripta. Dostupné z WWW: http://www.wikiskripta.eu/index.php/Akustika
13
s akustickou rychlostí a jsou dány součtem klidového a akustického tlaku. Matematicky můžeme vyjádřit maximální hodnotu tlakové změny: *
* . + .
!"
!"
kde p je hustota prostředí.
1.6 EFEKTIVNÍ AKUSTICKÁ RYCHLOST A EFEKTIVNÍ AKUSTICKÝ TLAK V praxi nemusíme vždy pro výpočty používat okamžitých hodnot, ale můžeme počítat s hodnotami efektivními. To ale pouze v případě, že jejich průběh je harmonický 17
(sinusový) . ,-
!"
√2
0,707 .
!"
Obdobně pro akustický tlak: *,-
*
!"
√2
0,707 . *
!"
Pokud je kmitání neharmonické, a to je prakticky vždy (v případech fyziologické akustiky), nelze tyto vztahy použít a je potřeba vycházet z definic středních hodnot pro periodický signál s periodou T: 1 5 *,- 0 2 *3 4 1 6 V případě rovinné akustické vlny jsou akustická rychlost a akustický tlak provázány vztahem: *,- *+,-
17
Akustika [online], poslední aktualizace 7. 3. 2016. [cit. 25. 4. 2016], WikiSkripta. Dostupné z WWW: http://www.wikiskripta.eu/index.php/Akustika
14
1.7 VLASTNOSTI ZVUKU 1.7.1 Výška zvuku (tónu) Výška tónu je dána frekvencí. Čím je frekvence vyšší, tím je i zvuk vyšší. Jednoduché tóny se sinusovým průběhem mají tzv. absolutní výšku tónu, která se nedá určovat sluchem. Pro člověka je důležitější relativní výška tónu, kterou umí subjektivně posoudit.18 V této souvislosti určuje hudební akustika jako základní tón s frekvencí 440 Hz19. Technická praxe využívá jako základní tón s frekvencí 1000 Hz. Popsané se týká zvuků sinusových. Jedná-li se o zvuk nesinusový, tedy složený, určuje se jeho kmitočet velmi obtížně. Obvykle se určuje tón, který má frekvenci nejnižší.
1.7.2 Barva zvuku Dva zvuky se stejnou frekvencí mohou však mít různou barvu. Pokud zahrajeme na klavír a na housle stejný tón (se stejnou frekvencí), zní každý jinak. To je právě způsobeno barvou zvuku. Jedná se o vyšší harmonické tóny, které jsou přidané k základnímu tónu. Sluchem také rozeznáváme nejen hudební nástroje, ale i hlasy lidí apod. Pokud jsou periodické frekvence celistvými násobky frekvence základního tónu, hovoříme o vyšších harmonických kmitech (alikvotní tóny). Podle jejich násobku jde o druhou harmonickou, třetí harmonickou atd. Čím je harmonická frekvence vyšší, tím drsněji tón zní. Tím se liší např. žesťové nástroje od nástrojů dřevěných dechových.20 V dnešní době jsou to často elektronické nástroje, které vytvářejí doprovodné zvuky. Ty nejsou v harmonickém poměru k frekvenci základních tónů.
18
Reichl, Jaroslav, Všetička,Martin. Výška zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/194-vyska-zvuku 19 Frekvence 440 Hz byla vzata v hudbě za základní tón, označený písmenem C. 20 Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk#Barva_zvuku
15
1.7.3 Hlasitost a intenzita zvuku Jedná se o subjektivní veličinu. Přímo závisí na akustickém tlaku. Tím působí vlnění na sluch člověka a zvířat. Někteří živočichové jsou schopni vnímat i přímo vlnění kolem sebe a tudíž vnímat zvuk. V praxi se měří tzv. hladina akustického tlaku. Označuje se Lp. Slyšitelný rozsah vjemů je vyšší, než sedm dekadických řádů neboli hodnot této fyzikální veličiny. Používá se pro ni proto logaritmického matematického vyjádření: 20 log
* *7
kde po je vztažná jednotka akustického tlaku. Bývá označována prahem slyšení nebo jako prahovy akusticky tlak21. Matematicky je vyjádřena vztahem: *7 2 . 108 9 20 :9
Jednotkou hlasitosti je jeden dB (decibel). U lidského sluchu se rozlišuje práh slyšitelnosti, kdy začíná vznikat sluchový vjem, až po práh bolesti, kdy je pro člověka zvuk nepříjemný a může dojít i k trvalému poškození sluchových orgánů. Hlasitost zvuku se tedy pohybuje u člověka v rozmezí 120 dB až 125 dB a toto rozmezí se nazývá dynamika lidského sluchu. Dopad zvukové energie na jednotku plochy za jednotku času se nazývá intenzita zvuku, nebo také též akustický výkon na jednotku plochy.
Platí vztah: ;
21
< = .
Kolektiv autorů: Matematické,fzikální a chemické tabulky pro střední školy.
16
Z tohoto je odvozen vztah: 10 log
; ;7
Kde Io je smluvní vztažná hodnota intenzity: ;7 103 >3
1.8 DOPPLERŮV JEV V praxi se setkáváme s jevem, kdy nastane relativní pohyb pozorovatele a zdroje zvuku. Jedná se o změnu frekvence a zároveň o změnu vlnové délky, protože vlnová délka je převrácená hodnota frekvence vysílaného signálu oproti přijímanému. Změna vlnové délky je způsobena vzájemnou rychlostí mezi přijímačem a vysílačem, která může být kladná i záporná (tedy směrem k přijímači nebo od něho).
Je-li zdroj vysílaného zvuku s frekvencí fo v pohybu směrem k přijímači (posluchači), pak stojící přijímač jej přijímá o frekvenci f22: ( (7
? @,A
Obdobně opačně, pokud se zdroj pohybuje směrem od přijímače: ( (7
@,A
kde v je rychlost vlnění v dané látce a vs,r je relativní radiální rychlost zdroje vůči přijímači. Kladná hodnota signalizuje vzájemné přibližování a záporná hodnota vzájemné vzdalování.23
22
Dopplerův jev [online], poslední aktualizace 19. 2. 2016 v 19:07.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Doppler%C5%AFv_jev
17
V praxi může nastat situace, že se nepohybuje zdroj, ale přijímač. Pak platí matematický vztah: ( (7 1
7
kde vo je rychlost přijímače. Blíží-li se přijímač, je hodnota kladná a naopak pro vzdalující se přijímač je hodnota záporná. Tento jev můžeme pozorovat, když stojíme a kolem jede auto se zapnutou sirénou. I když siréna vydává stále stejnou frekvenci, nám se jeví, že se mění. Tón sirény blížícího se vozu se jeví jako vyšší a po projetí se vzdalováním zdroje se jeví jako nižší. Dopplerova jevu využívají některé přístroje, např. radary pro měření rychlosti vozidel nebo v lékařství je používá sonograf.
1.9 OCHRANA PŘED HLUKEM Již bylo řečeno, že vysoká intenzita zvuku může vést k poškození sluchu. Proto práce v hlučném prostředí je pro člověka nebezpečná a může ovlivnit i jeho pracovní výkon a hlavně pozornost. To je nebezpečné také u přehrávačů se sluchátky, kdy příliš nahlas puštěná sluchátka mohou také poškodit sluch. Člověk nemá schopnost adaptace nadměrného hluku. U některých profesí jsou proto předepsány ochranné pomůcky, které pohlcují zvukové vlny. Vhodnými látkami je plst, vakuové prostředí, koberec apod. Lidé, kteří jsou denně vystavováni vysokým intenzitám zvuku, postupně ztrácí sluchovou citlivost. Ochrana sluchu je důležitá, protože případné poškození sluchu je jev nevratný. Proto se ochrany používá v pracovním i nepracovním životě.
23
Reichl, Jaroslav, Všetička,Martin. Pohybující se zdroj. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/191-pohybujici-se-zdroj
18
2. ZÁZNAM ZVUKU Již od pradávna byla snaha zvuk nejen vnímat, ale také ho zaznamenat a znovu přehrát pro opětovné vnímání. Po prvních úspěších v záznamu zvuku a s rozvojem technologických možností rostla také příslovečná chuť umístit co nejdelší záznam na co nejmenší místo. K rozvoji technologií pro záznam zvuku také přispěl vynález filmu, protože od zavedení zvukového filmu byla tendence podpořit obrazové dění kvalitním zvukovým doprovodem. Záznam zvuku lze rozdělit na: •
Mechanický
•
Magnetický
•
Digitální
•
Optický
2.1 MECHANICKÝ ZÁZNAM ZVUKU Počátky bádání nad záznamem zvuku lze datovat již do poloviny 19. století. Nebyl to jen záznam, ale také zpětná reprodukce a uchování zvuku a lidského hlasu. Až Thomas Edison patentoval roku 1878 první skutečně funkční přístroj – fonograf. Fonograf se rychle rozšířil po Evropě a dokonce i po Americe. V podstatě se jednalo o voskový váleček, na kterém byla „vyryta“ zvuková stopa. Samotný zvukový výkon byl zesilován plechovou troubou. Jeho dominance skončila v roce 1910. Nevýhodou fonografu byla měkkost válečku, a proto byl na začátku 20. století nahrazen celuloidovým válečkem, který se už nedal tak snadno poničit. Princip záznamu však byl stejný. Jednalo se o akustický záznam, kdy se mluvilo nebo zpívalo do trouby, která byla spojena s rycí jehlou. Do otáčejícího se válečku bylo tak přenášeno chvění jehly v podobě různě hluboké rýhy. Velkou nevýhodou byla nemožnost záznamy jednoduše rozmnožovat.24 Dalším průkopníkem byl Emil Berlinger, který v roce 1889 vynalezl gramofon v podstatě v dnešní podobě. I když princip záznamu zvuku byl obdobný jako u fonografu, zápis se prováděl na plochou desku. Výhodou ploché gramofonové desky byl oboustranný a tím i delší záznam. Nevýhodou bylo, že v domácím prostředí se nedalo na gramofonu 24
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/
19
nahrávat, takže i po roce 1910 se fonograf stále užíval. Výhodou gramofonové desky pak bylo poměrně jednoduché rozmnožování pomocí lisování, což snížilo cenu a vedlo k masovému rozšíření gramofonů. Výrobu desek lze popsat jednoduše tak, že prvotní záznam byl vyryt do zápisové desky, která byla po ukončení záznamu potažena speciální látkou. Do ní se obtiskly vyryté drážky a následnými procesy se přenesl obtisk do odolného kovu. Vznikl tzv. negativ nebo též matrice, s jejíž pomocí se lisovaly šelakové desky.25 První gramofonové desky byly vyráběny z šelaku, protože plasty ještě nebyly objeveny. Ty se používaly až do konce 50. let, kdy byl objeven vinyl a začaly se vyrábět již známé vinylové desky. Za zmínku ještě stojí rychlost otáčení desek. Původně se ustálila na 78 otáčkách za minutu. To platilo pro šelakové desky. Vinylové desky se rozdělily na dvě rychlosti, 45 otáček pro tzv. singly26 a 33 otáček pro tzv. elpíčka27. Je ale pravda, že pro mluvené slovo se používala i rychlost 16 otáček za minutu. Fonografický záznam i záznam na deskách měl však řadu nevýhod. Hlavně úzké frekvenční pásmo záznamu, kdy nízké frekvence nebylo v podstatě vůbec možno zaznamenat. Ve dvacátých letech 20. století byl po vynálezu mikrofonu, elektronky a principu zesilovače, také vynalezen princip elektrického záznamu zvuku. Cesta zvuku přes mikrofon, předchůdce mixážního pultu, zesilovač a reproduktor dala podnět nové éře záznamu, ale i reprodukci zvuku. Sice princip původního záznamu zvuku zůstal stejný – rytím, ale jehla byla již rozkmitána elektricky, nikoli mechanicky. V té době byl velkým mezníkem masivní rozmach rádia a tím i šíření slova a hudby. Zároveň s tím rostl prodej hudebních nosičů. Začala vznikat rozhlasová studia s jednoduchými mixážními pulty a záznamovými zařízeními. I když je pravdou, že mix zvuku (například více zpěváků) se prováděl tak, že snímání probíhalo mnohdy jedním mikrofonem a pouhým odstupem nebo přiblížením k mikrofonu se výsledný zvuk zpěváka mixoval s orchestrem. Záznam byl jednokanálový a vše se nahrávalo živě, takže jakékoliv dodatečné korekce nebyly možné. Mikrofony se používaly nejčastěji páskové, které měly oproti kondenzátorovým výhodu širšího frekvenčního spektra a celkově i lepší zvukovou kvalitu.28
25
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/ 26 Byly menší v průměru a na každé straně byla nahrána jedna skladba. 27 Byly v průměru větší a na každé straně bylo zhruba 20 minut záznamu, proto byly označeny LP (z anglického Long Play) a odtud počeštěného názvu. 28 Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/
20
Výrobu desek lze popsat jednoduše tak, že prvotní záznam byl vyryt do zápisové desky, která byla po ukončení záznamu potažena speciální látkou. Do ní se obtiskly vyryté drážky a následnými procesy se přenesl obtisk do odolného kovu. Vznikl tzv. negativ nebo též matrice, která se lisovala do desek. V té době existovala tzv. záznamová studia, kde si mohl obyčejný člověk prostřednictvím pronájmu za určitý poplatek nahrát svoji písničku. To byla v období třicátých až padesátých let jediná možnost záznamu. Tato studia však byla vybavena jen velmi skromně a záznam byl vyryt do speciální desky, kterou si zákazník rovnou odnesl domů.
2.2 MAGNETICKÝ ZÁNAM ZVUKU Němečtí inženýři v polovině třicátých let ve firmě IG Farben vynalezli první použitelnou magnetickou pásku, respektive pásku, na kterou bylo možno pomocí magnetizmu (magnetického pole) zaznamenat zvukovou stopu. Existovaly i magnetofony používající jako záznamové médium tenký ocelový drát, vyvinuty byly v Německu ve 40. letech a dokonce se vyráběly začátkem 50. let u nás (drátofon Meopta Paratus).29 Firma AEG pak následně vyrobila první magnetofon, ale vypuknutí války přerušilo další vývoj (přitom se jednalo o původně chráněnou značku firmy TELEFUNKEN). Magnetofon se používal pouze v třetí říši a po její prohře ukořistili magnetofon Američané. Zde je začala ve velkém vyrábět firma Ampex, která se posléze stala jedním z velkých výrobců i studiových magnetofonů na celém světě.30 Způsob magnetického záznamu na pásce měl řadu výhod. Bylo poprvé možno záznam opakovat na stejný pásek, tzn. původní záznam vymazat. Poprvé také byla možnost střihu, pochopitelně pomocí nůžek a speciální lepicí pásky. Tím bylo možné již nahrané záznamy měnit. Nezanedbatelnou byla oproti šelakovým deskám i výrazně delší doba záznamu, která záležela na délce pásku, respektive průměru kotoučů, na kterých byla navinuta. Kvalita zápisu byla významně ovlivněna rychlostí posuvu pásku a to tak, že čím byla rychlost posuvu pásku větší, tím byl záznam kvalitnější.
29
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/ 30 Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/
21
První pásky byly ocelové, ale postupem času byly nahrazeny pásky s feromagnetickou vrstvou, kterou tvořila magneticky tvrdá látka31. Kvalita záznamu se následně zlepšila vynálezem tzv. předmagnetizace32. Od konce 40. let magnetický pásek zcela nahradil desky ve studiích, ale ty se používaly i nadále jako cílový produkt pro zákazníky. Kvalita záznamu se také výrazně zlepšila výrobou tehdy technicky dokonalých kondenzátorových mikrofonů pod označením U47, které se rychle rozšířily po celém světě, a které vyráběla po válce v 50. letech firma Neumann.33 Stále se jednalo o jednokanálový záznam, dnes označovaný jako mono. Již od 30. let se experimentovalo také se stereofonním34 záznamem, tedy s dvoukanálovým a následně i vícekanálovým. Pan Les Paul byl průkopníkem vícestopého pásu a magnetofonu, díky němuž se v padesátých letech rozšířil stereozáznam. Principem stereozáznamu je snímání například orchestru minimálně ze dvou míst dvěma mikrofony (dnes z více míst více mikrofony). Pro každý mikrofon musí být na pásku jedna magnetická stopa, proto vícestopý pásek, na který zaznamenává vícestopá hlava. Reprodukce pak musí probíhat také ze dvou reproduktorů, a pokud posluchač sedí ve středu mezi reproduktory (ve vrcholu pomyslného trojúhelníku), pak má stejný vjem, jakoby seděl v hledišti před orchestrem. Prostřednictvím stereozáznamu se také vytvoří dokonalá iluze přesunu herce z jedné strany jeviště na druhou, přejetí vozidla apod. Také bylo možno na jednu stopu nahrát hlas a dodatečně na druhou stopu hudbu, což bylo základem pro rozhlasové hry, protože přenos pomocí rádiových vln byl ještě monofonní. Takže obě stopy se přehrály jako jeden signál. Tím došlo k významné modernizaci zvukových studií, protože bylo možno jednak dodatečně nahrávat další záznamy, ale také lépe porovnávat hlasitost jednotlivých stop. V Americe se v 50. letech používal standardně třístopý záznam, který byl výhodný například pro stereo nahrávku orchestru a jednoho kanálu pro hlas zpěváka. Do roku 1964 se v Evropě používal záznam dvoustopý. Od konce šedesátých let byl ve studiích běžný osmi kanálový záznam a od sedmdesátých let se používalo 24 až 32 stop. To již pro běžné nahrávky studií a požadavků zákazníků zcela postačovalo. Také samotná studia zaznamenala výrazné změny. Mixážní pulty již byly modernější a umožňovaly i tzv. korekce zvuku, především regulaci hloubek (nízkých kmitočtů) a výšek (vysokých kmitočtů) a to u každého kanálu zvlášť. Dále pak ekvalizaci, neboli řízení 31
Jedná se o vliv vnějšího magnetického pole na danou látku. Na pásek těsně před záznamem působí pomocné magnetické pole, ovlivňující charakter magnetizační křivky. http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/ 34 Stereo (stereos - řecky prostorový) označuje technologii k prostorovému zobrazení.
32
33
22
kmitočtových pásem jednotlivých kanálů ve větším měřítku, panoramatického efektu (převádění zvukového záznamu z jedné stopy do druhé) a jednoduchých efektů, jako například dozvuku, který se však prováděl dozvukovou komorou nebo později páskovým efektem. Mezi nástrojovými mikrofony proslul typ BM57, který je dodnes považován za standard tehdejšího studia, ale i typ Shure Unidyne III, ze kterého se BM57 odvodil. Studia se začaly využívat k masivnímu nahrávání a šíření nahrávek jednotlivých skupin, zpěváků, ale i mluveného slova.35 Magnetofony se začaly v 50. letech také hojně prodávat pro domácí využití. V tehdejší Československé republice je vyráběla firma Tesla. Vývoj magnetofonů probíhal od elektronkového monofonního přístroje až k moderním stereofonním přístrojům s využitím nejmodernějších polovodičových součástek a LED diod. S volným prodejem mikrofonů bylo také možno i v domácnosti pořídit poměrně kvalitní záznam. Magnetofonové pásky kralovaly skoro až do konce 90. let, kdy byly klasické kotouče definitivně nahrazeny magnetofonovou kazetou, která již dokázala relativně kvalitně zaznamenat nahrávku. První kazetové magnetofony se objevily již v 70. letech, walkman v roce 1978. Měla také výhodu v tom, že na konci pásku kazety se kazeta prostě jen obrátila a záznam bylo možno přehrávat dál. Jednalo se tedy o pásky (stejně jako magnetofonové) čtyřstopé, pro každý směr dvě stopy stereo záznamu. Modernější kazetové přehrávače byly tzv. reverzní36. První kazetu představila firma Philips v roce 1963, s vynálezem technologie DOLBY37 se kazety staly kvalitním záznamovým médiem. Přístroje se díky polovodičovým součástkám velmi zmenšily a vznikly dnes již zapomenuté walkmany, tedy kapesní kazetové přehrávače. Některé typy byly kombinovány i s rádiem.38 Nevýhodou pásku však bylo, že záznam byl zaznamenán v časové chronologii a i když kazety se daly vyjímat v kterékoli části záznamu (u pásků kotoučového magnetofonu to bylo obtížné, nikoli nemožné, ale část pásku zůstala i na navíjecí cívce a pásek se mohl zacuchat), bylo potřeba při hledání konkrétní části záznamu kotouče i kazety přetáčet, což v praxi bylo velmi zdlouhavé. Z tohoto důvodu stále měly na trhu místo i desky. A dlouho se ještě používaly v tanečních klubech.
35
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/ 36 Přístroj sám změnil na konci pásku kazety směr pohybu pásku, a tudíž nebylo nutné kazetu otáčet. 37 DOLBY SYSTÉM se dlouhá léta používal i v kinech a byl uváděn v titulcích. Jedná se o odšumění záznamu. 38 http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/
23
2.3 OPTICKÝ ZÁZNAM ZVUKU S rozvojem filmu vznikla nutnost i zvukového doprovodu. Aby byla zajištěna dokonalá synchronizace obrazu a doprovodného zvuku, zaznamenávaly se zvukové stopy přímo na filmový pás. Záznam byl proveden exponováním zvukové stopy pomocí světla, které mělo stálou intenzitu. Světlo procházelo štěrbinou, které bylo zakrýváno stínítkem masky. Maska měla vhodný tvar, aby osvětlená část štěrbiny odpovídala okamžité hodnotě akustického tlaku, který odpovídal zaznamenávanému zvuku. Současně s pohybem masky se pohybuje zrcátko. Na něho dopadá soustředěné světlo pomocí čočky. Jako světelného zdroje je využita žárovka. Takže světlo ve výsledku prochází maskou, odráží se od pohybujícího se zrcátka. Prochází dále štěrbinou a čočkou je soustředěno na přesné místo filmového pásu. Poškrábání nebo třeba i prachové částice mohou způsobit zvláště v tichých pasážích nepříjemný šum. Proto se okraje štěrbiny automaticky zakrývají křidélky protišumové clony. Automatické ovládání je řízeno střední hodnotou zaznamenávaného zvukového signálu. Čím větší je intenzita signálu, tím více dopadá na filmový pás světla. Pro snímání zvuku z filmového pásu se využívá procházející světlo, které přes štěrbinu dopadá na světlo citlivý prvek, nejčastěji fotodiodu39 nebo fototranzistor40, dříve na speciální elektronku. Tím je vytvořen elektrický signál, který je po zesílení v zesilovači veden do reproduktorových soustav.41 Důležitá je mechanika posuvu. Zatím co obraz je promítán po políčcích, je zvuk třeba snímat z kontinuálně běžícího pásu. Proto je mezi optikou a zvukovým snímačem větší vzdálenost a vytvořená smyčka filmového pásu slouží ke zklidnění posuvu. Rychlost přehrávání filmu je určována zvukovou stopou, protože na změny zvuku jsme citlivější než na změny rychlosti přehrávání obrazu. Proto pás prochází přes tlumící kladky, přítlačné kladky a kladku setrvačníku, které tlumí během promítání kmitavý pohyb v promítacím stroji.
39
Polovodičová součástka. Čím více světla dopadá na fotodiodu, tím větší napětí je generováno na jejích vývodech. 40 Fototranzistor je polovodičová součástka. Místo báze je však světlo citlivý vstup, který ovládá odpor (přechod) mezi kolektorem a emitorem. 41 Reichl, Jaroslav, Všetička,Martin. Princip optického záznamu zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/1346-principoptickeho-zaznamu-zvuku
24
V současné době jsou filmové pásy vybaveny některým z moderních zvukových záznamů (nejčastěji digitálním zvukem), které umožňují ve vhodně vybaveném kině poskytnout divákovi prostorový zvukový doprovod filmu42.
2.4 HI-FI TECHNOLOGIE S modernizací, a hlavně s rozvojem především polovodičových součástek, rostla pověstná chuť také po stále lepším a lepším záznamu i reprodukci. S tím vším souvisí zrození fenoménu zvaného HI-FI (z anglického hight fidelity neboli věrný záznam). Jedná se o jednotlivá zařízení, která dokáží velice věrně a bez zkreslení reprodukovat zaznamenaný akustický signál. Datuje se od šedesátých let, ale u nás byl standardizován až v roce 1973. Posluchači tak měli možnost poprvé vnímat svoje oblíbené interprety z kvalitních zesilovacích a reprodukčních souprav, i když tato zařízení byla velmi nákladná. Masivní rozšíření HI-FI techniky přišlo až v sedmdesátých letech, kdy se cena této techniky snížila a byla přijatelná pro širokou veřejnost. Příkladem výroby HI-FI techniky může být Japonsko, ale tehdy i západní Německo. Pochopitelně s rostoucím požadavkem na přesnou kvalitu reprodukce, rostl i požadavek na velmi kvalitní záznam. Proto se jednotlivá studia znovu rekonstruovala a od konce 70. let došlo i k experimentům s digitálním vícestopým záznamem. A tak se v roce 1982 poprvé na trh uvedl kompaktní disk (CD), lidově zvané „cédéčko“. Označení CD je přejato z anglického compact disc. Jde o optický disk určený k ukládání digitálních dat.
42
Encyklopedie fyziky: Optický záznam zvuku. In: Encyklopedie fyziky [online]. 2016 [cit. 2016-04-28]. Dostupné z: http://fyzika.jreichl.com/main.article/view/1344-opticky-zaznam-zvuku
25
3. DIGITALIZACE ANALOGOVÉHO SIGNÁLU 3.1 VÝHODY DIGITÁLNÍHO ZÁZNAMU Analogový záznam a jeho kvalita se používáním a rozmnožováním (kopírováním) i opakovaným přehráváním stále snižuje a časem se takový záznam stane nepoužitelný. I čas sám o sobě může mít degradační účinky. Pásky a gramofonové desky jsou také velmi náchylné k mechanickému poškození, které má zásadní vliv na kvalitu reprodukce. Hlavní výhodou digitálního záznamu je tedy to, že ho můžeme stále přehrávat i několik let, protože běžným používáním ani kopírováním se nijak neničí. Další výhodou je možnost přehrávání pomocí telefonů, přehrávačů a jiných přístrojů prakticky kdekoliv, nejen doma, jako tomu bylo například u gramofonu a gramofonových desek. Nespornou výhodou je i to, že digitální záznam umožňuje v dnešní době velkou kapacitu záznamu. Takže můžeme poslouchat třeba hudbu na cestách i několik hodin z jednoho média. A to velmi kvalitně. Například výrobci do vozidel montují kvalitní rádia s MP3 přehrávači a kvalitní reproduktorovou soustavou.
3.2 DIGITALIZACE ANALOGOVÉHO SIGNÁLU Spojitý signál je nutné převést na digitální signál, který využívá pouze dvou hodnot, logické nul y logické jedničky. Čili toto časové třídění kanálů s digitální modulací předpokládá tři postupné kroky: •
Vzorkování
•
Kvantování
•
Kódování43
3.2.1 Vzorkování signálu V závislosti na použití, požadované rychlosti vzorkování a přesnosti převodu (počtu míst) jsou používány různé metody převodu44.
43
BEZDĚK, Miroslav. Elektronika III. České Budějovice: KOPP, 2004. Str. 238
26
Na počátku procesu máme spojitý analogový signál, viz Obrázek 1. Analogový signál45, je znázorněn červeně. V určitém časovém sledu odebereme vzorek z tohoto signálu, tzn. jeho okamžitou hodnotu. Získáme tak body, kterým budou přiděleny jednotlivé úrovně, viz Obrázek 2. Vzorkování signálu. Rychlost, s jakou vzorkování provádíme, se nazývá vzorkovací frekvence. Podmínka, která uvádí minimální hodnotu vzorkovací frekvence, se nazývá Nyquistova podmínka (Budeli dodržena minimální hodnota vzorkovací frekvence při vzorkování signálu, nevznikne zkreslení typu aliasing, které by způsobilo závažné a neodstranitelné strukturované rušení ve výsledném signálu.). Při dodržení této minimální frekvence při vzorkování analogového signálu nedojde k jevu zvanému aliasing46, který by znamenal velké rušení v konečném signálu.
Obrázek 1. Analogový signál
44
HÄBERLE, Heinz O. Průmyslová elektronika a informační technologie. Vyd. 1. Překlad Jiří Handlíř. Praha: Europa-Sobotáles, 2003. ISBN 8086706044. Str. 326. 45 Obrázky 1 až 4 překresleny z: https://cs.wikipedia.org/wiki/Musical_Instrument_Digital_Interface 46 Jedná se o jev, který může vzniknout při převodu spojitého signálu na nespojitý.
27
Obrázek 2. Vzorkování signálu
Pro výpočet vzorkovací frekvence platí: (BC
5DE
F 2 (
!" ,
kde fvz je vzorkovací frekvence, pomocí níž se vzorkování provádí, Tvz je perioda a fmax je hodnota nejvyšší frekvence. Ta je odvozena od horní hranice slyšitelného pásma.
Proto praxe využívá následující vzorkovací frekvence: 1) 32 kHz pro použití v telekomunikačních přístrojích a v levnějších komerčních přístrojích. Využívá se pro zvukové signály, které mají menší frekvenci, než 16 (respektive 15) kHz. 2) 44,1 kHz – touto frekvencí se vzorkuje signál při zpracování kvalitního záznamu pro kompaktní disky a některá studiová zařízení. Zde je soulad s Nyquistovou podmínkou, protože lidské ucho vnímá frekvenci zvuku do 20 kHz. Jedná se o nejrozšířenější vzorkovací frekvenci. Vyšší frekvence se používají jen kvůli kvalitě zaznamenaného signálu. 3) 48 kHz se využívá u moderních zařízení ve studiích. 4) 96 kHz se využívá pro některé prvotní záznamy a pro efektové procesory.
Stále se však jedná o analogové hodnoty, protože vzorek může nabýt prakticky jakýchkoliv úrovní. Protože jich může být nekonečně mnoho, nelze je převádět do digitálních dat. Platí zásada, že čím více vzorků odebereme, tím bude digitální záznam přesnější, ale bude více náročný na výslednou velikost uloženého souboru.
28
3.2.2 Kvantování signálu Kvantováním signálu provádíme přiřazení bodů jednotlivých vzorků ke konkrétním hodnotám předem daných úrovní. Ty jsou již vyjádřeny určitým binárním kódem, který odpovídá příslušné úrovni, viz Obrázek 3. Kvantování signálu.
Obrázek 3. Kvantování signálu
Plné černé vodorovné čáry zobrazují jednotlivé úrovně a jejich přiřezaní k binárním kódům. Čárkované černé vodorovné čáry zobrazují rozhodující úroveň pro přiřazení vzorku jedné či druhé úrovni. Modré svislé čáry pak pro daný čas zobrazují přiřazenou úroveň a tím i binární kód. Analogové hodnoty tak zaokrouhlením přiřadíme již konkrétním binárním hodnotám.
3.2.3 Kódování signálu Kódováním signálu získáme již konečný digitální signál. Jednoduché přiřazené binární kódy se nahradí vhodnějším kódem pro další zpracování výstupního digitálního signálu, viz Obrázek 4. Digitální signál.
29
Obrázek 4. Digitální signál
Důvodem kódování je to, že pro činnost počítačů i jiných přístrojů je nevhodné příliš časté střídání logické nuly s logickou jedničkou. Kvantovaný signál se tedy překóduje se zachováním svého smyslu, ale je následně jednodušší pro další zpracování.
3.3 DIGITÁLNÍ ZÁZNAM ZVUKU Oproti analogovému záznamu zvuku přinesl řadu výhod: •
Výrazné zlepšení kvality zvuku
•
Větší dynamický rozsah nahrávky
•
Vyšší odstup šumu
•
Rychlé vyhledávání konkrétní části záznamu
•
Výrazné zjednodušení i dodatečné editace záznamu (střih, kopírování, apod.)
3.3.1 Historie CD a jeho technická data Vznik CD se datuje do roku 197947, kdy jej firmy SONY a PHLIPS vyvinuly a uvedly na trh jako způsob uchování věrného záznamu zvuku, především hudby. Původně byly určeny pro délku záznamu 60 minut, což odpovídalo zhruba oběma stranám dlouhohrající desky. Zajímavostí je, že firma SONY trvala na délce záznamu 74 minut, aby se na CD vešla celá Devátá symfonie od Beethovena. V současné době jsou dnes používaná CD s délkou záznamu 80 minut. K dispozici jsou však varianty s délkou záznamu 90 a 99 minut. Tyto disky však 47
Záznam a reprodukce zvuku [online], poslední aktualizace 1. 4. 2016 v 21:05. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Z%C3%A1znam_a_reprodukce_zvuku
30
nemusí být čitelné na všech přístrojích a proto se užívají zřídka pro záznam hudby. Někteří výrobci v manuálech dokonce upozorňují na zákaz používat nadstandardně dlouhé záznamy těchto CD z důvodu poškození přístroje. První album, které bylo ve formě CD, bylo The Visitors nahrané skupinou ABBA. Nahrávka byla pořízena 17. srpna 1982. Od té doby postupným snižováním cen, především CD přehrávačů pro veřejnost, došlo k úplnému vytlačení LP desek z trhu. Oblíbené byly také discmany, které nahradily walkmany. Tím prakticky skončilo období, kdy se aktivně používal analogový záznam zvuku. CD s průměrem 12 cm se také brzy stal úložištěm i ostatních dat pro PC. Původně měl kapacitu 565 MB s délkou záznamu 74 minut, ale dnes se používají CD s kapacitou 700 MB s délkou záznamu 80 minut. Někdy, například pro reklamní účely, se používají CD s menším průměrem (8 cm), které mají kapacitu 184 – 210 MB a délkou záznamu 21 - 24 minut. Data jsou uložená na CD ve spirále, na rozdíl od gramofonových desek ale od středu po okraj. Navíc u desek byla po celý čas přehrávání konstantní rychlost otáček desky a rychlost posuvu drážky proti snímací jehle se postupně zmenšovala, jak se rameno pohybovalo směrem ke středu. U CD je relativní rychlost mezi záznamovou stopou CD a snímací laserovou hlavou stále stejná a mění se postupně rychlost otáčení CD. Laser se pro čtení dat používá vlnovou délku 785 nm a vzdálenost středů vedle sebe jdoucích stop je 1,6 µm. Délka spirály dosahuje i 6 km a data v ní jsou uložena stále se stejnou hustotou a jsou zaznamenána pouze na spodní straně disku, což je další rozdíl oproti klasické desce. Ta měla rýhu z obou stran. Disk má typicky tloušťku 1,2 mm a zápis dat se provádí na poloměru 23 až 58 mm. Pro úplnost ještě zmínka o DVD, které je přímým pokračovatelem CD. Je od CD pohledem prakticky nerozeznatelné, ale umožňuje uložit i obraz, protože má vyšší kapacitu záznamu.
3.3.2 Audio CD Jak již bylo řečeno, jedná se o nejstarší záznam zvuku prostřednictvím CD. Pro vzorkovací kmitočet se používá frekvence 44 100 Hz se stereofonním záznamem bez komprese s pulzní kódovou modulací.
31
Pro výpočet, kolik zabere jedna minuta záznamu bajtů, lze použít vztah:
44100 x 16 x 2 x 60 : 8 = 10 584 000 bajtů Navíc jsou data zabezpečena protichybovým kódováním FEC (z anglického Forward Error Correction). Díky tomuto kódování může přehrávač „opravit“ řadu chyb, které mohou vzniknout například částečným poškozením CD. Systém je označován CDDA (Compact Disc digital Audio). Kód UPC (Universal Product Code) slouží k jednoznačné identifikaci alba a kód ISRC (International Standard Recording Code) slouží jako identifikátor hudebních skladeb. Skládá se z dvanácti znaků. V tabulce 2 Význam zkratek jsou uvedeny zkratky pro záznam, střih i výsledný záznam, které bývají na CD (jako audio nosiče) uvedeny. ZKRATKA
Původní záznam
Způsob střihu
AAD
analogový
analogový
ADD
analogový
digitální
DDD
digitální
digitální
Výsledný záznam
Vždy digitální
Tabulka 2 Význam zkratek
3.3.3 Technologie MIDI Digitální záznam přinesl také technologii MIDI48 (Musical Instrument Digital Interface). V hudebním průmyslu slouží jako elektronický komunikační protokol, který je mezinárodně uznávaný. Dovoluje v reálném čase komunikaci hudebních nástrojů, počítačů a dalších přístrojů prostřednictvím definovaného sériového rozhraní. Dále je pomocí MIDI možno ovládat i jevištní techniku, jako jsou světla (jas, barva), popřípadě obrazová data a na jejich základě kaleidoskopické obrazce. Vše začalo v roce 1981 prvním propagátorem MIDI firmou ATARI, která tímto rozhraním vybavila svoje počítače. Přenos dat je sériový, který je podobný sběrnici RS 232, s rychlostí 31 250 bit/s. Využívá proudovou smyčku o velikosti proudu 5 mA a také galvanicky oddělený vstup.
48
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historie-zaznamu-zvuku/
32
4 KOMPRESE DAT 4.1 DŮVODY KOMPRESE Komprese dat, někdy též komprimace dat, je zpracování dat pro počítačovou techniku. Cílem komprese je zmenšení objemu dat, vyjádřeno počítačově, aby měly méně bajtů. A to při zachování informací, které byly v datech obsaženy. Úkolem je tedy zmenšit datový tok při přenosu nebo zmenšit zdrojovou potřebu při ukládání dat. Výsledkem je zmenšení velikosti datových souborů. To je výhodné např. při jejich archivaci. Komprese je také důležitá při přenosu dat pomocí sítě se zmenšenou rychlostí, respektive zkrácení doby nutné pro její přenos. Využívá se také kvůli omezené datové propustnosti u mobilních telefonů, kdy se data hovoru komprimují, aby je bylo možno přenášet pomocí GSM sítě. Kódování je zvláštní postup, kterým se ze souboru dat odstraňují nadbytečné informace. Tyto na první pohled nadbytečné (redundantní) informace jsou součástí počítačových dat, aby bylo možno eliminovat chyby vznikající jejich přenosem. Jedná se například o paritu, kontrolní součet, kontrolní číslici apod. Jsou i složitější a také nákladnější redundance v podobě samo opravných kódů, které dovolují opravovat jednu nebo i více chyb v určitém počtu bitů jedné informace. Zvláštními postupy – kódováním, které je dané zvoleným kompresním algoritmem – se ze souboru odstraňují redundantní (nadbytečné) informace, zvyšuje se entropie dat. Komprese dat lze rozdělit do dvou základních kategorií: •
Ztrátová komprese – při kompresi jsou některé informace nenávratně ztraceny a nelze je zpět zrekonstruovat. Používá se tam, kde je možné ztrátu některých informací tolerovat a kde nevýhoda určitého zkreslení je bohatě vyvážena velmi významným zmenšením souboru. Používá se pro kompresi zvuku a obrazu (videa), při jejichž vnímání si člověk chybějících údajů nevšimne nebo si je dokáže domyslet (do určité míry).
•
Bezeztrátová komprese – obvykle není tak účinná jako ztrátová komprese dat. Velkou výhodou je, že komprimovaný soubor lze opačným postupem rekonstruovat do původní podoby. To je nutná podmínka při přenášení počítačových dat, výsledků
33
měření, textu apod., kde by ztráta i jediného znaku mohla znamenat nenávratné poškození souboru49.
4.2 KOMPRESNÍ POMĚR Je to podíl mezi nekomprimovanou (vstupní) informací a komprimovanou (výstupní) informací. Například je-li vstupní informace velikosti 20 MB komprimována na velikost 4 MB, je kompresní poměr 20 ku 4 = 5. V praxi je pochopitelně komprimace ovlivněna zvoleným typem komprimovaných dat i zvoleného kompresního algoritmu. S tím souvisí, kolik „místa“ ušetříme. Vyjadřuje se jako velikost nekomprimovaných dat mínus kompresní poměr. V našem příkladu: 1 – 1/5 = 0,8 a to je úspora 80%. Audio CD obsahují nekomprimovaná data a jejich tok je zhruba 1,35 Mb/s. Komprimovaná zvuková data (příkladem je dnes moderní formát AAC, který podporuje Apple iPod a nebo velmi všeobecně rozšířený formát MP3) mají tok zásadně 128 Kb/s. Tudíž kompresní poměr je zhruba 11 a nemalá úspora 90 % datového toku. Zde se samozřejmě jedná o ztrátovou kompresi. Pokud bychom ale žádali pro shodný typ dat bezeztrátovou kompresi, tak by se jednalo zásadně o poměr do 2 : 1. V tomto případě nelze však dosáhnout vyšší komprese, než je míra entropie50 komprimovaných dat.
4.3 VLIV HUDEBNÍHO ŽÁNRU NA KOMPRESI
Na zvoleném datovém toku a formátu komprese závisí kvalita komprimovaných skladeb. Platí, že čím vyšší je datový tok, tím bude výsledný záznam kvalitnější a jako soubor bude větší. Tabulka 3 Orientační přehled velikosti souboru při různých datových tocích a závislost frekvenční charakteristiky uvádí některé základní kompresní algoritmy a jejich ovlivnění při různých datových tocích a kmitočet omezující frekvenční charakteristiku51.
49
Komprese dat[online], poslední aktualizace 7. 5. 2015 v 11:38. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Komprese_dat 50 Jedná se o základní pojem v teorii informatiky. Setkáme se s ní u pravděpodobnosti možných stavů dané soustavy. Jedná se o pravděpodobnost možných stavů dané soustavy či systému. 51 Tabulky 2 a 3 převzaté ze zdroje: http://avmania.e15.cz/komprese-zvuku-jen-podvod-na-usi
34
Formát komprese MP3 MP3Pro OGG Vorbis AAC AACPlus VMAPro
48 kb/s 1,02 1,02 0,94 1,06 1,02 1,05
Velikost souboru (MB) 80 96 128 kb/s kb/s kb/s 1,7 2,04 2,72 1,7 2,04 1,57 1,87 2,42 1,73 2,06 2,73 1,69 2,03 2,71 1,73 2,07 2,75
Omezení frekvenční charakteristiky (kHz) 48 80 96 kb/s 128 kb/s kb/s kb/s 7,5 13,1 15,1 16,0 16,2 neomezuje 14,1 15,9 16,6 17,4 8,7 15,2 15,2 17,2 neomezuje 15,8 11,9 13,2 15,5 15,5
Tabulka 3Orientační přehled velikosti souboru při různých datových tocích a závislost frekvenční charakteristiky
Tabulka 3 uvádí hodnoty oproti originálnímu souboru PCM WAV 44,1 kHz/16b.
Naproti tomu tabulka 4 Orientační přehled velikosti souboru u různých druhů hudby a závislost frekvenční charakteristiky porovnává stejné komprimační formáty a vyjadřuje velikost souboru na typu hudebního žánru. Uvádí také omezení frekvenční charakteristiky.
Formát komprese MP3 MP3Pro OGG Vorbis AAC AACPlus VMAPro
Velikost souboru (MB) rock
jazz
elektro nická hudba
1,02 1,02 0,94 1,06 1,02 1,05
1,44 1,44 1,24 1,49 1,45 1,47
1,74 1,74 1,86 1,76 1,76 1,78
Omezení frekvenční charakteristiky (kHz) klasika
rock
jazz
elektro nická hudba
klasika
1,47 1,47 1,19 1,52 1,49 1,5
7,5 16,2 14,1 8,7
7,5 16,2 15,1 8,5 20,4 12
7,5 16,2 15,1 8,4 20,4 12
7,3 16,1 14,2 8,5 20,3 12
neomezuje
1,9
Tabulka 4 Orientační přehled velikosti souboru u různých druhů hudby a závislost frekvenční charakteristiky
Tabulka 4 uvádí hodnoty oproti originálnímu souboru PCM WAV 44,1 kHz/16b a datovém toku 48 kb/s. Z tohoto porovnání vychází klasický soubor MP3 nejhůře, protože při nižších datových tocích ořezává vyšší frekvence jak 7,5 kHz. Takový záznam se může jevit jako nekvalitní. Modernější formát MP3Pro dokáže při stejném datovém toku komprimovat i frekvence po 16 kHz a to při zachování stejné velikosti výsledného souboru. MP3Pro má využívá navíc technologii SBR, která je přímo určena pro komprimaci vyšších kmitočtů. Stejná komprese pro různé druhy hudby však přináší při stejné rychlosti datového toku různě veliké výsledné soubory. Elektronická hudba může být na úložný prostor náročnější až o 100 %.
35
5. ZVUKOVÉ FORMÁTY BEZEZTRÁTOVÉ 5.1 APPLE LOSSLESS Tento formát vyvinula společnost Apple Computer jako bezeztrátovou kompresi pro hudební soubory. Je také známý jako Apple Lossless nebo jeho varianty Apple Lossless Codek, ALAC, popřípadě Apple Lossless Encoder, ALE.52 Soubory mají příponu .m4a, protože pro ukládání hudebních souborů, které jsou kódovány pomocí Apple Lossless, využívají kodér MP4. Není však založena na AAC, nýbrž používá lineární predikci53, stejně tak jako jiné bezeztrátové kodeky. Příkladem mohou být Shorten nebo FLAC. Dle firmy Apple je velikost komprimovaných souborů asi poloviční, ale testování ukázalo, že velikost souborů je cca 60 % původní, tedy nekomprimované velikosti. Je to podobné ostatním bezeztrátovým kompresím. Na rozdíl od ostatních formátů má ale Apple Lossless jednu velkou výhodu. Tento formát není náročný na zpětnou dekompresi dat, a proto je lze využít v přístrojích s omezenou zdrojovou náročností, jako jsou například iPody. V dubnu roku 2004 byl představen jako součást známého Quick Time, proto je použitelný v iTunes.54 Pomocí firmwaru Rockbox lze tento formát přehrát a používají ho starší verze přehrávačů od firmy Apple.
5.2 FORMÁT FLAC
(Free audio codec) Jedná se o tzv. otevřený bezeztrátový zvukový kodek.55 Využívá Golomb-Riceova kódování, kdy lineární predikcí provádí konverzi zvukových dat (jejich vzorků) do série malých čísel neboli reziduálů. Je to velmi efektivní způsob a za použití RLE se reálně uplatňuje pouze u 8 bitového rozlišení. U tohoto bitového rozlišení je poměrně dost velká pravděpodobnost splynutí odchylek, a proto sousední hodnoty budou stejné. Při použití 16 52
Apple Lossless [online], poslední aktualizace 15. 4. 2016 v 22:16. [cit. 26. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Apple_Lossless 53 Podle https://kalabovi.org/pitel:msz:linearni_predikce je lineární predikce operace, při které jsou následující vzorky signálu v diskrétním čase jako lineární funkce vzorků předchozích. 54 Apple Lossless [online], poslední aktualizace 15. 4. 2016 v 22:16. [cit. 26. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Apple_Lossless 55 Free Lossless Audio Codec [online], poslední aktualizace 1. 4. 2016 v 08:15 [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Free_Lossless_Audio_Codec
36
bitů je toto řešení prakticky nepoužitelné. FLAC v porovnání s jinými kodeky dosahuje horších kompresních poměrů, ale jeho dekódování je méně náročné na výpočty a umožňuje streamování, a proto je více podporován. I vývoj jednotlivých verzí od 1.1.2 po 1.1.4 nabízí větší kompresní poměr. Na trhu se objevují hudební nahrávky ve formátu FLAC, což zaručuje zákazníkovi vysokou kvalitu záznamu, ale zpravidla se také jedná o vyšší cenu a delší stahování nahrávky oproti kodeku MP3. Dlužno také podotknout, že se jedná o internetové nabídky stahování hudebních záznamů. FLAC také ale umožňuje kromě uložení nahrávky do výsledného datového souboru také síťové on-line streamování. Kvůli úspoře kapacity datových linek používají dnešní internetové stanice také ztrátových kompresí, jako např. WMA, Ogg Vorbis nebo MP3. A proto není dnes mnoho stanic, které by používaly k vysílání kodeků jako FLAC, i když by pro přenos mnoha hudebních žánrů byl žádaným přínosem. V současnosti pouze Český rozhlas, používá pro přenos kodek FLAC. Existují zde však různé spekulace, jestli kvalita zvuku není omezena jiným způsobem (například přenosovou trasou) a jestli je tak příjem opravdu v CD kvalitě. Kromě stanice českého rozhlasu D-dur (české vysílání) používá FLAC i stanice Absolute radio (pouze však v anglickém jazyce).
5.3 FORMÁT APE
Audio Lossless Monkey– jedná se o bezeztrátový zvukový kodek. Velikost komprimovaných souborů je oproti originálu zhruba poloviční, ale je oproti konkurenci o něco pomalejší. Soubory tohoto formátu mají příponu .ape. Jsou podporovány i některými osobními přehrávači.
5.4 FORMÁT WMA
(Windows Media Audio) Je to také poměrně známý a rozšířený soubor s příponami .wma nebo .asf, který také měl nahradit známý formát MP3. V dnešní době konkuruje formátu AAC, ale je součástí Windows Media. Z historického hlediska můžeme vývoj WMA rozdělit na dvě fáze, a to do vrze 8 a od verze 9. To proto, že znalci označili kvalitu verze do „osmičky“ jako kodeky, které si nezaslouží žádnou pozornost. Zato verze právě od devítky se rychle dostaly na úroveň 37
ostatních formátů (Musepack nebo Vorbis). Avšak i verze 9 jsou známy častým ořezáváním vyšších frekvencí při nízkých datových tocích. Z druhé strany WMA neobsahuje při nízkých datových tocích tolik artefaktů, co konkurenční formáty. Patří do rodiny komprimace typu ASF. Jde o multikanálovou bezeztrátovou kompresi.56 Jediný oficiální kodér je integrovaný ve Windows Media Playeru. Je velmi rychlý a dokonce rychlejší než např. kodér Vorbisu. Obsahuje pouze minimum nastavení. Použití s platformou Windows je však určitou nevýhodou tohoto formátu, protože není jinde jednoduše použitelný a požaduje pluginy, díky nimž je možné přehrání i na jiných operačních systémech. Výhodou je ale to, že přehrávače ve Windows Media Playeru pracují naprosto stabilně a bezchybně. WAV je velmi rozšířený a používaný formát, které používají DVD přehrávače a v podstatě i jiné přehrávače hudby.
5.5 FORMÁT WAV Je hodně starý. Byl vytvořen firmami IBM a Microsoft především pro ukládání zvukových dat do PC. Označuje se také někdy jako WAVE (Waveform audio file format), z čehož plynou i přípony souborů .wav nebo .wave. Jde o speciální variantu obecného formátu RIFF57. Má jistou podobnost s formátem 8SVX počítačů Amiga a s formátem AIFF, který se využívá u počítačů Macintosh.58 Pro svoji činnost využívá pulzně kódovanou modulaci a bezeztrátovou komprimaci dat. Její zpracování je jednoduché a výpočet snadný. Proto se často používá jako pracovní formát při různém zpracování zvukových formátů, a to při jejich archivaci nebo přenosech, navíc v nejvyšší kvalitě. Díky tomu, a jednoduché vnitřní struktuře, se tento formát používá také pro přenos zvukových dat mezi vzájemně různými systémy. Operační systém Windows 2000 rozšířil původní WAV do podoby ukládání vícekanálového zvuku. V dnešní době předčí ostatní formáty bezeztrátového ukládání, jako např. FLAC, Shorten nebo WMA Lossless.
56
Windows Media Audio [online], poslední aktualizace 26. 10. 2014 v 20:52. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Windows_Media_Audio 57 RIFF (Resource Interchange File Format) je soubor od firmy Microsoft pro ukládání zvukových a obrazových předloh. 58 WAV [online], poslední aktualizace 1. 4. 2016 v 07:35. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/WAV
38
6. ZVUKOVÉ FORMÁTY ZTRÁTOVÉ 6.1 FORMÁT AAC Formát AAC (Advanced Audio Coding) je klasickým ztrátovým formátem. Vyvinul se jako následovník oblíbeného MP3.59 Pracuje na středních a vyšších bitratech, který je standardem formátu MPEG-4. Tento formát existuje ve více variantách. Jeho obsahem jsou různé profily a vylepšení. Existuje mnoho kodérů lišících se hlavně kvalitou. Přesto AAC patří k pokročilým kompresním formátům a má také různé modifikace. Nejznámějším je patrně AACplus. Obsahuje také pokročilé technologie jako LTP (Long Term Prediction) nebo Postprocessing. Ty z něho dělají velmi dobré audio formáty pracující na nízkých bitrate, které jsou někdy lepší, než Vorbis.60 Kodérů pro AAC je poměrně mnoho, ale ne všechny jsou zdařilé. Za ty méně zdařilé jsou považovány NERO Digital nebo FAAC, naopak za velmi zdařilý je považován kodér od firmy Apple.61 Soubory, komprimované pomocí AAC mají tyto přípony: aac, .m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4.
6.2 FORMÁT DOLBY DIGITAL Jde o formát digitální ztrátové komprese zvuku z dílny společnosti Dolby Laboratories (původní označení AC-3) pro dnešní digitální ztrátovou kompresi s označením Dolby Digital. Vyvinula ho firma Dolby Laboratories začátkem devadesátých let minulého století. Řadí se mezi následníky formátů Dolby Stereo a je také konkurencí pro formáty SDDS a DTS. Jeho nejpoužívanější konfigurace je tzv. 5.1. Jedná se o pět hlavních kanálů celého frekvenčního rozsahu, tedy 20 Hz až 20 kHz, (umístěných tak, že tři jsou před posluchačem a dva za ním). 59
AAC [online], poslední aktualizace 22. 8. 2014 v 22:09. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AAC 60 AAC [online], poslední aktualizace 22. 8. 2014 v 22:09. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AAC 61 AAC [online], poslední aktualizace 22. 8. 2014 v 22:09. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AAC
39
Soustavu doplňuje jeden basový kanál, který je nazýván subwoofr. Ten zvýrazňuje zvuky nízkých frekvencí, neboli basy, například při různých ránách nebo explozích a jeho přenášená frekvence je typicky 120 Hz. Zprvu to byl velmi rozšířený systém v kinech (a to vždy v konfiguraci 5.1), později však i v konfiguraci Dolby Digital Surround EX.62 Také se používal i v digitálním televizním vysílání a také to byl základním formátem pro kódování zvuku pro filmy na nosiče DVD. Velmi rychle zdomácněl a DVD přehrávače s touto konfigurací se používají dodnes pod lidovým označením „domácí kino“. Dolby Digital má klasicky příponu .ac3 a je možné ho použít jako součást videosouborů (při komprimaci obrazu) AVI, MKV i OGM. Protože se jedná o velmi rozšířenou komprimaci, je vhodné uvést datové toky, které u audio standardu AC-3 dosahují 640 kbit/s. Video DVD má nejvyšší tok 448 kbit/s, přičemž pro konfiguraci 2.0 i 2.0 Surround se jedná o datový tok 192, respektive 224 kbit/s. Pro konfiguraci 5.1 se standardně využívá toku 448 kbit/s a to i při využití na ATSC.63 Známé možné konfigurace AC-3 jsou64: •
Dolby Digital 1.0 – je monofonní
•
Dolby Digital 2.0 – může být monofonní i stereofonní, protože obsahuje dva zvukové kanály
•
Dolby Digital 2.0 Surround – nebo též Dolby Surround, je již konfigurace digitální tuto informaci také obsahuje
•
Dolby Digital 4.0 – tato varianta se prakticky nerozšířila, ale obsahuje čtyři plnohodnotné kanály (dva před a dva za posluchačem)
•
Dolby Digital 5.0 – i tato varianta se příliš nerozšířila, obsahuje pouze pět samostatných plnohodnotných kanálů, ale bez subwooferu65
•
Dolby Digital 5.1 – jedná se již o popsanou konfiguraci pěti plnohodnotných kanálů a jednoho LFE kanálu (pro subwoofr)66
62
Dolby Digital [online], poslední aktualizace 17. 4. 2016 v 22:59. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Dolby_Digital 63 Dolby Digital [online], poslední aktualizace 17. 4. 2016 v 22:59. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Dolby_Digital 64 Dolby Digital [online], poslední aktualizace 17. 4. 2016 v 22:59. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Dolby_Digital 65 Tento formát byl poprvé použit ve filmu Vodní svět. 66 Prvním filmem v tomto formátu je Batman se vrací.
40
•
Dolby Digital 5.1 EX – dnes nejrozšířenější konfigurace v kinech a filmových záznamech značena jako Dolby Surround EX, která vznikla v říjnu 1998, používající konfiguraci 6.1 a 7.167
6.3 KODEKY AMR Kodek AMR (Adaptive multi-rate compression) byl vyvinut především pro komprimace řeči. Je určený pro přenos v UMTS sítích, ale používá se i v GSM sítích, a také se hojně využívá pro činnost diktafonů a pochopitelně mobilních telefonů. Dosahuje zde velmi dobrých výsledků komprese a má mnoho režimů. Ty jsou kompatibilní s PDC, GSM-EFR a také TMDA- FER. V komprimaci hudby však má horší kvalitu záznamu, a proto se zde užívají komprese vhodnějších formátů, jako např. MP3, WM nebo OGG Vorbis. Ve zprávách MMS využívá AMR kompresi IMS, pro níž je základním kodekem a je standardem 3GPP.68
6.3.1 Kodek AMR-WB
(Wilde Band) Využívá vzorkovací frekvenci 16 kHz. Umožňuje tak při vyšších datových tocích vyšší kvalitu záznamu. Tento věrnější přenos se používá pro mobilní televize a rádia. Využívá se také pro věrný a kvalitní přenos telekonferencí a mobilních hovorů.69 Soubory používají příponu .amr. Pro změnu bitového toku používá každých 20 ms vzorkovací frekvenci 8 kHz a 13 bitů datového toku. I když je tento formát velmi rozšířen, není příliš znám. AMR kodeky umožňují celkem 14 módů kódování. Osm je pro plnou rychlost a 6 je pro rychlost poloviční. Rychlosti se pohybují od 12,2 kbit/s u verze AMR 12.20 (nejvyšší rychlost) až po 1.8 kbit/s u verze AMR SID (nejpomalejší).
67
První filmem v konfiguraci 7.1 je Star Wars: Epizoda I – Skrytá hrozba. Audiokodeky.In gymozart.cz [online], [cit. 25. 4. 2016]. Dostupné z WWW: http://www.gymozart.8u.cz/souborygympl/elearning/svt/teorie/25.Audiokodeky.pdf 69 AMR(kodek) [online], poslední aktualizace 10. 12. 2013 v 21:19.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AMR_(kodek) 68
41
6.3.2 Kodek AMR-WB+ (Wilde Band plus) Bývá také někdy označován jako Stereo over AMR. Stejně jako předešlý formát umožňuje pomocí vzorkovací frekvence 16 nebo 8 kHz přidávat druhý kanál a tím je zajištěn přenos stereofonního signálu.70
6.4 FORMÁT ATRAC
(Adaptive Transform accoustic coding) I tento způsob patří mezi ztrátovou komprimaci zvuku. Podobně jako MP3 využívá i ATRAC tzv. psychoakustického modelu zvukových dat, kdy se jedná o snížení objemu dat pro přenos signálu tak, že lidské ucho ho vnímá stejně jako originální nekomprimovaný zvuk. Je navržen pro použití v zařízeních, která používají minidisc (médium MD). Minidisc má oproti klasickému CD přibližně 4 x až 5 x menší datový tok, takže výsledný datový tok oproti CD (1.4 Mbit/s) je u ATRAC jen 292 kbit/s. Kodér se v průběhu času měnil a dnes už je verze ATRAC3, která ukládá data rychlostí pouhých 132 kbit/s ATRAC3plus s ukládací rychlostí 256 kbit/s (Hi-MD SP), respektive 64 kbit/s (Hi-HD LP).71
6.5 FORMÁTY SKUPINY G 6.5.1 Formát G.711 Jedná se o jednoduchou a velmi často používanou kompresi. Používá se především v telekomunikacích, kde byla schválena jako standard ITU-T již v roce 1988. Je jednoduchá, ale proto také méně úsporná na přenosovou rychlost. Používá vzorkovací frekvenci 8 kHz v osmibitovém rozlišení, z čehož vyplývá přenosová rychlost 64 kbit/s. Jak už bylo uvedeno,
70
AMR(kodek) [online], poslední aktualizace 10. 12. 2013 v 21:19.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AMR_(kodek) 71 Adaptive Transform AcousticCoding [online], poslední aktualizace 9. 3. 2013 v 11:02. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Adaptive_Transform_Acoustic_Coding
42
používá se v telekomunikacích, především v ISDN a PCM. Je ale pravda, že tento způsob přenosu byl již překonán výkonnějšími a modernějšími způsoby.72 Formát využívá logaritmickou kompresi a převod na osmibitový signál. Zajímavostí je použití logaritmické komprese pro přenos hovorového pásma v Austrálii a Evropě označovaný jako A-law a v Japonsku a severní Americe jako µ-law. V Japonsku a severní Americe se také užívá daleko vyšší komprese, jelikož se používá sedmibitového přenosu pro hovor a jeden bit pro signalizaci. Naopak v Evropě se používá všech osm bitů pro přenos hovoru a signalizace je proto přenášena jiným, samostatným kanálem. Proto v Evropě a Austrálii má hovor vyšší kvalitu. Pokud dochází k hovoru například mezi Evropou a Japonskem, musí dojít k překódování.
6.5.2 G.711.0 Jedná se o modernější standard ITU-T, který byl schválen v roce 2009 a který poskytuje bezztrátovou kompresi. Někdy se také označuje jako G.711 LLC (Lossless compression of G.711 pulse code modulation).73
6.5.3 G.711.1 Je o rok starší, ale rozšiřuje předchozí verzi o použití vzorkovací frekvence 16 kHz a tím i vyšší kvalitu zvuku. Datový tok je u této verze 64,8 kbit/s, popřípadě 96 kbit/s, což zajišťuje kompatibilitu s verzí G.711. Případné vyšší datové rychlosti již kompatibilní nejsou.74
72
G.711 [online], poslední aktualizace 9. 4. 2016 v 16:34. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/G.711 73 G.711 [online], poslední aktualizace 9. 4. 2016 v 16:34. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/G.711 74 G.711 [online], poslední aktualizace 9. 4. 2016 v 16:34. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/G.711
43
6.5.4 G.729 Pro efektivnější využití limitovaného pásma při přenosu hlasu po počítačové síti v IP telefonii se využívá tohoto kodeku. Vyčleněné pásmo pro hovor je 64 kbit/s. Toho využívá kodek např. G.711 v síti PCM nebo ISDN. Komprimace v kodeku G.729 umožňuje snížení pásma na šířku 8 kbit/s.
6.6 FORMÁT MP3 Velmi známý a široce rozšířený kodek s příponou .mp3. I když je to formát se ztrátovou kompresí zvuků, je velmi oblíben širokou veřejností, protože zachovává poměrně vysokou kvalitu výstupního zvukového signálu (téměř v CD kvalitě). Zmenšuje však nekomprimovaný soubor zhruba na jednu desetinu, i když u mluveného sova je výsledná kvalita výrazně horší, než u hudebních souborů. Svoji oblibu také dosáhl díky jednoduchému přehrávání a dalšímu zpracováním (střih hudby apod.) včetně archivace hudebních dat nejen v počítači, ale i v různých typech jiných přenosných přehrávačů a dokonce i v telefonních přístrojích. Tím v dnešní době zcela vytlačil do této doby používané CD přehrávače, tzv. discmeny. O jeho vývoj se zasloužil především německý vědec Karlheinz Brandenburg (ředitel pobočky Frauenhoferova ústavu pro mediální komunikaci) se svým týmem. Využívá základu psychoakustického modelu, kdy ze vstupního signálu odstraňuje složky, které lidské ucho nevnímá nebo si jej ani neuvědomuje za pomoci frekvenčního maskování. 75 Slabinou jsou však mluvené záznamy, jak již bylo podotknuto. Frekvenčním maskováním může být totiž potlačena počáteční či koncová slabika. Může také dojít k časovému krácení mezery mezi jednotlivými slovy, což působí pochopitelně rušivě. Proto pro kompresi čistého mluveného slova jsou vhodné jiné způsoby, jako například AMR, Vorbis, Speex nebo G.729.76
75
Audiokodeky.In gymozart.cz [online], [cit. 25. 4. 2016]. Dostupné z WWW: http://www.gymozart.8u.cz/souborygympl/elearning/svt/teorie/25.Audiokodeky.pdf 76 Audiokodeky.In gymozart.cz [online], [cit. 25. 4. 2016]. Dostupné z WWW: http://www.gymozart.8u.cz/souborygympl/elearning/svt/teorie/25.Audiokodeky.pdf
44
Výsledná kvalita a také parametry jsou velmi závislé na zvoleném datovém toku. Ale je to opět výhoda programů komprimujících do formátu MP3, že dovolují širokou škálu nastavení komprimace, včetně rychlosti datového toku. Využití kodeku MP3 také našlo širokou popularitu v šíření hudby a konec konců i mluveného slova pomocí internetu. Umělci jej také využívají na svých www stránkách. Zvláště začínající umělci hojně využívají komprimaci MP3, proto že si nemohou dovolit distribuci v jiném souboru. Tento trend dal vzniknout i různým druhům vyhledávačů specializujících se výhradně na soubory s koncovkou .mp3 - např. http://mp3s.nadruhou.net/..
6.7 FORMÁT MP3PRO "Jde o inovovaný formát MP3, který přinesl především technologii SBR (Spectral Band Replication). Ta zlepšuje kvalitu zvuku odstraněním nežádoucích artefaktů při použití úspornějších datových toků. V podstatě v sobě nese dva proudy. Standardní MP3 a druhý, kódující vyšší frekvence."77
6.8 FORMÁT MOD První typ modulovaného souboru pro ukládání hudby v PC je právě komprese typu MOD. Používala se v domácích počítačích typu Amiga a jeho 32 bitový procesor Motorola 68000 měl velmi málo práce. Tento typ počítače byl jako jeden z prvních vybaven rozhraním MIDI pro připojení hudebních nástrojů (např. klávesy). V 80. letech patřily Amigy ke standardní výbavě našich hudebníků. Tento kodek se také používal u prvních elektronických hudebních nástrojů, které měly zpočátku patnáct, později až třicet dva hlasů. Nástroje měly jen jednoduché úrovně nastavení hlasitosti. Originální software používal monitorování, který pracoval v časovém cyklu 50 Hz, a proto časový rámec MOD souboru byl 0,02 s. Každá stopa disponovala 64 řádky při jejím trvání právě 0,02 s. To platilo pro běžný nastavený čas při daném nastavení rychlosti.
77
Švec,Jiří. Komprese zvuku? Jen podvod na uši! In Avmania.e15.cz/ [online]. 10. 6. 2009 [cit. 27.4.2016]. Dostupné z: http://avmania.e15.cz/komprese-zvuku-jen-podvod-na-usi
45
6.9 FORMÁT MUSEPACK Od roku 1997 se vyvíjel tehdy MPC (ještě dříve MPEG+ a MP+) ztrátový zvukový kodek pod licencí BSD a LGPL. Pro svoji činnost používá formát MPEG-1 Layer 2, se specifikací optimalizování stereofonního zvuku a datovým tokem od 160 do 180 kbit/s. Maximum byla však rychlost až 320 kbit/s.78 Tyto soubory používají příponu .mpc, .mpp, nebo .mp+.
6.10 FORMÁT OPUS Jedná se o otevřený kodek, který je licenčně nezatížený. OPUS je univerzální formát komprimace se ztrátou. Je navržen a vyvinut především pro internetový přenos digitalizovaného hlasového projevu, pro streamování hudby a videokonference. Spojuje technologie dvou zvukových formátů a to SILK, který byl vyvinut pro Skype, a CELT, který je součástí kodeků Ogg. Tím dosahuje optimální komprese jak mluveného slova, tak i hudebních záznamů. Dokáže detekovat typy zvuků a kombinuje nízký stav predikce.79 V rámci pracovní skupiny IETF přispěl OPUS k programovému spojení například softwaru Mozilla nebo Skype. Odlišuje se od většiny kodeků, které jsou také vysoce kvalitní (např. AAC, MP3, Vorbis apod.), svou nízkou latencí a také tím, že je dostupný v bezplatném režimu. V neposlední řadě je OPUS také již součástí standardu pro novou komunikaci, která využívá webový prohlížeč WebRTC.80 Přípona těchto souborů je .opus.
78
Musepack [online], poslední aktualizace 18. 11. 2013 v 12:08. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Musepack 79 Opus (kompresní formát) [online], poslední aktualizace 15. 1. 2016 v 19:57. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW:https://cs.wikipedia.org/wiki/Opus_(kompresn%C3%AD_form%C3%A1t) 80 Opus (kompresní formát) [online], poslední aktualizace 15. 1. 2016 v 19:57. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW:https://cs.wikipedia.org/wiki/Opus_(kompresn%C3%AD_form%C3%A1t)
46
6.11 FORMÁT SPEEX Na komprimaci lidské řeči je také zaměřený volně dostupný formát Speex. Jedná se o ztrátovou komprimaci, která je projektovou součástí Ogg. Při zachování srozumitelnosti dosahuje velmi dobré komprese. Není předurčen na komprimaci telefonních hovorů.81 Speex používá tři vzorkovací kmitočty a to o frekvenci 8, 16 a 32 kHz. Tyto kmitočty se nastavují jako jeden z parametrů zpravidla od 0 do 10. Pro kompresi řeči má Speex několik variant82.
6.11.1 Voice Activity Detection V českém překladu detekce hlasové aktivity (VAD). Touto technologií se rozlišuje, zda řečník hovoří nebo dělá přestávku mezi slovy popřípadě větami. V takovém případě je vytvářeno pouze malé množství bitů.
6.11.2 Discontinuous Transmission Označuje se DTX a rozšiřuje předchozí technologii, která navíc detekuje delší mlčení. V tom případě se se však zcela zastavuje datový přenos.
6.11.3 Perceptual enhancement Zeslabuje šum tvořený kódováním a dekódováním. Tato technologie má subjektivně lepší výstupní zvukový požitek i přes to, že vzdaluje výstupní zvuk od původního. Obecně používají tyto soubory příponu .spx.
6.12 FORMÁT VORBIS
81
Speex [online], poslední aktualizace 18. 11. 2013 v 12:13. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Speex 82 Speex [online], poslední aktualizace 18. 11. 2013 v 12:13. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Speex
47
Tento soubor je typem ztrátové komprese a používá přípon .ogg nebo .oga. Měl být náhradou formátu MP3 a jeho vývoj zajišťovala organizace Xiph Org Foundation. Je také členem rodiny Ogg, a proto je taky někdy označován jako Ogg Vorbis. Ve své době byl jediným a určeným pro všeobecné použití. Byl také mylně pokládán za Ogg. Zajímavý je vznik jeho názvu, protože pochází z knihy Malí bohové, kde je jednou z důležitých postav jménem diákon Vorbis. Vorbis je po kvalitní stránce minimálně na stejné úrovni, jako formát Microsoftu Windows Media Audio. Dá se říct, že je i kvalitnější, než dnes už poměrně zastaralý, leč stále nejrozšířenější kodek MP3. Kvůli principu ztrátové komprese je však přesné srovnání takřka nemožné. Je to dané také tím, že lidské ucho je v podstatě nedokonalé a vypuštění některých frekvencí není na závadu z hlediska konečného vjemu. Dle konkrétní verze pracuje Orbis s přenosovou rychlostí od 45 do 500 kbit/s.83 Jeho nejčastější využití jsou zvukové soubory obsažené ve videohrách.
83
Vorbis [online], poslední aktualizace 6. 4. 2016 v 21:54. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Vorbis
48
7. MODULACE SIGNÁLU Pokud potřebujeme data (logické jedničky a nuly) přenášet po vodičích, stačí nám k tomu dvě napěťové úrovně. Pro bezdrátový přenos informací je tento způsob nepoužitelný pro svoje fyzikální vlastnosti. Proto musíme tyto napěťové úrovně přenášet pomocí jiného signálu a vzájemně tyto signály modulovat. V praxi se využívají různé druhy modulací: •
Amplitudová modulace
•
Frekvenční modulace
•
Fázová modulace
Obrázek 5 Druhy modulací
7.1 AMPLITUDOVÁ MODULACE Vyjdeme z obrázku 5 Druhy modulací. V horní části jsou znázorněny napěťové úrovně pro logickou nulu a jedničku. Jedná se tedy o digitální signál. V řádku a) je pak znázorněn harmonický signál, který budeme modulovat signálem logickým. Výsledkem je řádek b), kdy se logickou jedničkou mění amplituda výsledného signálu.
49
7.2 FREKVENČNÍ MODULACE U frekvenční modulace se změní logickou jedničkou frekvence (kmitočet) signálu, obrázek 5 c). Takže výsledný signál je frekvenčně různý v závislosti na digitálním signálu.
7.3 FÁZOVÁ MODULACE Ta je znázorněna na obrázku 5 d). Původní harmonický signál je opět ovlivněn signálem digitálním. V případě příchodu logické jedničky dojde k fázovému posuvu harmonického signálu. Následný příchod logické nuly způsobí další fázový posuv. Pokud touto modulací vznikají jen dva rozlišitelné stavy výsledného signálu (fázový posuv 0° a 180°), hovoříme o modulaci dvoustavové. Ta nese jednobitovou informaci, protože dva rozlišitelné stavy mohou reprezentovat pouze dvě logické hodnoty. V praxi se však můžeme setkat i s více stavovou modulací. U používané čtyřstavové modulace nastává fázový posun o 0, 90, 180 i 270 stupňů. Pak se jedná o dvoubitovou informaci.
Aby bylo možné přenášet i více bitové informace, tak se používá kombinace modulací, například v telefonních modemech se kombinuje fázová modulace s modulací amplitudovou.
7.4 MODULAČNÍ A PŘENOSOVÁ RYCHLOST Počet změn nosného signálu za jednotku času (v sekundách) vyjadřuje modulační rychlost. Měří se v Baudech a užívaná zkratka je Bd. Ta ale nic neříká o tom, jak velké množství informace je přenášeno.84 Naopak přenosová rychlost udává množství přenesených informací za jednotku času. Vyjadřuje se v bitech za sekundu a z anglického bits per second se užívá zkratka bps. Naopak přenosová rychlost neříká nic rychlosti změn výsledného signálu.
84
Peterka, Jiří. Modulační a přenosová rychlost. In. eArchiv.cz [online], 24. 9. 1996 . [cit. 25. 4. 2016], Dostupné z WWW: http://www.earchiv.cz/a96/a639k150.php3
50
V případě dvoustavové modulace je rychlost modulační rovna rychlosti přenosové. Při použití čtyřstavové modulace vyjadřuje jeden stav výsledného signálu dvoubitovou informaci, ale přenosová rychlost je číselně dvojnásobná.85
85
Peterka, Jiří. Modulační a přenosová rychlost. In. eArchiv.cz [online], 24. 9. 1996 . [cit. 25. 4. 2016], Dostupné z WWW: http://www.earchiv.cz/a96/a639k150.php3
51
ZÁVĚR Bakalářská práce se zabývá současnými formáty pro záznam zvuku. Postupně popisuje cestu zvuku od zdroje přes snímač k záznamovému zařízení. Věnuje se dnes již historickým analogovým metodám záznamu zvuku založeným na mechanickém, optickém a elektromagnetickém principu. Dále se práce zabývá digitalizací signálu a jejím využitím pro kvalitní záznam zvuku včetně využití komprese pro zmenšení objemu zaznamenávaných dat. V další části práce jsou uvedeny jednotlivé formáty pro záznam zvuku v závislosti na použitém způsobu komprimace signálu. Z uvedeného přehledu je patrné, že existuje velké množství záznamových formátů. Není jednoduché říci, který z formátů je nejlepší, protože každý z nich byl vytvořen za jiným účelem. Některé formáty jsou používanější než jiné, některé jsou výhodnější z hlediska délky záznamu, jiné z hlediska maximální kvality. Pro běžné použití a pro širokou veřejnost je nejoblíbenější formát MP3. Tento formát se užívá pro záznam především hudebních dat, protože při své poměrně vysoké kvalitě záznamu je v podstatě nejúspornějším, co se týká místa na disku nebo jiných záznamových médiích. Dnes jsou i přehrávače standardně vybaveny pro přehrávání formátů MP3, ať už se jedná o malé kapesní přehrávače nebo o přehrávače, které jsou součástí audio systémů. Takže i CD, na kterém je záznam v MP3 formátu, lze bez problémů přehrávat. Navíc i telefonní přístroje a prakticky veškerá elektronika tento typ souboru dokáže zpracovat a proto je tak oblíbený a rozšířený. Pro domácí prostředí a lepší kvalitu záznamu při použití lepšího zvukového systému je výhodnější formát FLAC. Časté využití najde při zálohování hudebních CD jako prevence proti poškození média, kde nedochází ke ztrátě kvality skladby. Důvodem může být nejen zálohování jako prevence, ale i jako základ pro úpravu skladeb pomocí ekvalizéru či jiného k tomu určenému softwaru. V případě formátu FLAC, bezztrátovém zvukovém formátu, se vysoká kvalita zvukového záznamu odráží v rostoucí výsledné velikosti zvukového souboru, který může být oproti ztrátovému formátu MP3 až desetinásobný. Starší, ale mezi veřejností velmi známý, je formát WAV, který se nejčastěji používá pro záznam hlasu. Je též, podobně jako formát FLAC, bezeztrátový, díky čemuž se s ním dá pohodlně pracovat. Uživatelé, používající operační systém Windows, se s ním setkávají v aplikaci zvané „záznam zvuku“. Také hráči počítačových her, ať na profesionální či amatérské úrovni, mohou tento formát využít pro záznam hlasu, vkládaného do videí z her zvaných let´s playe. Mnohdy se využívá jako pracovní formát při různém zpracování zvukových formátů, například při jejich archivaci nebo přenosech, navíc v nejvyšší kvalitě. 52
Digitální technologie umožňují nahrávat zvuk (hudbu) v kvalitě nerozeznatelné od originálu. Tato možnost se otevírá nejen profesionálům, ale i běžným uživatelům. Každé PC je dnes již v operačním programu přímo od výrobce vybaveno možností zpracovávat zvuk. Mezi nezbytné základní součásti patří zvuková karta, ať integrovaná nebo speciální přídavná a vhodná reprodukční sestava nebo alespoň kvalitní sluchátka připojená na zvukový výstup stolních PC i notebooků. V současnosti se rozšiřuje přenos zvukového výstupu do reproduktorů bezdrátovou technologií, např. pomocí Bluetooth.
53
SEZNAM ZDROJŮ KNIŽNÍ ZDROJE Autorský kolektiv (přeloženo z němčiny). Průmyslová elektronika a informační technologie. Praha: 8. vydání 2003. ISBN 80-86706-04-4.
BEZDĚK, Miloslav. Elektronika III. České Budějovice: Kopp, 2004.ISBN 80-7232-241-9
BEZDĚK, Miloslav. Elektronika I: učebnice. 2. vyd. České Budějovice: Kopp, 2007. ISBN 978-80-7232-321-0.
ČEŠKOVÁ, Martina. Hudba na počítači. Praha: Grada, 2003. ISBN 80-247-0811-6.
DOBEŠ, Josef, ŽALUD, Václav. Moderní radiotechnika. Praha: BEN, 2006. ISBN 80-7300132-2.
KAPOUNOVÁ, Jana. Elektronické kompetence. Ostrava: Ostravská univerzita, 2008. ISBN 978-80-7368-565-2.
KESL, Jan. Elektronika I. Analogová technika. Praha: BEN 2003. ISBN 80-7300-074-1.
Kolektiv autorů: Matematické,fzikální a chemické tabulky pro střední školy. Dotisk 3.vydání. Praha. Prometheus. 1997. ISBN 80-85849-84-4
MALINA, Václav. Poznáváme elektroniku V. České Budějovice: KOPP 2001.ISBN 80-7232114-5
SMETANA, Ctirad, a kol. Hluk a vibrace. Měření a hodnocení. Praha: Sdělovací technika, 1998. ISBN 80-90 1936-2-5.
UHLÍŘ, Jan., KŘEČAN, Zdeněk. Elektrotechnika pro 2. a 3. ročník SOU: učební text. 3., nezm. vyd. Praha: SNTL, 1990. ISBN 80-03-00161-7. 54
VLACHÝ, Václav. Praxe zvukové techniky. 2. aktualiz. vyd. Praha: Muzikus, c2000. ISBN 80-86253-05-8.
55
INTERNETOVÉ ZDROJE AAC [online], poslední aktualizace 22. 8. 2014 v 22:09. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AAC
Adaptive Transform AcousticCoding [online], poslední aktualizace 9. 3. 2013 v 11:02. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Adaptive_Transform_Acoustic_Coding
Akustika [online], poslední aktualizace 7. 3. 2016. [cit. 25. 4. 2016], WikiSkripta. Dostupné z WWW: http://www.wikiskripta.eu/index.php/Akustika
AMR(kodek) [online], poslední aktualizace 10. 12. 2013 v 21:19.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/AMR_(kodek)
Apple Lossless [online], poslední aktualizace 15. 4. 2016 v 22:16. [cit. 26. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Apple_Lossless
Asociace akustiky č.s. Akustický slovník. In asociaceakustiky.cz [online]. Dostupné z WWW: http://www.asociaceakustiky.cz/akusticky-slovnik
Audiokodeky.In gymozart.cz [online], [cit. 25. 4. 2016]. Dostupné z WWW: http://www.gymozart.8u.cz/souborygympl/elearning/svt/teorie/25.Audiokodeky.pdf
CD-RW[online], poslední aktualizace 8. 5. 2014 v 17:42. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/CD-RW
Dolby Digital [online], poslední aktualizace 17. 4. 2016 v 22:59. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Dolby_Digital
Dopplerův jev [online], poslední aktualizace 19. 2. 2016 v 19:07.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Doppler%C5%AFv_jev 56
Free Lossless Audio Codec [online], poslední aktualizace 1. 4. 2016 v 08:15 [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Free_Lossless_Audio_Codec
G.711 [online], poslední aktualizace 9. 4. 2016 v 16:34. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/G.711
Goertzelův algoritmus [online], poslední aktualizace 16. 4. 2013 v 15:52. [cit. 25. 4. 2016], Panwiki.panska.cz/. Dostupné z WWW: http://panwiki.panska.cz/index.php/Goertzel%C5%AFv_algoritmus
http://www.audified.com/projekt/ft-ta3010/page5/page9/page9.html
Kadlec, Luke. Historie záznamu zvuku. In test-nastroju.webnode.cz [online]. Luke Kadlec © 2011 [cit. 25. 4. 2016], Dostupné z WWW: http://test-nastroju.webnode.cz/nahravani/historiezaznamu-zvuku/
Klíčování amplitudovým posuvem [online], poslední aktualizace 17. 1. 2016 v 19:04. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Kl%C3%AD%C4%8Dov%C3%A1n%C3%AD_amplitudov%C 3%BDm_posuvem
Klíčování fázovým posuvem [online], poslední aktualizace 25. 2. 2016 v 15:32.. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Kl%C3%AD%C4%8Dov%C3%A1n%C3%AD_f%C3%A1zov %C3%BDm_posuvem
Klíčování frekvenčním posuvem [online], poslední aktualizace 21. 11. 2014 v 19:02. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Kl%C3%AD%C4%8Dov%C3%A1n%C3%AD_frekven%C4%8 Dn%C3%ADm_posuvem
57
Kompaktní disk[online], poslední aktualizace 11. 4. 2016 v 16:09. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Kompaktn%C3%AD_disk
Komprese dat[online], poslední aktualizace 7. 5. 2015 v 11:38. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Komprese_dat
Modulace [online], poslední aktualizace 12. 6. 2015 v 01:41. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Modulace
Modulace při přenosu v přeloženém pásmu. In. eArchiv.cz [online] [cit. 25. 4. 2016], Dostupné z WWW: http://www.earchiv.cz/a91/gifs/p142c112.gif
Musepack [online], poslední aktualizace 18. 11. 2013 v 12:08. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Musepack
Musical Instrument Digital Interface[online], poslední aktualizace 18. 2. 2016 v 00:36. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Musical_Instrument_Digital_Interface
Opus (kompresní formát) [online], poslední aktualizace 15. 1. 2016 v 19:57. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW:https://cs.wikipedia.org/wiki/Opus_(kompresn%C3%AD_form%C3%A1t)
Otevřená škola. Dj za 10 dní – pracovní sešit. In otevrena-skola.cz [online]. Dostupné z WWW: www.otevrena-skola.cz/cms/get/file.php?id=446
Peterka, Jiří. Modulační a přenosová rychlost. In. eArchiv.cz [online], 24. 9. 1996 . [cit. 25. 4. 2016], Dostupné z WWW: http://www.earchiv.cz/a96/a639k150.php3
58
Reichl, Jaroslav, Všetička,Martin. Magnetický záznam zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. [cit. 25. 4. 2016], Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/1348-magneticky-zaznam-zvuku
Reichl, Jaroslav, Všetička,Martin. Optický záznam zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/1344-opticky-zaznam-zvuku
Reichl, Jaroslav, Všetička,Martin. Pohybující se zdroj. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/191-pohybujici-se-zdroj
Reichl, Jaroslav, Všetička,Martin. Princip optického záznamu zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/1346-princip-optickeho-zaznamu-zvuku
Reichl, Jaroslav, Všetička,Martin. Rychlost zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/189-rychlost-zvuku
Reichl, Jaroslav, Všetička,Martin. Výška zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/194-vyskazvuku
Reichl, Jaroslav, Všetička,Martin. Základní dělení zvuku. In Encyklopedie fyziky. [online]. Copyright © 2006 – 2016. Dostupné z WWW: http://fyzika.jreichl.com/main.article/view/186-zakladni-deleni-zvuku
Speex [online], poslední aktualizace 18. 11. 2013 v 12:13. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Speex
59
Švec,Jiří. Komprese zvuku? Jen podvod na uši! In Avmania.e15.cz/ [online]. 10. 6. 2009 [cit. 27.4.2016]. Dostupné z: http://avmania.e15.cz/komprese-zvuku-jen-podvod-na-usi
Technimanie Science Center. Akustika – metodiky a pracovní listy. In techmania.cz [online]. Dostupné z WWW: http://techmania.cz/wpcontent/uploads/2015/07/techmania_metodika_AKUSTIKA_cz.pdf
Vorbis [online], poslední aktualizace 6. 4. 2016 v 21:54. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Vorbis
WAV [online], poslední aktualizace 1. 4. 2016 v 07:35. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/WAV
Windows Media Audio [online], poslední aktualizace 26. 10. 2014 v 20:52. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Windows_Media_Audio
Záznam a reprodukce zvuku [online], poslední aktualizace 1. 4. 2016 v 21:05. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Z%C3%A1znam_a_reprodukce_zvuku
Zvuk [online], poslední aktualizace 10. 2. 2016 v 16:43. [cit. 25. 4. 2016], Wikipedie. Dostupné z WWW: https://cs.wikipedia.org/wiki/Zvuk
60
SEZNAM POUŽITÝCH ZKRATEK HZ
hertz
KHZ
kilohertz
DB
decibel
MB
megabyte, megabit
GB
gigabit, gigabyte
CD
compact disc
DVD
digital versatile disc
HIFI
high fidelity
MIDI
musical instrument digital interface
ALAC
apple lossless codek
ALE
apple lossless encoder
FLAC
free audio codec
APE
monkey’s audio
WMA
windows media audio
IBM
international business machines
WAVE
waveform audio file format
AAC
advanced audio coding
AVI
audio video interleave
AMR
adaptive multi-rate compression
WB
wilde band
ATRAC
adaptive transform accoustic coding
PCM
phase change method
ISDN
integrated services digital network
MP3
music protocol 3
SBR
spectral band replication
VAD
voice activity detection
DTX
discontinuous transmission
PC
personal computer
BD
baud
Atd.
a tak dále
Např.
například
Tj.
to je 61
SEZNAM POUŽITÝCH TABULEK Tabulka 1: Šíření zvuku v některých materiálech a teplotách Tabulka 2: Význam zkratek Tabulka 3: Orientační přehled velikosti souboru při různých datových tocích a závislost frekvenční charakteristiky Tabulka 4: Orientační přehled velikosti souboru u různých druhů hudby a závislost frekvenční charakteristiky
SEZNAM POUŽITÝCH OBRÁZKŮ Obrázek 1: Analogový signál Obrázek 2: Vzorkování signálu Obrázek 3: Kvantování signálu Obrázek 4: Digitální signál Obrázek 5: Druhy modulací
62