SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
24. Audio formáty moderního videa (DTS, Dolby Digital) Kodek (složenina z počátečních slabik slov „kodér a dekodér“, respektive komprese a dekomprese; převzato z anglického codec analogického původu) je zařízení nebo počítačový program, který dokáže transformovat datový proud (stream) nebo signál. Kodeky ukládají data do zakódované formy (většinou za účelem přenosu, uchovávání nebo šifrování), ale častěji se používají naopak pro obnovení přesně nebo přibližně původní formy dat vhodné pro zobrazování, případně jinou manipulaci. Kodeky jsou základní součástí softwaru pro editaci (střih) multimediálních souborů (hudba, filmy) a často se používají pro videokonference a distribuci multimediálních dat v sítích (streamování). Zvuková i obrazová data mohou navíc obsahovat i doplňující informace (metadata), která umožňují obě složky synchronizovat. Kodek je někdy zaměňován s formátem audia nebo videa. Ten je daný svojí specifikací, která může nebo nemusí být veřejně dostupná. Příkladem specifikace je standard MPEG Layer 3 známý jako MP3. Autoři kodeků pak vyvíjejí softwarové nebo hardwarové implementace, které s tímto formátem pracují. Známými kodeky pro MP3 jsou například LAME, FhG (Fraunhofer-Gesellschaft), Blade nebo Xing. Pojmy kodek a formát se v poslední době velmi často zaměňují a vede to ke zmatení uživatelů. V některých případech k tomu přispívá fakt, že se někdy název kodeku shoduje s názvem formátu. Příkladem takových kodeků jsou Lagarith, HuffYUV nebo WMV. Přesto je třeba toto rozlišovat a to zvláště u kodeků, kde jejich název není shodný s formátem, který produkují. To je případ asi dvou nejznámějších kodeků - DivX a Xvid, které oba pracují se stejným formátem MPEG-4 ASP. To mimo jiné znamená, že jsou kompatibilní (video zakódované jedním z nich lze dekódovat pomocí jiného). Výrobci elektroniky často deklarují „podporu DivX”. Tato formulace je už sama o sobě špatná. Správně by mělo být napsáno, že takový přístroj podporuje MPEG-4 ASP. Přehraje tedy video vytvořené libovolným kodekem, jehož výstupem je MPEG-4 ASP. Jako kodek je také velmi často nazýván dekodér. Přehrávače videa nepoužívají pro svoji práci kodeky. Chybí zde totiž první část této složeniny - kodér. Přehrávače video pouze přehrávají (na rozdíl od programů pro střih videa). To samé platí i obráceně. O programu x264 lze těžko mluvit jako o kodeku, protože video umí pouze zkomprimovat, nedokáže jej již zpět dekódovat. Správně by tedy mělo být řečeno, že x264 je kodér pro formát MPEG-4 AVC (H.264) a například přehrávač Media Player Classic zase obsahuje integrovaný dekodér formátu MPEG2. Kodeky rovněž nelze zaměňovat s tzv. kontejnerem. Ten umožňuje uložit zvuková, obrazová i jiná data do jednoho souboru – v souborech s příponami „.ogg“, „.mpg“, „.avi“, „.mov“ atd. jsou informace zakódované kodeky pouze uloženy. Kontejnery se liší ve formátech, které mohou obsahovat. Mezi univerzální kontejnery patří např. AVI a Matroska. Ztrátové formáty fungují tak, že je část informace úplně vypuštěna. Jedná se o tu část dat, která je nejméně důležitá pro poslech a běžný posluchač ji v nahrávce ani neslyší. Použijeme-li ztrátový formát, tak velikost výsledného souboru je rovna přibližně 10-16% původního souboru (při běžně použí-
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
vaných nastaveních). U bezeztrátových audio kodeků bývá velikost výsledného kolem 60% velikosti souboru původního.
Prostorová konfigurace reproduktorů • • •
•
• • •
• • • •
1.0 – mono. S tímto formátem už se dnes prakticky příliš nesetkáte, jedině tak u skutečně starých CRT televizorů či příručních „tranzistoráčků“. 2.0 – obsahuje pouze kanály náležící přednímu páru reproduktorů a přenášený signál může být stereofonní nebo monofonní. 2.1 – přední pár reproduktorů je doplněn o subwoofer přenášející společnou basovou složku. Nejde tedy o samostatný třetí kanál přenášející nízké kmitočty, ale o jeho vytvoření sečtením signálu z obou předních kanálů (a filtrací jejich vyšších kmitočtových složek). 4.0 – přední pár reproduktorů je doplněn o pár zadních (surroundových) reproduktorů, kromě LFE (Low Frequency Effects, informace o basové složce) kanálu oproti konfiguraci 5.1 není zastoupen ani centrální kanál, hrají zde jen reproduktory po stranách poslechového prostoru. 4.1 – sestava 4.0 doplněna kanálem LFE. 5.0 – doplnění sestavy 4.0 o centrální kanál, v této konfiguraci není zastoupen LFE kanál a basová složka tohoto kanálu je přenášena jednotlivými hlavními kanály. 5.1 – tedy 5 hlavních kanálů v rozsahu 20Hz – 20kHz a jeden kanál LFE nesoucí basovou složku v pásmu do 120 Hz. Rozložení jednotlivých kanálů v prostoru je patrné z obrázku níže, kde hlavní kanály – centrální (3. Center) by se měl nacházet přímo v ose mezi poslechovým místem (1.) a zobrazovací plochou, levý a pravý přední kanál (2. L, R – front) by se měly nacházet po stranách zobrazovací plochy v odklonu od pozorovací osy 22° - 30° (4), zadní kanály (6 Ls, Rs – surround) se nachází po stranách pozorovacího místa v odklonu 90° - 110° od pozorovací osy, basová složka (LFE) je reprezentována subwooferem (5. Sub) a jelikož se jedná o nejnižší frekvence zvukového spektra, které se dobře přenáší prostorem a nejsou zatíženy směrovostí reproduktoru, může být jeho umístění v prostoru téměř libovolné. 6.1 – sestava 5.1 je doplněna o zadní centrální kanál, který leží v ose mezi poslechovým místem a zobrazovací plochou. 7.1 – další evoluční varianta sestavy 5.1, tentokrát je sestava doplněna o pár zadních reproduktorů, které se nachází v prostoru za surroundovými reproduktory pod úhlem 135°- 150°. 9.1 – tato konfigurace je využívána systémem Dolby Pro Logic IIz, kdy nad předními reproduktory jsou umístěny další dva přední horní reproduktory. 10.2 – sestava disponující 12 kanály: 7 předních kanálů, 3 surroundové a 2 LFE kanály. Existují velmi drahé přístroje, které vám umožní dopřát si poslech tohoto formátu doma v obýváku, např. i u nás běžně dostupný Pioneer SC-LX90 s cenou pohybující se na úrovni 200 000 Kč, ovšem jen těžko seženete zdroj multimediálního obsahu s tímto zvukovým formátem. Na běžných DVD a Bluray médiích na českém trhu se zatím příliš nevyskytuje ani formát 7.1, natož pak nějaký s ještě větším počtem kanálů.
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
Rozmístění reproduktorů v systému 10.2.
optických disků. Laserdisc měl rozměry gramofonových desek, a sloužil k záznamu a distribuci filmů a jiných videozáznamů. Laserdiscy byly oboustranné. Obraz s rozlišením přibližně
Laserdisc (zkratka LD) byl vůbec prvním formátem
400 řádků se na ně zaznamenával analogově, zvuk analogově či digitálně, přičemž mohl využívat i prostorové ozvučení ve formátech
Dolby Surround, Dolby Di-
gital či DTS.
Přehled filmových audio formátů 1. Digital Theater Systém (DTS) Digital Theatre System (DTS) je digitální vícekanálový formát prostorového ozvučení se ztrátovou kompresí, používaný především pro ozvučení filmů v kinech, discích DVD Video, nebo Blu-ray discích, přičemž jsou menší technické rozdíly mezi domácími a komerčními variantami. DTS vytvořila roku 1993 společnost Digital Theater Systems, která se často také označuje jako DTS. DTS je přímým konkurentem formátu Dolby Digital. Společnost založil roku 1990 Terry Beard a financuje ji společnost Universal City Studios. Spoluzakladatelem a spoluvlastníkem této společnosti je také filmový režisér Steven Spielberg, který vycítil, že filmové zvukové formáty, existující před založením společnosti, již nevyhovují potřebám kvalitního zvuku ve filmovém průmyslu, kde kvalitní zvuk nabyl krajního významu. Práce na formátu začaly roku 1991, přibližně ve stejné době, kdy společnost Dolby Laboratories začala pracovat na svém novém kodeku Dolby Digital. Ozvučení ve formátu DTS poprvé použil roku 1993 Steven Spielberg ve svém filmu Jurský park, což bylo necelý rok po premiéře prvního filmu se zvukem ve formátu Dolby Digital. Když se tento film objevil koncem roku 1993 na laserdiscu, byl současně prvním komerčně prodávaným titulem obsahujícím DTS, zatímco první komerčně prodávaný titul se zvukem ve formátu Dolby Digital, se objevil až roku 1995! Co se prostorové konfigurace reproduktorů týče, jsou obě platformy vzájemně kompatibilní (není nutné měnit rozestavení reprobeden v místnosti při přehrávání formátů Dolby a DTS, které mají stejný počet kanálů).
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
Datové toky a rozlišení formátu DTS Maximální datový tok formátu DTS je 1536 kbit/s, ale disky DVD Video nejčastěji využívají datový tok 768 kbit/s, který u formátu DTS představuje spodní hranici. Obvykle používané rozlišení je 20 bitů při frekvenci 48 kHz, ovšem nejnovější varianta DTS 96/24, kterou využívá DVD Audio, umožňuje rozlišení 24 bitů při frekvenci 96 kHz. Další nepříliš často využívané frekvence jsou 44,1 a 88,2 kHz. Pro kompresi signálu se používá CAC (Coherent Acoustic Coding) s kompresním poměrem 4:1 až 8:1.
DTS 5.1
Stejně jako konkurenční Dolby Digital se nejčastěji vyskytuje v konfiguraci reproduktorů 5.1 která se shoduje, ale tyto formáty nejsou navzájem kompatibilní, je tedy nutné na zvukovou stopu zakódovanou systémem DTS použít patřičný DTS dekodér. Tento formát je rovněž zatížen ztrátovou kompresí. Co se médií týče, byla cesta formátu DTS totožná jako Dolby Digital – taktéž byl nejdříve nasazován do kin, kde tomuto formátu náležela pozice mezi Dolby Stereo a okénky filmu, poté se dostal na CD, a nakonec i na DVD a Blu-Ray. V současnosti je to nejrozšířenější varianta DTS formátu.
DST-HD Master Audio – bezztrátový formát
Tento formát podporuje teoreticky neomezený počet virtuálních surroundových kanálů, které můžou být downmixovány do 5.1, nebo 2 kanálů (v přehrávačích, které nepodporují DTSHD), a může přenášet audiosignál v datových tocích dosahujících kvality bezztrátové komprese s 24bitovou hloubkou a 192kHz vzorkovací frekvencí. DTS-HD MA podporuje variabilní datové toky do 24.5 Mb/s na Blu-Ray disku s dvěma kanály vzorkovanými na 192 kHz, nebo s osmi kanály na 96 kHz s 24bitovou hloubkou. DTS-HD Master Audio signál obsahuje 2 datová streamy: klasický (core) DTS a tzv. reziduální stream, jakýsi bitový doplněk ztrátového DTS do originálního signálu. Tento převod provádí tzv. enkodér při vytváření (autorizaci) disku (filmu). Přehrávač podporující DTS-HD zpracuje oba streamy a film má tak uživatel k dispozici v nejvyšší možné kvalitě, naopak „obyčejný“ přehrávač zpracuje „pouze“ klasický DTS „core“ stream. 6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
Poznámka: DTS-HD je kódováno vždy jako VBR (variable bit rate).
DTS-HD Master Audio lze propojit s receiverem domácího kina následujícími způsoby: • •
•
Přes 6, 7, nebo 8 jednotlivých analogových kabelů s využitím vnitřního dekodéru a převodníku v přehrávači. Přes HDMI 1.1 jako 6, 7, nebo osmikanálový signál dekódovaný v přehrávači a odeslaný do receiveru jako PCM datový tok, kde je následně převeden na analogový signál. Přes HDMI 1.3 jako původní DTS-HD Master Audio signál, dekódovaný a převedený v receiveru.
DTS-HD Master Audio je konkurentem formátu Dolby TrueHD.
Formát
Počet kanálů Max. datový tok
DTS Digital Surround
5.1
1,524 Mb/s
DTS-HD Master Audio (bezztrátový)
8 (48 kHz, 96 24,5 Mb/s kHz), 6 (192 kHz)
Vzorkovací frekvence 48 kHz 48 kHz, 96 kHz, 192 kHz
2. Dolby Digital
Dolby Digital (původní označení AC-3) je označení digitální ztrátové komprese zvuku, vyvinuté společností Dolby Laboratories roku 1991. Je přímým následníkem formátů Dolby Stereo, resp. Dolby Surround a konkurentem formátů DTS a SDDS. Nejčastěji se vyskytuje v konfiguraci 5.1 kanálů (pět hlavních plnorozsahových kanálů a jeden nízkofrekvenční „basový“ LFE kanál využívaný subwooferem při explozích a podobně), ale podporováno je i stereo, mono, Dolby Surround a některé další konfigurace. Plnorozsahové kanály mají rozsah od 20 Hz do 20 kHz, LFE kanál má rozsah do 120 Hz. Původně se tento formát používal v kinech (zde vždy v konfiguraci 5.1, od roku 1998 i v konfiguraci Dolby Digital Surround EX), později se začal používat i na laserdiscích, v digitálním televizním vysílání a je to i základní formát pro kódování zvuku na DVD. Dá se nicméně použít i jako součást videosouborů AVI, OGM, nebo MKV. Zvukové soubory formátu Dolby Digital mají typicky příponu ac3. V současné době patří Dolby Digital mezi nejrozšířenější formáty kódování zvuku, nejčastěji v konfiguraci 5.1. Velice často se s ním setkáváme v kinech vybavených prostorovým zvukem
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
a na discích DVD a Blu-ray. Na zvukovou stopu AC-3 můžeme narazit také u souborů komprimovaného videa, abychom byli schopni správně dekódovat zvukovou složku, je třeba vybavit PC vhodným audio kodekem, nebo přehrávačem, který si s tímto formátem dokáže poradit.
Datové toky Audiostandard AC-3 může mít maximální datový tok 640 kbit/s. U DVD Videa má maximální datový tok 448 kbit/s, přičemž nejčastějšími datovými toky na DVD-Video jsou 192 nebo 224 kbit/s pro konfiguraci 2.0 a 2.0 Surround, 384 nebo 448 kbit/s pro konfigurace 5.0 a 5.1, a 448 kbit/s pro konfigurace 5.1 EX. Maximální datový tok při použití u digitálního televizního vysílání je 448 kbit/s. Maximálním datovým tokem při použití na ATSC je 384 kbit/s.
Nejznámější konfigurace • • •
Dolby Digital 1.0 – mono Dolby Digital 2.0 – obsahuje 2 zvukové kanály a může být buď stereo nebo mono. Dolby Digital 5.1 – nejčastější varianta, obsahující 5 hlavních plnorozsahových kanálů (přední levý, střední, přední pravý, zadní levý a zadní pravý) a jeden LFE kanál. Prvním filmem v tomto formátu byl Batman se vrací z roku 1992.
Dolby TrueHD – bezztrátový formát
Dolby TrueHD je vylepšený bezztrátový multi-kanálový zvukový kodek vyvinutý laboratořemi Dolby, pro domácí multimediální zařízení s vysokým rozlišením, tedy Blu-ray přehrávače. Je to nástupce Dolby Digital AC-3, který je určen pro standardní DVD disky. Konkurenčním bezztrátovým kodekem je DTS-HD Master Audio od společnosti DTS. Specifikace Dolby TrueHD zajišťuje 100% bezztrátovou technologii přenosu prostorového vícekanálového zvuku. Díky použitému kódování je přenášený zvuk identický se studiovým záznamem. Počet kanálů: 14 Vzorkovací frekvence: 44,1–192 kHz Vzorkovací poměr: konstantní na všech kanálech Bitová hloubka: 24 bitů Datový tok: až 18 Mb/s na discích Blu-ray Přenos mezi zařízeními Dolby TrueHD může být přenášeno do přijímačů domácího kina jako 5.1 nebo 7.1kanálový
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
zvuk v bezztrátovém formátu v jedné z následujících konfiguraci, v závislosti na schopnostech přehrávače a receiveru. •
• •
Přes 6 nebo 8 analogových linek s využitím interního dekodéru a převodníku z digitálního na analogový signál v přehrávači. Do receiveru pak vede 8 analogových linek a funguje v roli 8kanálového zesilovače. Přes HDMI 1.1 jako 6 nebo 8kanálový zvuk ve formátu Linear PCM, jenž je dekódován přehrávačem a z digitálního na analogový signál převeden v receiveru. Přes HDMI 1.3 jako originální TrueHD datový tok, jenž je dekódován a převáděn na analogový signál až převodníky v receiveru.
Dolby TrueHD je formát určený pro využití k přenosu zvuku na HD médiích, se svými 14 kanály má obrovskou rezervu do budoucna, jelikož dosavadní dostupná HD média jsou limitována do 7.1 kanálů. 24bitová hloubka zaručuje dostatečnou dynamiku přenášeného zvuku, a vylepšené bezztrátové kódování garantuje věrné přenesení audio signálu tak, jak opustí zvukové studio. Ještě malá tabulka shrnující nejdůležitější parametry formátu Dolby Digital: Formát
Počet kanálů
Max. datový tok
Dolby Digital
2.0 až 5.1
640 kb/s
Dolby True HD (bezztrátový)
8 (48 kHz, 96 18,64 Mb/s kHz), 6 (192 kHz)
Vzorkovací frekvence
48 kHz 48 kHz, 96 kHz, 192 kHz
Z tabulky je patrné, že formáty společnosti DTS, která je vývojově mladší oproti laboratořím Dolby, se vždy snažily předčit svého konkurenta vyššími datovými toky, a tím pádem kvalitnějším přenášeným signálem a podle toho to také vypadá, na Blu-ray discích začíná v poslední době dominovat právě formát DTS.
6
SVT 4. ročník
24. Audio formáty moderního videa
2012/2013
3. Sony Dynamic Digital Sound (bonus)
Konfigurace formátu SDDS
Sony Dynamic Digital Sound (oficiální zkratka SDDS) je formát digitálního prostorového zvuku, vyvinutého firmou Sony. Představuje konkurenci pro formáty Dolby Digital a DTS, avšak na rozdíl od nich je SDDS určen výlučně pro kina a nemá žádnou variantu pro běžné domácí použití. SDDS využívá konfiguraci 7.1 (5 za plátnem - levý přední, levý střed, střed, pravý střed, přední pravý + 2 zadní kanály) a jeden nízkofrekvenční LFE kanál. Ve většině kin nejsou nainstalované plátnové reproduktory pro levý střed a pravý střed, a tyto kanály jsou pomocí downmixové technologie dekódovány a přehrávány přes 3 obvyklé plátnové reproduktory.
Na filmovém pásu je zaznamenán na levé a pravé straně pásu mezi perforací a okrajem v podobě azurových pruhů. Záznam na jedné stráně pásu zálohuje záznam na straně druhé, informace v obou pruzích jsou tedy totožné.
6