VYSOKÁ ŠKOLA BÁŇSKÁ – TECHNICKÁ UNIVERZITA OSTRAVA
Fakulta elektrotechniky a informatiky
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO Garant předmětu: Přemysl Mer Autor textu: Přemysl Mer
Ostrava 2014
Vznik těchto skript byl podpořen projektem č. CZ.1.07/2.2.00/28.0062 Evropského sociálního fondu a státním rozpočtem České republiky.
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava Za odbornou náplň tohoto vydání odpovídá autor. Přemysl Mer je odborným asistentem na Fakultě elektrotechniky a informatiky VŠB Technické univerzity v Ostravě, kde přednáší předmět Multimediální technika pro studenty navazujícího magisterského studia, kurz Multimediální technika je na fakultě nabízen ve studijním programu Informační a komunikační technologie. Vznik skript byl podpořen projektem č. CZ.1.07/2.2.00/28.0062 Evropského sociálního fondu a státním rozpočtem České republiky. Tato publikace neprošla redakční ani jazykovou úpravou. © Přemysl Mer, 2014, VŠB - Technická univerzita Ostrava
Autor: Katedra: Název: Místo, rok, vydání: Počet stran: Vydala: Náklad:
Přemysl Mer Katedra telekomunikační techniky Multimediální technika pro integrovanou výuku VUT a VŠB-TUO Ostrava, 2014, 1. vydání 62 Vysoká škola báňská - Technická univerzita Ostrava elektronicky
Neprodejné ISBN 978-80-248-3568-6
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
1
Předmluva Cílem tohoto skripta je vytvořit studijní oporu v podobě tohoto učebního textu pro telekomunikační obory, především pro předmět Multimediální technika. Ten se předkládá studentům navazujícího magisterského studia v posledním semestru posledního ročníku jako předmět volitelný. Náplň je věnována praktické tvorbě multimediálních klipů a učební text tohoto druhu doposud chyběl. Obsah je proto přizpůsoben základnímu přehledu v problematice multimediálních technik a formuje jakýsi přehledný výčet multimediálních pojmů, principů a souvislostí. Zdaleka v této formě nepojmenoval a nevysvětlil všechny dostupné údaje a informace, které multimediální oblast nabízí. Díky dodržení předepsané délky dokumentu toto budiž ambice do budoucna, která povede k detailnějšímu a aktuálnějšímu doplňování, neboť vydání bude pouze v elektronické formě. Věřím, že tento materiál poslouží k lepší přípravě studentů a lepšímu pochopení zpracované problematiky. Vedle vysokoškolských studentů i díky přehlednosti a ucelenosti učebního textu může najít čtenáře i z řad zájemců o problematiku multimédií. Chtěl bych poděkovat svým kolegům a přátelům, kteří svými i kritickými připomínkami přispěli k dokončení tohoto skripta. Také děkuji doc. Ing. Martinu Vaculíkovi, PhD., který provedl recenzi.
2
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Obsah 1
ÚVOD ..................................................................................................................................4
2
TELEVIZNÍ SIGNÁLY A SYSTÉMY ............................................................................5 2.1 2.2 2.3 2.4 2.5
HISTORIE A VÝVOJ........................................................................................................... 5 ANALOGOVÝ TELEVIZNÍ SIGNÁL ..................................................................................... 6 ANALOGOVÉ TELEVIZNÍ NORMY...................................................................................... 7 DIGITÁLNÍ TELEVIZNÍ NORMY ....................................................................................... 10 DIGITÁLNÍ TELEVIZNÍ NORMY DRUHÉ GENERACE .......................................................... 13 2.5.1 DVB-T2...................................................................................................... 13 2.5.2 DVB-S2 ...................................................................................................... 15 2.5.3 DVB-C2 ..................................................................................................... 15 2.6 ROZLIŠENÍ A FORMÁTY.................................................................................................. 16 3
KOMPRESNÍ FORMÁTY MPEG ................................................................................19 3.1 MPEG 1 ........................................................................................................................ 20 3.2 MPEG 2 ........................................................................................................................ 23 3.2.1 Profily a úrovně MPEG-2 ......................................................................... 24 3.3 MPEG-4 ....................................................................................................................... 24 3.3.1 Audio a video kodeky pro MPEG-4........................................................... 25 3.3.2 Popis částí MPEG-4 standardu................................................................. 25 3.3.3 Profily a úrovně ......................................................................................... 27 3.3.4 Aplikace a využití ...................................................................................... 27
4
KODEKY ..........................................................................................................................29 4.1 VIDEO KODEKY ............................................................................................................. 29 4.1.1 Bezztrátové video kodeky .......................................................................... 29 4.1.2 Ztrátové video kodeky................................................................................ 31 4.2 AUDIO KODEKY ............................................................................................................. 33 4.2.1 Bezztrátové audio kodeky .......................................................................... 33 4.2.2 Ztrátové audio kodeky ............................................................................... 33
5
MULTIMEDIÁLNÍ KONTAJNERY ............................................................................35 5.1 FORMÁT RIFF ............................................................................................................... 35 5.2 KONTAJNERY TYPU AAF A MXF .................................................................................. 37 5.2.1 MXF ........................................................................................................... 38 5.2.2 AAF............................................................................................................ 38 5.3 ZÁKLADNÍ KONTEJNERY................................................................................................ 39 5.3.1 AVI ............................................................................................................. 39 5.3.2 ASF, WMV, WMA ...................................................................................... 40 5.3.3 MOV .......................................................................................................... 40 5.3.4 MKV, MKA, MKS ...................................................................................... 40 5.3.5 MP4 ........................................................................................................... 41
6
MULTIMEDIÁLNÍ ROZHRANÍ ..................................................................................43 6.1 USB (UNIVERSAL SERIAL BUS) .................................................................................... 43 6.1.1 Princip funkčnosti ..................................................................................... 44 6.1.2 Rychlost přenosu dat – verze USB ............................................................ 45 6.1.3 Napájení .................................................................................................... 45 6.1.4 Typy konektorů .......................................................................................... 45
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
3
6.1.5 Architektura USB ....................................................................................... 46 6.1.6 Typy přenosů dat ........................................................................................ 47 6.2 DVI ............................................................................................................................... 47 6.2.1 Konektory DVI ........................................................................................... 48 6.3 HDMI ............................................................................................................................ 48 6.3.1 Kompatibilita s DVI ................................................................................... 49 6.3.2 Konektory ................................................................................................... 49 6.3.3 Kabely ........................................................................................................ 50 6.3.4 Verze HDMI ............................................................................................... 51 6.4 IEEE 1394 ..................................................................................................................... 52 6.4.1 Verze FireWire ........................................................................................... 53 6.4.2 Porovnání multimediálních rozhraní ......................................................... 53 7
TVORBA MULTIMEDIÁLNÍCH MATERIÁLŮ....................................................... 55 7.1 ORIENTACE V ŽURNALISTICKÝCH STYLECH A JEJICH POUŽÍVÁNÍ ................................... 55 7.2 REPORTÁŽ ..................................................................................................................... 56 7.2.1 Základy při výrobě reportáže ..................................................................... 56 7.3 MULTIMEDIÁLNÍ KLIP .................................................................................................... 58 7.4 ZÁKLADY PRO STŘIH ...................................................................................................... 59 7.4.1 Lineární střih ............................................................................................. 59 7.4.2 Nelineární střih .......................................................................................... 59
SEZNAM POUŽITÉ LITERATURY .................................................................................. 61
4
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
1 Úvod Multimediální technika v současné době zažívá ohromný rozmach. Jsou to právě multimediální data, které se stávají největším artiklem na poli moderní telekomunikační sítě, které tak jsou nuceny poskytovat široký rozsah služeb. S multimediální technikou se dnes setkáváme na každém kroku, zvláště pak osobní koncová zařízení a způsob dnešní komunikace je směrován k multimediálním datům. Základ k tomu přinesl vývoj televizního vysílání, který lze chápat jako jednosměrný přenos multimediálních dat. V první kapitole je v kostce popsán její vývoj až po moderní digitální standardy. Pro rychlý a kvalitní přenos multimediálních digitálních dat je rozhodující jejich velikost v poměru k jejich kvalitě. Proto se další kapitoly věnují problematice komprese, kódování a dekódování a přenosových multimediálních kontajnerů. Je zde nastíněn přehled nejdůležitějších z nich se stručnými popisy. Přenos a distribuce multimediálních dat souvisí s jejím příjmem, proto shrnuje další kapitola přehled nejdůležitějších multimediálních rozhraní a jejich vlastnosti. V poslední kapitole je nastíněn postup při tvorbě některých multimediálních formátů.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
5
2 Televizní signály a systémy Televize a televizní vysílání patří dnes k neodmyslitelným součástem běžného života. Je to obrovský komunikační nástroj, který má obrovskou sílu při předávání informací, dokonce může formovat názor uživatele a v horším případě i manipulovat a ovlivňovat. Však se také hovoří o velmoci v souvislosti s televizí a tiskem. Uživatel je v tomto komunikačním řetězci v pasivní roli, jelikož přenos informací je jednosměrný. Televize je také zdrojem zábavy a vzdělání díky atraktivnímu zprostředkování multimediálních dat, tedy pohyblivého obrazu a zvuku.
2.1 Historie a vývoj Již v roce 1843 skotský hodinář Alexander Bain potvrdil, že přenos obrazu na dálku je možný, k čemuž je nutné obraz rozložit na řádky a body. Světelné body se převedou na elektrické impulzy a zpět, avšak rozklad i skládání musí probíhat synchronizovaně. O rozklad se postaral Paul Gottlieb Nipkow pomocí děravého rotujícího kotouče v roce 1883. V roce 1890 německý fyzik Karl Ferdinand Braun vynalezl obrazovou elektronku – katodovou trubici CRT (Catode Ray Tube). Jako mezinárodní standard byl zvolen v roce 1906 formát obrazu 4:3. V letech 1928 a 1929 již byly představeny první televize s rozlišením 30 resp. 60 řádků. Byl také objeven princip prokládání proti blikání obrazu (1930). V roce 1934 se začali na televizi dívat první diváci prostřednictvím několika desítek veřejně umístěných přijímačů. První "komerční" vysílání bylo uskutečněno v Berlíně v březnu 1935 se 180 řádky a 25 snímky za vteřinu. Ke snímání byl však ještě použit mechanický systém s rotujícím diskem. Stejný rok v listopadu se začalo vysílat i z Paříže na stejném principu. Vysílání s plně elektronickým systémem se 405 řádky začalo v roce 1937. Počet řádků pak ještě upravila Francie (455 řádků) a Německo (441), v roce 1941 byl zvolen v zámoří standard s 525 řádky a v roce 1952 byl ustaven standard pro vysílání v Evropě - měl 625 řádek při 50 půlsnímcích/s. Následně přišla barevná televize. Jelikož do roku 1949 již bylo v USA asi 10 mil. televizorů, byla nutná zpětná kompatibilita s černobílou. To znamenalo, že barevná televize měla umět přijímat černobílý obraz a stará černobílá vysílání barevné (i když černobíle). Přes mírné komplikace přišli dva tehdy největší výrobci CBS a RCA každý s novým systémem. Systém od RCA byl spolehlivější a tak byl v roce 1953 přijat standard pro barevný televizní signál NTSC (National Television Systém Committe) a začalo komerční barevné vysílání. Evropa kvůli válce mírně zaostala. První zpětně kompatibilní barevné vysílání sice bylo v provozu již v roce 1953, dále se však vylepšovalo a standardizováno bylo až v roce 1957 jako systém PAL (Phase Alternation Line). Ve Francii zároveň vznikl systém SECAM (Sequentiel Couleur Avec Mémoire). Barevné vysílání začalo ale až v roce 1967. V Československu se začalo vysílat černobíle v roce 1953, barevně v roce 1973. Již v roce 1972, kdy polovina TV přijímačů byla barevných, se začalo mluvit o digitální televizi. 1977 se začalo vysílat komerčně přes družici. Kolem roku 1980 byla představena první HDTV a byla představena první plochá TV. Letní olympiáda v Soulu 1988 byla jako první komerčně vysílána v HD rozlišení, o rok později pak byla přijata norma pro vysílání ve vysokém rozlišení. Tyto systémy však zatím byly dostupné jen pro hrstku vyvolených. [1] Největší rozmach digitálního vysílání začal v průběhu 90. let, kdy byly přijaty postupně standardy pro digitální satelitní vysílání DVB-S (1993), kabelové digitální vysílání DVB-C (1994) a konečně digitální terestriální (pozemní) DVB-T vysílání v roce 1995. V témže roce
6
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
bylo vyzkoušeno pozemní digitální vysílání ve Velké Británii a vyšla informace, že počet televizních přijímačů ve světě dosáhl jedné miliardy. V této době také začíná prodej prvních plazmových a LCD televizí. Vznik prvního set-top-boxu pro příjem digitálního vysílání se datuje na rok 1997. Od roku 2005 převládají HD televizory s plochou obrazovkou a úhlopříčky se dostávají až na 150 cm. Rok 2010 znamená příchod 3D obrazu a přichází také SMART TV (chytré televize) s přístupem na internet přes WIFI, filmotékou, sociálními sítěmi, atd.
2.2 Analogový televizní signál Velmi zjednodušeně se jedná o amplitudově modulovaný obrazový signál vysílaný s jedním postranním pásmem. Přidán je frekvenčně modulovaný zvuk. Barva se přenáší pomocí barvonosné složky umístěné „mezi řádky“ černobílého obrazu. To vše v 8 MHz širokém kanálu. Nevýhodou je malé využití kanálu při přenosu a mnoho informací přenášených zbytečně. Televizní kanál tvoří tedy řádky, mezi nimi barvonosná složka a zvukový doprovod. Jednotlivé kanály musí být vzdáleny tak, aby se vzájemně nerušili. Dochází tak k problému s nedostatečným počtem kanálů – televizních stanic. Toto je jeden z hlavních důvodů, proč se ustoupilo od analogového vysílání a přešlo se na vysílání digitální. Další nevýhodou jsou tzv. duchové, tedy degradace obrazu během přenosu vzduchem. Formát tohoto signálu je 4:3 při rozlišení 768x576 viditelných bodů pro normu PAL nebo 720x480 u NTSC. Celkem se přenáší 625 řádků (525 řádků), ale část není viditelná a pouze zajišťuje synchronizaci nebo např. službu teletextu. Jednotlivé body vytváří na stínítku obrazovky elektronový paprsek, který má za úkol rozsvěcování luminoforů (světelných bodů) na CRT obrazovce. Postupně vznikají řádky složené z půlsnímků, ze kterých se skládá obraz (viz. obrázek 1). Obraz jako celek vnímáme díky setrvačnosti lidského oka a luminoforů. Aby se alespoň z části zabránilo blikaní obrazu, používá se tzv. prokládané řádkování.
Obr. 1:
Skládání řádků na obrazovce
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
7
Pro dosažení dojmu plynulého pohybu bez blikání obrazu musí být přeneseno za 1s minimálně 25 snímků. Při vyšších jasech velkých ploch je kritický kmitočet blikání až 70 Hz. Snímková rychlost je také odvozena od kmitočtu sítě (50 Hz Evropa/60 Hz USA), tedy 50 půlsnímků (25 snímků/s) v Evropě (PAL) respektive 60 půlsnímků (30 snímků/s) v USA (NTSC). Tato technologie vydržela bez zásadních úprav téměř 75 let. Je to až neuvěřitelné při pohledu na vývoj ostatní elektroniky (mobily, počítače, …).
2.3 Analogové televizní normy Dá se označit za souhrn standardů kódování signálu pro televizní vysílání. Tuto normu musí splňovat všechny vysílače i přijímače. U analogové televize se definuje technická stránka, jako jsou parametry přenosu obrazového signálu, systém kódování barvy, systém pro vícekanálový zvuk a další informace šířené společně s televizním signálem (např. teletext). U digitální televize jsou všechny tyto složky součástí jediného systému. Jak již bylo zmíněno výše, postupně vznikly 3 základní analogové systémy barevného televizního vysílání. Jako první to byl v USA systém NTSC, o pár let později v Evropě vznikly dvě soustavy, v Německu PAL a ve Francii SECAM. Tyto tři systémy se rozšířily do všech částí světa, jak je vidět na obrázku 2 a základní parametry jsou shrnuty v tabulce 1. Tab. 1:
Základní parametry analogových televizních norem
Parametr Vznik Počet řádků
NTSC
PAL
SECAM
USA
Německo
Francie
525 (480)
625 (576) 15,625 MHz
Horizontální kmitočet
15,734 MHz
Půlsnímků/s
60 (30 sn/s)
625 (576) 15,625 MHz (15,750 MHz) 50 (25 sn/s)
Označení přenášené barvy
U & V nebo I & Q
U&V
Db & Dr
Kmitočet barvonosné vlny
3,58 MHz
4,43 MHz
4,25 nebo 4,4 MHz
Šířka TV signálu
4,2 MHz
5 MHz (4,2 MHz)
5 MHz (6 MHz)
Kmitočet nosného zvuku
4,5 MHz
5,5 MHz (6,5 MHz)
Varianty
4,43, J, M
5,5 MHz (4,5 MHz) B, D, G, H, I, N, M & Nc
Obr. 2:
Rozložení televizních norem ve světě.
50 (25 sn/s)
B, D, G, K, K1, P
8
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
V roce 1961 proběhla ve Stockholmu mezinárodní konference, na které Mezinárodní telekomunikační unie definovala soubor norem pro vysílání televizního signálu. Každá norma pro vysílání černobílého signálu má přiděleno jednopísmenné označení (A – M), které spolu s označením systému kódování barevné informace (NTSC, PAL, SECAM) jednoznačně definuje libovolný standard monofonního analogového televizního vysílání (např. PAL-B, NTSC-M apod. – viz. tabulka 2). Tab. 2: Snímková Norma Řádků frekvence [Hz]
Označení analogových televizních norem
Šířka Šířka Posun Postranní Modulace pásma obrazu zvuku pásmo Polarita Poznámky zvuku [MHz] [MHz] [MHz] [MHz] Zastaralý britský systém, pouze černobílá TV, jen VHF. První 5 3 −3,5 0,75 + AM televizní systém (cca 1936). Většinou jen VHF, kompromis mezi kvalitou systému D a účinností 7 5 5,5 0,75 − FM systému N. 7 5 5,5 0,75 + AM Zastaralý belgický systém, kompromis mezi B a L. Většinou jen VHF, vylepšení systému I, nejlepší kvalita obrazu z 8 6 6,5 0,75 − FM 625řádkových systémů. Zastaralý francouzský systém pro VHF. Velmi vysoká kvalita 14 10 ±11,15 2 + AM obrazu, ale plýtvá šířkou pásma. Zastaralý belgický a lucemburský systém, kompromis mezi 7 5 5,5 0,75 + AM systémy E a B. Jen UHF, víceméně systém B s upravenou roztečí kanálů. Mírně 7 5 5,5 0,75 − FM horší obraz než u systémů I a D.
A
405
25
B
625
25
C
625
25
D
625
25
E
819
25
F
819
25
G
625
25
H
625
25
8
5
5,5
1,25
−
FM
I
625
25
8
5,5
5,9996
1,25
−
FM
J
525
29,97
6
4,2
4,5
0,75
−
FM
K
625
25
8
6
6,5
0,75
−
FM
K’
625
25
8
6
6,5
1,25
−
FM
L, L'
625
25
8
6
6,5
1,25
+
AM
M
525
29,97
6
4,2
4,5
0,75
−
FM
N
625
25
6
4,2
4,5
0,75
−
FM
Belgie, Lucembursko, země bývalé Jugoslávie; jen UHF, víceméně systém G s rozšířeným postranním pásmem a vyšší roztečí kanálů. Spojené království, Irsko, JAR, Macao a Hongkong; lepší než systém B, ale horší než D. Japonsko; VHF a UHF, oproti systému M se používá jiná úroveň černé (0 IRE místo 7,5 IRE). Jen UHF, prakticky totožný se systémem D. Franc. zámořská území; kompromis mezi systémy L a D. Francie; Kvůli AM a pozitivní modulaci je o něco horší než systém D. L' se označuje norma, která je (byla) vysílána v 1. pásmu VHF. Nosná zvuku je před nosnou obrazu -6,5MHz a je vysíláno pouze mono (jedna nosná zvuku). Kanály na kterých je L' se také označují jako A, B, C, D; to jest čtyři kanály. Většina Ameriky, Filipíny, Jižní Korea, Čínská republika; až na Brazílii s PAL-M všichni NTSC-M. Argentina, Paraguay a Uruguay; lepší využití pásma na úkor zhoršené obrazové kvality.
Základní princip je u všech stejný. Přenáší se barevná informace o třech základních barvách. Červené (R), zelené (G) a modré (B). U klasických CRT televizí lze tyto barvy při pohledu zblízka na obrazovku vidět. Tyto tři barvy představují zároveň informaci o celkovém jasu obrazového bodu. Pokud sečteme tyto tři barvy (R+G+B), 0,3 0,59 0,11 (1) získáme tedy hodnotu jasu. Informace o jasu je ale předem známa. Jedná se o černobílý obraz. Vhodným normováním lze z hodnoty jasu a dvou známých barev dopočítat třetí barvu. Tedy ze složek R, G, B a Y vygenerujeme rozdílové hodnoty R-Y (CR) a B-Y (CB). Nepřenáší se tedy tři barvy, ale pouze dvě (chrominanční signál) společně s jasem (jasový signál). Tím se zajistila zpětná kompatibilita s černobílým systémem. Barevná informace se ukládá pomocí kvadraturní amplitudové (PAL, NTSC) nebo frekvenční (SECAM) modulace do spektra jasového signálu. Spektrum barvonosného signálu je užší, než černobíle, má tedy menší rozlišení barev. Lidské oko ale také není zcela dokonalé, takže nižší rozlišení nevnímá. NTSC (National Television Systém Committe) První soustava (slučitelná s černobílou televizí) Dnes používána i v Kanadě a Japonsku. Existuje i evropská varianta NTSC 4,43.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
9
K přenosu informace o barvě jsou použity signály UI/ a UQ/ (Amerika) nebo chrominanční signály UR/ - UY/ a UB/ - UY/ (Evropa). V obou případech se signály přenáší souběžně, kvadraturně namodulované na jednu barvonosnou vlnu. Využívá se kvadraturní modulace, kdy barvonosná vlna se rozloží na dvě složky posunuté vzájemně o 90°. Obě jsou amplitudově modulovány jedním chrominančním signálem. Barvonosná vlna je přitom potlačena. Sečtením obou modulovaných signálů vzniká kvadraturně modulovaný signál. Tento signál je tedy amplitudově i fázově modulovaný. Okamžitá hodnota obsahuje informaci o barevné sytosti, okamžitá fáze údaje o barevném tónu. Jestliže jsou oba chrominanční signály rovny 0, je nulová i výsledná amplituda barvonosné vlny (černobílý přenos). Velikost amplitudy odpovídá sytosti přenášené barvy, hodnota fáze = tón barvy. Energie jasového signálu EY je v kmitočtovém pásmu rozložena nerovnoměrně. Kmitočtový rozestup složek, jímž je přenášena, odpovídá řádkovému kmitočtu. Součtem kvadraturně modulovaného chrominančního signálu a jasového signálu získáme úplný zakódovaný barevný signál NTSC. Tento signál se přenáší do vysílače, kde je zpracován stejně jako signál černobílý. Pro vznik odpovídajícího barevného obrazu na obrazovce musíme získat z přijatého zakódovaného signálu zpět jednotlivá napětí UR, UG, UB. Těmi potřebujeme řídit proudy elektronových svazků jednotlivých trysek obrazovky. Plusem je jednoduchost přijímače a jednoduchost režijního zpracování. Největší nedostatek normy NTSC je značné zkreslení barevného tónu a sytosti barvy, z důvodu zkreslení signálu při přenosu. Dlouhodobé konstantní zkreslení jde opravit regulátorem barev v přijímači, dynamické změny však vylepšit nelze.
PAL (Phase Alternation Line) Soustava PAL byla vymyšlena počátkem 60. let firmou Telefunken v Německu. Používá se ve velké části Evropy, v Austrálii, částech Asie i Jižní Ameriky. V roce 1992 nahradila systém SECAM i tehdejším ČSFR. Vychází z principů soustavy NTSC. Periodickým střídáním fáze barvonosné složky o 180° v každém následujícím řádku se navíc kompenzuje lineární zkreslení, které výrazně postihuje soustavu NTSC. Z hlediska odstupu nosného kmitočtu obrazu od kmitočtu zvuku existují 2 varianty – PAL D/K (rozestup 6,5 MHz) a PAL B/G (rozestup 5,5 MHz) Díky určitého vylepšení dochází k obohacení spektra barvonosného signálu ve srovnání se soustavou NTSC. K proložení spekter jasového a barvonosného signálu musíme použít čtvrt-řádkový offset. Frekvence barvonosné vlny je 4,43 MHz. Jasová složka Y se přenáší v rozsahu pásma (0 - 5 MHz), chrominanční signály U, V jsou shodné jako u soustavy NTSC. Frekvenční šířka pásma každého signálu je však odlišná, 1,3 MHz. Všechny signály se amplitudově modulují na příslušnou nosnou s částečně potlačeným horním postranním pásmem (potlačení od 0,57 MHz). Výhodou systému PAL je přenos úplného informačního obsahu, odstranění citlivosti na fázorové zkreslení, kompenzace přeslechu mezi barevnými složkami způsobeným kmitočtovým omezením barvonosného signálu, kvalitnější mag.
10
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
záznam a kontrolu signálu a zároveň nejvyrovnanější přenosové vlastnosti. Dosah vysílače PAL je nejméně o 1/3 větší než u soustavy SECAM. Nevýhodou je složitější přijímač BTV (vyžaduje náročnější a přesnější zpožďovací linku než u SECAM U systému PAL se během jedné padesátiny sekundy (20 ms) musí vygenerovat kompletní obraz. Ten se skládá z 312,5 řádků. Jeden řádek tak má rovných 64 µs. Řádková frekvence je tedy 1/0.000064, což se rovná 15625 Hz. Každý řádek začíná horizontálním synchronizačním pulsem (HSYNC), který trvá 4 µs. Pak následuje 8 µs „tmy“ a následuje vlastní jasový signál, který trvá 52 µs. Videosignál má definované úrovně napětí (0–1V) pro jednotlivé situace. Synchronizačnímu pulsu odpovídá 0 V, černá je 0,3V a bílá 1.0V. Jeden řádek videosignálu (obr. 3) vypadá zhruba takto:
Obr. 3:
Ukázka jednoho řádku videosignálu
2.4 Digitální televizní normy Digitální obraz formátu 4:3 má v návaznosti na normu PAL rozměry 768x576 bodů (rozlišení 702x576). Formát 16:9 1024x576 bodů při stejném viditelném rozlišení. Tyto hodnoty byly navrženy s ohledem na jednoduchost A/D převodníků, které měli mít pouze jeden kmitočet pro Evropu (50 Hz) i USA (60 Hz). Uložení digitálního obrazu specifikuje zejména multiformátová norma ITU R 601 (dále také 629, 656, 657, 962 a další) společná pro PAL i NTSC. Celosvětově platné doporučení CCIR ITU-R 601 (Comité Consultatif International des Radiocommunications) pro digitalizaci složkových obrazových signálů obsahuje tyto základní parametry: Vzorkovací kmitočet jasového signálu Y je 13,5 MHz. Vzorkovací kmitočet chrominanční složky CR, CB je 6,75 MHz. Základní formát vzorkování 4 : 2 : 2 (obr. 4).
Obr. 4:
Formát vzorkování pro jas a barvonosné složky
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
11
Počet vzorků jasového signálu v řádku TV (normy PAL 625/50) je 864, v aktivní části 720. Počet vzorků jasového signálu v řádku TV (normy NTSC 525/60) je 858, v aktivní části 720. Použití lineárního kvantování, jeden vzorek = 8 bitů. Při digitalizaci obrazového signálu dle doporučení ITU-R 601 je přenosová rychlost R výsledného digitálního signálu rovna součtu všech tří složek, tedy Y, CB a CR, uvedena ve vztahu (2) (2) 13,5 ∗ 10 ∗ 8 6,5 ∗ 10 ∗ 8 6,75 ∗ 10 ∗ 8 216 Mbit/s
Pokud bychom chtěli získat obraz v rozlišení full HD (1920x1080 bodů), je vzorkovací kmitočet 54 MHz a přenosová rychlost vychází dokonce na 864 Mbit/s. Tyto hodnoty jsou nereálně vysoké a byla by potřeba obrovská šířka pásma pro jeho přenos, proto se musí signál komprimovat – tedy musí se mnohonásobně snížit přenosová rychlost vhodnou komprimační metodou. Řešení je kompresní technologie MPEG, která snižuje potřebné množství dat o přebytečné informace, a jen některé snímky mají plnou informaci o obrazu. Využívá se také více stavové modulace. Dnes se používá komprese MPEG-2 pro SDTV a MPEG-4 (H.264) pro HDTV. Kompresí se ušetřilo takové množství dat, že se do jednoho televizního kanálu o šířce 8 MHz vejde až 7 programů společně s dalšími datovými službami. Na základech evropské normy PAL má digitální obraz rozměry 768x576 bodů (rozlišení 702x576). Obraz se při sledování na obrazovce horizontálně natáhne a ukládá se jako digitální rastr 720x576 bodů. Přesah slouží pro převod do analogu. Každý bod digitálního obrazu má svou jistou hodnotu jasu "Y" (mezi černou a bílou). Také dva rozdílové signály přenášející informaci o barvě mají poloviční rozlišení. Převod „analogu na digitál“ a opačně tedy spočívá v převzetí spojité analogové hodnoty jednoho TV řádku (zde „jasového“ Y), který se pravidelně navzorkuje na dílčí body TV řádku digitálního. Odpovídá tomu digitální hodnota 0 - 255 (8-bitová řada). Tato četnost vzorkování (T) určuje kmitočet A/D převodníku. Pokud jeden TV řádek viditelné analogové části obrazu má v normě PAL 52 μs, poté při vhodném kmitočtu převodníku získáme potřebný počet bodů (702) na jednom TV řádku obrazu digitálního. Jak plyne z doporučení uvedeného výše, hodnota kmitočtu byla vypočtena pro obě normy (PAL i NTSC) na 13,5 MHz. [2] Označení „digitální televizní signál PAL“ je mírně zavádějící. Norma PAL popisuje kódování barvy analogového televizního signálu a s digitálním má společné pouze základní parametry obrazu. Digitálnímu obrazu v nízkém rozlišení SD, označovaného jako „576i“, se někdy říká právě „PAL“, jelikož formát tohoto obrazu má stejné rozlišení 768x576 bodů, obnovovací kmitočet 25 snímků/s (50 půlsnímků) a je prokládaný. Barva se přenáší taktéž na frekvenci 4,43 MHz. Zvuk je přenášen modulací PCM. Občas se lze setkat s pojmenování „formát PAL“ i u neprokládaného (progresivního) vysílání „576p“. Obdobně se pak používá systém NTSC pro označení SD digitálního obrazu s označením 480i (640x480 bodů, 30 snímků/s, prokládané) nebo 480p (progresivní). Některé výhody digitálního vysílání: V rámci jednoho televizního kanálu lze přenášet více TV i rozhlasových stanic a další datové služby
12
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Podpora nových TV přijímačů s přenosem obrazu a zvuku ve vysoké kvalitě (HD) Digitální vysílání je odolnější vůči rušení ve srovnání s analogovým (není však imunní) Digitální příjem lze sledovat i na starém TV přijímači, pro příjem digitálního signálu, stačí dokoupit set-top-box.
Nevýhody digitálního vysílání: Při poklesu kvality digitálního TV signálu pod určitou hranici, se objevuje „kostičkování“ až „zamrzání“ obrazu a rušený zvukový doprovod. Může dojít až k úplnému výpadku služby. Kvalita signálu je také závislá na míře komprese přenášených dat, vliv má také počasí, kvalita antény (především polarizace a zisk antény), citlivost set-top-boxu či digitálního tuneru či vhodný TV přijímač z hlediska parametrů obrazovky (CRT, LCD, Plasma, (O)LED). Stejně jako u analogových existují i digitální televizní normy (DVB – Digital Video Broadcast). Podle způsobu vysílání je můžeme rozdělit na základní tři: nejstarší satelitní digitální vysílání – S. kabelové digitální vysílání – C. pozemní (terestriální) digitální vysílání – T. Dále také vznikly normy digitální vysílání pro mobilní zařízení – H. digitální vysílání přes internetový protokol IPTV. Rozlišujeme tedy, stejně jako u A-TV (PAL, SECAM, NTSC), tyto digitální televizní normy: DVB – používaná ve většině světa včetně Evropy, využívá modulací QPSK (DVB-S), QAM (DVB-C) a DVB-T tzv. kódovaný ortogonální multiplex s kmitočtovým dělením (COFDM) a hierarchickou modulaci, vysílání na kmitočtech 5, 6, 7 MHz s datovým tokem 4-32 Mbit/s, DVB-C pracuje v pásmu 2 – 10 MHz při toku až 64 Mbit/s. ATSC – používá se v Severní Americe a Jižní Korei, zde je použita modulace 8VSB s datovým tokem 19,4 Mbit/s pro jeden HD kanál nebo více SD kanálů u terestriálního přenosu a 16VSB/256-QAM pro satelitní přenos s tokem až 38,8 Mbit/s. Šířka kanálu je 6 MHz. ISDB – Japonský formát používaný i v Jižní Americe, využívající modulaci TC8PSK//QPSK s datovým tokem až 51 Mbit/s pro satelitní přenos při šířce kanálu 34,5 MHz a kombinaci PSK/QAM s COFDM s přenosem až 23 Mbit/s u pozemního přenosu s šířkou kanálu 5,6 MHz. DTMB – využívá Čína, Kuba, státy blízkého východu, jedná se pouze o pozemní vysílání s modulací DS-OFDM a datovým tokem 5 – 32,5 Mbit/s. Jejich geografické rozložení je zobrazeno na obrázku 6.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
Obr. 6:
13
Rozložení digitálních televizních norem ve světě
2.5 Digitální televizní normy druhé generace Nejstarší ze skupiny digitálních standardů druhé generace, satelitní DVB-S2, definovaný normou ETSI EN 302307 již v březnu 2005, je několik let využíván v praxi a jeho vlastnosti i parametry jsou odborné veřejnosti dostatečně známé. Oproti tomu standard DVBC2 je „nejmladší“ a představuje významné vylepšení původního digitálního kabelového standardu DVB-C, vyvinutého již v roce 1994. Je určen pro kabelovou distribuci digitálních televizních a rozhlasových signálů. Zajímavý je především tím, že jeho spektrální účinnost se již blíží k tzv. Shannonovu limitu, který definuje maximální teoretickou přenosovou kapacitu kanálu. Návrh parametrů, které jsou v řadě směrů podobné „pozemnímu“ standardu DVB-T2, byl již v roce 2009 schválen a zveřejněn v tzv. modré knize A138 a měl být v letošním roce standardizován normou EN 302 769. 2.5.1 DVB-T2 DVB-T2 (Digital Video Broadcasting– Second Generation Terrestrial) je doposud nejnovější standard digitálního televizního vysílání za pomocí pozemních vysílačů. Poprvé byl publikován sdružením DVB Steering Board [3] v roce 2008 a následně standardizován evropským ústavem pro telekomunikační normy ETSI v srpnu 2009 [4]. Standard vychází z původního standardu, kdy televizní stanice jsou shlukovány do multiplexů, přičemž standard DVB-T2 pojme až 20 TV kanálů (programů), nebo až 5 program v HD kvalitě, než původní DVB-T. Hlavní výhodou je lepší podpora televizních stanic v HD rozlišení a větší kapacita jednotlivých multiplexů, které mohou obsahovat až desítky stanic. Datový tok je komprimován pomocí multimediálního standardu MPEG-4, který poskytuje lepší možnosti pro šíření televizních stanic ve vysokém rozlišení. Změny se objevily i u parametrů vysílání. Podporuje nejen rozlišení SD a HD, ale také UHD (Ultra HD), mobilní TV, nebo jejich kombinace. Formát Ultra HDTV disponuje čtyřnásobně vyšším rozlišením v porovnání s Full HD. Základní parametry jsou uvedeny v tabulce 3.
14
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava Tab. 3:
Srovnání parametrů DVB-T a DVB-T2 DVB‐T
DVB‐T2
Vstupní rozhraní
Pouze jeden přenosový tok (TS ‐ transport stream))
Vícenásobný přenosový tok (TS) s využitím generického zapouzdření (GSE ‐ Generic Stream Encapsulation)
Dopředná korekce chyb (FEC)
Konvoluční kódování + Reed Solomonův kód 1/2, 2/3, 3/4 ,5/6, 7/8
LDPC + BCH 1/2, 3/5, 2/3, 3/4, 4/5, 5/6
Módy
Konstantní kódování a následná modulace
Variabilní kódování a následná modulace a adaptivní kódování a následná modulace
Modulační schémata
QPSK, 16‐QAM, 64‐QAM
QPSK, 16‐QAM, 64‐QAM, 256‐QAM
Ochranný interval
1/4, 1/8, 1/16, 1/32
1/4, 19/128, 1/8, 19/256, 1/16, 1/32, 1/128
Počet nosných
2k, 8k
1k, 2k, 4k, 8k, 16k, 32k
Šířka pásma multiplexu
6, 7, 8 MHz
5, 6, 7, 8, 10 MHz
Průměrná přenosová rychlost
24 Mbit/s
40 Mbit/s
Maximální přenosová rychlost
31,7 Mbit/s (při použití šířky pásma 8 MHz)
45,5 Mbit/s (při použití šířky pásma 8 MHz)
Minimální odstup signálšum
16,7 dB
10,8 dB
DVB-T2 používá COFDM modulaci (Coded Orthogonal Frequency Division Multiplex). Využívá se velkého počtu subnosných vln (až 32k), který je vhodný pro stacionární přenosy. Podobně jako DVB-T, standard DVB-T2 nejen využívá vícenásobný vstupní stream s paketovými digitálními toky (Transport Stream, TS), ale nově také obecné datové toky (Generic Stream Encapsulation, GSE). LDPC (Low Density Parity Check) kódování využívá binární lineární blokový kód v kombinaci s cyklickým samoopravným kódem BCH (Bose-Chaudhuri-Hocquengham). Tato kombinace zaručuje vynikající odolnost signálu vůči vysokým hladinám šumu a interferencím. DVB-T2 používá variabilní VCM (Variable Coding and Modulation) a adaptivní ACM (Adaptive Coding and Modulation) kódování a modulaci, pomocí nichž je možno měnit, případně optimalizovat modulaci a systémové parametry kódování pro různé uživatele v reálném čase. Jelikož se používá vícenásobný datový tok, je nutné použít více, než jednu anténu. V tomto případě se nepoužívá schéma MIMO, jak ho známe například ze standardu 802.11n, ale je využito schéma MISO (Multiple-Input Single-Output). Standard DVB-T2 přidává vylepšený typ vnitřní modulace 256-QAM, která díky jednoho symbolu, dokáže přenést celých 8 bitů, tímto je zvětšena přenosová rychlost v jednom kanálu, téměř dvojnásobně, při zachování šířky pásma multiplexu. Nicméně šířku pásma kanálu je možné zvětšit na 10 MHz a tím dosáhnout ještě rychlejšímu přenosu dat. Navíc pokud použijeme kratší ochranný interval (1/128) je možné v tomto času, přenášet další data. Nespornou výhodou je zmenšení nároku na odstupu signálu od šumu na přenosové trase. Úspěšná implementace kvalitnější a pokrokovější digitální terestrické televize druhé generace nabídne oproti DVB-T další možnosti. Lepší zabezpečení přenosu Vyšší datový tok umožňující ekonomický přenos HDTV Krystalicky čistý obraz
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO 2.5.2
15
Realističtější barvy a jejich přechody Až 5x podrobnější vizuální informace
DVB-S2
DVB-S2 (Digital Video Broadcasting – Second Generation Satellite) je druhá generace standardu pro satelitní vysílání audiovizuálních streamů a doprovodných dat (teletext, EPG) pomocí telekomunikačních satelitů. Byl vyvinutý sdružením DVB Steering Board v roce 2003 a ratifikován byl evropským ústavem pro telekomunikační normy ETSI v roce 2005 [5]. Vznikla rozšířením standardní normy DVB-S a počítá se u ní i s využitím komprese MPEG4/AVC, která je často spojena (není to ale pravidlem) s vysíláním ve vysokém rozlišení obrazu - HDTV. Zvuk se často přenáší jako AC-3 datový tok ve formátu Dolby Digital. Základní parametry jsou uvedeny v tabulce 4. Tab. 4:
Porovnání mezi DVB-S a DVB-S2 [5]. DVB‐S
DVB‐S2 Vícenásobný přenosový tok (TS) s využitím Pouze jeden přenosový tok (TS ‐ transport generického zapouzdření (GSE ‐ Generic Vstupní rozhraní stream)) Stream Encapsulation) Konvoluční kódování + Reed Solomonův kód LDPC + BCH 1/4, 1/3, 2/5, 1/2, 3/5, 2/3, 3/4, Dopředná korekce chyb (FEC) 1/2, 2/3, 3/4 ,5/6, 7/8 4/5, 5/6, 8/9, 9/10 Variabilní kódování a následná modulace a Módy Konstantní kódování a následná modulace adaptivní kódování a následná modulace Modulační schémata BPSK, QPSK, 8PSK BPSK, QPSK, 8PSK, 16APSK, 32APSK Ochranný interval 1/4, 1/8, 1/16, 1/32 1/4, 19/128, 1/8, 19/256, 1/16, 1/32, 1/128 Prokládání Bitové prokládání Bitové prokládání Pilotní signál Nepřenáší se Přenáší se v intervalech Maximální přenosová rychlost
75 Mbit/s (při šířce pásma 25 MHz)
125 Mbit/s (při šířce pásma 25 MHz)
Výhody oproti staršímu systému se dají shrnout: větší přenosová kapacita oproti DVB-S a to až o 30% vylepšení robustnosti pro danou kapacitu Adaptive Coding and Modulation (ACM) možnost modulací 8-PSK, 16-APSK a 32-APSK hlavní požadavek na DVB-S2 - nové služby zpětná kompatibilita a interaktivní služby – priorita II. řádu DVB-S2 není zpětně kompatibilní s DVB-S, všechny současné HD přijímače ale podporují obě normy. 2.5.3
DVB-C2
Standard DVB-C2 (Digital Video Broadcasting – Second Generation Cable) je nejmladším standardem, z výše uvedených standardů druhé generace. Je určen pro kabelovou distribuci digitálních televizních a rozhlasových signálů. Zajímavostí tohoto standardu je to, že jeho spektrální účinnost se již blíží k Shannonovu limitu, který definuje maximální teoretickou přenosovou kapacitu kanálu. Poprvé byl publikován sdružením DVB Steering Board [3] v roce 2010 a následně standardizován evropským ústavem pro telekomunikační normy ETSI v srpnu 2011 [6]. DVB-C2 je primárně určeno pro vysílání ve vysokém rozlišení
16
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
(HDTV, UHDTV) a pro službu Video on Demand. Lze ho šířit po hybridních sítích (Hybrid Fibre-Coaxial). Vychází ze standardu DVB-T2, s nímž má některé stejné vlastnosti a parametry – např. stejnou modulaci COFDM a stejné protichybové zabezpečení. Mohou se v něm přenášet nejen paketované digitální toky TS (Transport Stream) MPEG-2/-4 se 188 bytovými pakety, jako v distribuční platformě první generace DVB-C, ale i obecné datové toky GSE (Generic Stream Encapsulation). Používá variabilní VCM (Variable Coding and Modulation) a adaptivní ACM (Adaptive Coding and Modulation) kódování a modulaci, pomocí nichž je možno měnit, případně optimalizovat modulaci a systémové parametry kódování pro různé uživatele v reálném čase. Základní parametry jsou uvedeny v tabulce 5. Tab. 5:
Porovnání mezi DVB-C a DVB-C2 [6]. DVB‐C
Vstupní rozhraní Dopředná korekce chyb (FEC) Módy Modulační schémata Ochranný interval Prokládání Pilotní signál
Pouze jeden přenosový tok (TS ‐ transport stream))
DVB‐C2 Vícenásobný přenosový tok (TS) s využitím generického zapouzdření (GSE ‐ Generic Stream Encapsulation)
Konvoluční kódování + Reed Solomonův kód LDPC + BCH 1/2, 2/3, 3/4, 4/5, 5/6, 8/9, 9/10 1/2, 2/3, 3/4 ,5/6, 7/8 Variabilní kódování a následná modulace a Konstantní kódování a následná modulace adaptivní kódování a následná modulace 16‐QAM ‐ 256‐QAM 16‐QAM ‐ 4096‐QAM Nepoužívá se 1/64, 1/128 Bitové prokládání Bitové, časové, nebo frekvenční prokládání Nepřenáší se Přenáší se kontinuálně
Maximální přenosová rychlost
50 Mbit/s
80 Mbit/s
Ochranné kódy LDPC (Low Density Parity Check) a BCH (Bose-ChaudhuriHocquengham) jsou účinné korekční kódy pro opravu chyb při vysoké úrovni šumu a interferencí v kanále. Jsou užity i ve standardu DVB-T2.
2.6 Rozlišení a formáty Existuje mnoho formátů a standardů pro zobrazovací jednotky, jako jsou monitory, displeje či televizní obrazovky. Mezi základní parametry patří rozlišení a poměr stran. Následující tabulka shrne tyto standardy pro digitální televize. Tab. 6: Digitální televizní standardy. Digitální TV Standard Rozlišení
Poměr
D-1 NTSC
720×486
4:3
D-1 NTSC (square pixels) 720×540
4:3
D-1 PAL
720×576
4:3
HDTV 1080i
1920×1080
16 : 9
HDTV 720p
1280×720
16 : 9
EDTV 480p
640×480, 704×480 nebo 852×480 4 : 3 nebo 16 : 9
DVD NTSC
720×480
4 : 3 nebo 16 : 9
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
17
DVD PAL
720×576
4 : 3 nebo 16 : 9
VCD NTSC
352×240
4:3
VCD PAL
352×288
4:3
Laserdisc
560×360
4:3
Rozlišení (resolution) udává počet pixelů, které může být zobrazeno na obrazovce (monitoru, displeji). Často se udává jako počet sloupců (horizontálně, „X“), které se uvádí vždy jako první, a počet řádků (vertikálně, „Y“). Na obrázku 7 jsou uvedeny všechny, tedy nejen pro televize, ale také pro počítačové monitory či displeje.
Obr. 7:
Přehled jednotlivých rozlišení
Poslední parametr, který se udává při zmínce o zobrazovacích parametrech pro různé standardy, je poměr stran. Na obrázku 8 jsou porovnány nejpoužívanější.
18
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Obr. 8:
Přehled poměru stran
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
19
3 Kompresní formáty MPEG MPEG (Moving Picture Experts Group) je označení pro skupinu standardů používaných ke kódování/dekódování obrazového či zvukového materiálu za pomoci kompresních algoritmů, který byl vyvinut stejnojmennou skupinou. Skupina pracuje od roku 1988 a v roce 1993 dokončila návrh standardu MPEG-1 pro kódování obrazu a přidruženého zvuku s bitovým tokem do 1,5 Mbit/s. Práce na standardu MPEG-2 přímo navazovaly včetně zajištění jednostranné slučitelnosti, základní části standardu byly dokončeny koncem roku 1994. Skupina MPEG má standardizovány následující skupiny formátů: MPEG-1: Kódování pohyblivého obrazu a přidruženého zvuku pro digitální datové nosiče při přenosové rychlosti od 0,9 až do 1,5 Mbit/s. Standard pro kódování zvuku zahrnuje také oblíbený zvukový kompresní formát Layer 3 (MP3). MPEG-2: Obecné kódování pohyblivého obrazu a přidruženého zvuku. Zahrnuje přenosové, obrazové a zvukové kódovací standardy pro vzduchem šířené televizní vysílání ATSC a DVB, digitální satelitní TV přenos, digitální kabelový TV signál, a (s určitými změnami) pro disky DVD Video. Přenosová rychlost se pohybuje od 1,5 Mbit/s až do rychlosti 15 Mbit/s (TV signál používá rychlost 6 Mbit/s). MPEG-3: Původně určený pro kódování standardu HDTV, ale později byl jeho vývoj pozastaven a standard MPEG-3 byl sloučen se standardem MPEG-2. MPEG-4: Kódování audiovizuálních objektů. Zahrnuje nové kompresní formáty audia a videa, podporu audio / video "objektů", časovaného textu, standardizovaný formát fontů písma, 3D obsah, vektorovou grafiku, Digitální správu práv (DRM Digital Rights Management) a další možnosti. Poskytuje široké možnosti kódování audiovizuálních prezentací – od velmi nízkých datových toků vhodných například pro kapesní mobilní zařízení nebo pomalé internetové připojení, až po vysoké datové toky používané pro televizní vysílání, video a audio ve vysokém rozlišení. MPEG-7: Standard pro popis dat s multimediálním obsahem. Tento formát by měl sloužit k rychlému a efektivnímu vyhledávání multimediálních dat. (ISO / IEC 15938) MPEG-21 (ISO / IEC 21000) MPEG-A (ISO / IEC 23000) MPEG-B (ISO / IEC 23001) MPEG-C (ISO / IEC 23002) MPEG-D (ISO / IEC 23003) MPEG-E (ISO / IEC 23004) Standardy vyvinuté pracovní skupinou MPEG našli kromě jejich přímého využití, uplatnění i v dalších specifikacích, nebo standardech, vyvinutých jinými organizacemi: VCD nebo jinak Video CD je formát záznamu videa prostřednictvím MPEG-1 a zvuk je kódován v MPEG-1 Audio Layer II. Video je možné vytvořit ve dvou formách a to PAL nebo NTSC. Formát byl definován společnostmi Sony, Philips, Matsushita a JVC a vydán pod označením White Book (Bílá kniha). SVCD nebo SuperVideo CD je kvalitnější formát využívající kódování videa ve formátech MPEG-2 Video a MPEG-1 Audio Layer II. Formát byl definován ve standardu IEC 62107. DVD-Video (definované organizací DVD Forum) podporuje kódování videa ve formátech MPEG-2 a MPEG-1.
20
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
BD-ROM (Blu-ray) podporuje kódování například ve formátech MPEG-4 Part 10 (H.264) a MPEG-2 (ale i ve formátech, které nebyly definovány skupinou MPEG).
3.1 MPEG 1 MPEG 1 definuje skupinu audio a video kódovacích a kompresních standardů, které pracují s rozlišením 352x288 při rychlosti 25 snímků za sekundu a datovém toku do 1,5 Mbit/s. MPEG 1 je navržen pro ztrátovou kompresi audia a videa, což znamená, že při kompresi dojde k nenávratné ztrátě některých (méně důležitých) informací. V současné době, je MPEG-1 nejvíce kompatibilní ztrátový audio/video formát na světě, a je používán ve velkém množství výrobků a technologií. Snad nejznámější součástí standardu MPEG-1 je MP3 audio formát. Standard MPEG-1 je publikován jako standard ISO / IEC 11172 [7]. Tato norma se skládá z následujících pěti částí: Systems (ISO / IEC 11172-1 – poprvé publikováno 1993) Video (ISO / IEC 11172-2 - poprvé publikováno 1993) Audio (ISO / IEC 11172-3 - poprvé publikováno 1993) Conformance testing (ISO / IEC 11172-4 - poprvé publikováno 1995) Reference software (ISO / IEC 11172-5 - poprvé publikováno 1998) Systems (ISO / IEC 11172-1) Tato část specifikuje logickou vrstvu a metody ukládání kódovaných audio, video a dalších dat do standardního bitového toku. Tento formát je speciálně navržen pro ukládání na média a přenos přes datové kanály, které jsou považovány za relativně spolehlivé. Pouze omezené množství chyb je definováno normou a malé chyby v bitovém toku můžou způsobit znatelné poškození. Video (ISO / IEC 11172-2) MPEG 1 video využívá podobnosti snímků, které jdou za sebou tak, že nemusí kódovat každý snímek (frame), ale zakóduje pouze změnu mezi jednotlivými snímky. MPEG rozdělí jednotlivé snímky na celkově tři druhy I, P a B. (viz. Obr. 9).
Obr. 9
Rozdělení snímků
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
21
I snímek (Intra-frame) Jedná se o nejdůležitější typ snímku (rámec), protože jako jediný lze dekódovat nezávisle na ostatních snímcích (někdy je také proto nezíván “keyframes“), tento snímek také zabírá nejvíce místa ze všech ostatních typů snímků. Při stříhání videa není možné začít přehrávání video segmentu před prvním I snímkem (rozhodně ne bez výpočetně náročného procesu – re-encoding), z tohoto důvodu se pro úpravy používají MPEG videa obsahující jen I snímky (I-frame-only). Komprese za použití pouze I snímků je velice rychlá, ale zabírá asi 3x (nebo i víc) více místa než video kódované standardně podle MPEG 1. Posloupnost snímků (vzdálenost) mezi dvěma I snímky se nazývá GOP (Group of Pictures). Nejčastěji používaná velikost GOP je 15-18, což znamená, že na I snímek připadá 14-17 snímků jiného typu (kombinace P a B snímků). Velikost GOP je omezena limitem vyrovnávací paměti dekodéru. P snímek (Predicted-frame) Snímek typu P existují kvůli zlepšení komprese ve videu. P snímek funguje tak, že zaznamená (uloží) pouze změnu (rozdíl) oproti předcházejícímu I snímku, nebo P snímku (někdy se také předcházející snímek nazývá “anchor frame“ - kotevní snímek). Rozdíl mezi P snímkem a kotevním snímkem se vypočítá pomocí pohybových vektorů (znázorněno na obrázku 10) pro každý makroblok každého snímku. Tento typ snímku není vhodný, pokud se video drasticky mění každým snímkem, v takovém případě je vhodnější užívání I snímku.
Obr. 10
Výpočet pohybových vektorů
B snímek (Bidirectional-frame) B-snímky mají ze všech typů snímků nejmenší velikost a jsou velmi podobné P-snímků, jen se vypočítávají jako rozdíl předchozím a následujícím (I nebo P) snímkem, proto je nezbytné, aby byl nejprve dekódován následující I nebo P snímek, než je možné dekódovat a zobrazit B snímek. To znamená, že dekódování B-snímků vyžaduje větší datové vyrovnávací paměti a způsobuje větší zpoždění, jak při dekódování tak během kódování. Žádné další snímky nemohou být předpovídány z B snímku. Na následujícím obrázku je znázorněn příklad uspořádání snímků s naznačenou predikcí u P a B snímku.
22
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Obr. 11
Výpočet pohybových vektorů
Makrobloky Snímek je ještě rozdělen do makrobloků o počtu 16x16 jasových bodů (8x8 barvonosných bodů). Tyto makrobloky (obr. 12) slouží k zachycení a kódování změn mezi snímky. Makrobloky se dále dělí na čtyři bloky o počtu 8x8 jasových bodů. Ty se zpracovávají pomocí DCT (diskrétní kosinovou transformací) s využitím kvantizačních tabulek, které jsou zvlášť určené pro I snímky a zvlášť pro P a B snímky.
Obr. 12
Makrobloky
Audio (ISO / IEC 11172-3) Část 3 standardu MPEG-1 se vztahuje na audio a je definován v ISO/IEC-11172-3. MPEG-1 Audio využívá psycho-akustického snížení potřebné rychlost přenosu dat požadovaného audio toku. Redukuje, nebo zcela vyřadí některé části zvuku, které lidské ucho
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
23
nemůže slyšet, a to buď proto, že jsou ve frekvencích, kde ucho omezené citlivosti, nebo jsou maskovány jinými (obvykle hlasitějšími zvuky). MPEG-1 Audio je rozděleno na 3 vrstvy. Každá vyšší vrstva je výpočetně složitější, a obecně účinnější při nižších přenosových rychlostech než předchozí. Tyto vrstvy jsou částečně zpětně kompatibilní, protože vyšší vrstvy opakovaně používají technologie implementované v nižších vrstvách. Bitové rychlosti vrstvy I: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416, 448 kbit/s Bitové rychlosti vrstvy II: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, 384 kbit/s Bitové rychlosti vrstvy III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 kbit/s Díky podstatnému zlepšení výkonnosti v digitálním zpracování od zavedení Layer I, se tato vrstva stala velmi rychle zbytečná a zastaralá. Layer I zvukové soubory obvykle používají příponu .MP1, nebo někdy .M1a. MPEG-1 Layer II (přípona .MP2) je ztrátový audio formát navržen pro poskytování vysoké kvality (stereo zvuk) při rychlosti asi 192 kbit/s. Dekódování MP2 audio je výpočetně jednoduché, vzhledem k MP3, AAC, atd. MPEG-1 Layer III (MP3) je ztrátový audio formát navržen tak, aby poskytnul přijatelnou kvalitu při rychlosti okolo 64 kbit/s pro monofonní zvuk, a 128 kbit/s pro stereo zvuk. Conformance testing, Reference software Čtvrtá část standardu MPEG-1 se vztahuje na zkoušení shody, a je definována v ISO/IEC-11172-4. Poskytuje dvě sady pokynů a referenčních bitových proudů pro testování shody MPEG-1 audio a video dekodéry, stejně jako bitového proudu produkovaného kodérem. Část 5 standardu MPEG-1 obsahuje referenční software, a je definována v ISO / IEC TR 11172-5.
3.2 MPEG 2 Standart (ISO/IEC 13818) MPEG 2 vychází z MPEG 1, který neuměl pracovat s prokládanými snímky. MPEG2 se stal standardem pro kompresy digitálního videa. Oproti MPEG-1 podporuje MPEG-2 vyšší rozlišení, proměnlivý datový tok, což se hodí při vysoce dynamických scénách, popřípadě ve statických scénách. MPEG-2 má tedy vyšší kvalitu oproti MPEG-1. Práce na standardu MPEG 2 přímo navazovaly včetně zajištění jednostranné slučitelnosti, základní části standardu byly dokončeny koncem roku 1994 (ISO/IEC 13818-1 až 3). [8] Nejdůležitější vlastností kódování MPEG je jeho pružnost a otevřenost. Standard MPEG 2 je založen na definování syntaxe přenášeného bitového toku a vlastností dekodéru. Každý dekodér MPEG 2 musí umět dekódovat všechny bitové toky až do maximálního pro danou úroveň (Level) a daný profil (Profile) a také všechny úrovně a profily nižší.
24 3.2.1
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava Profily a úrovně MPEG-2
Standard MPEG-2 zahrnuje také škálovatelnost, jako možnost demultiplexovat obsah ve vyšší i nižší kvalitě. Kvalitativní parametry komprimovaného videa určují profily a úrovně kódování. MPEG 2 je rozdělen do následujících profilů: Jednoduchý profil (SP Simple Profile) V tomto profilu se nepoužívají žádné B snímky, díky tomu není potřeba nového uspořádání snímků, které je časově náročné, proto se tento profil používá nejčastěji u aplikací citlivých na zpoždění, jako jsou videokonference. Hlavní profil (MP Main Profile) V hlavním profilu jsou používané všechny druhy snímků (I, P, B). Maximální zpoždění zde dosahuje 250 ms. SNR profil Při tomto profilu se optimalizuje kvantizační zkreslení, zlepšením odstupu signálu od šumu. Prostorový profil (SpP Spatial Profile) Používá prostorovou škálovatelnou kompresy pro zlepšení obrazu. Nejlepší profil (HP High Profile) Je určený pro TV aplikace s vysokým rozlišením ve formátu 4:2:0 a 4:2:2. Používá algoritmy na redukci kvantizačního zkreslení a dokonalejší kódování obrazu s různým rozlišením. Následující tabulka definuje úrovně pro různou kvalitu přenosu. Tab. 7:
Úroveň (Level) low main high 1440 high
Úrovně pro různou kvalitu přenosu.
Rozlišení Snímky/s Bitová rychlost Vyrovnávací paměť pixel (fps) Mbit/s kB 325x288 do 30 4 58 720x576 do 30 15 ‐ 20 224 1440x1088 do 60 60 ‐ 80 896 1920x1088 do 60 80 ‐ 100 1194
3.3 MPEG-4 Představuje skupinu standardů pro kódování audia, videa a dalších technologií jako standard ISO/IEC 14496. [9] Dále též slouží jako objektová reprezentace audiovizuální scény s nízkou přenosovou rychlostí (méně než 1,5 Mbit/s), která je kódována jako komplex přirozených nebo syntetických objektů. Mezi syntetické objekty můžeme zařadit např. strukturované audio (jazyk pro popis generace zvuku), animované obličeje, tvary, 2D a 3D mřížky a vektorová grafika. MPEG4 ve své podstatě pojal řadu vlastností od standardů MPEG-1 a MPEG-2, ke kterým přidal řadu funkcí, zejména pak podporu audio/video „objektů“, 3D obsah a digitální správu dat (DRM Management). Použití ztrátového kodeku MPEG-4 se dotýká např. komprese audiovizuálních datových toků (streamovaných dat) z webu, distribuce CD nosičů, hlasu (telefonování, 3G video volání) i televizního vysílání. V kolekci MPEG-4 najdeme v základu audiokodek, samotný systém, videokodek, referenční software, prostředky testování, integrovaný Multimedia Integration Framework a další součásti. Jedná se o živý kodek, který s sebou nese řadu částí, resp. vydefinovaných standardů. V současné době (duben 2013) je oficiální cestou vypuštěno 28
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
25
částí, další dvě jsou pak vyvíjeny a plánovány do blízké doby. Společnosti, které propagují MP4 však běžně neuvádí, k podpoře které části se přiklánějí. Za zmínku však stojí klíčové části, tj. část 2 (Advanced Simple Profile, využíván v kodecích DivX, Xvid či u QuickTime 6) a část 10 (Advanced Video Coding, používán QuickTime 7 a HD médii, např. Blu-ray disky). Mezi základní výhody patří: vylepšená efektivita oproti MPEG-2 (MPEG-4 stačí poloviční datový tok při současném zachování kvality obrazu), tzn. Při použití MPEG-4 lze do jednoho multiplexu umístit až osm či deset kanálů, místo pěti snížení datového toku v rámci zachování kvality obrazu výhodné pro datově náročné HDTV kanály možnost zakódovat smíšený multimediální obsah (zvuk, řeč, video) odolnost vůči chybám při přenosu možnost interakce s audiovizuální scénou generovanou na přijímači, např. uživatel může spustit sportovní přenos výběrem z 3D mapy, může zjistit informace o programu, může poslouchat komentář ve sdruženém okně a sledovat reklamy sponzorů – to vše jednom MPEG-4 streamu podporujícím vícero multimediálních objektů multiplexování a synchronizace dat spojených s multimediálními objekty tak, aby mohly být efektivně přenášeny přes síť (internet) možnost kódování placených TV kanálů (MPEG-2 neumí) 3.3.1
Audio a video kodeky pro MPEG-4
MPEG-4 konvenční audio a video kodeky poskytují nejvyšší kvalitu a efektivitu komprese, kterou dnes lze na trhu dostat. Kodeky byly přijaty jako základna pro mnohé multimediální produkty a služby. Mezi nejpoužívanější MPEG-4 audio a video kodeky (tabulka 8) patří: Tab. 8:
Kodeky pro MPEG-4.
Kodek
Vlastnosti Typické použití Vysoce výkonný video kodek pro náročné Vysílání HDTV, mobilní AVC (část 10) aplikace multimédia, internetové video Vysoce výkonný video kodek se škálovatelností a 3G telefonie, intranet a internet SP, ASP (část 2) video, digitální fotoaparáty pružností AAC
Vysoce výkonný audio kodek pro skvělou kvalitu Přenosné hudební přehrávače při průměrných přenosových rychlostech
HE‐AAC
Vysoce výkonný audio kodek pro lepší kvalitu při Satelitní rádio, stahování hudby přenosových rychlostech pod 48 kbit/s
HE‐AAC v2
Vysoce výkonný audio kodek pro skvělou kvalitu Datový tok (streaming) do při přenosových rychlostech pod 48 kbit/s mobilních zařízení
3.3.2
Popis částí MPEG-4 standardu
V následující tabulce jsou uvedeny jednotlivé části standardu MPEG-4 se stručným popisem činnosti.
26
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava Tab. 9:
Jednotlivé části standardu MPEG-4.
Část Název
Popis
1
Systems
Synchronizace a multiplexování videa a audia
2
Visual
2 Visual Kompresní formát pro vizuální data
3
Audio
Sada kompresních nástrojů pro kódování audia
4
Conformance testing
Postupy pro shody s jinými částmi standardu MPEG‐4
5
Reference software
Referenční SW pro demonstraci a ověření ostatních částí standardu
6
Delivery Multimedia Integration Framework
Univerzální framework
7
Optimised reference software for coding AVO Ukázky, jako vylepšovat implementace
8
Carriage of MPEG‐4 content over IP networks Metody pro přenos MPEG‐4 na IP sítích
9
Referrence hardware description
Hardwarové návrhy pro demonstraci implementace ostatních částí standardu
10
Advanced Video Coding (AVC)
Kompresní formát pro video signály
11
Scene description and application eEngine
Použití pro bohatý, interaktivní obsah (2D, 3D) s více profily
12
ISO base media file format
Formát pro ukládání časově založeného mediálního obsahu
13
IPMP Extensions
Přídavek k části 1, zavádí IPMP zpracování
14
MP4 File Format Druhá definice formátů MPEG‐4
Druhá definice formátů MPEG‐4
15
AVC File format
Formát ukládání AVC (část 10)
16
Animation Framework eXtensioan
Rozšíření pro reprezentaci 3D obsahu
17
Streaming text format
Časovaný formát titulků
16
Font compression and streaming
Příprava pro Open Font Format (část 22)
17
Synthesized texture stream
Syntetizované streamy textu pro vytváření syntetických videoklipů v nízkém bitratu
18
MPEG‐J Graphoncs Framework eXtensions
Popis programovacího prostředí pro pokročilé interaktivní multimediální aplikace
22
Open Font Format
Založen na fontu OpenType 1.4
23
Symbolic Music Representation
Vydán jako ISO standard
24
Audio and systems interaction
Popisuje očekávané spojení MPEG‐4 souborového formátu a MPEG‐4 audia
25
3D Graphics Compression Model
Popis spojení 3D grafických kompresních nástrojů s grafickými primitivy jiných standardů
26
Audio Conformance
‐
27
3D Graphics conformance
Timed text and other visual overlays grafiky a testy
28
Composite font representation
‐
29
Web video coding
(v přípravě)
30
Timed text and other visual overlays
(v přípravě)
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO 3.3.3
27
Profily a úrovně
MPEG-4 se skládá z řady nástrojů, ne všechny jsou ale pro dané aplikace potřebné. K tomu, aby jednotlivým implementátorům bylo umožněno využívat pouze podsadu nástrojů, které potřebují, slouží profily. Jedná se tedy o nástroje, v rámci kterých je možná implementace těch funkcí, které jsou třeba. Jednotlivé profily se pak odlišují v rámci úrovní, které stanovují limity výpočetního výkonu, resp. specifikují maximální hodnoty bitratu, maximální počet objektů na scéně, maximální rozlišení při daném počtu Hz a podobně. Nejnižší specifikace mají úrovně L0, s růstem hodnoty označení profilu rostou i ostatní hodnoty jím definované, resp. kvalita výstupu. Vybrané názvy a funkce běžných video profilů v rámci MPEG-4: Simple Visual - Podobný MPEG-2 kódování Advanced Simple Visual - Přidává podporu pro B-rámce Core Visual - Přidána podpora pro binární objekty AVC Baseline - Menší zpoždění, nižší nároky na procesor AVC Main - Podpora prokládaného videa, B-rámců, kódování CABAC AVC Extended - Přidání nástrojů pro řešení chyb a B-rámců AVC High - Podpora vysoké kvalita a vysokého rozlišení pro digitální kina Dále souhrn běžných zvukovým profilům, které vydefinoval standard MPEG-4: High-Quality Audio - Součástí jsou nejpopulárnější objekty AAC Low Delay Audio - Varianta AAC kodeku s 20ms zdržením, pro HQ konference a rozhovory High Efficiency AAC - Vylepšení efektivnosti kódování při nízkých bitratech HE-AAC v2 - Další vylepšení efektivnosti kódování při nízkých bitratech, nové nástroje 3.3.4
Aplikace a využití
Televizní vysílání Standardem televizního vysílání je MPEG-2, ten však neumí nabídnout dostatečnou kompresi vzhledem k vysílání stovek kanálu kabelové a satelitní televize v HD rozlišení. Jakmile bude stoupat po vysílání s vyšším rozlišením, bude se toho účastnit i MPEG-4, např. s kodekem AVC. Ten nabídne efektivnější kompresi, navíc je již využíván u hlavních hráčů na trhu digitální televize v rámci HD kanálů a služeb. IP televize IP sítě jsou omezeny šířkou pásma, a proto vyžadují vysoce efektivní kódování, např. AVC, aby bylo možné jedním připojením obsloužit více žadatelů o službu. Hraní na přenosných mobilních zařízeních Herní zařízení bývala běžně uzavřenými systémy, v rámci uvolňování zábran přichází i integrace MPEG-4 standardů. Například využítí MPEG-4 Simple Profile pro sledování videí uložených na paměťových kartách a AVC pro samotné přehrávání videí ze svého optického disku se zvukem, jenž je dekódován AAC audiem. Mobilní komunikace a zábava MPEG-4 Simple Profile je od roku 2001 součástí 3G videovolání. MPEG-4 HE AAC audio kódování bylo využito v řadě služeb pro stahování hudby, HE-AAC v2 pak byl použit jako nový standard pro hudební streamování. MPEG-4 je navíc součástí mobilního televizního broadcastu ve standardech DVB-H, DBM a MediaFlo.
28
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Stremování na internetu MPEG-4 byl zpočátku navržen pro streamování multimédií napříč řadou platforem. Mezi zákazníky tak patří Apple (MPEG-4 SP a AAC v přehrávačích QuickTime 6, AVC v QuickTime 7) či Real Player. V rámci Windows Media Playeru existují pluginy třetích stran, které umožní sledování MPEG-4 obsahu. Videokonferenční hovory Videokonferenční terminály jsou přirozenou aplikací MPEG-4 AVC kodeku v praxi. AVC v porovnání s dřívějšími standardy H.261 a H.263 nabízí zvýšenou kvalitu videa při stejném internetovém připojení, resp. zachovává kvalitu při polovičním datovém toku. Digitální fotoaparáty a multimediální přehrávače Digitální fotoaparáty disponují možností natáčet krátké videosekvence do vysoce kapacitních flash pamětí v rámci využívání MPEG-4 kodeku. To samé platí i o multimediálních přehrávačích a chytrých telefonech.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
29
4 Kodeky Kodek pochází z anglického slova codec čili kóder – dekóder. Je to zařízení nebo krátký program na kódování a dekódování datového toku (streamu) či signálu. Musí splňovat dvě podmínky: musí fungovat oběma směry, tedy komprese a dekomprese, musí mít konkrétní implementaci určitého formátu. Uživatelé si často pletou pojmy kodek, formát a filtr. Zatímco kodek je systémová knihovna, video komprimuje a dekomprimuje, tak formát je standard, který kodek musí implementovat. Na dekompresi si může použít libovolný kodek, který dekomprimuje a komprimuje video a zvuk. Kodeky se velmi často používají při zpracovaní zvuku nebo obrazu. Většinou se kodeky upravují datové toky při vysílaní v médiích, videokonferencích, při nahrávaní digitálních videozáznamů a audiozáznamů. Dá se tedy podle typu signálu hovořit o video kedecích a audio kodecích. Kodeky se také dají rozdělit do dvou skupin podle toho, kolik informací ztrácí při komprimaci. První skupinu tvoří tzv. bezztrátové kodeky, u kterých nejsou ztracené žádné informace, ale díky tomu nedosahují vysoké kompresní poměry (obvykle kolem 1:2). Běžný uživatel se s tímto druhem kodeků obyčejně nesetká, používá se hlavně v profesionálním střihu videa, jelikož jsou hlavně určené dalšímu zpracování. Druhou skupinu tvoří ztrátové kodeky, které část informací ztrácejí. Vychází se z faktu, že lidské oko není dokonalé a tak určitou míru zkreslení obrazu nepostřehne. Při použití ztrátových kodeků je možne dosáhnout kompresi v poměru 1:4 až 1:100 v závislosti na míře komprese a kvalitě použitého algoritmu. Při poměru vyšším než 1:100 dochází už k výraznému zkreslení signálu. Míru komprese ukazuje především datový tok (bitrate) použitý ve výsledném souboru. Dále se dá srovnávat rychlost zpracování, výsledná kvalita a velikost souboru. Datový tok může být navíc nejen konstantní, ale také proměnlivý. Ten je vhodný především k použití u videí, kde dochází k častějšímu střídání rychlých a pomalých scén případně změny scenerií. Díky němu se použije vyššího datového toku při rychlejší, respektive obrazově náročnější, scéně a tak lze dosáhnout kvalitnějšího podání při stejné velikosti výsledného souboru.
4.1 Video kodeky Zpracovávají obrazový videosignál použitím kompresních metod k upravení velikosti původního zdrojového signálu. Ve většině případů se pod pojmem video skrývá jak obrazová, tak i zvuková informace. Základní rozdělení takovýchto kodeků je podle ztrátovosti při kódování. V následujících kapitolách je uveden stručný přehled a popis některých z nich. 4.1.1
Bezztrátové video kodeky
Bezztrátová komprese je jeden ze dvou základních přístupů ke kompresi dat. Jedná se o algoritmy, které dovolují přesnou zpětnou rekonstrukci komprimovaných dat na rozdíl od ztrátové komprese, kde to možné není. Bezeztrátová komprese se používá všude tam, kde je důležité, aby originální data a data po dekompresi komprimovaného souboru byla totožná např. komprese textů nebo komprese čehokoli, kde je nepřípustná i sebemenší ztráta kvality.
30
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
4.1.1.1 Huffyuv kodek Huffyuv (nebo také HuffYUV) kodek je velmi rychlý bezztrátový obrazový (video) kodek, jehož autorem je Ben Rudiak-Gould. Je uvolněn pod licencí GPL. Umožňuje komprimovat video ve formátu YUY2 (ve skutečnosti Y Cb Cr), RGB a RGBA. Algoritmus je podobný bezztrátové kompresi JPEG-LS v tom, že je predikována hodnota následujícího pixelu a chyba (rozdíl) je zakódována pomocí Huffmanova kódování, které je založeno na různé četnosti znaků. V nejlepších podmínkách dokáže z původní velkosti videa zkomprimovat až na 40%. Huffyuv kodek byl původně určen pouze pro Microsoft Windows, ale byl nakonec zahrnut také do FFmpeg a produktů na něm založených (např. MPlayer a VLC media player), takže je platformě nezávislý. 4.1.1.2 Lagarith Uvolněn pod licencí GPL (General Publik License), jedná se o nástupce kodeku Huffyuva. Lagarith je otevřený bezztrátový obrazový (video) kodek, jehož autorem je Ben Greenwood. Vlastní kodek je určen pro Windows, ale existují i utility pro Mac OS. Byl navržen s několika cíli: Rychlost - není tak rychlý jako Huffyuv, rychlost kódování je porovnatelná s mnoha jinými bezztrátovými kodeky, při dekódování může být pomalejší. Poslední verze podporují také paralelní (multivláknové) zpracování na multiprocesorových systémech. Podpora mnoha barevných modelů - konverze mezi barevnými modely může přinášet zaokrouhlovací chyby, které způsobují ztrátu dat, což je v rozporu s ideální bezeztrátovou kompresí. Kodek Lagarith usiluje o vyhnutí se tomuto problému podporou barevných modelů YV12, YUY2, RGB a RGBA. Klíčové snímky (keyframes) - kodek nepoužívá predikci mezi jednotlivými snímky. Každý snímek je zakódován odděleně (a tím je v podstatě každý snímek klíčovým snímkem). To ulehčuje střih, spojování a posouvání se ve videu. 4.1.1.3 Další bezztrátové video kodeky FFV1 - je to vnitřně rámcový video kodek, který může používat množství variabilních délek kódovaní nebo aritmetické kódovaný pro entropické kódovaní. ArithYuv - je video kodek navržený pro zaznamenávaní videa. Podporuje barevný prostor YUY2. Nastavení obrazu se mohou měnit během komprese videa. Rychlost tohoto kodeku je nižší než u Huffyuvho, avšak jeho kompresní vlastnosti jsou lepší. LCL - jedná se o dva volně šiřitelné kodeky a to AVIzlib a AVImszh. Pracují s barevnými modely RGB a YUV. AVIzlib využívá kompresní knihovnu zlib, která umožňuje vysokou rychlost kompresního algoritmu. AVImszh využívá algoritmus LZ77, který je určený ke kompresi digitálních animací. CamStudio – je kodek, který umožňuje produkovat výborné výsledky s o mnoho menší velikostí souborů v porovnání s jinými kodeky. Nabízí dva algoritmy LZO, který rychle kóduje záznamy obrazovky a GZIP, který je pomalejší, ale s lepším kompresním poměrem. Pracuje v RGB módu a je schopný komprese 16, 24 a 32 bit RBG bit mapy. FastCodec - je volně dostupný rychlý videokodek na zachytávání videa. Hlavním úspěchem návrhu je rychlost a jednoduchost. Kompresní algoritmus je relativně jednoduchý. Každý rámec je komprimovaný jednotlivě. Rámce jsou dělené do čtvercových bloků 4x4 nebo 8x4 pixelů. Každý blok je konvertovaný z RGB do barevného schématu YUV. Pracuje jak v bezztrátovém, tak i ve ztrátovém módu. Tento kodek je bezztrátový pro videa rozlišením s
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
31
násobkem 4 pro šířku i výšku. Ztrátový je pro videa s rozlišením násobkem 4 pro výšku a 8 pro šířku. JPEG2000 - je kodek založený pro kompresi obrazu na vlnkové transformaci. Taktéž umožňuje pracovat v obou módech. Při použití bezztrátové metody dosahuje lepšího kompresního poměru formát PNG. MSU Lossless video codec – je bezplatný kodek, který komprimuje s bezztrátovým faktorem vyšším než 5. Stejně jako JPEG2000 nabízí tento kodek bezztrátovou komprimaci i vizuálně. Efektivita kodeku by měla být větší než u jiných kodeků. SheerVideo - je z rodiny proprietárních bezztrátových kodeků, který umožňuje zachytávat, přehrávat, editovat a archivovat na profesionální kvalitě video formáty v reálném čase. Průměrný kompresní poměr je 2:1. YULS - byl navržen, aby produkoval vysokou kompresi videa bezztrátově. V porovnání s ostatními kodeky má YULS nejlepší kompresní poměr. Maximální rozlišeni videa je 1024x768. Šířka a výška obrazu musí být násobky 16. Dirac codec - je kompresní formát obrazových dát založený na vlnkové kompresi. Pracuje v obou módech. Cílem je dekódovat video při rozlišení 720x576 pixelů při 25fps v reálnem čase, no současný stav je okolo 17fps na 3GHz PC. Kodek může pracovat od nízkých QCIF po HDTV a vyšší rozlišení. H.264 - je video kompresní formát ekvivalentní pro MPEG-4. Jeho úlohou je přenášet obraz ve vysoké kvalitě při nízké přenosové rychlosti. Využívá se hlavně při pozemních digitálních vysíláních ve formátu MPEG a pro satelitní DVB-S2. Pracuje v 21 různých profilech a v závislosti na tom, s jakým profilem pracuje, je tento kodek ztrátový nebo bezztrátový. 4.1.2
Ztrátové video kodeky
Ztrátová komprese je způsob ukládání některých digitálních dat pomocí speciálního algoritmu, který zmenšuje objem dat na zlomek původní velikosti. Přitom se některé méně důležité informace ztrácejí a z vytvořených dat již nejdou zrekonstruovat. 4.1.2.1 Kodeky z rodiny DivX DivX je značka produktů vytvořených společností DivX, Inc. (dříve DivXNetworks), včetně obrazového kodeku kompatibilního se standardem MPEG-4. Tento kodek se díky své schopnosti kvalitní komprese filmů na výrazně menší velikost velice často používá pro nelegální šíření filmů chráněných autorskými právy. Jeho popularita však vedla i k tomu, že velká část moderních DVD přehrávačů podporuje přehrávání filmů kódovaných kodekem DivX. Ve zkratce tedy řečeno DivX je komerční ekvivalent Xvid kodeku, ovšem rozdíl je v tom, že DivX obsahuje nejen video kodek jako je tomu u Xvid, ale obsahuje i multimediální přehrávač a multimediální kontejnery. DivX je kompletní nástroj, který umožňuje zmenšování videa, rozlišení, ořezáváni a další. Využívá například více proudové komprimování. V prvním přechodu získává parametry a vlastnosti videa, které zapisuje do logu a při následujícím přechodu komprimuje video na základě informací z prvního přechodu. Takto dosahuje výborné kompresní poměry při zachování vysoké kvality. Technologie DivX využívá většinu standardních komprimačních metod a kontajnerů, jako jsou H.264, MKV, AVI, MP4 a další. 4.1.2.2 Kodeky z rodiny XviD Xvid je volný software a je uvolněn pod licencí GNU GPL. To znamená, že zdrojový kód softwaru je veřejně dostupný a programátoři mohou provádět změny kódu. Xvid odstraňuje informace, které nejsou důležité pro lidské vnímání a to umožňuje velmi vysoké
32
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
komprese, které vám umožní efektivně pracovat s digitálním videem na domácích počítacích vůbec. Umožňují vytváření videa určeného pro různé aplikace a byly zavedeny profily interoperability zařízení pro přehrávání Xvid. Profily poskytují všechny funkce obvykle zaměstnány v příslušné aplikaci, scénáři a funkcí. Patří mezi ně např. pokročilé nástroje pro kódování jako kompenzace pohybu quarterpel nebo vlastní kvantizační matice (CQM). Jsou definovány čtyři základní profily, které se liší s ohledem na podporované nástroje pro kódování a povolené maximální rozlišení: Mobilní profil Xvid je nejméně náročný a umožňuje vytváření videa pro zařízení s menším displejem jako mobilní telefony. Xvid přenosný profil je zaměřen na používání v přenosných přehrávačích médií nebo web tabletech a podporuje video až do rozlišení VGA. Xvid domácí profil je navržen pro použití s domácím video zařízením a set-top boxů až do rozlišení PAL/D1. Xvid HD profil byl definován pro kompresi videa v HD rozlišení. XviD technologie také pokrývá všechny důležité video kompresní standardy od MPEG1, MPEG-2, H.263, MPEG-4 Simple a Advanced Simple profily na H.264/AVC. Tyto kompresní standardy mají zcela odlišné pole použití. XviD poskytuje nejvyšší kvalitu softwarového řešení pro všechny z nich, podporuje širokou škálu hardwarových platforem a bezkonkurenční výkon. 4.1.2.3 Další ztrátové video kodeky Ligos Indeo - Původně jde o kodek vyvinutý firmou Intel, ta jej později prodala firmě Ligos. Výsledná kvalita jím zpracovaného obrazu je dobrá, při nastavení na 100% není možno výsledek téměř rozeznat od originálu, tomu však odpovídá i velikost souboru. Microsoft Video 1 - Tento kodek se stal součástí operačních systémů firmy Microsoft od verze Windows 95. Později byl rozšířen o kompresní algoritmy kodeků Intel Indeo 3.1 a Supermac‘s Cinepak. Díky tomu mohl být výsledný obraz o rozměrech 320×240 bodů s frekvencí až 30 snímků za sekundu. Windows Media Video - Kodeky WMV vyvinula firma Microsoft, při kompresi udržuje datový tok, snímky zahazuje, aby jej nepřesáhl, anebo vyplňuje nadbytečnými informacemi, aby tok nebyl nižší. H.261 Jedná se o jeden z prvních prakticky digitálních kodeků, který byl hlavně určený pro přenosy přes ISDN v rychlosti 64kbit/s a byl vyvinutý pro kódování videa v datovém toku od 40 kbit/s do 2 Mbit/s, podporoval rozlišení videa 352 x 288 a 176 x 144. Tento kodek položil základy mezinárodním standardům pro následující kodeky. M-JPEG Využívá klasické JPEG kompresní algoritmy, které používáme při kompresi obrázků. Kodek komprimuje každý snímek videa individuálně, dosahuje poměrně malých kompresních poměrů, avšak v nejlepším případě dosahuje 1:20. DV Využívá ke kompresi intra-frame diskrétní kosínovou transformaci (DCT), kde je každý snímek komprimovaný samostatně. Kompresní poměr je pevný a to 5:1. Základní rozlišení je 720 x 576 pixelů. DV je základním formátem pro střih videa, nevýhodou je vysoký datový tok.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
33
4.2 Audio kodeky Zvukové (audio) kodeky jsou určeny ke kódování a dekódování zvuku. Fungují na principu komprese zvuku odstraněním složek, které lidské ucho nevnímá. Kodeků pro zpracování audia lze nalézt v dnešní době mnoho, důvodem jsou jejich specializace. Je totiž zřejmé, že pro reprodukci hlasu na síti bude třeba jiný kodek, než pro kvalitní reprodukci hudby. Zvukové kodeky s kompresí lze rozdělit do tří skupin. A to bezztrátové, ztrátové a kodeky pro kódování řeči. 4.2.1
Bezztrátové audio kodeky
U této komprese nejsou vypuštěny žádné informace. Specializují se především na hudbu. Při snížení velikosti souboru nedochází ke snížení kvality. Jejich velikost je však stále dost velká. Zvukový záznam lze zpětně rekonstruovat do původní podoby. Free Lossless Audio Codec (FLAC) Je to otevřený zvukový bezeztrátový formát, jehož výstupní soubor má velikost přibližně 60% souboru původního. Pracuje podobně jako univerzální komprimační programy, jejichž stupeň komprimace zvukových dat bývá nižší a komprese a dekomprese pomalejší. AAC Lossless Je rozšířením standartu pro kompresi zvuku MPEG-4 Part 3. Má podobné výsledky jako FLAC. WMA9 Lossless Jeho typická komprese je 1,7:1 - 3:1. Apple Lossless Tento kodek známý také jako Apple Lossless Encoder, ALE případně Apple Lossless Audio Codec, ALAC je bezeztrátový kodek pro kompresi hudby vyvinutý firmou APPLE. Pro ukládání hudby kódované pomocí Apple Lossless je použit kontejner MP4 a soubory mají příponu .m4a. Nepoužívá žádnou DRM ochranu, ale lze ji aplikovat díky povaze QuickTime kontejneru. Komprimované soubory dosahují asi 60% původní velikosti. Má nenáročnou dekompresi, tak je výhodný pro přístroje s omezeným zdrojem energie. WavPack je open source kodek. Jeho přípona je .wv nebo .wvc. Umožňuje hybridní kompresi, kdy vytvoří dva soubory. Jeden s kvalitní ztrátovou kompresí a druhý obsahuje data, jež byla ztracena. Podporuje také vícekanálový zvuk. Oproti FLAC je pomalejší. 4.2.2
Ztrátové audio kodeky
Pracují na principu odebrání informací ze vstupního signálu, které člověk neslyší, nebo si je neuvědomuje. Zvukový záznam již není možné přesně rekonstruovat, jelikož dochází ke ztrátě určitých dat. U ztrátových transformačních kodeků se vzorky obrazu nebo zvuku rozdělí na drobné segmenty, transformují se na frekvenční prostor a poté kvantují. Výsledná kvantovaná data se dále kódují entropicky. MP3 (MPEG-1 nebo MPEG2 LAYER 3) Jedná se o komprimační kodek, ale pro zachování kvality by komprese neměla být větší než 11-ti násobná. Snaží se odstranit redundanci zvukového signálu na základě psych akustického modelu, tj. že se ze záznamu odeberou informace, které jsou pro člověka neslyšitelné. Využívá při tom principu časového a frekvenčního maskování. Jeho bitový tok bývá obvykle 128 kbit/s, v rámci kvality je však ideální datový tok 192 kbit/s. Nejvyšší možný datový tok je 320 kbit/s. Tento kodek zvládá mono nebo stereo reprodukci, ale v současné době existuje alternativa „mp3 surround“, která podporuje i formát 5.1. WMA (Windows Media Audio) Tento kodek, který je spjat s platformou Windows, byl původně určen jako náhrada za MP3. Jeho nevýhoda je časté ořezávání vyšších frekvencí při nižší přenosové rychlosti. Oficiálně existuje pouze jeden kodér a ten je integrovaný ve Windows Media Player. Bývá v kontejneru ASF a mývá příponu .asf nebo .wma.
34
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
AC3 Tento kodek vyvinutý firmou Sony je určen pro filmový průmysl. Pro hudbu není vhodný. Patří však mezi nejkvalitnější kodeky, což dokazuje jeho využití na DVD, BluRay, HDTV atd. Má bitovou hloubku 24 bitů a podporuje kmitočty 48 kHz až 96 kHz. Zvládá prostorový zvuk 5.1, 6.1 i 7.1. Jeho datový to může být až 640 kbit/s. Také má nižší nároky, jelikož má jednodušší dekódování procesorem. AC-3 je nejkvalitnější a nejkompatibilnější kodek. AAC (MPEG-4 ADVANCED AUDIO CODING) Tento kodek je kombinací MP3 a AC3. Vyhovuje standardu ISO a je patentován skupinou MPEG. Má vyšší rozsah kmitočtů (8 - 96 kHz pro MPEG-2, a až 196 kHz pro MPEG-4), podpora až 48 kanálů, plnou podporu všem rychlostem snímkování (fps – frame per second) filmů bez výraznější ztráty kvality, vyšší efektivitu komprese, lepší analýzu zvuku při kompresi (nižší ztráty), atd. Pro kvalitní reprodukci mu stačí datový to 60kbit/s a umožňuje i VBR. Na rozdíl od AC3 je vhodný také pro hudbu, je rovněž licencovaný. Zatím hlavní nevýhodou tohoto kodeku je malá kompatibilita, jen málo přehrávačů jej podporuje, ale bývá využíván i v mobilních telefonech.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
35
5 Multimediální kontajnery Multimediální soubory jsou povětšinou složeny hned z několika částí: zvuková data, obrazová data, titulky a navíc doplňující informace, tzv. metadata, která umožní všechny složky synchronizovat. Další součástí může být i obálka (envelope), která se na rozdíl od metadat nepodílí na informačním obsahu, ale přidává se, aby se samotná zakódovaná zvuková a obrazová data odlišila od ostatních součástí datového toku. Každý program, proces nebo hardware může využívat jinou část těchto dat, aby však s nimi bylo možné manipulovat, musí být zapouzdřena do jednoho celku, tzv. kontejneru. Kontejner zapouzdřuje všechna data do jednoho souboru - obecně datového toku. Ten tak může například obsahovat jednu video stopu, několik zvukových stop v různých jazycích, několik titulků a je zajištěna jejich synchronizace. Uživatel si tak při přehrávání může vybrat, kterou kombinaci multimediálních dat chce použít. Proto, aby mohl být kontejner přehrán, se používá tzv. splitter (též demuxer), který datové proudy rozdělí do různých kodeků a následně do výstupních zařízení. Kontejner sám o sobě neříká, jaká vnitřní komprese uložených dat byla použita. Ta je určena použitým kodekem. Kontejner však nese informaci o tom, jakým kodekem byl každý datový proud kódován.
5.1 Formát RIFF Resource Interchange File Format, zkráceně RIFF, je nejpoužívanější standardizovaný formát uložení dat v PC. Používají ho převážně soubory obsahující digitální zvuk nebo obraz, ale např. i odkládací soubory některých programů nebo soubory animovaných ukazatelů Windows. Základním prvkem RIFF souboru je informační blok nazývaný "chunk". Každý tento blok začíná čtyřznakovou identifikací a délkou chunku. Pokud je délka dat obsažených v bloku lichá, doplňuje se chunk na konci nulou, aby délka celého chunku byla sudá. Bloky lze do sebe "vnořovat" a vytvářet stromovou strukturu. Většinou se ale nepoužívají více než tři úrovně. Nadřazený blok, tzv. "parent chunk", obsahuje kromě identifikace a délky také čtyřznakovou identifikaci typu bloku. Za ní následují jednotlivé podřízené bloky, tzv. "sub chunks". Délka dat nadřazeného bloku zahrnuje tedy i identifikaci typu a délku všech podřízených bloků, včetně záhlaví. Názvy nadřazených bloků jsou obvykle velkými a názvy podřízených bloků malými písmeny, v názvu lze použít i mezery. Existují 2 typy parent chunku: RIFF a LIST. RIFF obvykle obsahuje samostatné datové struktury a LIST seznamy položek. Existuje několik typů souborů s různou příponou ve formátu RIFF: AVI - video záznam s prokládaným zvukem (různé formáty dat). WAV - zvukový záznam (různé formáty dat), některé aplikace ukládají WAV ve starším formátu, který je částečně kompatibilní s novější verzí RIFF. RDI - bitmapová data. RMI - MIDI data (ekvivalent MID souborů). jiné typy souborů využívající jako kontejner RIFF formátu. Například zvukové soubory typu WAV používají pro uložení dat strukturu RIFF, jejichž struktura a pořadí bloků je následující: RIFF parent chunkWAVE (pokud je nutný) - Format - Factual Length (pouze u souborů pro samplery) - Data (pokud jsou v souboru markery a/nebo regiony)
36
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava - Sampler (pouze pro Session8, AudioWork atd.) - Cue (pokud je nutný) - PAD (podle abecedy) LIST parent chunk INFO (pokud jsou v souboru markery a/nebo regiony) - Summary information LIST parent chunk adtl - Label text - Labels - Trigger list - Playlist - Instrument
Význam jednotlivých bloků: Blok Waveform - Tento blok obsahuje samotná audio data, informace o jejich formátu a doplňkové informace. Blok Format - Obsahuje informace o formátu zvukového souboru. Jeho rozsah je určen použitým zvukovým formátem. Patří sem informace o počtu bitů na vzorek, vzorkovacím kmitočtu, počtu kanálů a způsobu kódování audio dat. Blok Factual Length - Obsahuje informace o skutečné délce audio dat. U některých způsobů kódovaní, např. ADPCM totiž délka zvukových dat neodpovídá počtu vzorků. Tento blok je ve WAV souboru obsazen pouze tehdy, je-li nutný, např. při použití výše zmíněné ADPCM, který používá pouze 4 bity na jeden vzorek, na rozdíl od 16-ti bitů u PCM. Blok Data - Obsahuje vlastní audio data. Způsob uložení dat závisí na formátu určeném wFormatTag. Např. formáty Microsoft, IMA a Creative ADPCM používají jiné formáty ukládání dat, i když se jedná o stejný způsob kódování - adaptivní rozdílovou PCM. Obecně ale platí, že jsou kanály sloučeny, tj. po jednom celém vzorku prvního kanálu následuje jeden celý vzorek druhého kanálu atd. Teprve po prvním vzorku posledního kanálu následuje druhý vzorek prvního kanálu. Pokud je vzorek více jak 8-mi bitový, používá se pro ukládání jednotlivých bytů vzorku little endian, čili jako první nejméně významný byte (LSB) a jako poslední nejvíce významný byte (MSB). Blok Sampler - Specifikuje informace pro soubory používané elektronickými hudebními nástroji nazývanými sampler. Samplery přehrávají navzorkované signály a podle zahrané noty mění výšku tónů. Kromě základních informací o audio datech vyžadují samplery i další informace, např. o tzv. smyčkách, tj. oblastech audio souboru, jejichž přehrávání se opakuje. Tyto informace obsahuje blok Sampler. Počet smyček v souboru může být neomezený, pokud ale není soubor rozdělen do regionů (viz dále), používají se maximálně dvě smyčky - Sustaining Loop a Release Loop. Blok Cue - Určuje začátky markerů nebo konce regionů. Marker je přesně definovaný bod (časová pozice) v audio datech sloužící např. ke střihu souborů. Region je oblast audio dat určená dvěma časovými pozicemi (začátkem a koncem). Regiony slouží např. k segmentaci dat pro editování v HDR systémech (HardDisk Recording - digitální záznam zvuku na harddisk). Blok PAD - Tento blok je určen k řazení bloků Data do sektorů pro použití s audio hardwarem jako je Digidesign Session 8. Identifikátor tohoto bloku je PAD.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
37
Blok souhrnných informací - Blok souhrnných informací je nadřazený blok, který obsahuje sub-chunky s textovými informacemi o souboru. Řetězec znaků je vždy ukončen nulou. Většina informačních bloků se ale týká hlavně skenovaných grafických souborů. Blok regionů a triggerů - Tento nadřazený blok, označený adtl, obsahuje detailní informace o regionech, např. jejich jména, způsob spouštění a přehrávání atd. Doplňuje blok Cue a jeho samostatná existence neposkytuje kompletní informace o regionech. Blok Cue poskytuje pouze seznam regionů/markerů, další informace jsou obsaženy v adtl parent chunku, identifikace jednotlivých bloků dat je podle čísla pořadí markeru/regionu v seznamu Cue. Blok Label Text - Obsahuje doplňkové informace o regionech, tj. informace, které nejsou obsaženy v bloku Cue. Blok Label - Obsahuje jméno regionu nebo markeru. Blok Trigger List - Tento blok se používá k určení externích spouštěcích událostí pro vstup do regionů a playlistu. Autorem je firma Sonic Foundry. Jsou-li ve zvukovém souboru definovány regiony, můžete externě spouštět jejich přehrávání pomocí triggerů. Trigger je událost na řídící MIDI sběrnici, která spustí přehrávání regionu. Touto událostí může být časový údaj SMTPE synchonizačního kódu, libovolná MIDI zpráva (např. zahrání tónu na elektronickém syntezátoru) nebo přijetí bloku systémových MIDI dat. Blok Playlist - Obsahuje tzv. playlist souboru, tj. informaci o pořadí přehrávání jednotlivých regionů. Používá se v HDR systémech při editaci nahrávky - soubor se rozdělí na regiony a změní se jejich pořadí, takže není potřeba přesunovat data v souboru. Identifikátor tohoto bloku je plst. Blok Instrument - Připraven pro budoucí použití se softwarovými wavetable syntezátory nebo hardwarovými wavetable syntezátory s pamětí RAM. Identifikátor tohoto bloku je inst. [11]
5.2 Kontajnery typu AAF a MXF AAF (Advanced Authoring Format) anebo MXF (Media Exchange Format) jsou projekty ke vzájemné výměně formátů, které vytvářejí framework, se kterým masmediální profesionálové pracují produktivněji. K pochopení AAF a MXF je vhodné připomenout, že existují vždy sú dva aspekty ke každému médiu a to: „Essence“ (podstata) „Metadata“ (metadata) Essence je samotné médium. Pokud médium existuje v otevřeném formátu (se standardním kodekem), potom příčná anebo jinak nazvaná diagonální aplikace využije této podstaty (essence) k její realizaci. Existuje mnoho formátů essence, které mohou být použité pohodlně na téměř libovolném systému. Některé otevřené (standardy) formáty se mohou podobat quicktime, mpeg1, mpeg2, wav atď., ale samotná essence se nehodí ke spolupráci. Z tohoto důvodu potřebujeme další část a tou jsou „metadata“. Metadata je informace o médiu („essence“). V samotné podstatě poskytují metadata informace o tom jak zkombinovat či upravit essence. Ve svém jádře jsou metadata data o jiných datech. Metadata informace obsahuje jen identifikace, popis a časový kód (timecode). Taktéž může obsahovat informaci o tom, co se stalo v essence.
38
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Jednou z výhod AAF je možnost výměny nejen surových mediálních souborů, ale též projektů mezi rozdílenými systémy bez potřeby ustupování a objevování toho, co už bylo vytvořené. 5.2.1 MXF MXF je standard, který definuje datovou strukturu pro zvukový a vizuální materiál (essence) v bodě (místě) změny (myšleno v síti, ne v rámci systému). Definuje hlavičku, zápatí a způsob, jakým jsou zabalené metadata. I když není nastavený standard pro essence formát metadat (myslí se tím informace o materiálu z povodní získané formy přes všechny kroky až po současnu formu), i tak definuje, jak musí být metadata napsané v „plug in“ do MXF. MXF je víc než jen zaobalený „konec řetězce“, navržený k úplnému obsahu, který v buducnosti už nebude přepracovávaný, anebo využívané jen jeho kousky. To je důležité hlavně v prostředí vysílání nebo pro poskytování širokopásmového obsahu. Jednou ze svých hlavních zásad MXF je rozšiřitelnost, čili musí být možné přidat víc možností bez toho, aby se změnil základní formát anebo zpětná kompatibilita. Za účelem dosažení cíle, pro které bol MXF vytvořený, MXF definuje sadu: Essence kontejnery - definované způsoby vykonávaní essence Index tabulky - způsob mapovaní časových posunů na byte ofsety Header metadata - technický popis struktury a obsahu souboru, plus volitelné charakteristika metadat Partition Metadata - metadata využívané na popis fyzikální struktury souboru Random Index Pack - index, který pomáhá při umístnění oddílů v souboru Run-In - volitelný, nestandardní blok dát v horní časti souboru, který se používá jen ve specializovaných operačních vzorech. 5.2.2
AAF
Hlavní části jsou tvořeny: AAF objektová specifikace AAF specifikace nízko úrovňového kontajneru AAF SDK (Software Development Kit) referenční implementace AAF objektová specifikace definuje strukturování kontajneru pro ukládání essence dat a metadat pomocí objektově orientovaného modelu. Definuje logický obsah objektů a pravidel. AAF specifikace nízko úrovňového kontajneru charakterizuje, jak je každý objekt ukládaný na disk. Využívá strukturalizované úložiště, systém ukládaní souborů k ukládání objektů na disk. AAF SDK referenční implementace se skládá z objektově orientovaných programovacích nástrojů a dokumentace, která umožňuje klientským aplikacím přístup k datům uložených v AAF souboru. Je nezávislá na platformě nástrojů poskytovaných ve zdrojovém formátu. AAF se vztahuje na různé druhy metadat včetně: Identifikace a lokalizace (jak je položka jednoznačně identifikovaná) Administrativa (práva, přístup, šifrování a bezpečnost, atd.) Interpretace (názvy, umělci, atd.) Parametrizace (kódovaní signálu a charakteristika zařízení)
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
39
Procesy (editace a skládání dat) Relace (popisuje vztah mezi různými částmi metadat a anebo essence) Časoprostor (místa, časy, věci, úhly kamery, atd.) Výhodou je samozřejmě schopnost přenášet do metadat něčí editaci anebo kompozici a být schopný znát rychlost vlákna, jaký byl původní formát, kde se nacházejí původní části média, jaké byli použité ukázky atd.
5.3 Základní kontejnery Struktura všech kontejnerů je velice podobná. Některé mají strukturu jednodušší, jiné složitější, ale základní principy zůstávají stejné. Liší se názvy jednotlivých částí souborů, jejich identifikace a uložení, ale najdeme zde zřetelnou podobnost. Mezi moderní kontejnery lze zařadit ASF, MOV a Matrošku, jejichž specifikace není uzavřená a lze nadále rozvíjet. Především posledně jmenovaný má výhodu v použití universálního EBML, jehož kladem je také malá velikost přidaných dat potřebných pro zachování struktury. Nelze také jednoznačně určit, který kontejner je vhodnější, každý se používá ke svému určitému účelu, v určitých situacích. AVI je formátem pro editaci ve Windows, MOV pak na počítačích Apple. Ostatní formáty jsou pak většinou vytvořeny pro uložení finálního videa, které se již nebude dále upravovat a tak je také třeba s nimi pracovat. 5.3.1
AVI
Jedná se o zkratku z anglického Audio Video Interleave, soubory mají příponu .avi. Vyvinula jej firma Microsoft a začala používat již v roce 1992 ve své nástavbě operačního systému Windows 3.1 (spolu s frameworkem Video for Windows); jedná se o derivát formátu RIFF. Data byla původně bez komprese v rozlišení 160×120 bodů při 15 snímcích za sekundu. Omezení bylo i v maximální 1 GB velikosti výsledného souboru. Poté následovaly další dvě verze, které formát výrazným způsobem rozšiřovaly a modernizovaly. Vývojové verze AVI AVI 1.0 - umožňuje nahrávat pouze do velikosti 1GB, maximální počet snímků je 22500, tedy asi čtvrt hodiny záznamu pro 25sn/s. AVI 1.1 - rozšířeno nahrávání a indexování do velikosti souborů 2GB, některé programy řeší překonání této bariéry pomocí nahrávání do více souborů AVI 2.0 - označuje se také OpenDML, má neomezenou velikost souboru, ale FAT32 omezuje maximální velikost na 4GB, na NTFS je (téměř) neomezeno (velikost disku) AVI soubor je založen na formátu RIFF (Resource Interchange File Format), začíná vždy hlavičkou, která identifikuje soubor, hlavička začíná čtyřmi písmeny RIFF, velikostí souboru a typem, dále jsou informace o typu obsažených streamů a dále multiplexovaná data. Na konci je index, bez kterého není přehrání možné. Video a audio data jsou multiplexována po snímcích a audio paketech, normálně je to pravidelně například po snímku nebo po určitém čase (doporučená hodnota 500 ms), ale obecně to může být jakkoliv, s tím také souvisí nastavení prokládání při zachytávání (Full prokládá po nastaveném čase, None prokládá okamžitě po přijetí dat, tedy není zaručeno pravidelné prokládání, Capture prokládá po nastaveném čase, ale pokud by to narušilo tok dat, tak nemusí prokládání dodržet za každou cenu). Své přednosti najde hlavně při zachytávání videa pro následnou editaci, protože je podporován velkým množstvím programů. Nejoblíbenější je DV AVI, což je normální AVI
40
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
soubor s kompresí DV, používanou u digitálních kamer, kde je zaručena synchronizace obrazu a zvuku. Buď obsahuje pouze jeden datový tok, který nese video i zvuk (je to přímo ten, který se přenáší po Firewire z kamery), pak jde o DV AVI typ 1, nebo AVI obsahuje video a zvuk zvlášť (Firewire stream je při nabírání demultiplexován), pak mluvíme o typu 2. Do tohoto kontejneru není možné uložit titulky ani jiné informace (kapitoly).[10]. 5.3.2
ASF, WMV, WMA
Advanced Systems Format (ASF), dříve označovaný jako Advanced Streaming Format. Soubory mají příponu samozřejmě .asf, později přibylo i .wmv a .wma, což pochází od Windows Media Video/Audio, struktura je ale stejná. Tento formát není určen pro nahrazení AVI, ale je určen především pro použití MPEG-4 a Windows Media Video a Audio formátů. Jeho cílem bylo odstranit hlavní nedostatky formátu AVI a jeho určení je především pro streamování po internetu. Největším nedostatkem je jeho uzavřenost, nelze v podstatě použít jiné kodeky, než Microsoft dovolí, a také není licenční politikou dovoleno pracovat se soubory přímo, ale jen za použití DirectShow filtrů Microsoftu. Struktura ASF v aktuální verzi 1.2 je založena na objektech, objekt je základní složkou, je identifikován pomocí GUID (stejně jako vše v DirectShow, velikost 16 bytů) a existuje v několika vrstvách, jeden objekt tedy může obsahovat jiný. Nejvyšší vrstva obsahuje tři objekty. Jako první objekt je v souboru povinně vždy hlavička - Header Object. Pomocí jejího GUID se identifikuje typ souboru v DirectShow (prvních 16 bytů v souboru je vždy totožných) a dále obsahuje objekty druhé vrstvy, většinou nejsou povinné a jsou to například File Properties Object, Stream Properties Object, Header Extension Object, Codec List Object, Script Command Object, Marker Object a mnoho dalších. [2] 5.3.3
MOV
Hlavní konkurent Microsfotu, firma Apple má také svůj formát, který konkuruje AVI již od jeho počátku. Jde o Quicktime soubory s příponou .mov, který se používá na počítačích Apple Macintosh ve stejné míře jako AVI ve Windows. Na svojí dobu byl poměrně sofistikovaný a podobný dnešním moderním kontejnerům, umožňuje nést různé typy informací, například i Flash. Základní jednotkou souboru je atom, který může obsahovat další atomy. Atom začíná vždy velikostí a dále typem, obě mají 32bitů (čtyři byty), pro větší atomy je zde rozšířená velikost 64 bitů hned za typem, pokud je standardní velikost rovna 1, ostatní informace jsou specifické pro různé typy atomů. Pro lepší orientaci v souboru je u novějších souborů zavedena jednotka QT atom, která má složitější strukturu, ale poskytuje informace o vnořených atomech. Jeden soubor je vždy jedním velkým atomem Movie atom, který má identifikaci moov, podle toho je možné soubor poznat i bez přípony. Uvnitř něho je hlavička Movie header s identifikací mvhd, která je vždy také přítomna. Následuje Track atom, což je jedna stopa, každá stopa je nezávislým elementem v souboru, Media atom specifikuje typ datového toku (video/audio), jeho délku a specifické informace, Video Media information resp. Sound Media informatik pak charakteristiku videa resp. zvuku. Sample Table obsahuje tabulku pro konverzi času na příslušné datové vzorky (chunks) a pak samotná data. 5.3.4
MKV, MKA, MKS
O svou přízeň se uchází i další otevřený formát Matroška (ruský název není náhodný). Vychází z dnes hojně používaného jazyka XML, resp. jeho binární verze Extensible Binary Meta Language (EBML). Jako takový umožňuje nést téměř cokoliv, ne jen video a zvuk.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
41
Obsahuje podporu pro titulky, menu, kapitoly, tituly, lze přiložit i soubory. Struktura souboru (obr. 13) začíná hlavičkou, která identifikuje typ EBML souboru a verzi, následuje segment(y), který tvoří datovou funkční část, typicky je jen jeden, ale může jich být i více. Segment se dále dělí na menší části (sekce), každá obsahuje jiný typ informace: Metaseek udává pozici těchto sekcí uvnitř segmentu. Information obsahuje základní informace o souboru jako název titulu, dále unikátní ID a pokud je součástí více souborů, tak i ID dalšího souboru. Tracks je seznam stop, tedy video, audio, titulky a také informace o nich. Chapters pak seznam kapitol a jejich umístění. Clusters jsou již samotná data - video snímky, zvukové pakety atd. Jejich pozice je vždy jako čas, což zabraňuje rozsynchronizování všech stop. Cueing Data je pro urychlení hledání pozice v souboru a slouží podobně jako index u AVI souboru, není však nezbytná, pouze urychluje vyhledávání. Attachment lze přiložit jakýkoliv soubor. Tagging, který nese související informace k titulu nebo jednotlivým stopám jako autor, účinkující a podobně, je to obdoba ID3 tagu u MP3. Bez jakýchkoliv pochybností lze říci, že jde o nejpropracovanější systém, který je možno přidáváním sekcí dále rozvíjet. Podle obsahu se používá i rozdílná přípona, u video souborů je to .mkv, u zvukových .mka a u samotných titulků .mks.
Obr. 13
Transportní kontajner MKV
5.3.5 MP4 Je multimediální kontejner definovaný standardem ISO/IEC 14496-14:2003. Je také známý pod názvem MPEG-4 Part 14, je tedy součástí MPEG-4 standardu. Jako jeho základ
42
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
posloužil kontejner MOV přehrávače QuickTime od společnosti Apple. Je to moderní a otevřená alternativa k AVI kontejneru. Oproti AVI může MP4 obsahovat menu, více titulků i zvukových stop a dokonce i 3D objekty. Umožňuje také bezproblémové streamování videa. Oproti AVI má MP4 trochu jiné možnosti v použití kompresí. Je to MPEG-1, MPEG-2 a MPEG-4 pro obraz a MP3 a AAC pro zvuk, tedy kompresní audiovizuální formáty skupiny MPEG. 3GP, 3GP2 jsou modifikací MP4, která kontejner zjednodušuje pro použití v mobilních zařízeních. Jako komprese obrazu se v 3GP používá formát H.263, zvuk je ve formátu AMR. Byl definován organizací 3GPP pro 3G UMTS multimediální služby. Využívá se převážně pro mobilní telefony.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
43
6 Multimediální rozhraní Nejpoužívanějšími digitálními rozhraními pro multimediální zařízení jsou USB, DVI (Digital Visual Interface), HDMI (High Definition Multimedia Interface), IEEE 1394 (FireWire). Tyto rozhraní se časem vyvíjely a jsou určená pro přenos sériového toku nekomprimovaných digitálních obrazových (video, v některých případech i audio) dat. Nekomprimovaná data jsou data bez použití kompresních algoritmů MPEG-2 (ITU H.262) případně MPEG-4 AVC (H.264), kdy jde o ztrátové komprese, které redukují přenosovou rychlost dat pro přenos signálu v libovolné platformě (satelitní, zemské nebo kabelové), za cenu přípustné ztráty. Tyto komprimovaná data jsou v přijímači dekomprimována, kdy je obnoven jejich objem (nikoliv přesný obsah), jako před kompresí. Právě takováto data jsou přenášena prostřednictvím mezi jednotlivými televizními a multimediálními zařízeními, kdy jde o přenos na krátké vzdálenosti, s vysokou přenosovou rychlostí.
6.1 USB (Universal Serial Bus) Toto rozhraní vzniklo v roce 1994 ve spolupráci nejznámějších firem, jakými byly Microsoft, Intel, IBM, Compaq a NEC, také proto se nový standard rozšířil po celém světě tak rychle. Toto rozhraní mělo sloužit ke sjednocení používaného komunikačního protokolu, a k jeho univerzálnímu použití. Rozhraní USB se dnes stalo prakticky náhradou sériového rozhraní RS-232. Malý konektor (proti konektoru CANNON pro RS-232), sériová komunikace, možnost zřetězení až 127 zařízení, dostatečné napájení v konektoru (5V/500mA), vlastnosti Plug & Play a především poměrně jednoduchý návrh a volný přístup k technologii. Toto jsou hlavní důvody obrovského nástupu USB zařízení a skutečnosti, že téměř každý současný notebook je vybaven alespoň jedním USB slotem. Dnes jsou běžně dostupné adaptéry na USB 3.0, které podporují přenosy o rychlosti až 5 G bit/s a jsou zpětně kompatibilní se staršími USB 2.0 periferiemi, což je obrovská výhoda. Díky vysoké komunikační rychlosti tak USB rozhraní postupně zvítězili nad rozhraním RS232. USB nám nabízí možnost obousměrné komunikace mezi PC a periferií, základní USB rozhraní je přitom umístěno na základní desce nebo na přídavné kartě. Některé počítače mají přímo na desce umístěn kořenový hub (rozbočovač s maximálně sedmi porty). Propojování lze řetězit až do sedmé úrovně nebo do 127 portů. Unikátní vlastnost USB je, že zařízení může mít hub integrován přímo v sobě. USB je obecně popisováno jako zřetězená hvězdicová architektura, přitom každé zařízení komunikuje s hostitelským portem, jako kdyby mělo vyhrazené spojení. Přes všechna zřetězení se huby chovají pro software transparentně a každé zařízení může být samostatně adresováno. Například USB klávesnice tak může mít další USB port pro USB myš. [12] Základní vlastnosti USB tedy jsou: Plug and Play (automatická detekce a konfigurace) Hot Swap (možnost připojení a odpojení za chodu) Přenosová rychlost verze 1.1 postačující pro pomalá zařízení, 2.0, 3.0 a nejnovější verze 3.1 pro rychlejší připojení Datový tok musí řídit procesor. Komunikační rychlost na USB není uživatelsky modifikovatelná, nastavují si ji obvody samy
44
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
6.1.1
Univerzální použití Orientace zejména na široké nasazení (totální náhrada sériového portu). Levná implementace (cena čipu pod 5 USD)
Princip funkčnosti
USB je sběrnice jen s jedním zařízením typu Master, tj. všechny aktivity vycházejí z PC. Data se vysílají v krátkých paketech o 8 bajtech a delších paketech o délce až 256 bajtů. PC může požadovat data od zařízení, naopak žádné zařízení nemůže vysílat data samo od sebe. Veškerý přenos dat se uskutečňuje v tzv. rámcích, které trvají přesně 1 ms. Uvnitř jednoho rámce mohou být postupně zpracovávány pakety pro několik zařízení. Přitom se mohou spolu vyskytovat pomalé (low-speed) i rychlé (full-speed) pakety. Obrací-li se PC na více zařízení, zajišťuje jejich rozdělení jako rozdělovač sběrnice (hub). Zabraňuje také, aby signály s plnou rychlostí (full-speed) byly vedeny na pomalá zařízení. Časový průběh přenosu informace je předepisován výhradně masterem. Zařízení typu slave se musí synchronizovat s datovým tokem. Jednotlivé bity jsou kódovány metodou Non Return to Zero Inverted (NRZI). Nuly v datech vedou ke změně úrovně, jedničky nechávají úroveň beze změny. Kódování a dekódování signálů je čistě hardwarovou záležitostí. Přijímač musí být schopen získat signál, přijmout a dekódovat data. Speciální prostředky zajišťují, aby nedocházelo ke ztrátě synchronizace. Obsahuje-li původní datový tok šest po sobě jdoucích jedniček, přidá vysílač automaticky jednu nulu (vkládání bitů), aby se tím vynutila změna úrovně. Přijímač tuto nulu z datového toku opět odstraní. Každý datový paket má za účelem synchronizace speciální zaváděcí bajt (00000001b). Přijímač v důsledku kódování NRZI a vsouvání bitů vidí osm střídajících se bitových stavů, na které se může synchronizovat. Během následujícího přenosu musí synchronizace zůstat zachována. Všechny tyto procesy se odehrávají pouze v odpovídajících hardwarových součástkách. Přijímač a vysílač jsou realizovány vždy společně v jedné součástce. Zařízení USB obsahuje jednotku zvanou Serial Interface Engine (SIE), která přebírá vlastní práci. K výměně dat mezi SIE a zbytkem zařízení slouží buffery FIFO (Firts In First Out). FIFO jsou paměti, které mohou postupně přijímat a vydávat data podobně jako posuvné registry. Připojený mikrořadič tedy potřebuje jen přečíst data z FIFO a jiná data do FIFO zapsat. Ve většině případů je SIE součástí mikrořadiče USB. Zařízení USB má obecně několik pamětí FIFO, jejichž prostřednictvím je možno přenášet data. Například myš, která je připojena přes USB, má vždy koncovou endpoint 0 a endpoint 1. Endpoint 0 se používá při inicializaci. Vlastní užitková data se z mikrořadiče v určitých časových odstupech zapisují do endpointu 1 a odtud si je vybírá PC. USB software tvoří tzv. trubice (pipes) k jednotlivým endpointům (koncovým adresám). Jedna trubice je logický kanál k jednomu endpointu v jednom zařízení. Pipe si můžeme představit jako datový kanál tvořený jediným vodičem. Ve skutečnosti však jsou data v trubici přenášena jako datové pakety v milisekundových rámcích a hardwarem rozdělována na reálné paměti podle jejich koncové (endpoint) adresy. Jedno zařízení může současně používat několik trubic (pipes), takže přenosová rychlost celkově vzroste. [12]
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO 6.1.2
45
Rychlost přenosu dat – verze USB
USB je moderní sběrnice, která byla standardizována v roce 1995 a v revizi 2.0 v roce 2000, může sběrnici provozovat v několika režimech. Režimy se rozdělují podle maximálně dosažitelné přenosové rychlosti: Low-speed → Maximální přenosová rychlost 1,5 Mbit/s Full-speed → Maximální přenosová rychlost 12 Mbit/s High-speed → Maximální přenosová rychlost 480 Mbit/s Super-speed → Maximální přenosová rychlost 5 Gbit/s Super-speed+ → Maximální přenosová rychlost 10 Gbit/s Rychlosti 1,5 a 12 Mbit/s byly dosažitelné s USB 1.1. Přenosová rychlost 480 Mbit/s s USB 2.0. USB 3.0 přináší teoretickou přenosovou rychlost až 5 Gbit/s a nejnovější verze USB verze 3.1, taktéž pod názvem USB SuperSpeed+ 3.1, jejíž hlavní avizovanou vlastností je zpětná kompatibilita a plánovaná rychlost až 10 Gbit/s. 6.1.3
Napájení
Rozhraní USB obsahuje vlastní rozvod napájecího napětí o hodnotě 5V a 0,25V. Zařízení mohou být napájena přímo z USB sběrnice, pokud jejich proudový odběr nepřekročí 100mA. Požadavek na větší odběr (až 500mA) musí být ohlášen při enumeraci (rozpoznání) zařízení. Vyšší odběr než je 100mA, může mít nejvýše jedno zařízení na celé USB sběrnici a při nedostatku rezerv může systém toto zařízení odmítnout. Pokud mají USB zařízení vlastní zdroj (např. počítač má vlastní systém pro distribuci napájení nezávislý na USB), je řízen USB sběrnicí (zapínání, vypínání, "stand-by" mód atd.). Každý segment USB umožňuje omezený přenos výkonu pro napájení USB zařízení, přičemž zařízení může být současně napájeno z vlastního zdroje. Společným standardem dle EU je od roku 2011 microUSB. Nabíjecí napětí je stejnosměrné a jeho hodnota je 5V. 6.1.4
Typy konektorů
USB rozhraní používá dva typy konektorů. Plochý konektor "typ A" je dnes obsažen na základní desce každého PC, vyrobeného v posledních několika letech a to v počtu minimálně dvou. Nejnovější základní desky mají kořenový HUB rozšířen o další integrovaný HUB a celkem tak poskytují až osm portů USB. Druhý konektor "typ B" je určen pro periferní zařízení, čímž je zároveň definován standard propojovacího kabelu. Oby typy konektorů jsou znázorněny na obrázku 14 a popis vodičů je uveden v tabulce 10. Tab. 10: Zapojení kabelu USB
PIN Označení Barva Význam 1 VBUS čevená napájení +5V 2 D‐ bílá Data ‐ 3 D+ zelená Data + 4 GND černá napájení ‐ GND (zem)
46
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Obr. 14
Konektory USB
6.1.5 Architektura USB Zařízení vybavené rozhraním USB je buď rozdělovač (hub – centrální jednotka hvězdicovité struktury), nebo funkční jednotka (periferní zařízení – např. myš, klávesnice, scanner, tiskárna, MP3 přehrávač, digitální audio-vstupy, atd.). Propojení je tak řešeno pomocí víceúrovňové hvězdicové struktury. Středem každého hvězdicového propojení je HUB (obr. 15) a jednotlivé propojovací segmenty spojují buď počítač (USB host) obsahující centrální rozdělovač s funkčními jednotkami a rozdělovači na vyšší úrovni, nebo rozdělovač na vyšší úrovni s funkčními jednotkami a rozdělovači na nižší úrovni. Každé USB zařízení má svoji USB adresu a podporuje jednu nebo několik koncových jednotek (end - points / nodes), se kterými může počítač komunikovat. [13]
Obr. 15:
Hvězdicová topologie USB
Činnosti HUB: rozšíření počtu připojitelných zařízení rozpoznání typu zařízení (Low speed, Full speed či High speed)
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO 6.1.6
47
rozvod a řízení napájení připojených zařízení vynulování zařízení (reset), dle stavu sběrnice
Typy přenosů dat
Po sběrnici USB je možné komunikovat jedním ze čtyř zde uvedených způsobů: 1. Řídící přenos (tzv."control transfer") je využit pro řízení zařízení. K tomu slouží řídící dotazy (tzv. "control requests"), které mají vysokou prioritu a obsahují automatické sledování chyb. Jeden dotaz může obsahovat až 64 bajtů. 2. Přenos při přerušení (tzv. "interrupt transfer"). Systém se zde periodicky dotazuje na nová data. S názvem přerušení to nemá nic společného, protože připojené zařízení nemůže vyvolat přerušení u hostitele. Typicky se přenáší až osm bajtů. Využívá se u klávesnice či myši. 3. Hromadný přenos (tzv. "bulk transfer") se používá pro velká množství dat, která vyžadující detekci chyb, ale nejsou časově kritická. Nízká priorita, typická pro skener či tiskárnu 4. Izochronní přenos (tzv. "isochronous transfer") je využíván také pro velká množství dat, ale s definovanou přenosovou rychlostí bez korekce chyb. Uplatnění si najde všude tam, kde se přenáší zvuk či video v reálném čase. Zde jsou kladeny mnohem vyšší nároky na časovou preciznost než na vlastní chybovost přenosu. Časové zpoždění může být velmi nepříjemným rušivým elementem. Wireless USB je technologie, která přišla na trh v roce 2007 a umožňuje bezdrátové propojení zařízení jako pomocí USB. Lze k němu připojit externí disky, fotoaparáty, videokamery. Parametry přenosu jsou shodné s rozhraním USB 2.0, kdy záleží na vzdálenosti zařízení. Při vzdálenosti 3m je teoretická rychlost 480Mbit/s, u deseti metrů již rychlost klesá na 110Mbit/s. WUSB pracuje v rozsahu od 3,1GHz do 10,6GHz. A využívá modulaci OFDM a šifrování AES-128/CCM. Nabízí stejný model komunikace, jako je u klasického USB kdy jeden funguje jako Master a ostatní jako Slave.
6.2 DVI DVI (Digital Visual Interface) rozhraní vzniklo v roce 1999 vylepšením rozhraní DFP (Digital Flat Panel), původně určeného pro přenos nekomprimovaného obrazového signálu z počítače do monolitického zobrazovače. Rozhraní DVI je určeno jen pro přenos obrazových signálů. Přenášejí se 24bitová data složkových signálů R, G, B (8 bitů na vzorek). Přenos každého ze složkových digitálních signálů je sériový, jednotlivé složkové signály jsou pak přenášeny paralelně (jsou jim vyhrazeny samostatné fyzické spoje). Důležitou vlastností rozhraní je způsob kódování dat pro přenos. Aby byl horní mezní kmitočet pásma potřebného pro přenos daného signálu co nejmenší, je v rozhraní použito tzv. TMDS (Transition Minimized Differential Signalling) kódování. Při něm se sice zvýší počet přenášených bitů (pro každý 8bitový vzorek se vytváří 10bitový symbol), ale zmenší se počet přechodů mezi stavy 0 a 1. Fyzicky je rozhraní realizováno třemi TMDS kanály – tedy třemi dvojicemi vodičů, přičemž každá dvojice je vyhrazena pro jeden složkový signál (R, G, B) a jedním kanálem synchronizačním. Varianta Dual Link DVI obsahuje pro zvýšení přenosové kapacity dvojnásobek TMDS kanálů. Rozhraní DVI navíc umožňuje použití ochrany obsahu HDCP (High Definition Content Protection) a přenos signalizace. Klasická varianta DVI Single Link podporuje formáty videa, pro které je potřebný hodinový kmitočet fvz = 25 – 165 MHz. Ve variantě DVI Dual Link to může být kmitočet až 165 – 330 MHz, což umožňuje s reservou i přenos signálů HDTV
48
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
1080p. Uvedené kmitočty představují vzorkovací kmitočty jednotlivých složkových signálů R, G, B a souvisí s dosažitelnou přenosovou rychlostí. Protože kromě samotných obrazových vzorků se na jednom spoji rozhraní mohou přenášet i další signály, je výhodnější charakterizovat potřebnou přenosovou kapacitu pro daný formát nikoliv rozlišením aktivního obrazu a snímkovou rychlostí, ale právě vzorkovacím kmitočtem. Například pro signál v PAL, tedy ve standardním rozlišení 720×576 obrazových bodů, se při 25 snímcích za sekundu používá pro každý z komponentních signálů vzorkovací kmitočet 13,5 MHz (dle doporučení ITU-R BT.601). Je-li každý vzorek signálů R, G, B reprezentován 8 bitovými vzorky, dostaneme pro složkové signály R, G, B potřebnou výslednou přenosovou rychlost = 324Mbit/s. [14] 6.2.1 Konektory DVI Existují 3 typy DVI konektorů (obr. 16), které závisí na implementovaných signálech: DVI-D (digital only) - pouze digitální signál DVI-A (analog only) - pro kompatibilitu s analogovými monitory DVI-I (digital & analog) - digitální i analogový signál Konektory mohou mít druhý datový spoj (tzv. „link“) určený pro přenos obrazu s vysokým rozlišením
Obr. 16:
Konektory DVI
Toto rozhraní vzniklo díky vylepšení DFP (Digital Flat Panel) v roce 1999 skupinou firem seskupených pod názvem DDWG (Digital Displey Working Group). DVI bylo původně určeného pro přenos nekomprimovaného obrazového signálu z počítače do monolitického zobrazovače. Je to širokopásmové rozhraní, které umožňuje kvalitní digitální komunikaci všech televizních a multimediálních zařízení a přenos nekomprimovaných obrazových dat všech používaných formátů, až po rozlišení ( 2560x1600 pixelů). Délka kabelu je omezená použitými materiály a konstrukcí (útlum kabelu).
6.3 HDMI HDMI je rozhraní pro přenos nekomprimovaného obrazového a zvukového signálu v digitálním formátu jedním kabelem. Rozhraní podporuje video standardního i vysokého
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
49
rozlišení a zvuk až s osmi kanály. Maximální datová šířka má podle tvrzení na webové stránce HDMI stačit i budoucím nárokům zábavní elektroniky v domácnosti. HDMI je standart připojení pro široké spektrum produktů: HDTV Blu-ray Disc přehrávače multimediální PC herní systémy digitální videokamery a další… 6.3.1 Kompatibilita s DVI DVI signál je kompatibilní s rozhraním HDMI a to bez ztráty kvality obrazu, ale neumožňuje přenosu zvuku nebo signálů z dálkového ovládání. Tento problém musí být řešen adaptéry či přídavnými kabely. Lze tedy bez problému použít HDMI-DVI kabel nebo redukci. Bohužel neplatí stoprocentně, že by takový spoj vždy fungoval ve stejném rozsahu, jako čisté HDMI-HDMi. Výhody HDMI: Přenos nekomprimovaných dat Potřeba jen jednoho kabelu Obraz v maximálním rozlišení (HD) je celkově 2x až 5x podrobnější než obraz ve standardním rozlišení, mezery mezi řádky jsou menší nebo nepostřehnutelné Jeho větší podrobnost umožňuje pohodlné sledování na větších úhlopříčkách Možnost přenosu až 8-kanálového nekomprimovaného digitálního zvuku 6.3.2 Konektory Konektor HDMI obsahuje standardně 19 pinů, jak je vidět z čelního pohledu na obrázku 17, jejichž stručný popis je uveden níže.
Obr. 17:
Piny na konektoru DVI
50
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Piny (1 až 9) slouží k přenosu tří TMDS datových kanálů (Transition Minimalized Differential Signaling) - technologie, která umožňuje DVI a HDMI posílat vysokorychlostní digitální data), tři piny na kanál (TDMS Channel 0 - 2). TMDS data zahrnují jak video, tak i audio informace Piny (10 až 12) přenášejí data pro kanálové hodiny TMDS, které pomáhají udržovat dané signály v synchronizaci. Pin 13 přenáší informaci o CEC (Consumer Electronics Control) kanálu, který se používá pro řízení dat mezi připojenými zařízeními Pin 14 je vyhrazen pro budoucí použití Piny (15 a 16) jsou určeny k DDC (Display Data Channel), který se používá pro komunikaci EDID (Extended Display Identifikační Channel) informací mezi zařízeními Pin 17 je datový štít pro CEC a DDC kanály Pin 18 slouží pro nízkonapěťové napájení (+5 V) Pin 19 je Hot Plug zjištění, které monitoruje události typu moc nahoru / dolů a plug / odpojit U HDMI má každé rozhraní jiný konektor a ty spolu nejsou kompatibilní. V současnosti existuje pět typy HDMI konektorů: A, B, C a D a E. Typy A a B jsou definovány od verze HDMI 1.0. Typ C je definován od verze HDMI 1.3 a poslední typy D a E pro nejnovější verzi HDMI 1.4. Nejvíce se používá konektor typu A se třemi datovými spoji. Konektor typu B s šesti spoji je delší a patří mu spíše budoucnost, zatím se příliš nevyužívá. Protože tedy ve většině případů je použit Single link, je maximální možné rozlišení 1080p při 60Hz. Typy HDMI konektorů: typ A má 19 pinů a šířku pásma pro podporu všech současných SDTV, EDTV a HDTV režimů, rozměry konektoru jsou 13,9 mm na šířku a 4,45 mm na výšku, typ A je fyzicky kompatibilní se single link DVI-D typ B má 29 pinů (21,2 mm x 4,45 mm) a má oproti typu A dvojnásobnou šířku pásma, proto ho lze použít pro přenos videa ve velmi vysokém rozlišení, jako například budoucím WQUXGA (3840x2400), typ B je kompatibilní s dual link DVI-D, ale momentálně se ještě nepoužívá typ C mini konektor je určen pro přenosná zařízení, je menší než konektor typu A (10,42 mm x 2,42 mm), ale má stejný počet pinů, pomocí redukce může být připojen na typ A typ D micro konektor definovaný ve specifikaci HDMI 1.4 zachovává standardních 19 pinů typů A a C, ale zmenšuje velikost konektoru na něco připomínající micro-USB konektor, typ D je menší než konektor typu C (6,4 mm x 2,8 mm), pro srovnání micro-USB je 7,8 mm x 2,94 mm typ E je automobilový konektor, jde o propojovací systému kabeláže odolný teplu a vibracím 6.3.3 Kabely Standard HDMI přesně nedefinuje maximální délku kabelu pro jednotlivé verze. Jediným omezením je útlum signálu. Délka tudíž závisí na konstrukci a kvalitě materiálů, které byly při jejich výrobě použity. U krátkých kabelů HDMI (1.2) do 1080i konstrukce a kvalita materiálu prakticky nerozhoduje. Pixel clock je pouhých 74,25 MHz a tomu vyhoví všechny HDMI kabely libovolné ceny bez výjimky (pokud není kabel vadný, což se stává u velmi levných kabelů až nepříjemně často). Na přenos na rozdíl od analogu navíc nemá prakticky žádný vliv ani efektní pozlacení konektorů. Pro rozlišení 1080p je však Pixel clock už 148,5 MHz a je
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
51
potřeba použít odpovídající kabel, schopný přenosu s tímto taktem. V označování kabelů HDMI je celkem zmatek a zdaleka ne každý výrobce má svoje kabely nějak rozumně označeny, aby bylo možno vybrat ten správný. Nové označování kabelů vnesl až nový standard 1.3. Jedná se o obdobu kategorií UTP kabelů, konkrétně byly definovány kabely 2 kategorií: Kategorie 1 – pro pásmo do 75 MHz (1080i/720p) Kategorie 2 – pro pásmo do 340 MHz (1600p) První kategorie kabelů vyhoví pro přenos signálu do 1080i s barevnou hloubkou 8 bit (na kanál, což vzhledem ke třem vodičům odpovídá 24 bitové hloubce). Na cokoliv lepšího by se již měly používat kabely kategorie 2. 6.3.4
Verze HDMI
HDMI má v současnosti celkem 6 typů verzí, nejnovější je standart verze 1.4. Ovšem brzy se můžeme dočkat sedmé verze HDMI a to standartu 2.0. Verze 1.0 - 1.2: Dnes stále velmi používaným standardem HDMI je verze 1.2. Maximální šířka pásma zůstává shodná s DVI, tedy 165MHz. Navíc se však do datového toku musí vejít i zvuková informace, případně některé nové řídící informace (ty využívají různé synchronizační technologie, jako Viera Link apod.). Aby bylo možno tyto další informace do omezeného pásma vměstnat, je třeba zvolit drobný trik. Zvukové a doplňkové informace se kódují do videosignálu ve chvílích, kdy není obnovován, respektive není obnovena neaktivní část obrazu, která se nezměnila. Data se ukládají ve vyrovnávací paměti, aby pak zvuk mohl být reprodukován kontinuálně. Verze 1.3(c): HDMI rozhraní 1.3 přináší hlavně rozšíření pásma pixel clock na 340 MHz. Specifikace této verze přitom dovoluje pásmo rozšířit až na 450MHz, v praxi se toho ale zatím nevyužívá. Širší “hrdlo“ datového toku se využívá jak pro vyšší obnovovací frekvenci, tak pro větší hloubku barev. HDMI ve verzi 1.3 umí kódovat RGB signál v 30, 36 a 48bitové hloubce (režim nazývaný Deep Color). Používá k tomu nový barevný formát xvYCC. Díky němu se Deep Color režimy stále “vlezou“ do Single link přenosu až do rozlišení 1080p při 60Hz. Inovace doznal i přenos zvukové informace. Nyní lze přenášet také zvuk ve formátech Dolby TrueHD a DTS-HD. Verze 1.4: HDMI 1.4 přináší především podporu 3D videa a Ethernetu, neboli síťového protokolu pro přenos dat. Rychlost dat může dosáhnout až 100 Mbit/s. Pokud byste tedy připojili televizi s HDMI 1.4 k Internetu, můžete přes další HDMI 1.4 kabel toto internetové připojení dále distribuovat (třeba do blu-ray přehrávače (teoreticky)). Specifikace standardu 1.4 dále definují rozdělení datového toku na dva stereo kanály při rozlišení až 1080p (1920x1080) pro použití v domácích 3D systémech (pro každé oko jiný obraz). Pro non-3D video lze přenést rozlišení až 4096x2160 při 24 Hz. Tato specifikace také přidává kanál pro zpětnou komunikaci. Ten má na starosti oboustranný datový přenos zvuku. Umožňuje například televizoru posílat audio data do A/V receiveru přes HDMI kabel, čímž redukuje počet potřebných kabelů. Jeden kabel tak dokáže přenést zvuk jak do přístroje, tak z přístroje ven.
52
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
6.4 IEEE 1394 IEEE 1394 neboli FireWire je standardem sériového rozhraní pro vysokorychlostní komunikaci, často používané v osobních počítačích nebo v oblasti digitálního videa a audia. Rozhraní je rovněž známo pod označením FireWire (používá společnost Apple), i.Link (Sony) a Lynx (Texas Instruments). Prostřednictvím rozhraní FireWire je dnes možné k přenosnému počítači připojovat například digitální kamery, fotoaparáty či další zařízení - v profesionální sféře se pak používá k rychlému připojení externích disků a optických mechanik, čteček paměťových karet a podobně. V poslední době je však toto rozhraní spíše na ústupu, vzhledem k tomu, že tato zařízení se častěji připojují pomocí USB. Výhodou IEEE 1394 je možnost přenosu bod – bod mezi dvěma perifériemi bez součinnosti procesoru a operačního systému. Rozhraní IEEE 1394 umožňuje napájet připojenou periférii výkonem až 30 W. Standard IEEE1394 specifikuje podrobně rozhraní, umožňující propojovat jednotlivá zařízení ve stromové struktuře. Jeden strom může obsahovat maximálně 65535 uzlů (šestnáctibitové adresování); adresy jsou přitom přidělovány dynamicky při startu sběrnice a/nebo při připojení nového uzlu; díky tomu sběrnice nevyžaduje žádné nastavování identifikačních čísel (jako tomu je např. u sběrnice SCSI) a podporuje přidávání a odebírání uzlů za běhu. Navíc jsou na síť kladena některá omezení - maximální vzdálenost mezi dvěma uzly např. nesmí přesáhnout 16 kroků (tj. nesmí mezi nimi být více než patnáct 'mezi uzlů'); fyzická vzdálenost pak odpovídá použitému kabelu, u standardního kabelu se jedná přibližně o 5 až 20 metrů (standardní kabely mohou být různě tlusté a odolné proti ztrátám a rušení), existují však - samozřejmě dražší - řešení, nabízející řádově větší rozsah. V jedné samostatné podsíti - kterou od ostatních odděluje most (bridge) - může být nejvýše 63 uzlů. Standardní stromovou sestavu sítě podporuje standard tím, že u každého uzlu předpokládá tři konektory (ačkoli obecně uzel může mít konektorů libovolný počet od 1 do 27). U tohoto rozhraní je používáno tří typů konektorů a to 4, 6 (obr. 18) a méně často jsou používány 9-ti pinové konektory.
Obr. 18:
Koncovky pro kabel FireWire s 4 a 6 pinovým zapojením
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO 6.4.1
53
Verze FireWire
Výbor pro standardy pod IEEE zavedl koncem roku 1995 standard IEEE 1394. Číselné označení vyjadřuje běžné pořadové číslo standardu, který popisuje rychlé rozhraní, určené pro činnost dnešních aplikací se značnými nároky na přenos dat (zejména zvuku a videa). Verze FireWire podporují rychlost přenosu dat 400 Mbit/s (varianta 1394a), nebo 800 Mbit/s (implementace 1394b). Varianta 1394a → řešila určité problémy spolupráce a kompatibility zařízení z původního standardu 1394; jinak má ale stejné konektory i stejné přenosové rychlosti. Varianta 1394b → byl pak zaveden na počátku roku 2003. Jeho současná varianta podporuje přenosové rychlosti do 800 Mbit/s, do budoucna je však možné dosáhnout 3 200 Mbit/s Varianta IEEE 1394c → přenosové rychlosti 1 600 Mbit/s a 3200 Mbit/s bude podporovat i další síťové technologie, jako jsou optické kabely ze skleněných a plastových vláken. V roce 2009 byl zahájen vývoj rozhraní IEEE 1394d, jehož cílem je přidat jednovidové optické vlákno jako další přenosové médium k FireWire. V souvislosti s tím lze očekávat zvýšení přenosové rychlosti až na 6,4 Gbit/s. Navíc se očekává rozšíření palety dostupných konektorů. 6.4.2
Porovnání multimediálních rozhraní
USB je nejrozšířenějším rozhraním sloužícím k připojení externích zařízení k počítači a jeho obliba neustále roste. S příchodem režimu High Speed nabízí vysokou přenosovou rychlost, která je dostačující i pro přenos velkých datových objemů. Tímto počinem se tento standard stal velmi zajímavou alternativu k rozhraní FireWire. Periferie počítače a vůbec elektronika připojitelná k počítači zažívají masivní rozvoj a tím se rozvíjí i komunikační rozhraní. Díky tomu vznikají nové přidružené standardy k USB, jako USB OTG nebo USB TMC, které jsou pouze jistým přizpůsobením stávajícího rozhraní na danou oblast použití. Rozhraní DVI je širokopásmové rozhraní umožňující vzájemnou kvalitní digitální komunikaci prakticky všech televizních a multimediálních zařízení a přenos nekomprimovaných obrazových dat všech dnes užívaných formátů – až po rozlišení WQXGA (2560×1600 pixelů). Není však určeno pro přenos audio signálů. Délka propojení DVI je omezená především útlumem kabelu – tedy konstrukci a kvalitou použitých materiálů. Můžeme říci, že díky připojení přes HDMI rozhraní dosáhneme velkého komfortu. Nabízí jednoduché zprovoznění i manipulaci díky jednomu kabelu a vysokorychlostní výkon digitálního propojení. Momentálně je HDMI v delším časovém horizontu velmi spolehlivý způsob jak připojit HD zařízení. Nekomprimované video a audio signály v reálném čase se přenášejí ve studiovém přenosovém řetězci. Standardní sériové rozhraní je SDI (Serial Digital Interface, video a audio). V paralelním tvaru se nekomprimovaný mediální tok potom přenáší přes rozhraní HDMI, DVI. Multimediální signály v komprimovaném tvaru se přenášejí rozhraními ASI (Asynchronous Serial interface), přenos transportního toku v kontejnerech MPEG2 (např. do vysílačů DVB) anebo IEEE 1394 ve formátech se standardním rozlišením a s kompresí DV. Na přenos souborů mimo reálný čas (s výjimkou WEB kamer anebo zvukových toků s nižší rychlostí) potom rozhraní USB nebo IEEE 1394. Na obrázku 19 je zobrazen přehled přenosových rychlostí některých rozhraní.
54
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
Obr. 19:
Přenosové rychlosti
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
55
7 Tvorba multimediálních materiálů Cílem této kapitoly je shrnout základní poznatky při tvorbě multimediálních materiálů. Multimediální materiály lze rozdělit podle jejich povahy na informační, zábavní či reklamní klipy. Je dobré si osvojit základy některých žurnalistických forem, které mohou být vodítkem a svými nepsanými pravidly pomohou formovat konečnou podobu jakéhokoliv multimediálního díla.
7.1 Orientace v žurnalistických stylech a jejich používání Zpráva je většinou krátký útvar čistě popisného a věcného charakteru. Cílem zprávy je podat příjemci stručnou a jasnou informaci o konkrétní události. Zpráva je maximálně objektivní, nutno se zdržet jakýchkoliv hodnotících soudů. Jde o toliko popisný útvar. Uvádí se celá jména (alespoň na začátku), používají se pouze popisná fakta a popisující přídavná jména. Zkratky se nepoužívají vůbec (výjimku představují „zlidovělé“ zkratky typu BBC, CNN atp.) Naopak zkratková slova (NATO, Čedok…) jsou přípustná. Cizí slova je dobré omezit na nezbytné minimum. Naopak je nepřípustná hovorová češtiny a citového zabarvení. Příjemce ze zprávy nesmí poznat, co si novinář myslí. Komentář je na rozdíl od zprávy vysoce subjektivní útvar. Musí v něm zaznít autorovo stanovisko. Pokud má být komentář zasvěcený, předpokládá se znalost popisovaného problému a dobré zdrojové zázemí. Cílem komentáře je nabídnout východisko, upoutat diváka, vybízet k diskusi, získat příjemce pro názor, případně vzbudit emoce okolo popisované problematiky. Komentář však neslouží primárně k tomu, aby skrze něj autor ventiloval své ambice. Komentář je vysoce specifický druh. Vyžaduje originalitu v nápadu, svižnou kompozici textu, zajímavé jazykové prostředky a dobré pointování děje. Český komentář je od svého vzniku v devatenáctém století až po dnešek velmi polemický a satirický, což je dáno okolnostmi jeho vzniku a vývoje v rámci Rakouska – Uherska (politická žurnalistika zde dlouho suplovala úlohu politických stran – např. Karel Havlíček Borovský, atp.). Zvláštním druhem komentáře jsou glosa a fejeton. Glosa je velmi krátký a vtipný komentář s údernou pointou. Fejeton je delší než glosa, který připomíná satirický komentář, tepající konkrétní společenský nešvar z jízlivě humorných pozic. Obecně platí, že kdo zvládne glosu a fejeton, zvládne jakýkoliv žurnalistický styl. Publicistika nenaplňuje pravidlo, že je vše, co není zpráva. Publicistický útvar představuje vyváženější komentář delšího rozsahu. I v tomto stylu musí zaznít stanovisko autora, tento má však zároveň povinnost poskytnout prostor „druhé straně“. Reportáž nabízí zajímavě podané líčení aktuální nebo významné události či prostředí a to na základě přímého pozorování nebo dokumentárního materiálu. Časté prolnutí s publicistickým stylem, aktuálnost. Dokument přináší doklad svědčící o určité skutečnosti. Dokument nemusí být nutně aktuální, často pojednává o záležitostech, které nemají s otázkou aktuálnosti žádnou spojitost (historické, geografické a přírodopisné dokumenty). Tomu odpovídá i jeho celková dramaturgie – pomalejší plynutí času, „klidná“ kamera, více mluveného slova, novinář je spíše skladatelem mozaiky než soudcem
56
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
7.2 Reportáž Dokument většinou řeší otázku „jak to bylo“ nebo „jak to je“ oproti tomu reportáž reaguje na aktuální dění. Je zde silnější pozice novináře jako tvůrce příběhu, který vynáší soudy. Má rychlejší spád a „akčnější“ kameru než dokument. Obvykle je proti dokumentu časově kratší (nejedná se však o charakteristický znak, spíše pomáhá identifikovat žánr). Reportáž řeší otázku „jak se mi to jeví“ nebo „jak to mohlo být“. K reportáži může autor přistoupit různě – může vystupovat jako aktivní průvodce dějem, může se „zapřít“ (vystřihne při tvorbě pořadu své otázky, aby vzbudil dojem, že postavy v reportáži hovoří bez jeho impulsu), případně lze obojí kombinovat. Zvláštním druhem reportáže je medailon. Používá se obvykle k představení osoby nebo místa. V medailonu je redaktor zcela zapřen. Své otázky „vystřihne“ a celý útvar působí tak, že zpovídaná osoba působí dojmem spontánně hovořícího subjektu bez pomoci redaktorovy předlohy. 7.2.1
Základy při výrobě reportáže
Redaktor/reportér rozhoduje o tvorbě reportáže a nese finální zodpovědnost za její podobu, vede tým, který obvykle tvoří kameraman, zvukař a střihač. Důležitá je přípravu podkladů, být při tvorbě reportáže alespoň rámcově v obraze a hlavně vědět, co točit. Příprava téměř vždy zabere více času než realizace. Při sbírání podkladů pozor na dezinformační potenciál. Nepřeskakovat z jednoho stylu do druhého! (komentář je komentář, zpráva je zpráva). Kameraman má za úkol zajistit si dostatek obrazového a filmového materiálu, který bude použit k „polepení“ reportáže. Je důležité natáčet z různých poloh, pozic a v různých módech. Nejedná se o celistvý materiál, který chronologicky popisuje události, ale vybrat si nejlepší záběry, které pak budou použity v konečném díle. Také délka natočených sekvencí je v řádech sekund, celkový dojem pak vytváří akční a atraktivnější vzhled. Střihač potom dle instrukcí redaktora a na základě scénáře, kterému se u reportáží říká košilka, poskládá reportáž do konečné podoby. Nejprve se zpracovává zvuková stopa, čímž se vytváří logicky i pocitově navazující ucelený příběh. Při tvorbě zvukové stopy používáme metodu „timecode“ (hodící se částí zvukové stopy se časově ohraničí a vypíše se několik úvodních a závěrečných slov. U větších reportáží se doporučuje přepisovat celé pasáže. Ukázka časově uspořádaného (timecodového) údaje, tzv. košilky, vypadá následovně: Konference Ochrana obyvatelstva – Dekontam 2011 Redaktor: Iva Petříková Kamera: Přemysl Mer Studio: ... As: Ve dnech 2. – 3. února se konala v nové aule VŠB-TUO mezinárodní konference s názvem Ochrana obyvatelstva - Dekontam 2011. Konferenci pořádala Fakulta bezpečnostního inženýrství a Sdružení požárního a bezpečnostního inženýrství ve spolupráci s Generálním ředitelstvím Hasičského záchranného sboru České republiky. (25´´) Titulek: Brig. Gen. Ing. Miloš Svoboda
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
57
Náměstek generálního ředitele HZS ČR Syn: Dnešní ………..………strategie udržitelného rozvoje, například. (00:08, 00:35, 27´´) (střihnout - 2010) As: * Ve vědeckém výboru konference byl prof. Jiří Matoušek z Masarykovy univerzity, prof. Karol Balog ze Slovenské technické univerzity v Bratislavě, doc. Ivana Bartlová a prof. Aleš Dudáček z VŠB-TUO, doc. Josef Janošec z Institutu ochrany obyvatelstva Lázně Bohdaneč, prof. Leoš Navrátil z Jihočeské univerzity, prof. Pavel Poledňák z Žilinské univerzity, plukovník prof. Dušan Vičar z Univerzity obrany Brno a brigádní generál Ing. Miloš Svoboda z Generálního ředitelství Hasičského záchranného sboru České republiky. (38´´ nebo poslední odstavec 20´´) Titulek: Brig. Gen. Ing. Miloš Svoboda Náměstek generálního ředitele HZS ČR Syn: Letošní ročník………..………problematika dekontaminace. (00:40, 02:41, 120´´) As: Konference se účastnila široká odborná veřejnost. Několika účastníků jsme se zeptali, odkud přijeli a proč se konference účastní. (10´´) Titulek: Účastník konference Syn: Jsem z Ostravy ………..………proto jsem se přišel podívat. (03:05, 03:16, 11´´) Titulek: Účastnice konference Syn: My jsme ze Středočeského kraje ………..………zákonů (03:43, 04:09, 26´´) Titulek: Účastník konference Syn: Jsme z Hradce Králové ………..………navštěvujeme pravidelně Ostravu (03:19, 03:37, 18´´) As: Program konference byl rozdělen do několika programových bloků. Mezi přednášejícími byli například i odborníci ze Státního úřadu pro jadernou bezpečnost Praha, odborníci akciové společnosti Vodovody a kanalizace Hradec Králové nebo Českého hydrometeorologického ústavu, Praha. (20´´) Odborným garantem této dvoudenní konference byl doc. Michail Šenovský z VŠB-TUO. Organizačně konferenci zajistili Ing. Lenka Černá ze Sdružení požárního a bezpečnostního inženýrství, Ing. Jiří Chalupa a Ing. Ivan Koleňák z Generálního ředitelství Hasičského záchranného sboru České republiky a doc. Vilém Adamec z VŠBTUO. (28´´)
58
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava *Odborným garantem konference byl doc. Michail Šenovský z VŠB-TUO. Ve vědeckém a organizačním výboru konference, byli kromě odborníků z pořádajících institucí, také odborníci z mnoha českých a slovenských univerzit a z Institutu ochrany obyvatelstva Lázně Bohdaneč. (20´´) Syn.: 3´22´´ As.: 2´ (nebo 1´43´´)
Zkratkou As: se značí asynchron (jen zvuk bez obrazu) a znamená namluvený komentář, který se obyčejně vytváří až po natáčení a tvoří jakousi dějovou linku. Většinou je dodán jako jeden zvukový soubor a buď podle textu či časové údaji za jednotlivými částmi se nastříhají. Dále následuje Titulek, který uvozuje respondenta (rozhovor). Ten se vkládá a stříhá podle úvodního a konečného slova respondenta, které je přepsáno a uvedeno jako Syn:, což znamená synchron (obraz i zvuk). Za přepisem bývá často uveden čas, který odpovídá pozici v natočeném materiálu. Tímto způsobem se poskládá zvuková stopa s natočenými synchrony a vznikne základní časový údaj o reportáži. Hotovou zvukovou stopu pokrýváme zajištěným obrazovým materiálem, buď v přímé návaznosti, nebo pomocí ilustračního materiálu. Nikdy nestříháme zároveň obraz i zvuk. Komunikace funguje jako kód, to se týká zejména (avšak nikoli výhradně) obrazového sdělení. Do obrazu se může zakódovat mnoho symbolů, které působí na podvědomí příjemce. Dá se tak sdělit spoustu informací, které formát reportáže neumožňuje.
7.3 Multimediální klip Do této kategorie můžeme už zařadit všechny ostatní formáty, jako jsou dokument, hudební klip, multimediální prezentace či reklamní klip. Mají však jednu společnou vlastnost, a tou je příprava v podobě scénáře. Ten by měl obsahovat všechny potřebné informace k natočení výsledného klipu. To by pak mělo ulehčit práci jak při pořizování materiálu, tak při jeho konečném zpracování. V případě reportáže se materiál pořizuje v závislosti na určitou událost v danou chvíli, u multimediálních klipů si lze všechno připravit a naplánovat. Dokonce se dá pracovat i s časovým harmonogramem, to znamená přesně rozvrhnout délku (stopáž) výsledného díla. Dalším formátem pro multimediální tvorbu jsou tzv. video archívy. Jedná se o soubor uložených krátkých video sekvencí, které se pak mohou použít při dokončování různých multimediálních prací. Musí však být pečlivě evidovány, aby je nebylo těžké vyhledat. Jejich evidenční popis by měl obsahovat podrobné informace o samotném záběru. Měly by obsahovat alespoň tyto údaje: Název souboru (jednotný formát jako třeba archiv_001.avi) Název situace (procházející dav lidí…) Podrobný popis celé situace Čas Umístění (interiér, exteriér) Světelné podmínky (slunečno, zataženo, umělé osvětlení …) Klimatické podmínky (déšť, sníh…) Záběr (celek, detail, …) Kamera pohyb (nájezd na detail, pohyb zleva doprava…).
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
59
7.4 Základy pro střih Střihové systémy pracují převážně s timecodem. Timecode je jakýsi časový čítač, zaznamenávaný do samostatné stopy. Kód je uložen ve formě HH:MM:SS:FF (hodiny:minuty:vteřiny:frame/okénko). Ke každému okénku/frame je přidán unikátní časový kód, který po převodu do počítače slouží také jako prostředek pro vymezení délky záběru. Timecode slouží jako základní orientační mechanismus pro střihače a střihové systémy. Pokud se totiž pohybujeme v rámci určitého videozáznamu, potřebujeme pevné orientační body, podle kterých lze nalézt jednotlivé záběry a dále s nimi pracovat. Timecode rovněž slouží pro přesnou synchronizaci se zvukovou stopou a je velice důležitý, když provádíme prvotní střih v Off-line kvalitě. 7.4.1
Lineární střih
Jak již bylo zmíněno, lineární střih je tvořen dvěma stroji. Příspěvkovým (playerem) a nahrávacím (recorderem). Samotný střih pak probíhá tak, že v přehrávači běží pásek s originálním záznamem a na recorder se nahrávají pouze vybrané záběry v požadovaném pořadí a délce. Limity takového řešení jsou přitom zřejmé na první pohled. Neustále musíte převíjet kazetu s originálním záznamem, nemluvě o náročné orientaci v hodinách natočeného materiálu. Především není možné zpětně upravovat již provedené střihy. Ačkoliv se lineární střižny používaly přibližně od konce padesátých let do začátku osmdesátých, nebyly tak označovány, protože jiný způsob střihu než lineární neexistoval. S nástupem počítačové techniky, byl tento systém vytlačen a nadále již téměř nepoužíván. 7.4.2
Nelineární střih
Nelineární střih, nebo-li NLE (Non-Linear Editing), nepoužívá pro záznam pásek. Všechny záběry jsou uloženy v digitální podobě v počítači a střihový software má přístup ke každému jednotlivému snímku nezávisle na ostatních a v požadovaném pořadí. To vše pouhým přetažením myší. Tento systém přinesl mnoho výhod oproti lineárnímu střihu. Filmový střih je také nelineárním střihem, protože můžeme dodatečně vkládat záběry do filmového pásu a tím dotvářet podobu skladby. Mezi základní výhody určitě patří zpětná návratnost. Kdykoliv se lze vrátit a libovolný záběr upravit nebo změnit jeho pořadí. Také nabízí neomezené množství změn a tak bez větších problému upravovat finální podobu filmu. Snadnou orientací ve zdrojovém záznamu a organizací hotových záběrů můžeme zkrátit celkový potřebný čas. Softwarové programy převzaly metaforu střihových stolů. I přes mnohostrannost a pružnost počítačového střihu přidává digitalizování další úkoly a střihač se musí starat o různé střihové varianty, časové kódy, střihové programy a také o technologii počítačů. Pořád ale existují lidé, kteří trvají na tom, že odvedou lepší práci na analogovém přístroji. V současné době existuje nepřeberné množství střihových aplikací. Od nejlevnějších, až po profesionální aplikace. Cenové rozpětí je široké a totéž platí i o kvalitách a použitelnosti jednotlivých aplikací. Tím nejdůležitějším je samozřejmě software - nelineární video editor. Rozdělit je můžeme do několika kategorií, které se ale často překrývají. Základní - mají pouze základní funkce umožňující střih, aplikaci filtrů a kompresi do exportního formátu. Sem patří například programy AviDemux, VirtualDub nebo Kino. Domácí – jde o plnohodnotné video editory, které se zaměřují hlavně na jednoduchost ovládání. Umožňují kromě střihu i aplikaci přechodů, efektů a filtrů,
60
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
vytváření titulků a export v různých formátech, často i přímo vypalování na optické disky. Obsahují někdy i automatizační nástroje, které se snaží udělat spoustu věcí za uživatele bez dlouhých úprav. Mají často omezení na počet video stop. Sem patří například Adobe Premiere Elements, Apple Final Cut Express, Pinnacle VideoSpin a Studio, Sony Vegas Studio, Corel VideoStudio, Canopus EDIO Neo, CyberLink PowerDirector, MainConcept EVE a další. Profesionální - umožňují plnohodnotný střih, neoplývají většinou žádnými automatizačními nástroji, ale mají různé kompoziční módy, pokročilé titulkovací nástroje. Většina funkcí je ručně a největší devizou jsou hlavně pluginy i od jiných firem. Podporují se v kombinaci s různými hardwarovými kartami a střižnami se vstupy a výstupy a případně i akcelerací zachytávání a efektů. Sem patří například Adobe Premiere Pro, Apple Final Cut Pro, Canopus EDIUS, Sony Vegas Pro nebo Avid Media Composer. Střižny (Profesionální) - tato kategorie se dnes většinou přesunula do profesionální kategorie. Editory se dodávaly pouze s hardwarovými video akcelerátory, ale s nárůstem výkonu počítačů tato nutnost pominula. Profesionálové totiž používají i další nástroje. Kromě editoru fotografií a pro tvorbu grafiky jsou to především animační a 3D nástroje, které dokáží rozpohybovat video a různé efekty - titulky a grafiku. Jde například o Adobe After Effects, Autodesk 3D Studio Max a Combustion nebo Blender.
Multimediální technika pro integrovanou výuku VUT a VŠB-TUO
61
Seznam použité literatury [1]
HANUS, Stanislav. Základy televizní techniky I: přednášky. Vyd. 1. V Brně: Vysoké učení technické, Fakulta elektrotechniky a komunikačních technologií, Ústav radioelektroniky, 2009, 82 s. ISBN 978-80-214-3971-9.
[2]
BEDNÁŘ, Jiří. Digitální televize: [populární průvodce technologií DVB-T]. 1. vyd. Praha: Sdělovací technika, 2006, 115 s. ISBN 80-866-4511-8.
[3]
Groups DVB. Http://www.dvb.org [online]. 2014 [cit. 2014-03-25]. Dostupné z: http://www.dvb.org/groups/SB
[4]
Understanding DVB-T2. Http://www.digitag.org [online]. 2009 [cit. 2014-03-25]. Dostupné z: http://www.digitag.org/DTTResources/DVB-T2_Handbook.pdf
[5]
ETSI TR 102 376 (DVB-S2). Http://www.etsi.org [online]. 2005 [cit. 2014-03-25]. Dostupné z: http://www.etsi.org/deliver/etsi_tr/102300_102399/102376/01.01.01_60/tr_102376v01 0101p.pdf
[6]
ETSI TS 102 991 (DVB-C2). Http://www.etsi.org [online]. 2011 [cit. 2014-03-25]. Dostupné z: http://www.etsi.org/deliver/etsi_ts/102900_102999/102991/01.02.01_60/ts_102991v0 10201p.pdf
[7]
ISO/IEC 11172-1. Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. 1993. Dostupné z: http://www.iso.org/iso/catalogue_detail?csnumber=19180
[8]
ISO/IEC 13818-1:2013. Nformation technology -- Generic coding of moving pictures and associated audio information. 2013. Dostupné z: http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=6207 4
[9]
ISO/IEC 14496-1. Information technology -- Coding of audio-visual objects. 2005. Dostupné z: http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?csnumbe r=38559
[ 10 ] LANDSMAN, Vlastimil: Centrum Didaktických a Multimediálních VýukovýchTechnologií. [online]. [cit. 2014-04-08]. Dostupné z: http://www.cdmvt.zcu.cz/storage/navody/avidemux/kontejner.html [ 11 ] SCHIMMEL, Jiří: Formáty zvukových souborů na PC. [online]. [cit. 2014-03-24]. Dostupné z: http://www.elektrorevue.cz/clanky/01007/index.html#wavechnk [ 12 ] USB - Universal Serial Bus [univerzální sériové rozhraní] - popis. [online]. [cit. 201402-28]. Dostupné z: http://www.elsaco.cz/navody/usb.ht [ 13 ] AXELSON, Jan. USB complete everything you need to develop custom USB peripherals. 3rd ed. Madison, WI: Lakeview Research, 2005. ISBN 978-193-1448031.
62
Fakulta elektrotechniky a informatiky, VŠB – TU Ostrava
[ 14 ] Popis rozhraní DVI. [online]. [cit. 2014-02-28]. Dostupné http://web.fit.vutbr.cz/study/courses/IPZ/public/texty/dvi/dvi_predn.pdf
z: