FORMÁTY PRO VIDEO
Základní pojmy
Části síťově šířených multimédií
zvuková data obrazová data metadata
doplňující informace umožňují obě složky synchronizovat.
obálka
nepodílí na informačním obsahu obvykle se přidává kvůli zpřístupnění informací nebo pro větší robustnost datového toku zapouzdření do společného celku
jednodušší manipulace
Základní pojmy
Multimediální kontejner
umožňuje uložit zvuková, obrazová i jiná data (streamy) do jednoho souboru
zajišťuje synchronizaci může obsahovat další informace (kapitoly, menu, titulky) neříká nic o vnitřní kompresi některé elementární streamy možné uložit bez kontejneru
např. mp3
příklady kontejnerů
datového toku
MPEG-2, MPEG-4, AVI, ASF, Quicktime, Realtime, Ogg, MKV
Splitter
slouží přehrávačům pro rozdělení kontejneru na jednotlivé streamy
ty pak předá odpovídajícím kodekům
Základní pojmy
Kodek
program (zařízení) pro transformaci datového proudu (streamu) nebo signálu 1. 2.
dělení
zvukové, obrazové (video), … ztrátové, bezztrátové
příklady kodeků
ukládání data do zakódované formy (kodér) obnovení přesné nebo přibližné původní podoby dat (dekodér)
MPEG-4, MPEG-4 AVC (H.264, DivX, XviD), WMV, Quicktime Movie, RealVideo, …
Ztrátová komprese pomocí transformačních kodeků
vzorky obrazu nebo zvuku se rozdělí na drobné segmenty transformují se na frekvenční prostor, kvantizují se a kódují
MPEG
Motion Picture Experts Group Skupina specifikací a standardů
pro kompresi, kódování a přenos audiovizuálních informací
stream, dekodér (kodér nespecifikuje)
jedna ze skupin v rámci společné technické komise ISO a IEC
http://www.chiariglione.org/mpeg, http://www.iptvdictionary.com/iptv_dictionary_MPEG_definition.html
MPEG-1
Ztrátové kódování videa a zvuku pro datové nosiče
video CD, kabelová a satelitní TV, digitální audiovysílání 1993 (dokončen 1991)
Vlastnosti
komprese videa kvality VHS a zvuku CD-audio
max. datový tok 1,5 Mb/s kompresní poměr 26:1, resp. 6:1
nejvíc kompatibilní formát, dnes zastaralý a téměř nepoužívaný .mpg, .mpeg, .mp1, .mp2, .mp3, .m1v, .m1a, .m2a, .mpa, .mpv
MPEG-1 - obsah
1. Systems
2. Video (komprimace) 3. Audio (komprimace)
Layer2 (MP2) vysílání, Layer3 (MP3) aplikace pro PC
4. Conformance testing
ukládání a synchronizace videa, audia a dalších dat současně
testy správnosti implementace standardu
5. Reference software
ukázkový software ukazující jak kódovat a dekódovat podle standardu
Part 1 MPEG-1 stream decoder
Part 2 Video decoder
Part 3 Audio decoder http://www.chiariglione.org/mpeg
MPEG-2
Ztrátové kódování videa a zvuku
DVD Video, TV vysílaní
přenosové, obrazové a zvukové kódovací standardy, 1994 DVB-T, DVB-S, DVB-C (Digital Video Broadcasting)
Vlastnosti
podpora prokládaných snímků vyvinut pro 720×576 bodů
podpora VBR (variable bit rate) – proměnlivý datový tok
pružnost, různé rozměry, různé poměry stran
rozpozná statickou scénu a BR zvýší nebo sníží možno volit VBR nebo CBR (i velikost)
lepší komprese, vyšší systémové nároky přenosová rychlost 1,5 až 15 Mb/s (pro TV signál 6 Mb/s)
Součásti MPEG-2
Part 1: Systems
Part 7: Advanced Audio Coding
Part 2: Video
Part 8: VOID
Part 3: Audio
Part 9: System extension RTI
Part 4: Conformance testing
Part 10: Conformance extension - DSM-CC
Part 5: Software simulation
Part 11: IPMP on MPEG-2 Systems
Part 6: System extensions - DSM-CC
http://www.chiariglione.org/mpeg
MPEG-2
Profily MPEG-2 Zkr. SP MP SNR Spatial HP
Název Simple profile Main profile SNR Scalable profile Spatially Scalable profile High profile
Typy snímků I, P I, P, B I, P, B I, P, B I, P, B
Aplikace
DVD DVB (Digital Video Broadcasting)
SDTV HDTV
ATSC (Advanced Television Systems Committee)
digitální náhrada NTSC
Chroma Format 4:2:0 4:2:0 4:2:0 4:2:0 4:2:2, 4:2:0
MPEG-4
Rozsáhlý multimediální standard
DVB-T, HDTV, komprese AV dat pro web (streaming) obsahuje mj. kontejner MP4, zvuk. kodek AAC, H.264
Vlastnosti
menší bitrate při stejné kvalitě obrazu, 1998
interaktivní TV a jiné aplikace
vyšší systémové nároky rozšiřuje MPEG-1
podpora 3D obsahu, kódování s nízkou rychlostí přenosu a Digitální správu práv (DRM)
MPEG-4
Part 2
povoleno použití vlastních kodeků
Part 3
kodek AAC
Advanced Audio Coding znám i jako MPEG-2 Part 7
Part 10
menší kompatibilita, ale vyšší komprese např. DivX, Xvid, Nero Digital nebo Quicktime 6
H.264 (AVC)
Part 12
vlastní kontejner MP4
Další standardy MPEG
MPEG-3
původně určený pro kódování standardu HDTV
MPEG-7 (Multimedia Content Description Interface)
standard pro popis multimediálního obsahu dat definuje sadu nástrojů pro audiovizuální popis
název, autor, co se v něm děje použití značkovacího jazyka XML
umožní efektivní přístup k multimediálnímu obsahu
později byl vývoj pozastaven a MPEG-3 byl sloučen s MPEG-2
archivace mm. souborů a vyhledávání
MPEG-21
širší rámec pro práci s daty
potřebnými pro tvorbu a přenos multimediálně zachycených informací
Multimediální kontejner
Formát uložení různých proudů multimediálních dat do jednoho souboru (datového toku)
video, několik zvukových stop, několik titulků …
Neříká nic o vnitřní kompresi
dána kodekem
zajištění synchronizace možnost volby kombinace při přehrávání
množina podporovaných kodeků může být omezena
Nejpoužívanější kontejnery
AVI MPEG, MP4 ASF (WMA, WMV) Quicktime a Realtime Ogg, Matroska
AVI (Audio/Video Interleave)
Microsoft 1992 (Windows 3.1) Vlastnosti
původně bez komprimace, 160×120, 15 fps (snímků/s)
další verze: libovolná komprese, velikost bez omezení
Struktura
hlavička
informace o videu (rozlišení, komprese, kodek atd.) a zvuku (frekvence, kodek …)
data rozdělená do bloků synchronizační tabulka na konci souboru
velikost max. 1 GB
soubor se nedal přehrát, pokud nebyl úplný (neprokládané audio a video)
Široká podpora videoeditačními programy, kompatibilita
použití i v digitálních fotoaparátech nedostatky při použití s moderními kodeky (DivX) nejsou podporovány doplňující informace
titulky, kapitoly
Kontejner ASF, WMV
Advanced System (dříve Streaming) Format, Microsoft
vychází z AVI (nenahrazuje) přípony .asf, .wmv. .wma
Používané kodeky
MPEG-4
WMV, WMA – Windows Media Video/Audio
Neobsahuje indexovou tabulku
pův. výhradně; jen částečná implementace standardu, bez podpory B-snímků
vhodné i pro internetové vysílání
Nevýhody
uzavřenost
Microsoft nutí používat systémové rozhraní Direct Show dvě varianty: v1.0 používána Windows Media Playerem a Windows Media Encoderem, neveřejná; v2.0 publikována a patentována
Kontejnery MPEG
MPEG Program Stream (MPEG-PS)
ISO/IEC standard, pro prostředí se zárukou bezchybnosti přenosu dat
jednoduchost, snadná implementace, horší pro editaci
DVD-Video – hlavní formát popis prokládání video a audio toku do jednoho streamu vnitřní časová synchronizace
MPEG Transport Stream (MPEG-TS)
komunikační protokol
pro prostředí bez záruky bezchybnosti přenosu dat
pro audio, video a data DVB, streamování po internetu elementární streamy MPEG PS zabaluje do vlastních paketů vnitřní časová synchronizace
BDAV MPEG-2 Transport Stream
BR, digitální kamery využívající formát AVCHD přípony .m2ts a .MTS.
Kontejner VOB (Video Object)
Součást DVD-Video Založen na MPEG-2 PS
přehrávač MPEG-2 přehraje
Video
MPEG-1 Audio Layer II nebo MPEG-2 Audio Layer II
Další objekty
MPEG-2 Part 2 nebo MPEG-1 Part 2
Audio
někdy nutné přejmenovat (na mpg nebo avi) nemusí fungovat titulky
titulky, menu
Srovnání s MPEG-2
navíc: Linear PCM, AC-3, DTS neumí: AAC audio (MPEG-2 Part 7), kompresní formáty MPEG-4
Kontejner Quicktime (MOV)
Otevřeně zdokumentovaný multimediální kontejner
Rozdělení dat na více nedělitelné části (atomy)
Apple, konkurence pro AVI a WMV; přípona .mov podpora jakýchkoliv kodeků každá má hlavičku o typu a uložení
Možnost pracovat s proměnným tokem
navíc v případě poškození některého z objektů je možné jej přeskočit
QuickTime Player
QuickTime framework
aplikace, která slouží jako multimediální přehrávač prostředí poskytující API funkcí pro kódování a dekódování zvuku a obrazu
MOV
formát souboru QuickTime Movie
Real Media Format
RealNetworks, přípona .rm, .rmf, .rmv, .rv RealMedia
kontejner může měnit framerate videa v čase
RealVideo
videoformát, .rv, několik vlastních kodeků
RealAudio
rv10, …, rv40
audioformát, .ra
Podpora streamování
hlavně v internetovém vysílání dnes malá podpora zejména díky licenční politice (přehrávání)
Kontejner MP4
Otevřený formát pro různá zařízení spotřební elektroniky
Základ kontejner MOV (QuickTime)
menu, více titulků i zvukových stop i 3D objekty zjednodušení bezproblémové streamování videa
Možnosti komprese
součást MPEG-4 standardu (MPEG-4 Part 12)
obraz MPEG-1, MPEG-2 a MPEG-4, DivX, Xvid, H.264 zvuk MP3 a AAC (Advanced Audio Coding)
Podpora
některé HW přehrávače a mobily
Nero, Apple
rozšíření brání omezená podpora kodeků nestandardizované úpravy formátu
ukládání HD videa v digitálních fotoaparátech (i kamerách)
množství nestandardních variant
Kontejner Ogg Media (OGM)
Svobodný software pro digitální multimédia
skládá se z tzv. stránek ogg jakýkoli video nebo audio kodek, CBR nebo VBR
Struktura hlavičky stránky
Zachytávací zdroj – vždy „OggS“ Pozice zrna – časová značka
Kontejner Matroska (MKV))
Moderní otevřený kontejner Přípona .mkv, .mka Popis vnitřní struktury založen na XML
respektive na binární verzi EBML
Umožňuje vnitřně nést téměř jakákoli data
skládá se ze segmentů, ty se dělí na sekce, každá nese jiný druh dat možnost přidávat sekce
Výhody
např. video v HD, audio DTS nebo AC3 podpora pro titulky, menu a další
Struktura souboru
Extensible Binary Meta Language
platformní otevřenost a vnitřní propracovanost
Nevýhody
zatím chybějící podpora, hlavně nekomerční sféra
Kontejner WebM
Otevřený AV formát pro web
reakce Googlu na možné poplatky za H.264
nákup autorů od On2 Technologies
Audio ve formátu Vorbis
navržen pro použití do HTML5
Kontejner založen na formátu Matroska Video ve formátu VP8
od 2016; Microsoft a Apple vlastní u H.264 téměř 70 patentů
lepší než zastaralý MP3
Podpora:
Firefox 4+, Opera 10.60+, Chrome 6+, IE 9+
pro IE nutno stáhnout WebM for IE9
Chip 11/2010
Další kontejnery
Kontejner Flash Video
otevřený formát pro Adobe Flash Player
přípona .flv, .f4?, možno zahrnout do .swf
snadná integrace s flashovými aplikacemi
jeden z nejpoužívanějších formátů na internetu
používá patentované kodeky podpora kodeků H.264, VP6, MPEG-4 ASP, Sorenson H.263 důraz na vysokou kompresi a kompatibilitu
k přehrání stačí plugin Youtube, Google Video, Stream, …
Kontejner NUT
formát vyvíjený týmy MPlayer a FFmpeg otevřený, nepoužívá patent
jednoduchý, flexibilní, odolný proti chybám přípona .nut
Kodeky
Program (zařízení) pro transformaci datového proudu nebo signálu 1.
ukládání dat do zakódované formy
2.
obnovení původní formy dat
Informace o použitém kodeku
pomocí FourCC kódu
čtyřpísmenná značka, je v hlavičce kontejneru
Codec ID
přesné nebo přibližné
zpětně kompatibilní s FourCC
Dělení
zvukové, obrazové (video), …
ztrátové, bezztrátové
Bezztrátové videokodeky
RAW
není kodek; data nekomprimovaná pro PAL signál 720x576 datový tok ~ 30 MB/s.
HuffYUV
komprese YCbCr (ne YUV)
výhody
rychlá komprese i dekomprese, menší paměťové nároky, volné používání
nevýhody
predikována hodnota následujícího pixelu (pod. jako bezztrátové JPEG) chyba (rozdíl) zakódována pomocí Huffmanova kódování
nízký kompresní poměr (nejlépe ~ 1:2,5), základ kodeku Lagarith
Lagarith
open source bezztrátový kodek založen na HuffYUV
menší rychlost než HuffYUV, možnost paralelního zpracování podpora mnoha barevných modelů (kvůli efektivitě) jednoduchý střih, spojování a posouvání videa
Ztrátové videokodeky
Indeo (pův. Intel, pak Ligos)
kvalita obrazu dobrá
součást Windows XP SP1, nekompatibilita s Win64 ani Vista
Microsoft Video 1
součást od Windows 95
později rozšířen o Intel Indeo 3.1 a Supermac‘s Cinepak
obraz 320×240 bodů až 30 fps dříve rychlý a kvalitní, dnes pomalý a zastaralý
při nastavení na 100% téměř totožné s originálem, velká velikost souboru
při nastavení 100% kvality komprese stále viditelné čtverečkování obrazu
MJPEG (Motion JPEG)
obrazová komprese JPEG jednotlivých obrázků videa
volitelný kompresní poměr v rozsahu 1:6 až 1:16 plně integrován do Windows i některého HW (menší nároky na výkon PC) dobrá editace videa, dobrá kvalita i velikost
při kompresním poměru 1:8 datový tok ~ 4MB/s
Ztrátové videokodeky
WMV (Windows Media Video)
nejen druh komprese, ale i celý formát
zapouzdřen do kontejneru ASF, podpora i AVI či MKV
především streamingové aplikace kodek založen na MS implementaci MPEG-4 Part 2 podpora variabilního i konstantního bitrate
při kompresi udržuje datový tok, snímky zahazuje, aby ho nepřesáhl a nebo vyplňuje nadbytečnými informacemi, aby tok nebyl nižší
formát HD DVD a Blu-ray disků
dokáže přibrat až o 25% více nadbytečných informací
povinný kodek pro zařízení PlaysForSure, Portable Media Center jediný podporovaný kodek pro Microsoft Silverlight
WMV 9
standardizován jako otevřený, ale zákonem chráněný VC-1 jeden ze tří povinných videokodeků pro BD-ROM
Ztrátové videokodeky
Quicktime Movie a QTVR (Quicktime Virtual Reality)
Apple; nejen kodek, ale celý formát
kódování videa na internetu
Apple Quicktime Player
komprese od 1:5 do 1:25
snadno přenositelný mezi Macintosh a PC
pro přehrání vyžaduje svůj software
QTVR pro panoramata 360°
dnes spíše průměr
RealVideo
komprese a formát firmy Real Networks
založeno na H.263, od RealVideo 8 na H.264 blízký typu Quicktime
větší důraz na kompresi videa pro internet
dnes ustupuje do pozadí
Videokodeky Ogg
Videokodeky
Theora
Tarkin
experimentální kodek využívající diskrétní waveletovou transformaci
Dirac
vyvinut jako součást projektu Ogg měl konkurovat formátu MPEG-4 a kodekům RealVideo, Windows Media Video
experimentální kodek vyvinutý BBC jako základ nového kodeku pro přenos videa přes internet
OggUVS
kodek pro ukládání nekomprimovaného videa.
Videokodeky MPEG-4
Videokodeky MPEG-4 Part 2
profily SP (Simple Profile), ASP (Advanced Simple Profile) DivX, Xvid QuickTime FFmpeg
3ivx
freeware pro nahrávání, konverzi a streamovaní (linux, i Windows) obsahuje přes 100 kodeků, často nelegálně rozkrytých komerční sada kodeků kompat. s MPEG-4
Videokodeky MPEG-4 Part 10 (AVC)
H.264 (a GPL enkodér x264) Nero Digital DivX Pro (od verze 7)
Ztrátové kodeky – DivX
Obrazový kodek kompatibilní s MPEG-4
kvalitní komprese filmů, podpora mnoha DVD přehrávačů
Varianty komprese
jednoprůchodová s daným datovým tokem
snaha o udržení datového toku bez ohledu na výslednou kvalitu
jednoprůchodová s danou kvalitou
snaha o udržení zadané kvality bez ohledu na velikost
dvouprůchodová
7 GB > 700 MB; nelegální šíření filmů chráněných autorskými právy
při prvním průchodu analyzuje a v druhém průchodu optimalizuje (lepší využití datového toku)
Od verze 5 implementuje další algoritmy
tzv. psychovizuální model obousměrnou kompresi (B snímky) kompenzace pohybu
optimalizace kompresí pro přibližování, náhlé změny jasu, stagnující plochy a další
Ztrátové kodeky – DivX
DivX 3.11 Alpha (1998, původní verze)
založená na nelegálně upravené verzi kodeku pro MPEG-4 od MS
ve své době vynikající, dnes lepší standard
OpenDivX (2000, vznik firmy DivX a vytvoření vlastního formátu) DivX 4 (opensource)
nekompatibilita se standardem MPEG-4, max. rozlišení 352×288 původně pouze do ASF, hackeři upravili pro AVI
kvalita horší
DivX verze 5 (2002)
uzavřený formát s kompresí MPEG–4 bez přístupu ke zdrojovým kódům zpětně kompatibilní, výborná kvalita
integruje v sobě nástroje a filtry pro úpravy obrazu už při kompresi
až 25% snížení velikosti výsledného souboru než DivX 4 rozměry, kvalitu, ostrost, atd.
vyšší nároky na výkon procesoru
Ztrátové kodeky – DivX
DivX 5 (2002)
několik verzí
DivX 6 (2005)
vylepšení samotného kodeku
až 40% nárůst výkonu paralelizace výpočtu
dvě verze
liší se placeným konvertorem (DivX Converter)
formát souborů .divx
omezený zdarma, plnohodnotný zdarma s reklamu, placený
DivX Media Format (DMF) podpora MPEG-4 menu
DivX 7 (2009)
komprese H.264, AAC audio (MPEG-2, 4) nativní podpora kontejneru Matroska
DivX 6 kodek DivX EKG DivX Pro kodek (na1 měsíc) průchozí DivX YV12 DivX Player
Ztrátové kodeky – XviD
XviD
otevřený formát kompatibilní s MPEG–4
původně založený na OpenDivX
navíc umí export videa široká konfigurovatelnost kodeku
podmínkou je dělitelnost 4
několik verzí
příliš složitý, optimální nastavení komplikované
libovolné rozlišení až do velikosti obrazu 1920×1088 bodů
po uzavření projektu (2001)
po rozporech uvnitř komunity
mohou být přehrány v DivX kompatibilním DVD přehrávači
použití pokročilých vlastností může způsobit nekompatibilitu
H.264
Standard pro komprimaci videa (2003)
součást standardu MPEG-4 (MPEG-4 Part 10)
Komprimační algoritmus videa
v současnosti nejkvalitnější
vysoký stupeň komprese (oproti MPEG-2 2× až 3×) vysoké nároky na CPU a paměť využití volné knihovny x264 (pouze kodér)
vyvinut pro HDTV, Blu-ray a HD-DVD
Nevýhody
licenční poplatky pro výrobce zařízení a komerční uživatele
MPEG-4 AVC (Advanced Video Coding)
do konce 2015 zdarma pro koncové uživatele
Velikosti dat zakódovaných různými verzemi MPEG MPEG-1 100%
MPEG-2 90%
MPEG-4 ASP 50%
MPEG-4 AVC 35%
Profily H.264
Baseline Profile (BP)
Main Profile (MP)
navíc podpora 10 bitového vzorkování
High 4:2:2 Profile (Hi422P)
základní profil pro vysílání a ukládání pro HDTV; též HD DVD, Blu-Ray přidává bezztrátové kódování, 8x8 pixel intrasnímkovou predikci
High 10 Profile (Hi10P)
určen pro streamování – vysoká komprese, robustnost
High Profile (HiP)
původně hlavní profil pro vysílání a ukládání; pracuje s B-snímky, prokládání
Extended Profile (XP)
nenáročné aplikace s omezenými zdroji – videokonference a mobilní zařízení, podpora pouze I/P snímků
navíc podpora YUV 4:2:2 chroma subsampling při 10 bitovém vzorkování
High 4:4:4 Predictive Profile (Hi444PP)
navíc podpora YUV 4:4:4 chroma sampling, 12 bitové vzorkování přidaná podpora bezztrátových oblastí a další
Použití H.264
široké rozšíření od streamování po HDTV HDTV
povinný videokodek HD DVD a Blu-ray standardů TV přenos DVB-S2 i DVB-T
Mobilní zařízení
standard
Multimédiální formáty
součást mnoha formátů
Videokonference
podpora v DVB-H (Handheld) a DMB (Digital Multimedia Broadcasting) PlayStation Portable, iPod (5.+ gen.) …
od 2005
Video-/Digicams
např. modely Casio, Kodak, Samsung, Canon, Sony, Sanyo
VP8
Bezplatný kodek Googlu
použití jako součást WebM pokračovatel VP6 (Flash) a VP7 (Skype)
Omezení
nepoužívá B-snímky nemá adaptivní kvantizaci …
http://www.chip.cz/mesicnik-chip/prave-pripravujeme/vp8-bezplatny-kodek-googlu
KOMPRESE VIDEA
Komprese videa
Požadavky
kontrola toku dat (zaručený kompresní poměr) rychlost komprese / dekomprese odolnost vůči chybám synchronizace se zvukem
řeší systémová vrstva – kontejner
Kodek
typicky tři vrstvy – video, audio, systém
případně text – titulky …
Komprese videa
Kódování interframe
mezi snímky odstranění časové redundance většina obrazové informace zůstane stejná
využití rozdílového kódování
není ji nutné kódovat vícekrát řešeno po makroblocích, využití DCT
Kódování intraframe
uvnitř snímku každý snímek samostatně prostorově komprimován
jako JPEG
možná vylepšení:
rozdělení obrazu na části (každá může mít jinou ztrátovost) optimalizace pro prokládaný obraz predikce v rámci obrazu
Komprese videa
Rekonstrukce rozdílově kódovaného snímku pro ztrátovou kompresi
první snímek A ztrátově zakódujeme
další snímek B nelze rekonstruovat, protože neznáme A
vhodné uložit rozdíl A’ – B místo A – B
kompresor musí obsahovat dekompresor
po dekompresi získáme aproximaci A’
ztrátově uloží A dekomprimuje A jako A’ snímek B komprimuje rozdílově jako A’ – B
kompresor i dekompresor obsahují paměť pro předchozí snímek
Kompenzace pohybu
Predikce a kompenzace pohybu
rozdělení do makrobloků
pohybový vektor (motion vector)
jednoznačně definuje posunutí bloku
provede se rozdíl mezi původním a výsledným obrazem
16x16 bodů zkoumá se možné posunutí
pokud malý, kóduje se rozdíl, jinak původní blok
Vylepšení metody
typický pohyb vodorovný jeden pohybový vektor na makroblok
výpočet jen pro složku Y
odhad v nižším rozlišení, pak zpřesnění využití koherencí
pohybové vektory u okolních makrobloků podobné pohybové vektory u předchozího snímku podobné http://www.digitalnitelevize.cz/magazin/dvb-t/dvb-t-technologie/technicke_minimum_mpeg2.html
Komprese videa
Sekvence jednotlivých samostatných snímků
I-frame (intraframe)
P-frame (predictive, forward)
klíčový snímek všechny makrobloky bez predikce
některé makrobloky predikované rozdílový obrázek mezi běžným a předchozím I nebo P původní obraz se dá zrekonstruovat za použití předchozího P nebo I
B-frame (bi-directional predicted, forward and backward)
některé makrobloky predikované rozdílový obrázek mezi dvěma nejbližšími I nebo P – silná komprese původní obraz se dá zrekonstruovat za použití 2 nejbližších P nebo I
Komprese videa
B-frame možnost zvolit, zda se daný blok kóduje proti předchozímu snímku, budoucímu či jejich průměru
standardně počítán jako ½ (IP + PN) některé kodeky zavádějí váhu – např. H.264
Zpětné prediktivní kódování obsahuje pouze snímky I a P příklad
I1 P2 P3 … I16 P17 P18 … P-snímek ~ 2-3× menší
vynucené vkládání dalšího I-snímku
oprava chyb možnost náhodného přístupu možnost editace
http://www.icsi.berkeley.edu/PET/pet-applications.html
Obousměrné prediktivní kódování
Typická posloupnost
IBBPBBPBBPBBI (mezi dvěma I jsou 3 (nebo 5) P a mezi vším 2 B) každých 0,4 s se objeví I-frame
Pořadí kódování
dekódér musí přijímat v jiném pořadí I1 B2 B3 P4 B5 B6 P7 B8 B9 P10 B11 B12 I13 I1 P4 B2 B3 P7 B5 B6 P10 B8 B9 I13 B11 B12
1 je I1;
2 spočten z I1, P4, B2;
původní pořadí pořadí po kompresi
3 z 2, P4, B3;
4 z I1 a P4
Dekomprese
P-snímku
najít předchozí I-snímek dekomprimovat všechny následující P-snímky až do daného
B-snímku
dekódovat oba okolní P-snímky
Obousměrné prediktivní kódování
Dekodér
musí obsahovat paměti pro předchozí (P) a následující (N) snímek I1 P4 B2 B3 P7 B5 B6 P10 B8 B9 I13 B11 B12
Postup zobrazení t
P
N
zobr
1
I1
-
I1
I1
P4
1
dekódovat I1, uložit do P, zobrazit
2
dekódovat P4, uložit do N, nezobrazovat naplánovat zobrazení na t = 4
3
dekódovat B2, neukládat, zobrazit
2
I1
P4
B2
4
dekódovat B3, neukládat, zobrazit
3
I1
P4
B3
5
zobrazit P4 z P
4
I1
P4
P4
přesunout N do P
P4
-
dekódovat P7, uložit do N, nezobrazovat naplánovat zobrazení na t = 7
P4
P7
6
Komprese videa
Vlastnosti
Pomalé datové toky
Vysoký kompresní poměr (20 až 200:1) Poměr velikostí I:P:B je po kompresi přibližně 15:5:2 možno vynechat B-snímky, příp. i P-snímky a v nejhorším případě i některé I-snímky
GOP - Group of Pictures – sekvence mezi dvěma I-snímky
obtížné dělení struktura pevná nebo proměnná
záleží na kodeku
Maximální délka GOP (MPEG-1/2 na DVD)
12 snímků pro PAL 15 snímků pro NTSC
Komprese VP8
makrobloky 16×16 pixelů rozdělení do 16 subbloků 4×4 DCT, kvantizace (jako JPG)
Snímky
první z GOP (G) prediktivní (P) referenční (R)
nejsou zobrazeny úložiště dat pro makrobloky
H.264
VP8 http://www.chip.cz/mesicnik-chip/prave-pripravujeme/vp8-bezplatny-kodek-googlu
TELEVIZNÍ PŘENOS
Charakteristiky TV přenosu
Rozlišení Poměr stran Frekvence Jasový rozsah, barevnost Struktura obrazu Technologie uložení/přenosu Podvzorkování
Rozlišení
Analogová televize
625 řádků (PAL) 525 řádků (NTSC)
aktivních 576 aktivních 480
overscan
Digitální televize
řádků
sloupců
poměr
Standard Definition Television (SDTV)
PAL
576
704 (720) nebo 640
16:9 a 4:3
NTSC
480
704 (720) nebo 640
16:9 a 4:3
High Definition Television (HDTV)
1080 720 Enhanced Definition Television (EDTV)
jako SDTV, ale progresivní
1920 1280
16:9 16:9
Rozlišení
Poměr stran poměr 4 3
14 15 16
9 9 9
1,33 1,37 1,50 1,56 1,67 1,78 1,85 2,00 2,20 2,35 2,39 2,59
popis 35 mm film Academy, standard 1932 - 1953 fotografie 35 mm film kompromis mezi 4:3 a 16:9 35 mm film, Evropa standard Academy standard, 35 mm film, US, UK SuperScope, 1950 - 1970 Super Panavision, standard film 70 mm CinemaScope, 35 mm anamorfický, do 1970 Panavision, 35 mm anamorfický, od 1970 Cinerama
Převod poměru stran Roztažení a chytré roztažení
Letterbox/pillarbox
Natáčení Open Matte
Pan & Scan
Frekvence Označení popis 24p kinofilm 50i PAL & SECAM 60i NTSC, PAL-M DTV progressive material: 25p PAL, SECAM 30p NTSC 50p PAL, SECAM 60p NTSC
poznámka
59.94i drop frame
29.97p drop frame 59.94p drop frame
Drop frame Typ časového kódu, který v NTSC každou minutu (kromě každé desáté) odebírá 2 snímky aby byla dosažena optimální frekvence
Analogová televize – technologie
PAL (Phase Alternation at Line Rate)
transformace RGB do YUV Y se vysílá tradičně U a V šířka pásma 1,3 MHz a namodulují se na vedlejší nosnou u každé druhé řádky je polarita fáze složky V obrácena
chyba barevného odstínu se převádí na chybu sytosti
oko tolik nevnímá
na začátku každé řádky se přidává referenční signál (color burst)
vyruší se drobné chyby v přenosu fáze
kterým se synchronizuje referenční úroveň amplitudy a fáze
Vlastnosti
625 řádků, aktivních 576 frekvence 50 Hz typické podvzorkování barev 4:2:0 nejvyrovnanější přenosové vlastnosti, složitější přijímač
Analogová televize – technologie
NTSC (National Television Systems Commitee)
předchůdce PAL, neotáčí fázovou polaritu mírně odlišný barevný prostor YIQ
525 řádků, aktivních 480 frekvence 30 Hz, tj. 60 půlsnímků/s
I šířka pásma 1,5 MHz; Q pouze 0,5 MHz (oko méně citlivé) barevná nosná frekvence 3,58 MHz
u barevného 60 000/1 001, aby bylo možné přidat barevná data a zůstat kompatibilní
typické podvzorkování barev 4:1:1 zkreslení barevného podání způsobené chybami přenosu (fáze) jednoduchost přijímače
Analogová televize – technologie
SECAM (Sequential Couleur avec Memoire)
používá podobný barevný prostor YDbDr přenáší se jen jedna složka
lepší barevného podání, ale další barevné zkreslení
druhá složka se uchovává z předchozího řádku potřeba zpožďovací linky, fungující jako paměť dané tím, že se polovina signálu přebírá z předchozího řádku
25 fps, 625 řádků
Přehled formátů PAL I
PAL N
PAL M
525/60 15.734 kHz
PAL B,G,H 625/50 15.625 kHz
625/50 15.625 kHz
625/50 15.625 kHz
60 Hz
50 Hz
50 Hz
50 Hz
NTSC M
Lines/Fields Horizontal Frequency Vertical Frequency Color Subcarrier Frequency Video Bandwidth Sound Carrier
525/60 15.750 kHz
SECAM B,G,H 625/50 15.625 kHz
SECAM D,K,K',L 625/50 15.625 kHz
60 Hz
50 Hz
50 Hz
3.579545 4.433618 4.433618 3.582056 3.575611 MHz 75 MHz 75 MHz MHz MHz 4.2 MHz
5.0 MHz
5.5 MHz
4.2 MHz
4.2 MHz
5.0 MHz
6.0 MHz
4.5 MHz
5.5 MHz
5.9996 MHz
4.5 MHz
4.5 MHz
5.5 MHz
6.5 MHz
SDTV – Standard-definition television
digi 576i50
digi horizontální 704 – 720 nebo 640(4:3) formáty 4:3 nebo 16:9 filmy 24 /s – o 4% rychlejší
digi 480i60
náhrada analog 625 řádků (overscan)
náhrada analog 525 řádků
digi horizontální 704 – 720 nebo 640(4:3)
Další možnosti
i interlaced p progressive scan
480p24, 480p30, 480p60 576p25, 576p50
Video System
Picture Dimensions
Pixel Aspect Ratio
Standard (4:3) PAL (tj. 576i)
720×576
12:11
Widescreen (16:9) PAL
704×576 352×288
16:11
Standard (4:3) NTSC (tj. 480i)
720×480
10:11
Widescreen (16:9) NTSC
704×480 352×240
40:33
1440 x 1080
4:3
HDV 1080i / HDCAM (16:9)
HD Ready, Full HD Full HD rozlišení 1080p HR Ready aspoň 720p a 1080i Full HD Minimální rozlišení 1920x1080 podporované videoformáty reprodukovány bez deformace ano Zobrazení 1080p a 1080i bez overscan (mapování pixelů 1:1) ano Zobrazení nativních videomódů při stejné nebo vyšší frekvenci ano Analogový HD vstup YPbPr ano Digitální HD vstup HDMI nebo DVI ano 720p HD progressive (1280x720 @50 & 60 Hz) ano 1080i HD (1920x1080 interlaced @50 & 60 Hz) ano 1080p HD (1920x1080 progressive @24, 50 & 60 Hz) ano HDMI nebo DVI vstup s podporou HDCP ano
HD Ready 720 řádků, widescreen ne ne ne ano ano ano ano ne ano
HDTV
Současné vysílání ve dvou formátech: 720p a 1080i
rozlišení 720p (720p50)
rozlišení 1080i (1080i50)
využívá 1080 řádků zobrazovaných najednou poskytuje větší detaily každá z variant vhodná na jiný typ pořadu
rozlišení 1080p (1080p25, 1080p50))
720 řádků zobrazovaných progresivně čistý, více stabilní obraz vhodnější pro obraz s rychlým pohybem
aktuálně není k dispozici TV vysílání (satelitní ani pozemní) nepřepokládá se, že by v nejbližší době některá stanice na rozlišení 1080p přešla Blu-ray
budoucnost: 1440p, 2160p („quad HDTV“)
Parametry evropských formátů HDTV Označení formátu dle SMPTE Zkrácené označení Počet viditelných řádků Počet viditelných bodů v řádku Poměr stran aktivního obrazu Celkový počet řádků Celkový počet bodů v řádku Počet viditelných bodů Celkový počet bodů Snímkový kmitočet [Hz] Vzorkovací kmitočet – Y [MHz] Vzorkovací kmitočet – R,B [MHz] Počet bitů/vzorek Bitová rychlost (čistá) [Mb/s] Bitová rychlost celková [Mb/s]
296, syst. 3 274, syst. 6 720p 50 1 080i 50 720 1 080 1280 1920 16:9 16:9 750 1 125 1 980 2 640 921 600 2 073 600 1 485 000 2 970 000 50 50 půlsnímků 74,250 74,250 37,125 37,125 10 10 921,6 1 036,8 1 485 1 485
274, syst. 9 274, syst. 3 1 080p 25 1 080p 50 1 080 1 080 1920 1920 16:9 16:9 1 125 1 125 2 640 2 640 2 073 600 2 073 600 2 970 000 2 970 000 25 50 74,250 148,500 37,125 74,250 10 10 1 036,8 2 073,6 1 485 2 970
Society of Motion Picture and Television Engineers, sdružení filmových a televizních techniků http://www.digizone.cz/clanky/jak-vznikla-hdtv-a-co-ji-ceka-do-budoucna/
Prokládaný obraz
Požadovaná frekvence 48 Hz
v počátcích televize nerealizovatelné velká potřebná šířka pásma, obvodové nerealizovatelnosti
Prokládání
každou sekundu přeneseno 50 půlsnímků (polí, field)
obraz se rozsvítí a zhasne 50× za sekundu přeneseno 25 úplných snímků
současné vysílání prokládané vhodné pouze pro CRT
Prokládaný obraz
Odstranění prokládání Deinterlacing
http://www.100fps.com/
Odstranění prokládání
Přepnutí kamery do režimu Progressive
Softwarově pomocí deinterlace filtrů: Bob (Line doubling)
složení půlsnímků (pomalé scény výborné, špatný pohyb)
Smart
svisle roztáhne a zprůměruje dva půlsnímky (jemné, „duchové“, šp. pohyb)
Weave
zdvojí řádky v každém půlsnímku; zdvojnásobná rychlost
Blend
25p, za cenu menší plynulosti rychlých pohybů
detekuje míru pohybu, vybere Bob pro rychlé pohyby a Weave pro pomalé (nejlepší)
Pokročilejší efekty
respektují pohyb kamery a snaží se jej dorovnávat
Odstranění prokládání původní snímky
prokládané snímky Weave
Bob
http://www.hthoma.de/video/interlace/index.html
Konverze snímkové frekvence
Film PAL (24 fps → 25 fps)
2:2 pulldown 24 fps 48 půlsnímků/s o 4 % zrychlené přehrání (1 h 57 min 36 s) korekce zvukové stopy
Konverze snímkové frekvence; telecine
Film NTSC (24 fps 29,97 fps)
2:3 pulldown každé 2. políčko 3 podsnímky 24 fps 60 půlsnímků/s zpomalené přehrání 59,94 půlsnímků/s (60000/1001) 1 h 1 h 3,6 s
NTSC → film
inverse telecine 29,97 fps 23,976 fps (30000/1001)
Upscaling
Konverze videosignálu z nižšího rozlišení na vyšší (HD kvalitu)
720p, 1080i, 1080p dopočítá další řádky používají blu-ray přehrávače a moderní HDTV
http://www.gamespot.com/forums/sho w_msgs.php?board_id=314159282&to pic_id=26528880
Zvýšení frekvence základní verze 100 Hz dva snímky (AB) se zobrazí dvakrát (AABB) nutnost digitální paměti
moderní verze 100 Hz mezi dva standardní snímky dopočítává jeden nový
200 Hz technologie dopočítání tří nových snímků
http://www.samsung.com.au/knowledgecentre/blog/2008/07/what-is-samsungs-100hz-motion.html
Podvzorkování barev
Chroma subsampling
Y:Cr:Cb
Cr horizontální faktor Cb totéž nebo 0, pokud vertikálně 2:1