1 MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01. Metody dekompozice v časové oblasti a parametrické (fraktálové) dekompozice obrazu. Kódování na bázi Waveletů Za...
Kódování na bázi Waveletů Zakládá se na dekompozici originálního signálu na signálové komponenty, které se kódují a přenáší. Jejich syntézou se získá rekonstruovaný signál. Dekompozice originálního signálu se realizuje Waveletovou transformací. (WT) ,syntéza se realizuje inverzní Waveletovou transformací. Waveletová transformace na rozdíl od Fourierové transformaci používá časově ohraničené funkce, pomocí kterých je možno posunem a změnou šířky dosáhnout časovou lokalizaci frekvenčních složek v signále. Základem spojité WT je rozklad signálu do množiny funkcí jejichž základem je mateřská Waveletová funkce (t ) ze které jsou odvozené další funkce postupnou dilatací a posunem v čase.
Množinu těchto funkcí lze vyjádřit ve tvaru
ab (t )
1 t b a a
Kde a - je poměrový faktor (scaling facktor ) b – faktor posunutí (translaction factor)
Obr.1 Příklad časových průběhů Waveletov Principy komprese obrazu, založené na lineárních transformacích (DCT, DWT)
Diskrétní kosinová transformace (DCT) a diskrétní vlnková (waveletová) transformace (DWT). Ztrátové komprese jsou založeny na prostorové podobnosti obrazových dat. Abychom takovou podobnost odhalili, je nutné využít transformace, která převede prostorový obrazový signál do kmitočtové domény (DCT), nebo do podoby tzv. dekompozičního obrazce (DWT). Takto získaná data zakódujeme pomocí určitého schématu do podoby určené k přenosu - zde dochází ke ztrátě informace. K dekompresi je třeba použít proces analogicky zcela opačný, tj. aplikace dekódovacího schématu a inverzní transformace k získání (nyní již kompresí ovlivněných) výsledných dat. Ke konkrétním implementacím, pracujícím na principu DCT, patří především grafický formát JPEG. Také naprostá většina kodeků pro ukládání videosignálu pracuje s využitím DCT, odlišnosti se dají nalézt především u kódovacího procesu, kterému transformace předchází. U DWT je nejdůležitějším představitelem především grafický formát JPEG2000 , určený pro kódování statického obrazu.
Strana: 1 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
DCT komprese obrazu Diskrétní kosinová transformace je odvozena z diskrétní Fourierovy transformace tak, že vrací pouze reálnou složkou. Jde o fourierovskou transformaci, což přináší základní nedostatek - složky v kmitočtové oblasti nenesou žádnou informaci o původní poloze v prostorové oblasti. Tato transformace je totiž určena k analýze statických (u obrazových signálů v prostoru neměnných) periodických signálů. Řešením je rozdělit původní prostorovou doménu na segmenty, které jsou dostatečně malé tak, aby se výše zmíněná vlastnost neprojevila. Ve skutečnosti jde o největší problém všech kompresí založených na DCT, neboť segmentace je zejména při vysokých stupních komprese zcela evidetní a vnáší do dekódovaného obrazu zkreslení v podobě tzv. blokových artefaktů, které je nutné odstraňovat následným speciálním zpracováním. Segmentace se provádí většinou na bloky o velikosti 8×8 pixelů. Dále se přistupuje k samotné transformaci. Využívá se algoritmu DCT-II [7], který je snadno realizovatelný pomocí maticového násobení (což je v případě takto malých segmentů výhodné). Následuje aplikace kódovacího schématu. To zahrnuje následující kroky: - kvantování - využívá se statické kvantovací matice, kterou se koeficienty dělí (prvek po prvku) a následně zaokrouhlí - načtení koeficientů dle cesty - všech 64 koeficientů se načte do zásobníku dle připravené "zigzag" (obr. 1) cesty, která zohledňuje důležitost jednotlivých koeficientů v jednom segmentu (koeficienty s větším významem jsou načítány jako první) - RLE kódování - kóduje koeficienty po dvojicích symbolů, přičemž zohledňuje zvýšený výskyt nul (RLE = Run Length Encoding) - Huffmanovo kódování - kóduje dvojice symbolů pomocí Huffmanova kódování (prefixový kód s převodní tabulkou, která zvýhodňuje nejčastěji se vyskytující dvojice)
Takto získaná data se poté uloží. Přitom se ještě odliší první koeficient (stejnosměrná složka - DC koeficient) - tato vykazuje zpravidla největší míru podobnosti v celém obraze a je proto kódována diferenčně (rozdílově) vzhledem k předcházejícím prvkům.
Strana: 2 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
JPEG komprese Funkční blok provádějící diskrétní kosinovou transformaci při kódování dle JPEGu
DWT komprese obrazu Vlnková transformace je ve srovnání s Fourierovou transformací zcela odlišný přístup k analýze signálů. Je vlastně odpovědí na výše zmíněný problém s lokalizací transformovaných koeficientů v prostoru. Spojitá vlnková transformace se dá velmi zjednodušeně vysvětlit tak, že procházíme postupně celým obrazovým signálem v prostorové doméně a zjišťujeme jeho podobnost s mateřskou vlnkou (která je bází transformace) v příslušném měřítku. Tak získáme teoreticky nekonečné množství informací o podobnosti signálu s analyzujícím vlnkou, které jsou definovány jednak pro určitou prostorovou pozici a jednak pro konkrétní měřítko. Tyto informace se nazývají vlnkové koeficienty. Jak jsou aplikovány tyto metody na obraz například při přenosu televizního obrazu Pokud bychom přenášeli nekomprimovaně 720x576 při 25sn/s, tak se dostaneme na bitrate téměř 250Mbit/s, což není ve vyhrazeném kmitočtovém pásmu (TV kanálu) možné přenést. Opět jde o podobný problém jako u DVD, proto se zavádí také komprese, opět stejná jako u DVD, tedy MPEG-2. DVD používá maximální bitrate (datový tok) 9800kbit/s, přičemž normálně se používá průměrně kolem 6000kbit/s, bitrate TV vysílání opět vychází ze šířky pásma TV kanálu a také způsobu přenosu - modulaci, kódování a ochraně proti chybám při přenosu. Máme k dispozici přibližně 23Mbit/s, což je více než 2x více než u DVD.
Strana: 3 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
Při kompresi se používají dva způsoby - za prvé se hledají rozdíly mezi jednotlivými snímky a stejné části obrazu není třeba přenášet (tzv. pohybové vektory), čímž dochází k redukci dat, za druhé data, která už přenést musíme, se převádí v blocích pomocí diskrétní kosinové transformace (DCT) do frekvenční oblasti. DCT dokáže snížit počet dat tím více, čím méně je v obraze vysokofrekvenčních složek, v ideálním případě, kdy je obraz jednolitá plocha, lze zakódovat pouze jedním bytem. Pokud chceme snížit počet dat na určitý datový tok, ale po provedené DCT jich máme stále více, můžeme poslední data prostě nepřenášet. Tomuto způsobu se říká kvantizace, čím vyšší kvantizace, tím více zanedbaných bitů a tím horší obraz - více viditelných kostiček v obraze. Při zanedbání pár dat ve vhodně zvolených oblastech obrazu nemusíme okem rozdíl vůči originálu vůbec poznat. Je jasné, že výsledek je vždy určitým kompromisem mezi výslednou vizuální kvalitou a stupni komprese. Ještě se zmiňme o rozdílu v příjmu analogového a digitálního vysílání. U analogového vysílání se uvádí minimální odstup signálu od šumu 40dB, aby byl obraz pěkný. Čím bude odstup signálu od šumu menší, tím více šumu bude v obraz, ale obraz bude stále ostrý., no znáte to určitě všichni. Je nutné také počítat s dobrými příjmovými podmínkami, protože odrazy signálu např. od hor nebo špatně sladěná pásma antén mohou způsobit duchy v obraze. U digitálního vysílání je to jiné. Díky tomu, že se přenásí jen nuly a jedničky a díky datové ochraně proti chybám (samoopravné kódy), postačuje rpo příjem daleko menší odstup signálu od šumu. Proto také digitální vysílače vysílají i s desetinovými výkony než analogové. Pokud se ale dostaneme za určitou hranici, nebude narůstat šum v obraze, ale v obraze se začnou objevovat chyby, obraz se bude sekat a při špatných podmínkách se úplně zastaví. Jinak se také projevují odrazy - i při silném signálu může odraz zanést tolik chyb, že bude příjem nemožný. Malé shrnutí - máme k dispozici datový tok 23Mbit/s pro celý multiplex, kam se musí vejít jak video, tak i zvuk a další doplňkové datové služby jako teletext, EPG apod. To ale plně postačuje pro dvě až tři stanice v DVD kvalitě. Nebo pro více stanic, ale za cenu snížení datového toku každé stanice a tím pádem i kvality. Nepletete se - byla vybrána druhá možnost, protože více stanic znamená více peněz pro provozovatele i pro stát. Přidána ale nebyla jen jedna. Čtyři stanice by dostaly každá přibližně 5750kbit/s, což je ještě akceptovatelné, bylo ale zvoleno stanic pět, z nichž každá se může těšit na přibližně 4600kbit/s, odečteme-li zvuk ve formátu MP2 384kbit/s a datové služby, zbývá asi 4000kbit/s pro video. Ve skutečnosti je to ještě daleko méně, protože se vysílají i rádiové stanice a ne celý multiplex je využit.
Princip MPEG komprese Komprese spočívá v tom, že každý x-tý snímek je uložen kompletní (I-snímek) a ostatní jsou definovány jako rozdíly mezi nimi (P-snímek a Bsnímek). I snímky jsou snímky klíčové, jsou komprimovány obdobně jako MJPEG, ale navíc s možností komprimovat různé části obrazu různým stupněm komprese. P-snímky jsou kódovány s ohledem na nejbližší předchozí I nebo P-snímek. B-snímky jsou pak dopočítávané jako rozdílové snímky mezi nejbližším předchozím I nebo P-snímekm a nebližším následujícím I nebo P-snímkem. Celá sekvence snímků (od jednoho I po další I snímek) se pak nazývá GOP (Group of Pictures) a standardní MPEG stream používá pořadí IBBPBBPBBPBBPBBPBB. Z pohledu zabíraného místa pak I snímky zabírají nejvíce místa, po nich jsou P snímky a úplně nejméně místa zabírají snímky B. Komprese MPEG-1 se nehodí pro střih videa z důvodu vzdálených klíčových snímků.
Fraktálová komprese obrazu Fraktálové kódování – je založené na principu lokální samopodobnosti bloků obrazu. Metoda je založená na aplikaci kontraktivních transformací na bloky obrazu. Obraz se rozdělí na soubor
Strana: 4 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
nepřekrývatelných bloků, které se označují jako R (Range) bloky. Dále se volí v obraze D (domain ) bloky, jejichž rozměr je dvakrát větší než rozměr R bloků a můžou se překrývat.
Obr. 2 Rozdělení obraze na R a D bloky
Při kódování hledáme také dvojici R a D bloků, které se sobě nejvíce podobají - mají tedy minimální euklidovou vzdálenost. Pro potřeby porovnávání R a D bloků se musí rozměr bloku D upravit na stejný rozměr jako má blok R. Z hlediska aproximace z nalezeného bloku D je možno vytvořit aproximovaný blok
Kde:
Rˆ ve tvaru :
Rˆi s.D j o.1
1 – je jednotková matice s, o – jsou koeficienty transformace
Při hledání nejpodobnějšího bloku Dj k danému bloku Ri je zapotřebí myslet i na jiné polohy bloků Dj např. pootočené o 90 , 180 , 270 stupňů otočené okolo vodorovné svislé osy atd. Tento parametr se nazývá IZOMETRIE. (i)
Obr.3 Princip fraktálového kódování obrazu. Fraktálový kód každého Ri bloku se skládá ze souřadnic x, y nejpodobnějšího bloku Dj s koeficientů s , o a použitého druhu izomerie. Dekódování je interaktivní tj. každý blok Ri je aproximovaný odpovídajícím blokem Dj, - v prvním kroku je Dj = 0. Po každé interaci bloky Rˆ i - konvergují k originálním hodnotám. Princip fraktálového kódování je uvedený na obr.3. Frakálové kódování je časově náročnější než dekódování, protože při hledání nejpodobnějšího D bloku k danému R bloku je potřeba vyšetřit všechny možné D bloky se všemi izometriami.
Strana: 5 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
Založen na principu hledání sobě-podobných částí obrazu.
I. Kódování 1. Obraz se rozdělí na nepřekrývající se části (podrobnosti v kapitole Dekompozice obrazu do oblastních bloků). Tyto části se nazývají „oblastní bloky“ a musí pokrývat celý analyzovaný obraz.
2. Pro každý oblastní blok je nutné najít větší blok, který je velmi podobný bloku oblastnímu. Tyto větší bloky se nazývají „doménové bloky“ a můžou se navzájem překrývat. Snahou je nalézt tedy takový mapovací předpis w, který vyjadřuje transformaci doménového bloku do bloku oblastního.
Jak nalézt domény: A. Spočítá se průměrná hodnota všech pixelů v oblastním bloku. B. Náhodně se vybere (generace pozice x,y) doménový blok, který je větší než blok oblastní. C. Spočítá se průměrná hodnota všech pixelů v doménovém bloku pro každý typ geometrické transformace (rotace, translace…)
Strana: 6 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
D. Kroky B a C se opakují, dokud není hodnota pixelů doménového bloku podobná jako hodnota oblastního bloku (využití střední kvadratické odchylky).
R sDo R = oblastní blok D = doménový blok s = škálovací faktor o = jasový posun E. Oblastní blok je nahrazen informacemi, které jsou získány popisem doménového bloku (jeho pozice, škálovací faktor, jasový posun, typ geometrické transformace) Nyní je zakódován jeden oblastní blok (získali jsme mapovací předpis w). Celý process je opakován pro každý oblatní blok v obrazu.
II. Dekódování K dekódování je potřeba: - Některý zdrojový obrázek nebo prázdný borázek nějaké barvy, ze které budeme originální obraz rekonstruovat. Nejlepší je použít šedou barvu, protože má minimální vzdálenost k ostatním barvám (je tedy zaručena rychlá konvergence k originálnímu obrazu) - Data po kódování: velikost obrazu, pole struktur obsahující informace o doménových blocích. Iterativní krok: Prázdný obrázek (nebo zdrojový obrázek) musí být rozdělen do oblastních bloků. Pro každý oblastní blok známe potřebné transformace, takže je nezbytné pouze načíst doménový blok na známých pozicích, zmenšit ho a aplikovat potřebné transformace. Celý process je iterativní, takže krok je opakován dokud není rekonstruován originální obrázek. V každé iteraci se oblastní bloky více a více rekonstruují, protože se stávají součástí oblastních bloků, které jsou v dalších krocích iterace používány k rekonstrukci oblastních bloků (tzn. zmenšený doménový blok se stane součástí jiného doménového bloku, který se při jiné transformaci zase mapuje, čímž se zvyšuje detail) Po první iteraci lze vidět základní kontury originálního obrazu. Pro druhou iteraci se jako výchozí pomocný obrázek používá obraz, který byl vytvořen v první iteraci:
Strana: 7 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
V dalších iteracích lze téměř vidět originální obrázek s určitým šumem:
Je potřeba zpravidla 8 iterací, aby byl získán obrázek podobný tomuto:
Stále lze vidět určitý šum a nedokonalosti v rekonstruovaném obrazu. Pokud se použijí menší doménové bloky, výsledek bude mnohem lepší. Dekódování je rychlejší než kódování, lze tedy říci, že fraktální komprese je asymetrická metoda.
Strana: 8 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
Vlastnosti fraktálové komprese: 1. Ztrátová – Nehledá se věrná kopie obrazu (části obrazu), ale přibližná. Z toho plyne, že degradace obrazu, která vzniká, je jiného druhu než u běžných kompresních algoritmů. Díky fraktálním složkám obrazu se změny jeví mnohem přirozeněji. Důsledkem toho je velmi obtížné srovnávat úspěšnost fraktální komprese s jinými ztrátovými metodami. Dá se jen těžko porovnat kvalita obrazu zkomprimovaného při stejném kompresním poměru různými algoritmy, vzhledem k tomu že ztráta kvality se projeví odlišně. 2. Asymetrická – Kódování je časově velmi náročný proces a na rozdíl od něj je aproximace původního obrázku z transformací velmi rychlá. Můžeme tedy říci, že fraktální komprese je silně asymetrická metoda. 3. Nezávislá na rozlišení – Dekomprimovaný obraz má znaky fraktálu. Je možné ho zvětšovat prakticky donekonečna a stále se objevují nové detaily (ty nejsou samozřejmě obsaženy v původním komprimovaném obraze, ale jsou uměle dopočítány). Tato vlastnost, tedy nezávislost na rozlišení, se dá velmi využít při zoomování a zvětšování obrazů. 4. Nezávislá na barevné hloubce obrazu – Velikost dat po kompresi je stále stejná bez ohledu na počet bitů na pixel v komprimovaném obraze. Z toho plyne, že kompresní poměr se zlepšuje lineárně s počtem bitů na pixel. 5. Patentovaná – Na rozdíl od jiných kompresních algoritmů je fraktální komprese od roku 1991 patentovaná Michaelem Barnsleyem a tudíž pouze držitel tohoto patentu ji může využívat ke komerčním účelům.
Dekompozice obrazu do oblastních bloků: A) Stejně velké bloky Obraz se rozděluje do stejně velkých oblastních bloků.
B) Quadtree (kvadrantový strom)
Strana: 9 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
V kvadrantovém stromu mohou z každého uzlu vycházet čtyři hrany. Kořenem tohoto stromu je obrázek sám a větvení se interpretuje dělením částí obrázku na čtyři stejné části (kvadranty). U stromu si můžeme navolit například minimální a maximální hloubku prohledávání, resp. minimální a maximální velikost oblastních bloků. Začíná se u kořene stromu, tedy u celého obrázku, který postupně dělíme, až se dostaneme na maximální povolenou velikost bloku (resp. minimální hloubku stromu). Každý ze čtyř vzniklých bloků podrobíme porovnávání s doménami. V těch blocích, kde jsme nenašli žádnou doménu s odchylkou splňující zadaný toleranční práh, se provede rozdělení a algoritmus může pokračovat rekurzivně.
C) HV (horizontal-vertical) dělení Obraz je segmentován do obdélníkových oblastních bloků. Pokud není pro tento blok nalezen vhodný doménový blok, oblastní blok je rozdělen do dvou obdélníků horizontálním nebo vertikálním řezem.
Strana: 10 / 11
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 01.
Metody dekompozice dekompozice obrazu.
v
časové
oblasti
a
parametrické
(fraktálové)
D) Polygonální dělení Totožný s HV dělením + navíc zavedeny 45° a 135° směry řezu obdélníku. E) Dělení pomocí evolučních algoritmů Nejlepší, ovšem nejnáročnější dělení na nesymetrické oblastní bloky.
Dyadický rozklad pomocí waveletové transformace Waveletová transformace slouží k analýze signálů v časově-frekvenční oblasti. Na rozdíl od Fourierovy transformace bere v potaz i lokalizaci signálu v čase (poloze). Používá časově ohraničené funkce, pomocí kterých je možné posunem a změnou šířky dosáhnout časové lokalizace frekvenčních složek v signálu. Nejpoužívanějším schématem pro analýzu obrazů je dyadický rozklad. Po provedení dyadického rozkladu první úrovně jsou ve výsledku k dispozici 4 sady koeficientů: LL – aproximace obrazu LH – detaily obrazu v horizontálním směru HL – detaily obrazu ve vertikálním směru HH – detaily obrazu v diagonálním směru Pro mnoho-úrovňovou dekompozici signálu se často používá dyadický rozklad, u kterého se vždy rekurzivně analyzuje pouze aproximační část (LL pásmo) z předchozího kroku dekompozice.
Strana: 11 / 11
02 Steganografie – techniky digitálních vodoznaků a jejich aplikace v multimediích.
Steganografie
- (řečtina. steganós-schovaný, gráphein-psát) je věda zabývající se utajením komunikace prostřednictvím ukrytí zprávy. Zpráva je ukryta tak, aby si pozorovatel neuvědomil, že komunikace vůbec probíhá. Zachycení zprávy se rovná prolomení steganografie. Aby ani v tom případě nedošlo k prozrazení obsahu zprávy, zpravidla se kombinuje s kryptografií (šifrováním). http://www.mvcr.cz/casopisy/kriminalistika/2006/04/steganografie.pdf
Princip steganografie: Princip této techniky je jednoduchý. Existují určité typy počítačových dat, například bitmapové obrázky (*.bmp) nebo zvukové soubory, které mohou projít mnoha změnami, aniž by to člověk poznal. Steganografické programy vezmou zprávu určenou k utajení a vloží ji dovnitř nějakých vhodných dat. V případě zvukových souborů je možné upravovat zvuky, které jsou pro lidské ucho neslyšitelné, avšak v záznamu se objevují. Výsledný zvuk se v tomto případě pro posluchače nezmění. V případě obrázkových souborů je jedna z metod užívaných ve steganografii zkreslování barev v obrázku, například posunem barevného spektra některých bodů. Výsledek bude pro lidské oko téměř stejný - obrázek jen bude obsahovat téměř nepostřehnutelný šum a kdo neví nebo nečeká žádnou tajnou zprávu, nemůže nic zjistit.
Steganografické metody: Ø využití nejméně významných bitů - Při kódování zpráv nemají všechny bity stejně velký význam. Hodnoty nejméně významných bit_ pak lze přepsat bity skryté zprávy bez toho, že by došlo k postřehnutelné změně původní zprávy. Ø využití rezervních bitů - Např. obrázky formátu *.bmp („Bit Map“) nebo *.gif („Graphics Interchange Format“). Obrázek sestává z matice obrazových bodů (tzv. pixelů), přičemž každý pixel je dán řetězcem 24 bitů = 3 B.Každý bajt reprezentuje podíl zastoupení červené, zelené a modré barvy pro daný pixel. Počet všech možných barev je 224 = 16,8 miliónů. Změnou posledního bitu každého z bajtů se barva pixelu změní na jeden z 23 = 8 navzájem sousedících odstínů. Rozlišit 8 sousedících odstínů z palety téměř 17 miliónů barev je pro lidské oko nemožné. Ø využití způsobu zápisu – Využívá se možnost, že informaci lze vyjádřit více různými zápisy. Typografická varianta (kombinace více formátů nebo stylů písma) a příkazová varianta (funkci lze realizovat různými příkazy). Ø rozprostření spektra
02 Steganografie – techniky digitálních vodoznaků a jejich aplikace v multimediích. Další metody: Další poměrně rozšířenou oblastí jsou metody založené na různých typech transformací, jako je například diskrétní kosinová (DCT), rychlá fourierova (FFT), waveletová (WT) nebo fraktálová transformace Digitální steganografie dnes nachází rozsáhlé využití například při ochraně autorských práv.
Digitální vodoznačení tedy znamená přidávání digitální informace do originálních dat takovým způsobem, že je to pro člověka nepostřehnutelné, ale zároveň snadno detekovatelné počítačovými algoritmy. Digitální vodoznak je většinou transparentní, neviditelný informační obrazec, který je vkládán do vhodných složek zdrojových dat užitím specifických algoritmů. Digitální vodoznaky jsou signály přidané do digitálních dat (audio, video, statický obraz, atd.), které mohou být kdykoli detekovány a vytaženy za účelem potvrzení pravosti zdrojových dat. Základní princip většiny dnešních systémů s vodoznaky je podobný symetrickým kryptosystémům, neboť je založen na použití stejného klíče k vložení i detekci vodoznaku.
Požadavky na vkládání vodoznaku: -
Nevnímatelnost – správné zvolení prahu. Nesmí dojít k viditelnému zkreslení zvuku ani obrazu.
-
Odolnost – nemělo by dojít k odstranění vodoznaku bez znalosti metody a klíče.
-
Bezpečnost – využití několika kryptografických klíčů, což stěžuje přístup.
-
Složitost – úsilí vynaložené na odstranění vodoznaku (čas). Doba by měla být tak velká aby po této době bylo odstranění bezvýznamné.
-
Spolehlivost detekce
-
Kapacita – množství vložených informací
Metody v časové oblasti: Tyto metody realizují modifikaci vzorků řečových nebo obrazových signálů. Metody vložení vodoznaku v časové oblasti, které se aplikují na obrazové signály, se také někdy
02 Steganografie – techniky digitálních vodoznaků a jejich aplikace v multimediích. nazývají jako metody vložení vodoznaku v obrazové oblasti. Využívá se nedokonalosti lidského zraku v tomto smyslu
Metody v transformační oblasti: Tyto metody realizují modifikaci transformačních Oblast vkládání vodoznaku Časová (obrazová) oblast Transformační oblast Parametrická oblast 20-6 koeficientů zdrojových dat. Při vkládání vodoznaku se nejprve musí provést transformace zdrojových dat do prostoru transformačních koeficientů. Vhodnými a často používanými transformacemi jsou diskrétní kosinová a diskrétní waveletová transformace. Po provedení transformace jsou realizovány samotné modifikace transformačních koeficientů. Zpětnou transformací modifikovaných koeficientů se získávají původní data, v kterých je obsažen vodoznak
Viditelný vodoznak vloží do obrázku zjevnou značku tak, aby bylo obtížné ji odstranit. Důvodem je obvykle ochrana autorských práv. Vložení vodoznaku je celkem triviální operací.
Skrytý vodoznak (též autentizační bitový vzorek) je aplikací steganografie. Skrytý vodoznak pozorovatelé zrakem nevnímají, ale přitom lze algoritmicky zjistit jeho přítomnost. Pro ochranu autorských práv slouží robustní vodoznak, který zůstává rozpoznatelný i po běžných transformacích dokumentu (komprese, konverze, základní grafické úpravy). Naopak pro ochranu integrity digitálních děl může být použit křehký vodoznak, který bude při jakýchkoli změnách obrazu snadno narušen.
Aplikují se jak do obrazového formátu tak i do zvukového.
3. Standardy komprese pro přenos a záznam obrazu a videosekvencí. Vysvětlete principy komprese obrazu, založené na lineárních transformacích (DCT, DWT). Jak jsou aplikovány tyto metody na obraz například při přenosu televizního obrazu? Standardy komprese pro přenos a záznam obrazu a videosekvencí Formát AVI AVI je asi nejstarší formát videa pro PC. Použil ho Microsoft v operačním systému Windows 3.11. Data byla původně bez komprese s rozměrem 160x120 bodů při 15 snímcích za vteřinu. Časem byl tento formát doplněn o vyšší rozlišení včetně volby kodeků pro snížení datového toku. Tento formát se používá dodnes ve většině zachytávacích zařízeních. Jeho nepříjemností bylo omezení maximální délky souboru na 2GB kvůli sytému záznamu na disk FAT16. Toto omezení v současnosti padlo s použitím FAT32 (max. 4GB), ale spousta programů přesto neumí pracovat se soubory AVI většími než 2GB. Formát MOV Pochází z počítačů Apple Macintosh jako formát programu Quicktime. V letech 1993-5 byl lepší variantou AVI lepší kvalita a funkce. V poslední verzi Quicktime 4 byla přidána možnost přenosu po internetu (bez nutnosti přenést nejprve celý soubor). V poslední době ale ztrácí na popularitě díky rozšiřujícímu se používání formátu MPEG. Formát MJPEG Tento formát je zkratkou Motion JPEG. Jedná se o sekvenci snímků JPEG po sobě tvořící video. Jeho velko výhodou je snadnost střihu, protože jednotlivé snímky na sobě nejsou vázány jako u MPEGů. Proto je také hojně používán u různých zachytávacích karet, např. Matrox Rainbow Runner nebo Miro DC50, které používají hardwarovou kompresi. Velice často se také používá softwarová komprese, například u Morgan Multimedia MJPEG kodeku nebo Pegasus PICVideo MJPEG kodeku. Stupeň komprese je přibližně 1:7-12. Formáty MPEG MPEG je zkratka "Motion Picture Experts Group" - mezinárodní organizace, která se zabývá vývojem tohoto standardu. Výhodou je nezávislost na platformě. V současné době se používají čtyři formáty: MPEG-1 Tento formát existuje již od roku 1993. Jeho hlavním kritériem bylo zachování rozumné kvality při redukci datového toku na přijatelnou mez. Byl definován tok 1-1,5 Mbitů/s s možností náhodného přístupu po půl vteřině. Maximální rozlišení je 352x288 a 30 snímků/s. Pro většinu domácích uživatelů a obchodní použití (dokumentace apod.) dává přijatelné výsledky. MPEG-2 Byl vypuštěn v roce 1995 a jeho základní princip je stejný jako u MPEG-1, ale umožňuje datový tok až do 100Mbitů/s pro digitální TV, video filmy na DVD a pro profesionální studia. Také rozlišení bylo zvětšeno a dává daleko lepší výsledky než MPEG-1. MPEG-4 Je nejnovější video formát a jeho cílem je dát co nejlepší kvalitu při co nejnižším datovém toku 10kbit/s - 1Mbit/s. Byl použita nová metoda pro přístup k objektům obrazu, takže mohou být zpracovávány separátně. Hlavním použitím je přenos videa přes internet a při mobilní komunikaci. MPEG-7 Je poslední projekt. Je určen pro popis multimediálních dat a je nezávislý na ostatních formátech MPEG. Očekává se jeho přijetí jako standardu v roce 2001. Formát H.261 a H.263 H.261 je standard pro videokonfernce videotelefonování přes ISDN. Umožňuje regulovat tok dat v závislosti na propustnosti sítě. Přenos je po 64kbit/s nebo 128kbit/s (dva kanály ISDN). H.263 implementuje vyšší přesnost při pohybu než H.261. Jeho použití je pro monitorovací systémy a pro videokonference s velkou obrazovkou.
Komprese na DCT DCT je často používána při zpracování signálu a obrazu, obzvláště pro ztrátovou kompresi. Je například použita v obrazovém kodeku JPEG, video kodeku MJPEG, MPEG a DV. Její modifikace jsou použity v audio kodeku AAC, Vorbis a MP3. Vychází z toho, že každý signál (tzn. i obraz) lze nahradit složením řady harmonických funkcí. Signál je vyjádřen součtem těchto funkcí, proto kosinová transformace. Jedná se v podstatě o převod z oblasti signálových hodnot (jas a chrominance) do kmitočtové oblasti (spektrální koeficienty), DCT - je realizována ve dvou rozměrech. Aplikuje se na čtvercové matice o velikosti 8x8 pixelů, obrázek se tedy rozřeže na čtverečky, které se potom zpracovávají jeden po druhém. Je ale nutno podotknout, že DCT sama o sobě není kompresní metoda. Jde pouze o transformaci, která je popsána jednou rovnicí a má i svou inverzní variantu. Pokud na matici aplikujete dopřednou DCT a potom inverzní DCT, nic se na ní nezmění. Původní pixelová matice sestává pouze z hodnot pixelů (pro černobílé obrázky to je stupeň šedi, pro barevné hodnota jedné složky), kdežto DCT matice obsahuje tzv. DC koeficienty tvořící jakousi frekvenční mapu. Při kompresi se využívá toho, že lidské oko není citlivé na funkce vysokých kmitočtů. Amplitudy těchto funkcí jsou soustředěné v jednom rohu DCT matice a naopak v protějším rohu jsou nízké frekvence (pomalejší barevné přechody). Pro kompresi se potom používá tzv. kvantizační matice, která má největší hodnoty právě v místech, kde jsou vysoké frekvence. Pomocí jednoduchého dělení matic se odřežou vysoké frekvence a v DCT matici tak vznikne velké množství nul. To je redundantní obsah, který se pak zredukuje nějakou neztrátovou metodou (obvykle Huffmanovo kódování). Při dekompresi se zredukovaná DCT matice opět vynásobí kvantizační maticí a pak se aplikuje I-DCT. Tím dostaneme aproximaci původního čtverečku (bloku). Míra komprese a tím taky kvalita výstupu je dána faktorem kvality (nazývá se Q-Faktor), který v podstatě stupňuje hodnoty v kvantizační matici. Funkce vyšších frekvencí obvykle nejsou tak viditelné, ovšem ostré hrany jsou často výjimkou. Tady potom dochází k nepříjemnému zvlnění (Gibbsův jev) a vůbec lehkému rozostření celého obrázku. Proto není JPEG ani žádná jiná metoda založená na DCT vhodná pro kompresi technických výkresů a prezentačních materiálů, naopak je výborná pro zpracování digitálních fotografií a videa (DCT využívají všechny MPEG kodeky).
Komprese na DWT DWT (Discrete Wavelet Transformation – diskrétní vlnová transformace – převod obrazu na množinu vlnových funkcí), což v praxi vede k lepšímu kompresnímu poměru a zároveň snesitelné ztrátě kvality obrazu (žádné čtverce ani vlnky, obraz je spíše rozostřený). Velkou výhodou může být také možnost volby regionů, které mají být komprimovány s vyšší a nižší kvalitou, což se podobá třeba floating MP3 u zvuku, kde se mění bitrate během přehrávání. Opět ale regiony volí uživatel, neboť on sám nejlépe rozhodne, co je v obrazu důležité a co se může třeba zahodit. Probíhá v celé ploše najednou nikoliv 8x8 jako DCT. Spojitá wavelet transformace: Signál je při této transformaci rozložen do sady funkcí, tzv. waveletů. Výpočet této transformace lze zjednodušeně popsat ve čtyřech krocích: 1. Vybere se vhodný wavelet a nastaví se jako mateční. 2. Wavelet se porovná s analyzovaným signálem. Vypočítá se koeficient waveletu (koeficient shody). Čím je koeficient větší, tím je větší shoda waveletu (při daném posunutí a měřítku) se signálem. 3. Wavelet se posune vzhledem k signálu (časové posunutí) a opakuje se krok 2. Krok 3 se provádí pro všechna časová posunutí. 4. Změní se měřítko waveletu (dojde k roztažení waveletu) a opakují se kroky 2 a 3. Opakování se provádí pro všechna měřítka.
!! U diskrétní wawelet transformace (DWT), se používají tzv. hlavní měřítka (mocniny dvou).!! = rozdíl proti spojité..
Aplikace DCT a DWT při přenosu TV obrazu
Komprese bitového toku v systému MPEG 2 je založena na diskrétní kosinové transformaci DCT, pohybově kompenzované mezisnímkové predikci na principu DPCM (Delta Pulse Code Modulation - delta pulsní kódová modulace je způsob uložení v digitální podobě, kdy každému vzorku odpovídá jedno číslo, které značí pouze rozdíl signálu od předchozího vzorku), kvantizaci koeficientů DCT a jejich kódování kódem RLC a VLC. Transformace DCT spolu s pohybově kompenzovanou DPCM se nazývá hybridní DCT. Způsob minimalizace chyb ve videu lze provádět za využití podobnosti po sobě jdoucích snímků. Na základě této podobnosti se snažíme extrapolovat obrazové data z předchozího snímku, která následně využijeme k maskování chyb v aktuálním snímku. Takovou metodou je metoda LL subband, jež využívá vlastnosti vlnkové transformace, která je základem kompresního algoritmu JPEG2000.
4. Principy a algoritmy ztrátové komprese při použití standardů JPEG a JPEG 2000. Způsoby uložení multimediálních souborů, principy ztrátové komprese u souborů typu JPG, MP3 a MPEG. Multimediální soubory - data, která obsahují obraz, zvuk a video. Každý z těchto typů dat vyžaduje rozdílný přístup při počítačovém zpracování. Pro uložení obrazu je celá řada formátů, které liší se podle původu a účelu, ke kterému mají sloužit. Základní členění na rastrové (bitmapové) a vektorové – rastrové obsahují data jako matici barevných bodů, podle množství uložených barev dělíme na monochromatické, ve stupnici šedi a barevné. Rastrové soubory obsahují velké množství redundantních informací (často bývají při ukládání komprimovány). Vektorové obsahují data jako popis grafických prvků, které popisují obraz v podobě posloupnosti kreslicích příkazů. JPEG – formát určený pro kompresi statických obrazů Prvním krokem optimalizace JPG je převod barevného modelu z RGB do HSB - Hue, Saturation, Brightness (Odstín, Sytost, Jas). Důvod převodu je ten, že tyčinky v lidském oku jsou mnohem citlivější než čípky, proto je oko velmi citlivé na změny jasu (Brightness), ale velice málo na změny barvy (Saturation a Hue). Hlavní podíl komprese tedy bude probíhat na těchto osách, zatímco osa B zůstane prakticky nezměněna. Hodnoty na osách H a S se zaokrouhlí (osa B zůstane nezměněna), což přinese dost podstatnou úsporu dat, aniž by to šlo poznat. Dalším krokem je rozdělení obrazu na čtverce o hraně 8 pixelů a převod HSB signálu na frekvenční hodnoty pomocí diskrétní kosinové transformace => popis 64 pixelů v jednom bloku převede na funkci, a každému z 64 pixelů se přidělí koeficient této funkce. Nejvíce ztrátový krok této kompresní metody je vydělení koeficientů jednotlivých pixelů koeficientem z tzv. kvantizační matice. Česky řečeno je to jakési zprůměrování koeficientů v rámci každého bloku a tedy zjednodušení funkce. Intenzitu komprese měníme škálováním kvantizační matice - změnou hodnoty kvantizačního koeficientu. Na závěr provedeme neztrátovou kompresi koeficientů - Huffmanova optimalizace, která funguje na principu přiřazování krátkých slov často se vyskytujícím řetězcům a dlouhých slov těm méně častým (Variable Length Coding). .ejdůležitější rysy formátu jpeg2000 (přípona j2k): • kompresní algoritmus založený na vlnkové (wavelet) transformaci • unifikovaný dekompresní postup - většina z 44 režimů standardu JPEG se ve většině dekodérů nepoužívá • lepší, rychlejší a kvalitnější komprese (zvýšení kompresního poměru o zhruba 20 až 30 procent oproti JPEG při ztrátové kompresi, poměr bezztrátové komprese 1/2) • odolnost proti chybám - standard JPEG je vysoce citlivý na chyby v datech • volitelné rozdělení obrazu do bloků, pro snadnější a flexibilnější přistup k zakódovaným datům. (oproti 8x8 u jpeg) • schopnost kvalitního zpracování obrázků s nízkým poměrem bit/pixel (na rozdíl od JPEG lze dobře pracovat s obrázky o poměru nižším než je 0.25 bit/pixel) • speciální zpracování "složených" (compound) dokumentů, tedy především takových, které vedle sebe obsahují text a grafiku (JPEG byl k uvedenému účelu prakticky nepoužitelný) • možnost zpracovávat obrázky větší než 64000 x 64000 pixelů (omezení současného JPEG) • kvalitní zpracování počítačově generované grafiky s ostrými přechody (JPEG byl orientován na obrázky "přirozené") • možnost využití různých barevných módů (JPEG podporuje pouze RGB) • progresivní transmise, znamenající možnost zobrazení a zpracování části či náhledu komprimovaného obrázku ještě před úplným načtením jeho souboru • možnost definice "zájmových oblastí", které jsou od ostatních částí obrázku odlišeny prioritním umístěním v datovém toku a případně i vyšším rozlišením Zvuk se skládá z vln u nichž se rozlišuje frekvence a amplituda. Amplituda udává sílu (hlasitost) zvuku, a frekvence udává výšku tónu. Převod zvuku do digitální podoby se děje vzorkováním. Na vstupu zvukové karty je A/D převodník, který s velkou frekvencí (např. 44kHz) snímá úroveň vlny a převádí ji do číselné podoby. Takto se v počítači získá zvuk ve formátu PCM, což je pulzní kódová modulace. Kvalita digitálního zvuku je pak určena vzorkovací frekvencí a rozsahem hodnot zaznamenávané amplitudy vlny. Lidské ucho se spokojí se vzorkovací frekvencí 44100Hz a rozsahem 65536 hodnot, tedy 16 bit. MP3 je inteligentně navržený kompresní algoritmus, který bere v úvahu kromě jiného i vlastnosti lidského ucha a při kompresi se mj. zaměřuje na frekvence, které jsou lidským uchem tak jako tak obtížně slyšitelné. Výsledná velikost souboru po kompresi může dosáhnout až jedné dvanáctiny původní velikosti. Komprese je ztrátová, což znamená, že z komprimovaného MP3 souboru již není možné rekonstruovat původní, originální nahrávku. MP3 komprese se však
snaží zachovat kvalitu nahrávky tím způsobem, že způsobí ztrátu kvality v nahrávce jen tam, kde to posluchač nepozná. Metody používané při MP3 kompresi Práh sluchu – zvuky situované pod prahem slyšitelnosti není nutné vůbec zahrnout, protože je lidské ucho jednoduše neslyší. Maskování – jedná se o vypuštění takových frekvencí, které lidské ucho stejně neuslyší. Maskování je velmi efektivní metodou, protože dokáže zmenšit soubor, aniž lidské ucho postřehne, že je „něco jinak“. Při přehrávání silných zvuků prostě neslyšíte ty slabší. Při maskování jsou nejčastěji vypouštěny nevýrazné pasáže, které ve skladbě sice kdosi hraje, nicméně je nemilosrdně přehlušen hlasitějšími nástroji. Joint stereo – skladby, které jsou zaznamenány stereo, mohou být zkomprimovány také tak, že vybereme taková frekvenční spektra, u nichž je stereozvuk (prostorový zvuk) jen velmi těžko (nebo vůbec) patrný. Tato spektra následně převedeme a zaznamenáme v mono zvuku. Zjednodušeně řečeno – takové pasáže, v nichž je stereo zbytečné, protože ho stejně neslyšíme, jednoduše zaznamenáme jako mono. Variabilní bitrate – v místech, kde lze snést nižší bitový tok, je použit nižní bitový tok, a v akusticky náročných pasážích je naopak použita vyšší bitrate, a záznam je v těch místech tedy kvalitnější. Problémem variabilního bitrate je skutečnost, že nemusí být podporován některými (především přenosnými) přehrávači. Platí jednoduché pravidlo říkající, že pokud chceme zachovat dobrou kvalitu digitálního záznamu a zaznamenat analogový signál v celé jeho zvukové šíři, vzorkovací frekvence by měla být alespoň dvojnásobkem nejvyšší frekvence zvuku v daném analogovém záznamu. Lidské ucho je schopné vnímat zvuky o frekvenci od 20Hz do 20kHz. Pro zachování zvuků o frekvenci do 20kHz, bychom měli použít vzorkovací frekvenci 40kHz nebo vyšší Video je sekvencí obrázků rychle po sobě jdoucích tak, že vznikne pro diváka iluze pohybu. Samozřejmou součástí videa je zvukový doprovod pohybujícího se obrazu. Bylo zjištěno, že postačuje poměrně nízká snímková frekvence, aby došlo k iluzi pohybu. Nejdůležitějšími parametry pro video jsou především právě snímková frekvence, rozlišení a barevná hloubka. Dříve byl záznam videa pouze analogový, dnes již existují digitální videokamery, zachytávací karty, TV-karty. Všechny tato zařízení obsahují A/D převodníky, které převádí analogový signál do digitální podoby a takto jsou data také ukládána. Surové video je ale poměrně velké. Při rozlišení 720x576 v barevném formátu RGB (což je standardně 3x8bitů na jeden obrazový bod) a snímkovou frekvencí 25Hz k uložení jedné sekundy videa potřebujeme 720x576x3x25 = 31 104 000 bajtů. Potřebujeme video komprimovat, používáme se k tomu tzv. kodeky (KOmpresor + DEKompresor). Kodek je mechanismus, který snímky daného videa zakóduje do menší podoby a při přehrávání videa jej zase dekóduje již v reálném čase. Kodeky dělíme na ztrátové a bezeztrátové. Bezeztrátové - video neztratí žádnou informaci, nízký komprimační poměr 1:2. Ztrátové kodeky využívají toho, že obraz nemusí být naprosto dokonalý, dokonce může být zkreslený. Různé kodeky se dále liší kvalitou, rychlostí a velikostí komprimovaného videa, kompr. poměr 1:4 - 1:100. Kompresní kodek MPEG (Motion JPEG) je založen na kompresi jednotlivých snímků použitím komprese JPEG. Tento kodek má většinou volitelný kompresní poměr v rozmezí 6:1 do 16:1. Při kompresním poměru 1:8 je kvalita obrazu stále ještě velmi dobrá a datový tok se pohybuje kolem 4 MB/s a dosahuje tak dobrého poměru kvalita/velikost, každý snímek je komprimován samostatně a je tedy vždy klíčový, je vhodný pro střih videa na počítači. MPEG-1 byl navržen pro práci s videem o rozlišení 352x288 bodů a 25 snímků/s při datovém toku 1500kbit/s. Parametry komprese MPEG-1 jsou srovnávány s analogovým formátem VHS. Formát MPEG-1 se stal součástí tzv. „White Book“ - norma pro záznam pohyblivého obrazu na CD. MPEG komprese používá ke kompresi videa I, P a B snímky. I snímky (Intra Pictures) jsou snímky klíčové, jsou komprimovány obdobně jako JPEG, ale navíc s možností komprimovat různé části obrazu různým stupněm komprese. P-snímky (Predicted Pictures) jsou kódovány s ohledem na nejbližší předchozí I nebo P-snímek. B-snímky (Bidirectional Pictures) jsou pak dopočítávané jako rozdílové snímky mezi nejbližším předchozím I nebo P-snímkem a nebližším následujícím I nebo P-snímkem. Celá sekvence snímků (od jednoho I po další I snímek) se pak nazývá GOP (Group of Pictures) a standardní MPEG stream pro VCD, SVCD a DVD používá pořadí IBBPBBPBBPBBPBBPBB. MPEG standard neurčuje žádná pravidla a omezení pro vzdálenost I a P snímků. Počet I, P a B snímků lze většinou nastavit, záleží na implementaci kompresoru. Z pohledu zabíraného místa pak I snímky zabírají nejvíce místa (komprese cca 7:1), po nich jsou P snímky (20:1) a úplně nejméně místa zabírají snímky B (50:1). Komprese MPEG-1 se nehodí pro střih videa z důvodu vzdálených klíčových snímků. Kodek je ale jeden z nejrozšířenějších formátů a lze jej softwarově přehrát téměř na každém počítači a stejně tak na 95% všech stolních DVD přehrávačích. MPEG-2 – Formát byl dokončen v roce 1994 a stal se standardem pro kompresi digitálního videa. Byl navržen tak, aby dosahoval vysílací kvality videa. Oproti MPEG-1 přináší komprese MPEG-2 podporu pro prokládané snímky, tedy půlsnímky. Podporuje proměnlivý datový tok, což umožňuje v náročnějších scénách videa použít více bitů pro kompresi a naopak v klidnějších scénách se použije méně bitů. Při stejném datovém toku a plném rozlišení (720x576) dosahuje MPEG2 mnohem vyšší kvality obrazu než MPEG1 komprese. Nevýhodou komprese MPEG2, je na druhou stranu velmi vysoké zatížení procesoru při přehrávání, a téměř žádný rozdíl v kvalitě oproti MPEG1 kompresi při nízkých rozlišeních. Pro streamování v nízké kvalitě je tedy vhodnější komprese MPEG1, zatímco pro plné rozlišení a vysoké datové toky zase MPEG2. MPEG-4 není přesná definice komprese a komprimačních algoritmů, nýbrž je to množina parametrů a vlastností, které musí kompresor splňovat, aby byl MPEG-4 kompatibilní. Známe tedy různé implementace MPEG-4, které vybírají z definice MPEG-4 vždy to, co je pro daný formát vhodnější. Kodeky s kompresí MPEG-4 např. Microsoft MPEG-4 v1, v2 a v3, DivX 5, XviD …
05 - Způsoby uložení zvuku - vzorky, MIDI, parametry při ukládání zvuku, přehled zvukových formátů. 1. Způsoby uložení zvuku – vzorky Pro uložení zvukových sekvencí do počítače potřebujeme zjistit základní parametry vlnění frekvenci a amplitudu. Postup, který nám toto umožňuje zjistit se nazývá vzorkování. A/D (analogově - digitální) převodník s velkou frekvencí snímá úroveň vlny a převádí ji do číselné podoby. Amplituda udává sílu (hlasitost) zvuku, a frekvence udává výšku tónu. Takto se v počítači získá zvuk ve formátu PCM (pulzní kódová modulace). PCM je modulační metoda převodu analogového zvukového signálu na signál digitální, a její princip spočívá v pravidelném odečítání hodnoty signálu a jejím záznamu v binární podobě. Určujícími parametry jsou vzorkovací frekvence a jemnost rozlišení jednotlivých hodnot. Vzorkovací frekvence se pohybuje od 8 kHz u digitálních telefonních linek ISDN přes 44,1 kHz u zvukového CD po ještě vyšší hodnoty u profesionálních záznamových zařízení a ovlivňuje kvalitu reprodukovaného záznamu. Při příliš nízké vzorkovací frekvenci nestačí zaznamenané hodnoty k rekonstrukci průběhu signálu a dochází ke ztrátě kvality. Podle Nyquistova vzorkovacího teorému by měla být vzorkovací frekvence alespoň dvojnásobná oproti frekvenci zaznamenaného signálu. Při nesplnění této podmínky vzniká efekt zvaný aliasing (původní frekvence spojité informace je vzorkováním zcela zfalšována). Rozlišení hodnot určuje přesnost hodnot v jednotlivých bodech. Obvykle se používá 8 nebo 16 bitů (tedy 256, resp. 65536 možných hodnot). Určení hodnoty je nazýváno kvantování. Každé kvantování zanáší do signálu šum, jehož úroveň s rostoucím rozlišením klesá. Při příliš nízkém rozlišení je šum slyšitelný.
2. MIDI Musical Instrument Digital Interface. Tedy rozhraní pro elektronické hudební nástroje, především klávesy a podobné. K těmto účelům pochopitelně také ještě dnes slouží a lze pomocí něj jednoduše nahrávat vlastní skladby, následně je editovat a provádět s nimi datové operace. Princip MIDI: zde není uložena hudba, je uložen pouze popis, jak kterou hudbu hrát. Jedná se v podstatě o složitější „noty“. Výhodou je, že samotný popis má zanedbatelnou velikost oproti záznamu hudby. Nevýhodou je, že přirozeně existuje příliš mnoho nástrojů a proto jsou některé skupiny nástrojů nahrazeny. Trochu zjednodušeně je základem FM syntézy myšlenka, že hudební zvuky mají podobu cyklu, který se skládá ze čtyř částí:
nástup pokles trvání zvuku doznívání.
05 - Způsoby uložení zvuku - vzorky, MIDI, parametry při ukládání zvuku, přehled zvukových formátů. 3. Parametry při ukládání zvuku 3.1. Vzorkovací frekvence Kolikrát za sekundu počítač zapíše hodnotu amplitudy analogového zvuku. Lidské ucho rozliší frekvenci do 16 kHz (děti do 20 kHz) S rezervou 22 kHz. Dle Kotelnikova teorému je je nejnižší vzorkovací frekvence 44 kHz. 3.2. Rozlišení amplitudy šířka slova, která vyjadřuje počet bitů použitých na vyjádření hodnoty vzorků při 8-mi bitech - 256 úrovní při 16-ti bitech - 65 535 úrovní 3.3. Mono či Stereo Kvalita vzorkování je definována: vzorkovacím kmitočtem(Hz). Vzorkovací kmitočet určuje, kolikrát za sekundu počítač zapíše hodnotu amplitudy analogového zvuku (44 kHz = 44.000 měření za sekundu). šířkou slova, která vyjadřuje počet bitů použitých na vyjádření hodnoty vzorků. Šířka slova může být 8-bitová, 16-bitová a 32-bitová. Tyto dvě základní vlastnosti vzorků mají vliv na to, kolik vzorek zabere místa v paměti na disku.
. 4. Přehled zvukových formátů Wav (Windows Audio Volume) Při přeměně zvuku z analogové podoby do digitální získáme v počítači zvuk ve formátu PCM. PCM ukládá zvuk nekomprimovaně. V tomto formátu jsou např uloženy písně na CD. 1 minuta záznamu je asi 10 MB. Formát MPEG/audio MPEG/audio komprese dosahuje vysoké úrovně komprese díky odstraňování vjemově nedůležitých částí zvukového signálu. Toto odstraňování ústí v neslyšitelné deformace zvuku, navíc MPEG/audio komprimuje všechen signál, který by mělo lidské ucho slyšet. • Standart MPEG nabízí tři různé nezávislé úrovně komprese; tyto se označují jako Layer-1 až Layer-3. MP1 (MPEG1 - Layer 1) – je nejjednodušší úroveň kódování. MP2 (MPEG1 - Layer 2) – je prostřední úroveň kódování MP3 (MPEG1 - Layer 3) – nejčastěji použivané, vhodné pro hudbu, velmi výkoná komprese, různé druhy bitrate (od 16kbit/s až 320kbit/s), konstantí nebo proměnlivá bitrate) Hlavička souboru obsahuje informaci o vzorkovací frekvenci, počtu kanálů a kvalitě vzorku. Za hlavičkou se vyskytuje spousta rámců, každý má svou vlastní hlavičku, obsahující podrobnější informace. Tento formát dosáhl své popularity díky vysoké kompresi (10:1) při vysoké kvalitě. Jedinou nevýhodou je jeho výpočetní náročnost, zejména při kódování.
05 - Způsoby uložení zvuku - vzorky, MIDI, parametry při ukládání zvuku, přehled zvukových formátů. Microsoft WMA – windows media audio Od M$ pro její video formáty WMV a ASF. Tento formát patří mezi nejrozšířenější hlavně díky politice firmy Microsoft, která je implementuje do svých operačních systémů. Hlavní rozdíl mezi WMA a ostatními formáty je v možnosti zachování autorských práv. Windows Media Audio. Má o 20% lepší kompresi než MP3, prostorový zvuk, 96 kHz při 2024 bitech. Při nižších frekvencích má lepší zvuk, než MP3, při vyšších horší. AAC - Advanced Audio Coding Kodek AAC je přímým nástupcem mp3 a je považován za vrchol současného oboru ztrátové komprese. Kodek umožňuje práci až s 48 samostatnými kanály a vzorkovací frekvencí až 96 kHz. Formální testy s mp3 dokázaly, že AAC s datovým tokem 96 kb/s se kvalitou vyrovná mp3 komprimovaným 128 kb/s. Formát AAC byl vybrán pro digitální rozhlasový přenos. RA -RealAudio Komerční formát. Pro jeho tvorbu v CD kvalitě je nutný komerční software. Vytvořen firmou Real.com. Je ještě více zkomprimován než MP3. Ve více ztrátové podobě je používán internetovými rádii. MIDI - Musical Instruments Digital Interface Formát pro komunikaci mezi hudebními nástroji. Nezaznamenává hudbu přímo, uchovává pouze poznámky, který nástroj hraje jakým způsobem, v určenou dobu. Nahrávka se při přehrávání zpětně syntetizuje. Velmi malé soubory. Používají profesionální hudebníci. OGG (Ogg Vorbis) je formát souboru pro ukládaní zvukových záznamů založený na ztrátové kompresi. Ta spočívá ve vypouštění signálů o vyšších frekvencích ze záznamu. Formát ogg není zatěžkán komerčními licencemi. Autoři tvrdí, že tento formát je srovnatelný nebo dokonce lepší, než dnes nejpoužívanější mp3. VQF je zvukový formát vyvinutý firmou Yamaha, je to alternativní řešení k formátu MP3. Dosahuje lepší komprese než MP3. Není však příliš rozšířen. AIFF, .AIFC (Audio Interchange File Format) Formát vyvinutý firmou Apple pro záznam profesionálního zvuku. AIFC se od AIFF liší pouze tím, že umožňuje kompresi. Hlavička každé nahrávky obsahuje vzorkovací frekvenci, počet kanálů, šířku vzorku a spousta dalšího.
6. Přehled formátů ukládání dat na CD a DVD. Hlavní rozdíly mezi CD a DVD. Podrobněji formát DVD-video. Autorizace DVD. Vysvětlení pojmů spojených s vypalováním jako overburning, burn proof, lead in, lead out, track at once apod.
Přehled formátů ukládání dat na CD a DVD • • • • • • • • • •
Hudební (Audio CD) Super Audio CD Datové (ISO 9660) Kombinované (Mixed Mode) Video CD (VCD) Super Video CD (SVCD) ... další DVD-Audio DVD-Video Datové DVD
Hudební (Audio CD): hudební CD obsahuje více stop a každá reprezentuje jeden audio úsek (například jednu písničku). V každé session tedy může být jedna datová stopa, libovolný počet audio stop a nebo obojí dohromady (v případě kombinovaného CD). Pro odlišení stop slouží takzvané mezery “gap”, minimální délka jedné stopy jsou 4 sekundy a pokračuje ve vypalování od místa, kde předtím skončila. Super Audio CD: Jeden z nejmladších formátů, schválených v r. 2000. skládá se ze dvou vrstev – vrstva CD a vrstva s vysokou hustotou • ochranná opatření (ACMS – Active Copyright Management systém) • kompatibilita • kvalita – umožňuje až osm zvukových kanálů • umožňuje přidávání textových informací Datové CD (ISO 9660): formátování sjednoceno ustanovením standardního formátu ISO 9660, Podporují ho systémy Windows, Linux i MAC OS. Tento formát je ještě rozdělen na dvě úrovně – Level 1 a Level 2. Rozdíl mezi Level1 a 2 je v zápisu souborů o určitém počtu znaků. Level 1 – 8+3, Level 2 – 32znaků. Kombinované CD: je takové, na kterém jsou smíchána jak data, tak i audio stopy. vyskytuje u her (audio je zde jako soundtrack) nebo u originálních hudebních CD, kde jsou písničky doplněny buďto nějakou mini hrou nebo dokumentacemi o umělci, atp. I takového CD je vždy první stopa datová a další hudební. Obojí tvoří dohromady jednu session (nejedná se tedy o multisession CD). Takové CD dokáže rozpoznat audio přehrávač i počítač – audio přehrávač datovou stopu přeskočí a začne přehrávat až tu hudební. VideoCD (VCD): záznam videa cca 70 min. na CD ve formátu MPEG-1 pro přehrání na většině nových DVD přehrávačů, formát MPEG-1 přehraje jakýkoliv Windows 95 a vyšší, prvé musí být film uložen ve formátu .MPG, nikoliv .AVI!, musí mít specifikovanou velikost a počet snímků za vteřinu, 352x240 při 29,97 snímcích, audio 16 bitů stereo 44,1 kHz, datový tok datový tok 1,15 MB/s SuperVideoCD (SVCD): 30 minut video na CD ve formátu MPEG-2, přehrají některé novější DVD přehrávače (od 12/99) a pokud máte správný video kodek v PC a CD-ROM XA, tak i na PC Windows, používá komprimovaný obraz i zvuk, rozlišení 480x576 bodů, 25 snímků za sekundu ve formátu MPEG 2 , zvuk ve formátu MPEG 1 s datovým tokem 32 až 384 kbits/s. DVD (Digital Versatile Disc): Tato technologie byla uvedena na trh v roce 1996. Optické disky mají stejné celkové rozměry jako disky CD, ale mají mnohem vyšší kapacitu - uchovávají 4 až 28krát větší množství dat. DVD-Audio: Na trhu od poloviny roku 2000. Tento formát určený pouze pro záznam zvuku je podobný disku CD-Audio, ale nabízí 16, 20 a 24bitové samplování s frekvencí od 44,1 do 192 kHz. Pro srovnání CD-Audio používají 16bitové samplování s frekvencí 44,1 kHz. Disky DVD-Audio mohou také uchovávat ozvučené video, grafické a další informace. DVD Video: Populární formát pro vysoce kvalitní MPEG2 video a digitální prostorový zvuk. Umožňuje pracovat s mnoha jazykovými verzemi zvuku i titulků a nabízí další zdokonalené uživatelské funkce. Ke kompresi obrazu se používá standard MPEG-2. Pro kódování zvukové stopy se standardně používá formát Dolby Digital (AC-3). U DVD filmů se setkáme s datovou rychlostí 3-10 Mbit/s.
Hlavní rozdíly mezi CD a DVD Protože jedním z požadavku při návrhu DVD bylo zachování kompatibility s CD, jsou rozměry a princip záznamu shodné. Rozdíly nejlépe znázorní tabulka:
CD
DVD
Průměr
12 nebo 8 cm
12 nebo 8 cm
Tloušťka
1,2 mm
2 x 0,6 mm
Počet záznamových vrstev
1
1 až 4
Počet stran se záznamem
1
1 až 2
Délka prohlubně (pitu)
0,834 µm
0,4 µm
Rozteč stop (pitů)
1,6 µm
0,74 µm
Kapacita
650 až 700MB
4,7 až 17 GB
Rozměry prohlubní (pitů) se záznamem jsou u DVD podstatně menší a hustota záznamu je větší, proto je třeba citlivější čtecí zařízení. V souvislosti s tím bylo také nutné zmenšit tloušťku průhledné vrstvy nad záznamem. Proto se DVD skládá ze dvou 0,6 mm ploten, na kterých může být záznam ve dvou vrstvách. Tím můžeme získat kapacitu až 17GB.Díky podobnosti obou médií mohou přehrávače DVD číst CD, ale přehrávače CD nemohou číst DVD.
Podrobněji formát DVD-video Ke kompresi obrazu se používá standard MPEG-2. Pro kódování zvukové stopy se standardně používá formát Dolby Digital (AC-3). U DVD filmů se setkáme s datovou rychlostí 3-10 Mbit/s. Vyšší počet zvukových stop nebo množství dodatečného materiálu (tzv. extra materiál -- fotogalerie, film ve verzi Režisérův sestřih, záznamy z natáčení, rozhovory s herci, a jiné) mají často za důsledek, díky omezené kapacitě DVD média, nižší datovou rychlost (a tím i kvalitu obrazu) hlavního filmu. DVD Video disk musí povinně obsahovat adresář s názvem VIDEO_TS, které obsahují soubory s příponou vob, ifo a bup. V těchto souborech jsou uložené všechny potřebné složky video obsahu, jako je obraz, zvuk, hlavní nabídka, informace o kapitolách a titulky. Souborová struktura DVD Vob (Video Objects) soubory obsahují video, zvuk a titulky a jejich maximální velikost na DVD Video disku nepřekračuje 1 GB, ikdyž lze pomocí určitého softwaru vyprodukovat i Vob soubory o velikostech několika GB. Obvykle bývá jeden film rozdělen klidně i mezi 8 Vob souborů. Ifo soubory zase obsahují informace o tom, jaké zvukové stopy a titulky příslušné vob soubory obsahují, a další důležité informace potřebné pro správné fungování DVD Video disku. Bup soubory pak představují záložní kopie příslušných ifo souborů DVD Video disky většinou obsahují více zvukových stop, Disky DVD Video obvykle poskytují i několik stop s titulky v různých jazycích, DVD Video může obsahovat i informace o kapitolách (angl. chapters), které umožňují jednodušší vyhledávaní určitého úseku. VTS_xx_0.VOB obsahuje vždy buď menu nebo jiné navigační informace, pro video se používá až pořadové číslo jedna. Pokud je disk bohatý na bonusy, najdete na něm spoustu VOB souborů, které jsou seskupeny podle VTS a patří k určitým IFO souborům, které o nich nesou identifikační údaje. A jak se odlišují jednotlivé VTS části? Každá VTS část má svoje pořadové číslo, např. film má označení VTS_01, bonus VTS_02, další bonus VTS_03 apod. V názvu VTS je pak uloženo i další pořadové číslo, které se využívá zejména u VOB souborů, např. VTS_01_1.VOB, VTS_01_2.VOB apod. Celé to pak vypadá třeba takto: • VTS_01_0.IFO – informace o tomto VTS, zde třeba filmu, • VTS_01_0.BUP – záložní soubor pro IFO, • VTS_01_0.VOB – menu filmu, • VTS_01_1.VOB – první část filmu, • VTS_01_2.VOB – druhá část filmu, • VTS_01_3.VOB – poslední část filmu. Ještě něco o DVD-video: • • • • • • • •
133 minut videa MPEG-2 na jedné vrstvě s prostorovým zvukem 5+1, formát obrazu 4:3 i 16:9 (nejčastěji 1:1,85 a 1:2,35), až osm zvukových stop, až 32 titulků, menu a submenu, rozdělení filmu do kapitol, až devět úhlů kamery na jedné scéně, digitální i analogová ochrana proti kopírování, ochrana dětí před závadným obsahem.
Autorizace DVD DVD autoring je proces při kterém se vytváří DVD Video, které pak lze přehrát v DVD přehrávači. Při tomto procesu dochází k vytváření struktury disku DVD videa včetně vytváření a programování DVD menu. K nejdůležitějším krokům při tomto procesu patří určení místa, odkud se má hotové DVD Video přehrávat; dále je nutno spojit video, audio a případné titulky. Dále se také mohou vkládat hodnoty udávající začátky kapitol. V DVD menu se vytvářejí aktivní oblasti, které v hotovém DVD menu představují tlačítka, sloužící například pro výběr audiostopy, titulků, kapitoly, bonusů atp.
Pojmy overburning, burn proof, lead in, lead out, track at once apod. Overburning - Každé CD má ve skutečnosti vyšší kapacitu, než se uvádí na jeho obalu. Většinou se jedná řádově o několik minut – kupříkladu na 74min CD se dá namačkat v průměru 76 až 78 minut – záleží na značce CD a jeho výrobci. Vypálení většího množství dat, než je uváděná kapacita CD, se říká „overburning“. Burn proof - Tato funkce zajišťuje, že když počítač nestačí vypalovačku zásobovat daty, bude vypalování dočasně zastaveno. Po tuto dobu pak čeká vypalovačka, až se buffer zase naplní, pak provede synchronizaci dat a pokračuje ve vypalování od místa, kde předtím skončila. Lead in - Je místo, které je na začátku každé session vynechané pro zápis její TOC (Table Of Contens: čísla stop a jejich začátky). Lead-in se zapisuje při uzavírání session (mimo Disc at once zápisu). Vymezuje si 4 500 sektorů (1 minuta, nebo 9 MB). Lead-in také naznačí, že disk je multissesion a zároveň říká která následující adresa je k dispozici pro zápis. P kanál zde obsahuje samé nuly, Q kanálem je pak kódována TOC. Lead out - Je oblast, na konci každé session, která říká, že byla ukončena část s daty. Do části Lead-out nejsou nahrávána žádná aktuální data. První Lead-out má velikost 6 750 sektorů (1,5 minuty nebo 13,5MB), každá další obsadí 2 250 sektorů (0,5 minuty, 4,5MB). P kanál v lead-out získává frekvenci 2Hz. Track at once - Způsob zápisu dat na disk. Při každém dokončení stopy (tracku) je zapisovací laser vypnut (i když se bude okamžitě zapisovat další stopa). Tzv. zápis postopách.
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 07.
Způsob uložení videa v počítači, přehled nejčastěji užívaných kodeků, parametry ovlivňující kvalitu videa a velikost souboru. Výhody nelineárního střihu videa, princip střihových programů. Formáty titulků k filmům.
Způsob uložení videa v počítači AVI – Audio Video Interleave – nejpoužívanější formát pro zápis obrazu a zvuku do souboru na platformě Windows – Soubory mají koncovku AVI a mohou obsahovat videostopu nebo také autostopu – Na všechny snímky tvořící záznam je použit stejný stupeň komprese. Pokud je použita, musíme mít nainstalovány buď kodeky nebo dekompresní filtry. – Výhodou AVI formátu je velké množství kodeků, které zaručují použití ve všech oblastech digitálního videa. Záznam do AVI umí téměř všechny karty a také jeho zpracování v libovolném editoru by nemělo být problémem. – AVI není určeno pro použití variabilního datového toku. QT – Apple Quick Time – formát pro uložení videa vyvinutý firmou Apple pro počítače MacIntosh. Verze QT určená pro Windows je výrazně pomalejší než její protějšek pro MacOS. Soubory s koncovkou MOV, které QT využívá pro ukládání dat, jsou ekvivalentem souborů AVI – video i audio je také komprimováno pomocí kodeků. Na rozdíl od AVI nejde soubory s koncovkou MOV přehrát ve Windows přímo, ale musíte k tomu použít přehrávač Quick Time Player s nainstalovanými vlastními filtry. RAW, DV, DIF a další – jedná se o ekvivalenty AVI nebo QT, vyvinuté jednotlivými výrobci HW pro ukládání dat. Pracovat s těmito soubory mohou většinou jen programy dodávány k těmto videokartám. Pro použití v ostatních dostupnějších programech je nutné provést export do AVI nebo jiných ostatních formátů. ASF, WMV – vyvinula firma Microsoft především pro stream videa. – ASF je formát i komprese, vychází z formátu AVI. – WMV pochází taky od firmy Microsoft, jde o novější verzi ASF. MPEG – Motion Picture Experts Group – Formát pro zápis a kompresi videa, založený na odlišném principu než předchozí. – Z obrazové informace je zachován každý x-tý snímek a zbytek je definován pouze jako změna mezi těmito tzv. I-framy. Touto metodou lze dosáhnout velkého zmenšení objemu dat bez vizuálně rozpoznatelné degradace kvality, což však může způsobit problémy při dalším zpracování. Tímto způsobem jsou uložena data pouze k přehrávání ( DVD, SuperVideoCD, Video CD). V součastné době existují 3 nejrozšířenější verze MPEG komprese: MPEG-1, MPEG-2, MPEG-4.
Princip MPEG komprese Komprese spočívá v tom, že každý x-tý snímek je uložen kompletní (I-snímek) a ostatní jsou definovány jako rozdíly mezi nimi (P-snímek a Bsnímek). I snímky jsou snímky klíčové, jsou komprimovány obdobně jako MJPEG, ale navíc s možností komprimovat různé části obrazu různým stupněm komprese. P-snímky jsou kódovány s ohledem na nejbližší předchozí I nebo P-snímek. B-snímky jsou pak dopočítávané jako rozdílové snímky mezi nejbližším předchozím Strana: 1 / 5
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 07.
Způsob uložení videa v počítači, přehled nejčastěji užívaných kodeků, parametry ovlivňující kvalitu videa a velikost souboru. Výhody nelineárního střihu videa, princip střihových programů. Formáty titulků k filmům.
I nebo P-snímekm a nebližším následujícím I nebo P-snímkem. Celá sekvence snímků (od jednoho I po další I snímek) se pak nazývá GOP (Group of Pictures) a standardní MPEG stream používá pořadí IBBPBBPBBPBBPBBPBB. Z pohledu zabíraného místa pak I snímky zabírají nejvíce místa, po nich jsou P snímky a úplně nejméně místa zabírají snímky B. Komprese MPEG-1 se nehodí pro střih videa z důvodu vzdálených klíčových snímků.
Nejčastěji používané kodeky Ke kompresi se používají kodeky (programy pro kompresi kodery-dekoder), které převedou nekomprimované video (RGB, YUV) do speciálního formátu.
MPEG-1
MPEG-1 existuje od roku 1993. Jeho hlavním kritériem bylo zachování rozumné kvality při redukci datového toku na přijatelnou mez. Byl definován tok 1-1,5 Mbitů/s s možností náhodného přístupu po půl vteřině. Maximální rozlišení je 352x288 a 30 snímků/s. Pro většinu domácích uživatelů a obchodní použití (dokumentace apod.) dává přijatelné výsledky.
MPEG-2
V roce 1995 byl vypuštěn MPEG-2 jehož základní princip je stejný jako u MPEG-1, ale umožňuje datový tok až do 100Mbitů/s. Je užíván pro digitální TV, video filmy na DVD a pro profesionální studia (kabelové a satelitní televize). Také rozlišení bylo zvětšeno na 720x576 čili plný PAL. Prozatím není přehratelný tak úplně na všem – jako MPEG-1.
DV
DV je stejně starý jako MPEG 2 a je v podstatě jeho obdobou. Je to formát navržený pro záznam videa na magnetický pásek, s optimalizací na možnost zpomaleného a zrychleného přehrávání. Používá pevný datový tok 25 Mb/s Do 4 GB souboru uložíme něco málo přes 18 minut záznamu. Po zpracování, lze výsledek našeho snažení uložit zpět na pásku digitální videokamery.
MPEG-4
Další z řady MPEG-4 má dávat co nejlepší kvalitu při co nejnižším datovém toku 10kbit/s - 1Mbit/s. Hlavním použitím je přenos videa přes internet a při mobilní komunikaci. MPEG-4 je mnohem variabilnější pro kompresi pohyblivých obrázků než MPEG-1. Na rozdíl od MPEG-1 může mít téměř libovolné rozměry obrazu, počet snímků za sekundu a vzdálenost mezi klíčovými snímky (Key-Frame, IFrame). Navíc nemá pouze konstantní datový tok (CBR: constant bit-rate), ale proměnný datový tok (VBR: variable bit-rate), což snižuje výslednou velikost videa.
Strana: 2 / 5
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 07.
Způsob uložení videa v počítači, přehled nejčastěji užívaných kodeků, parametry ovlivňující kvalitu videa a velikost souboru. Výhody nelineárního střihu videa, princip střihových programů. Formáty titulků k filmům.
Indeo Video 5 (Intel(R) Indeo(R) Video 5)
Výborná kvalita obrazu, při nastaveni na 100% téměř k nerozeznání od nekomprimovaného AVI. U tohoto kodeku lze nastavit, aby každý snímek byl klíčový (defaultně je každý 15.), což sice o něco zhorší kompresní poměr, ale umožní, podobně jako u MJPEG kodeku, stříhání AVIček bez rekomprese (tudíž bez ztráty kvality).
DIV-X
Založené na nelegálně upravené verzi kodeku MPEG-4 od společnosti Microsoft, doplněné o "čerstvou" verzi MP3 audio kodeku. Nejrozšířenější kodek v současné době
XVid
Počátky tohoto formátu jsou spjaty s formátem DivX. V okamžiku, kdy se OpenDivX stal uzavřeným, vzalo několik programátorů pracujících na OpenDivXu zdrojové kódy ještě otevřeného OpenDivXu a osamostatnili se. Na základě těchto zdrojových kódů začali vyvíjet vlastní verzi kodeku nazvanou XviD. Jedná se stejně jako u DivXu o kodek kompatibilní s MPEG-4 a implementuje mnoho jeho vlastností. Protože se však jedná o Open-Source projekt podílí se na jeho vývoji programátoři z celého světa.
Parametry ovlivňující kvalitu videa a velikost souboru HW a SW, kterými video natáčíme, získáváme, převádíme do počítače (digitální, analogový HW, vlastnosti HW – rozlišní obrazu, kontrast, jas, věrnost barev, stabilizátor obrazu a také médium, na které nahráváme záznam) Převod do počítače – digitálně přes 1394, USB – analogově přes S-video Formát videa (PAL, NTSC, SECAM)
Použitý kodek – komprese Snímková rychlost – počet snímků, který se vystřídá za vteřinu. Pro plynulý pohyb je potřeba minimálně 10 snímku za vteřinu (fps). (V kině 24 fps, TV 25 fps) Rozlišení – množství informace obsaženo ve snímku. Rozlišení je reprezentováno počtem pixelů (obrazových bodů), které jsou na obrazovce. Jsou dány počtem horizontálních krát vertikálních bodů. Jinak řečeno výškou a šířkou, respektive počtem řádků a sloupců. Standardní rozlišení obrazu jsou 320x200, 640x480, 1024x768, 1280x1024, 1600x1200. Čím vyšší rozlišení, tím vyšší kvalita obrazu.
Strana: 3 / 5
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 07.
Způsob uložení videa v počítači, přehled nejčastěji užívaných kodeků, parametry ovlivňující kvalitu videa a velikost souboru. Výhody nelineárního střihu videa, princip střihových programů. Formáty titulků k filmům.
Zjednodušeně lze říct, že je tvořen dvěma stroji - příspěvkovým (playerem) a nahrávacím (recorder). Samotný střih pak probíhá tak, že v přehrávači běží pásek s originálním záznamem a na recorder se nahrávají pouze vybrané záběry v požadovaném pořadí a délce. Nutnost převíjení kazety s originálním záznamem, nepřehlednost Nelze zpětně upravovat provedené střihy Použití např. u TV zpravodajství (není třeba větší kreativity střihu)
Nelineární střih videa
Vznik umožněn stoupajícím výkonem počítačových procesorů a rostoucí kapacitou pevných disků s vysokou přenosovou rychlostí. Umožňuje záznam v počítači roztřídit do jednotlivých záběrů a ty pak libovolně skládat v požadovaném pořadí. Během střihu se navíc můžete kdykoliv vrátit a libovolný záběr zkrátit nebo změnit pořadí. To vše pouhým přetažením myší. Výhody: jednoduchost úprav, snadná orientace v záznamu, …
Princip střihových programů Principem každého střihového programu je zoptimalizovat (upravit video do takové formy, která bude vyhovovat uživateli pro snadné použití). 1. pomocí střihového programu nahrajeme video do počítače (nahrát video) 2. vybereme si několik sekvencí (sestavení sekvencí) 3. úprava sekvencí (zpomalení, zrychlení, zkrácení, podbarvení, grafika, menu) 4. nastavení vlastností renderizace (rozlišení, datový tok, zvuk, výběr kodeku, a formát výstupního videa) 5. renderizace (zpracování dle zadaných požadavků a nastavení)
Titulky Externí titulky nejsou přímo ve videu ale v souboru zvlášť (v textovém souboru). Existuje několik formátů externích titulků, nejpoužívanější je většinou formát MicroDVD, a také se často používá formát SubRip.
MicroDVD (*.*)
Začátek a konec ve složených závorkách {} Od autorů Micro DVD Playeru Hodnoty ve snímcích -> nutnost znát framerate Zalamování řádků symbolem |
Strana: 4 / 5
MULTIMÉDIA A INFORMAČNÍ SYSTÉMY 07.
Způsob uložení videa v počítači, přehled nejčastěji užívaných kodeků, parametry ovlivňující kvalitu videa a velikost souboru. Výhody nelineárního střihu videa, princip střihových programů. Formáty titulků k filmům.
Sub Rip (*.srt)
Hodnoty zadány časově -> libovolný framerate Všechny titulky očíslovány Zalamování textu titulků zalomením textu v textovém souboru
SubViewer (*.sub)
Podobný jako SubRip, ale je rozšířený o autora, zdroj atd. Hodnoty jsou zadány v čase a k zalomení řádku se používá příkaz [br]. Dá se zde také nastavit barva, velikost a font písma.
Strana: 5 / 5
8. Rozdělení signálů, základní charakteristika, příklady. Jaké matematické nástroje používáme pro modelování a analýzu signálů? Signál je optické, elektrické, el. mag., akustické, mechanické, pneumatické nebo hydraulické znamení, které má určitý význam. Je to převedená fyzikální veličina. Rozdělení: Podle typu: Rozdíl mezi nimi je v počtu stavů signálů. o Spojité (analogové) – nekonečně mnoho stavů. o Diskrétní (digitální) – konečně mnoho stavů. Digitální signál je často pouze binárním – přenášené hodnoty jsou pouze jednička a nula. Podle charakteristiky signálu o Analogové informace analogovým signálem (např. rozhlas, televize, telefon, hlas) o Digitální informace pomocí analogového signálu Nevýhod prvního druhu přenosu je menší odolnost vůči šumu, zkreslení apod. Pro druhý druh přenosu je třeba převést digitální signál na analogový při vysílání a zpět při přijímání.
Podle množství informace, která je vysílána v jeden okamžik: o Pouze jedna hodnota – sériový přenos o Více hodnot – paralelní přenos – je rychlejší, ale nákladnější Podle způsobu komunikace: o Synchronní – vysílač je s přijímačem sesynchronizován tak, aby bylo zcela, kdy se budou přenášet jednotlivé části příslušné informace. o Asynchronní – vysílač vysílá bez ohledu na stav přijímače. Podle stacionárnosti: o Stacionární signál – má střední hodnotu a rozptyl konstantní Deterministické signály – možno analyticky popsat Stochastické signály (náhodné) – nelze analyticky popsat, popsaný statistickými charakteristikami střední hodnota a rozptyl. Opak deterministického signálu. o Nestacionární signál – výrazně se mění parametry v čase Spojité Přechodové jevy a rázy
Základní charakteristika časového signálu: Nejdůležitější veličiny:
Maximální hodnota (Peak) o Popisuje amplitudy krátkodobých jevů
o
Indikuje pouze přítomnost špičky, ale neukazuje na časový průběh ani kmitočtové složení hodnoceného kmitání. o Nazývá se jinak vrcholová hodnota, výkmit nebo špičková hodnota Peak – Peak Střední hodnota (Average) – (také centrální moment 1. Řádu) o Získává se zprůměrováním absolutních hodnot časového průběhu signálu. Efektivní hodnota (RMS – Root Mean Square) – (také moment 2. Řádu) o Ukazuje časový průběh a současně má přímý vztah k jeho energetickému obsahu
Matematické nástroje: Frekvenční analýza Založená na matematickém Fourierově teorému, že každá periodická křivka může být určena jako součet sinusových křivek, které jsou harmonickými složkami daného průběhu 𝑓 𝑡 = 𝐴0 + 𝐴1 sin 𝜔𝑡 + 𝜑1 + 𝐴2 sin 𝜔𝑡 + 𝜑2 + ⋯ Harmonická analýza Matematická teorie rozkladu periodického průběhu na jeho harmonické složky a způsoby určování těchto složek. Fourierův rozvoj (amplitudový rozklad): Tento rozvoj lze použít na každou jednoznačně určenou periodickou funkci F(t) s periodou T a frekvencí f mající v uzavřeném intervalu periodicity délky T jen konečný počet extrémů a nespojitostí prvního druhu. Tato funkce lze vyjádřit součtem nekonečné řady sinusových průběhů s amplitudo AN a fázovými posuny N a úhlovými frekvencemi N = n , které jsou celistvými násobky úhlové frekvence a původní analyzované periodické funkce. ∞
𝐹 𝑡 =
𝐴𝑁 sin (𝑛𝜔𝑡 + 𝜑𝑛) 𝑛=0
Konvoluce Je základním konceptem zpracování signálů, který stanovuje, že pro hledání výstupního signálu může být vstupní signál kombinován se systémovou funkcí. Symbol pro konvoluci je „*“.
𝑏
𝑦 𝑡 = 𝑥∗ℎ 𝑡 =
𝑥 𝜏 ℎ 𝑡 − 𝜏 𝑑𝜏 𝑎
Konvoluční integrál je obyčejně používán pro hledání konvoluce signálu typicky v rozmezí a = -nekonečno, b = + nekonečno Fourierova transformace Jde o funkci, která transformuje signál nebo systém z časové domény (průběh v čase) na frekvenční doménu (zobrazuje fázový posuv nebo amplitudu signálu na frekvenci). ∞
𝑥 𝑡 𝑑𝑡 < ∞ −∞
∞
𝑥(𝑡)𝑒 −𝑗𝜔𝑡 𝑑𝑡
𝑋 𝑗𝜔 = −∞
Inverze F. transformace pro převod z frekvenční domény na časovou: 𝑥 𝑡 =
1 2𝜋
∞
𝑋(𝑗𝜔)𝑒 𝑗𝜔𝑡 𝑑𝜔
−∞
Laplaceova transformace Jde o zobecněnou Fourierovu transformaci. Umožňuje transformovat jakýkoliv systém nebo signál, protože jde o transformaci do komplexní roviny. ∞
𝑋 𝑗𝑠 =
𝑥(𝑡)𝑒 −𝑠𝑡 𝑑𝑡
−∞
Inverze: 𝑥 𝑡 =
1 2𝜋
∞
𝑋(𝑠)𝑒 −𝑠𝑡 𝑑𝑠
−∞
Bodeho graf Graf amplitudy vs. Frekvence and fáze vs. Frekvence.
9 Vysvětlete princip a účel vzorkování signálu - jakými podmínkami se vzorkování signálu řídí. Vysvětlete princip a účel kvantování signálu - jaké jsou důsledky kvantování signálu z hlediska šumu. Pořízení digitálního záznamu signálu lze rozdělit na tři fáze: Vzorkování (v definovaných časových intervalech je odebírán vzorek signálu, tím se ze spojitého časového průběhu stane diskrétní časový průběh). Kvantování (vzorky získané vzorkováním se pomocí analogově-digitálního převodníku převedou do číslicové formy). Kódování (číslo získané kvantováním se kóduje z důvodu menší paměťové náročnosti, jednoduššího zpracování, přenosu atd. – např. kódování BCD). Digitalizací se nevratně ztrácí část informace obsažené v původním signálu, to se při zpětné rekonstrukci projeví jako šum. Vzorkování Princip: Jde o převod spojitého (analogového) signálu na signál diskrétní (digitální), tzv. digitalizace. Princip spočívá v odebírání hodnot zkoumaného signálu v diskrétních časových okamžicích a přiřazení digitální hodnoty z omezeného předem definovaného rozsahu. Převod spojitého signálu na diskrétní tedy sestává ze dvou fází. Nejprve se provede vzorkování signálu, a potom následuje kvantování.
Analogový signál
Vzorkování analogového signálu
Vzorkování se provede tím způsobem, že rozdělíme vodorovnou osu signálu (čas) na rovnoměrné úseky a z každého úseku odebereme jeden vzorek. Namísto spojité čáry dostáváme pouze množinu diskrétních bodů s intervalem odpovídajícím použité vzorkovací frekvenci. Účel: Účelem je zaznamenat analogový signál do digitální podoby, např. pro potřeby archivace, dalšího zpracování na číslicových počítačích apod. V digitální podobě se také dají signály daleko kvalitněji zaznamenávat a přenášet Vzorkování 1.druhu – během vzorkovacího impulsu je povolena změna amplitudy.
9 Vysvětlete princip a účel vzorkování signálu - jakými podmínkami se vzorkování signálu řídí. Vysvětlete princip a účel kvantování signálu - jaké jsou důsledky kvantování signálu z hlediska šumu. Vzorkování 2.druhu – ponechána hodnota která je načtena v okamžiku zahájení vzorkování. Podmínky vzorkováni: Jedná se především o frekvenci vzorkovacího signálu. Shannon-Kotelnikův teorem: Vzorkovací frekvence musí být minimálně 2x větší než nejvyšší frekvence obsažená ve vzorkovaném signálu. Toho se docílí nejčastěji předřazením dolní propusti (integrační zesilovač) před samotný AD převodník – antialiasing. Jinak by případná rekonstrukce do původní podoby nebyla proveditelná jednoznačně – zkreslení. Příklad: Člověk rozezná frekvence zvuku do 22 kHz – vzorkování zvuku nejméně 44 kHz. Kvantování Princip a účel kvantování: Vzhledem k tomu, že počítače a další zařízení dále zpracovávající digitální signál umí vyjádřit čísla pouze s omezenou přesností, je potřeba navzorkované hodnoty upravit i na svislé ose. Protože se hodnota vzorku dá vyjádřit pouze po určitých kvantech, nazýváme tuto fázi A/D převodu kvantování.
Na obrázku může veličina na svislé ose například nabývat pouze celočíselných hodnot. Aby bylo možné určit, které hodnoty má po kvantování nabývat určitý vzorek, je třeba rozdělit prostor kolem jednotlivých hodnot na toleranční pásy (jeden takový pás je naznačen kolem hodnoty 0). Kterémukoliv vzorku, který padne do daného tolerančního pásu, je při kvantování přiřazena daná hodnota. Kvantované hodnoty jsou na obrázku naznačeny zelenými kolečky. Jak je vidět, kvantované hodnoty se ve většině případů liší od skutečných navzorkovaných hodnot. Velikost kvantizační chyby je vzdálenost mezi kvantovanými a původními navzorkovanými body, na obrázku ji vyjadřují délky pomyslných úsečky mezi červenými a zelenými kolečky. Velikost této chyby se pohybuje v intervalu +1/2 až -1/2 kvantizační úrovně.
9 Vysvětlete princip a účel vzorkování signálu - jakými podmínkami se vzorkování signálu řídí. Vysvětlete princip a účel kvantování signálu - jaké jsou důsledky kvantování signálu z hlediska šumu. Dynamický rozsah – technicky možné rozmezí amplitud. (..%A překročení mezí = ZKRESLENÍ OMEZENÍM). Kvantovací chyba – soubor příčin: - konečný počet kvantovacích úrovní - každá úroveň reprezentuje VŠECHNY VZORKY MEZI ROZHODOVACÍMI ÚROVNĚMI Kvantovací krok: ∆x = konst
à LINEÁRNÍ kvantování
∆x = f
à NELINEÁRNÍ (nerovnoměrné) kvantování
Kvantovací zkreslení (kvantizační šum) Omezení zkreslení -
dostatečný počet úrovní (lineární) volby proměnného kroku kvantování (kompemzace signálu na vysílací straně a expanze na přijímací straně)
Způsob kvantování nutno přizpůsobit rozdělení hustoty pravděp. s ohledem na Pkv minimální: -
Lineární kvantování – pro rovnoměrné rozdělení f(x)
-
Nelineární kv. – pro jiné typy rozdělení
OPTIMÁLNÍ KVANTOVÁNÍ: Nerovnoměrnost rozdělení hustoty pravd. je vyvážena nerovnoměrnosti stupňů kvantování. NELINEÁRNÍ KVANTOVÁNÍ Slabina: stř. výkon kvant. šumu Pkve je konstatní v celém rozsahu a nezávislý na stř. výkonu signálu à S/N bude klesat s klesajícím středním výkonem užitečného signálu. Přípustná hodnota S/N – nejmenší očekávaná hodnota stř. výkonu signálu à volby počtu kvantizačních úrovní (pro všechny ostatní případy bude zvolený počet úrovní předimenzovaný).
Řešení pomocí NK:
9 Vysvětlete princip a účel vzorkování signálu - jakými podmínkami se vzorkování signálu řídí. Vysvětlete princip a účel kvantování signálu - jaké jsou důsledky kvantování signálu z hlediska šumu. -
malé hodnoty signálu à úzké kvantizační stupně
-
větší hodnoty signálu à širší kvantizační stupně
Počet kvantizačních úrovní Protože se digitální signál zpravidla zpracovává na zařízeních pracujících ve dvojkové číselné soustavě, bývají počty kvantizačních úrovní A/D převodníků zpravidla rovny N-té mocnině čísla 2, přičemž nakvantovaný signál pak lze vyjádřit v N bitech. Kvantizační šum Pokud bychom vynesli velikosti chyb od jednotlivých vzorků do grafu, získali bychom náhodný signál, kterému se říká kvantizační šum. Velikost šumu je zvykem vyjadřovat jako poměrné číslo v decibelech, a sice jako poměr užitečného signálu ku šumu. Protože číslo ve jmenovateli zlomku kvantizační chyba je u všech lineárních převodníků stejná (interval +1/2 až -1/2 kvantizační úrovně), závisí velikost kvantizačního šumu jen na čitateli zlomku, tedy na velikosti užitečného signálu, což je maximální počet kvantizačních úrovní daného převodníku.
U kvantizačního šumu lze rovnici převést do tvaru:
Např. u 16 bitového kvantování použitého u záznamu hudby na CD je odstup signálu od šumu: 16 . 6,02 = 96,32 dB. Díky diskretizaci původního spojitého signálu ve dvou osách nemůže ve většině případů signál zpětně převedený z digitální podoby do analogové přesně odpovídat původnímu signálu. Černá čára na obrázku znázorňuje zpětným D/A Analogový signál rekonstruovaný z digitálních hodnot převodem zrekonstruovaný analogový signál, zatímco modrá čára je původní analogový signál, ze kterého byl A/D převodníkem získán signál digitální (zelená kolečka).
MULTIMÉDIA A I FORMAČ Í SYSTÉMY
10
dále DSP) je mikroprocesor, jehož návrh je optimalizován Digitální signálový procesor (dále pro algoritmy používané při zpracování digitálně reprezentovaných signálů. Hlavním nárokem na systém bývá průběžné zpracování (tj. v reálném čase) velkého množství dat "protékajících" procesorem. Typická aplikace DSP Jedním ze základních důvodů k vytvoření DSP byl fakt, že klasické analogové obvody sloužící pro zpracování signálu bývají náročné z hlediska návrhu, nastavení, provedení a reprodukovatelnosti, přičemž jakmile akmile jsou vyrobeny nelze jejich funkci téměř modifikovat.
Typický řetězec pro zpracování signálu v DSP Analogový signál je nejprve převeden A/D převodníkem na digitální a v této podobě je průběžně zpracováván DSP. Zpracovaný digitální signál je D/A převodníkem převodníkem zpět převeden na analogový. V mnoha zařízeních prochází signál tímto řetězcem v reálném čase, ale na některých signálech je potřeba provést tak složité a výpočetně náročné algoritmy, že to ani velmi rychlý DSP procesor v reálném čase nestihne a digitalizovaná gitalizovaná data musí být nejprve zaznamenána do paměti a odtamtud teprve postupně zpracovávána. (V některých zařízeních je použita jen polovina tohoto typického řetězce nebo jsou sice použity obě poloviny, ale v samostatných oddělených řetězcích zpracovávaných zpracovávaných samostatnými procesory. Užití části řetězce nastává například v CD přehrávači, kdy je signál z kompaktního disku čten v digitální podobě, zpracován digtálním signálním procesorem a nakonec převeden na analogový. Příkladem odděleného zpracování je mobilní bilní telefon, ve kterém se obvykle zpracovává vysílaný a přijímaný signál odděleně v samostatných procesorech.) Architektura DSP: -
Harwardská arch. (odělená paměť zvlášť pro data a zvlášť pro program - data a kód programu využívají vlastní sběrnice)
-
Specializované lizované výpočetní jednotky procesoru, které dokáží pracovat paralelně (kromě ALU, navíc rychlá násobička, atd.), atd.) má také posuvný registr.
-
Dvě nebo více nezávislých adresních jednotek, tzv. DAG (DataAddress ( ddress Generator), adresujících data v lineárních nebo kruhových bufferech
MULTIMÉDIA A I FORMAČ Í SYSTÉMY
10
Typický DSP tak umožňuje během jednoho taktu provést jeden krok skalárního násobení dvou vektorů, procesor s klasickou architekturou by na stejnou operaci potřeboval několik taktů. Dělení DSP: -
použitá aritmetika (celočíselná, s pevnou řádovou čárkou, s plovoucí řád. čárkou).
-
podle šířky datové sběrnice (od ( 16 bitů výše)
-
počet jader (jedno, nebo vícejádrové)
Algoritmy DSP: Nejčastějšími algoritmy zpracování digitálních signálů signá jsou algoritmy filtrů. -
FIR (Finite Impulse Response) – oblast aplikací: filtry s lineární fázovou odezvou
Kaskádní filtr 4.řádu (kaskádní spojování filtračních modulů FIR a IIR 2. řádu)
-
Mřížkové filtry a další… Srovnání filtrů FIR a IIR - FIR:: pokud je kriteriem fázový průběh, lineární průběh fáze stabilita a prediktabilita jsou přirozenou vlastností - IIR:: mizerný průběh fáze (velká nelinearita), strmá přechodová oblast při malém počtu větví, pro stejný počet větví je filtr IIR 5-10x 5 10x účinnější v řízení amplitudové charakteristiky než filtr FIR.
Dalšími velmi častými algoritmy jsou transformace signálu (Fourierova T, Laplaceova Laplac T, Z-T, Diskrétní FT – DFT, Rychlá FT – FFT)
Modulace je nelineární proces, kterým se mění charakter vhodného nosného signálu pomocí modulujícího signálu. Modulace se velmi často používá při přenosu nebo záznamu elektrických nebo optických signálů. Nejběžnějšími příklady zařízení spotřební elektroniky využívajících modulaci jsou například rozhlasový a TV přijímač, mobilní telefon, různé typy modemů, satelitní přijímače atd. Zařízení, které provádí modulaci se nazývá modulátor.. Musí vždy obsahovat nějaký ně nelineární prvek, jinak nemúže k modulaci dojít. Platí to ale i naopak. Jakmile se jakékoliv dva signály setkají na nějakém nelineárním prvku nebo v nelineárně se chovajícím prostředí, dojde k jejich vzájemné modulaci tzv. intermodulaci. Opakem modulace modulace je demodulace, kterou provádí demodulátor. Rozdělení modulací Podle typu nosného signálu se rozdělují na:
MULTIMÉDIA A I FORMAČ Í SYSTÉMY
10
1. spojité analogové modulace - nosným signálem je signál s harmonickým průběhem v čase (sinusoida nebo cosinusoida) a modulačním signálem je analogový signál 2. spojité digitální modulace - nosným signálem je signál s harmonickým průběhem v čase (sinusoida nebo cosinusoida) a modulačním signálem je digitální signál 3. diskrétní modulace - nosným signálem těchto modulací je signál s nespojitým průběhem často také nazývaný taktovací signál Ad1) Spojité analogové modulace Pokud je modulačním signálem typický analogový signál nabývající nekonečného počtu hodnot, nabývá také výsledný fázor modulovaného signálu nekonečného množství hodnot. Ad2) Spojité digitální modulace Je-li modulačním signálem digitální signál nabývající konečného počtu stavů, nabývá i fázor modulovaného signálu konečného počtu poloh. Mezi jednoduché modulace tohoto typu patří: -
amplitudová m. – ASK (Amplitude-Shift Keying)
-
frekvenční m. – FSK (Frequency-Shift Keying)
-
fázová m. – PSK (Phase-Shift Keying) o dvoustavová fázová m. – BPSK (Binary Phase Shift Keying) o čtyřstavová fázová m. – QPSK (Quadrature Phase Shift Keying) o vícestavové f. m. – 8PSK, 16PSK, …
Ad3) Diskrétní modulace U taktovacího signálu diskrétních m. lze také měnit několik parametrů. Navíc se tyto m. rozdělují i podle toho, jestli je spojitý (nekvantovaný) nebo diskrétní (kvantovaný) signál modulační. -
nekvantované o pulzně amplitudová modulace - PAM o pulzně šířková modulace - PWM (W z anglického width) o pulzně polohová modulace - PPM (P z anglického position)
-
kvantované o pulzně kódová modulace - PCM (C z anglického code) o delta modulace - DM o adaptivní delta modulace - ADM o diferenční pulsně kódovaná modulace - DPCM o adaptivní diferenciální pulsně kódová modulace – ADPCM
Složené modulace Mezi nejpoužívanější složené modulace patří: -
kvadraturní amplitudová modulace - QAM (Q z anglického quadrature)
-
amplitudově fázová modulace - APSK - podobná jako QAM, jiný konstelační diagram
MULTIMÉDIA A I FORMAČ Í SYSTÉMY
10
Kliknutím tady lze vidět AM a FM animovaně v akci.
Fázová modulace
Frekvenční modulace
AM oboustranná - AM DSB (Dual Dual Side Band) Band <nosná je modře, červeně je modulační signál>
PAM PAM
AM oboustranná s potlačením nosné - AM DSB SC (Dual Dual Side Band Supressed Carrier) Carrier
PFM PPM
11. DHTML: objektový model dokumentu, typy událostí a jejich zpracování. Použití jazyka JavaScript přizpracování DHTML událostí. Možné typy vstupů a výstupů JavaScript-u v DHTML. Objektový model dokumentu Document Object Model (objektový model dokumentu) je API pro HTML a XML dokumenty. Umožňuje strukturovaně znázornit dokument, upravovat jeho obsah a vizuální podobu. V podstatě propojuje webové stránky se skriptovacími nebo programovacími jazyky. Všechny vlastnosti, metody a události, které jsou k dispozici webovým vývojářům k úpravě a vytváření webových stránek, jsou uspořádány do objektů (tj. objekt 'dokument', který představuje dokument jako takový, objekt 'tabulka', který představuje HTML prvky tabulky, atd.). Tyto objekty jsou přístupné pomocí skriptovacích jazyků ve většině současných webových prohlížečů. DOM je nejčastěji využíván ve spojení s JavaScriptem a to tak, že kód je napsán v JavaScriptu, ale využívá DOM pro přístup k webové stránce a jejím prvkům. DOM byl nicméně navržen tak, aby nebyl závislý na žádném programovacím jazyku, vytváří strukturované znázornění dokumentu dostupné pod jediným API. Ačkoliv se zde zaměřujeme právě na JavaScript, DOM může být implementován libovolným jazykem. HTML elementy jsou OBJEKTY. Každý objekt : má vlastnosti – atributy může reagovat na události Identifikace objektu: atributy id – jednoznačná identifikace name – několik objektů může mít stejné name Hierarchická struktura objektů:
objektový model:
Typy událostí Většina událostí je v prohlížečích předdefinována a pokrývají takřka všechny změny, které na stránce mohou nastat. Od pohybu ukazatele (kurzoru myši) nad nějakým objektem, kliknutí myši či stisku klávesy, přes načtení nějakého prvku či celého dokumentu, otevření a zavření okna, změnu fokusu okna (přesun do popředí/do pozadí) či nějakého prvku, až po vypršení nastavené doby časovače či situaci, kdy nastane nějaká chyba v běhu programu. Každá z těchto předdefinovaných událostí má přiřazen svůj ovladač (handler). Tento ovladač je pojmenován ve tvaru onUdálost - tedy např. onClick, onLoad, onChange atd. - ten se zavolá, pokud tato událost nastane. Události spojené s myší: onclick
při kliknutí myší na daném prvku
ondblclick
při dvojitém kliknutí myší na daném prvku
onmousedown při stisknutém tlačítku myši na prvku onmouseup
při uvolnění tlačítka myši na prvku
onmouseover
při ponechání myši nad prvkem
onmousemove
při najetí myši na prvek
onmouseout
při opuštění prvku myší
onfocus
při ponechání myši nad prvkem (u položek formuláře)
onblur
při opuštění prvku myší (u položek formuláře)
Události spojené s klávesnicí onkeypress
při rychlém stisku klávesy na prvku
onkeydown
při stisknuté klávese na prvku
onkeyup
při uvolnění klávesy
Události spojené s formulářem onsubmit
při odeslání formuláře
onreset
při vymazání formuláře
onselect
při výběru textu v textovém poli
onchange
při změně hodnoty v prvku formuláře
a mnoho dalších… Zpracování událostí:
Př:
//z powerpointu z moodle
Každý z výše uvedených ovladačů (handlerů) může mít přiřazen kód, který se má provést, pokud událost nastane. Výchozí hodnotou je většinou null, tzn. že událost nevyvolá žádnou akci. Chceme-li akci pro daný objekt při určité události přiřadit, existují dvě možnosti: 1.
Přímo v HTML pomocí atributu odpovídajímu názvu ovladače. Jeho hodnotou je tělo funkce, která se má provést, když událost nastane. Jméno atributu v HTML není case-sensitive (nerozlišují se malá/velká písmena), může být tedy použito např. onload, onLoad, ONLOAD (v XHTML však již musí být jména atributů pouze malými písmeny). Syntaxe je tedy: např. nebo: // zmeni pozadi na cerne