Učební text Multimédia
1. MULTIMÉDIA „Talking about multimedia is a lot like talking about love. Everybody agrees that it´s a good thing, everybody wants it, wants to participate in it, but everybody has a different idea of what „it“ really is. Right now, the industry reminds me of a bunch of teenagers dabbling in something that instinctively feels right, all the while wondering how and when they´ll know for sure if they´re really in „it,“ and what to do about it if they are.“ (Vaughan) (Hovory o multimédiích se velmi podobají hovorům o lásce. Všichni souhlasí s tím, že je to dobrá věc, každý ji chce, chce se na ní podílet, ale každý má jiný názor, co „to“ skutečně je. Právě teď mi obor připomíná partu teenagerů, kteří se rýpají v něčem, o čem si instinktivně myslí, že je to to pravé, a celou dobu jsou zvědaví, jak a kdy si budou jisti, jestli jsou skutečně „v tom“ a co budou dělat, pokud ano) Co to vlastně „multimédia“ jsou? Pojem "médium" je ve slovníku cizích slov vysvětlen jako "zprostředkující činitel". Koncem XX. století si slovo "média" přisvojila především oblast komunikace a rozuměla jimi druhy sdělovacích prostředků, případně soubory prostředků a systémů, zajišťujících přenos sdělení často složité povahy (hudba, vizuální umělecké formy apod.) od emitora k recipientovi (příjemce). Termín "multimédia" - společné působení více médií, popř. jejich prolínání - se přitom v literatuře objevuje často ve velmi různých kontextech. „multimédia“ - oblast informační technologie charakteristická sloučením audiovizuálních technických prostředků s počítači. Multimediální systém je souhrn technických prostředků jako je počítač, kamera, video, televize a další zařízení, která jsou schopná provozovat audiovizuální prezentaci v interakci s uživatelem. Moderní systémy již bývají vybavovány alespoň základními technickými prostředky pro provozování multimediálních aplikací.
1.1.
Kde se multimédia nejlépe uplatní
Použití multimédií je vhodné všude tam, kde člověk potřebuje přístup k elektronickým informacím. Multimédia rozšiřují tradiční textové počítačové rozhraní a podstatným způsobem podporují udržení pozornosti, zvyšují atraktivitu a mnohdy jsou i velice zábavná. Díky těmto vlastnostem se mohou přiblížit i lidem, kteří se jinak počítačům vyhýbají. V komerční oblasti se multimédia používají hlavně k prezentacím, reklamě, marketingu a jsou perfektním prostředkem při kurzech a různých školení. Vhodně sestavená prezentace přináší oživení výkladu a kombinací textové a grafické informace s hudbou na pozadí a vloženými videoklipy můžeme lépe upoutat posluchače. Hojně se multimédií používá pro veřejné účely a také v domácnosti. Pro využití multimédií na veřejných místech se nabízejí samostatné terminály v hotelech, na nádražích, v obchodních centrech nebo v muzeích. Tyto terminály mohou zájemcům nebo zákazníkům poskytovat informace nebo rady a nahradit tak tradiční informační službu nepřetržitým servisem V domácnostech se v současnosti používá řada různorodých zařízení - od video a audio přehrávačů přes herní systémy (PlayStation, Sega, Nintendo,…) až po plně multimediální počítače. Snahou výrobců a dodavatelů multimediálních programů je dosáhnout postupně sloučení těchto jednotlivých zařízení do jediného univerzálního systému. Tento proces bývá označován jako konvergence počítačových, volnočasových a herních médií.
2
1.1.1. Multimédia a virtuální realita Pro realistické znázornění virtuální reality je nezbytný vysoký výpočetní výkon, podobný nebo ještě vyšší než vyžadují multimediální aplikace. Navíc jsou pro proniknutí do virtuálního světa potřebné speciální pomůcky (helmy, rukavice, snímače polohy a natočení ). Přesto jsou aplikace virtuální reality nenahraditelné - například pro nacvičování nebezpečných situací, přípravu pilotů a obsluh speciálních zařízení, prohlídku navrhovaného objektu pro architekty a přirozeně také hry. 1.1.2. Multimédia a hry V současnosti je grafické zpracování her velice realistické. Vývojáři her se zaměřili na nejmenší detaily. Můžeme vidět stíny různých objektů, změnu fyzikálního modelu při změně počasí (když prší, klouže nám to) a jiné detaily. K realistické podobě her také pomohlo detailně zpracované zpracování zvuku, kdy slyšíme každé bouchnutí dveří či dopadající kapky deště na listy stromů. Značného rozšíření doznala multimédia při pořádání kurzů a školení. Multimediálně prezentované informace jsou i v tomto případě názornější a tím pádem snáze zapamatovatelné, školený člověk má navíc možnost se k libovolným problematickým partiím znovu vracet a lépe si uvědomovat logické vazby studované problematiky.
1.2.
Využití multimédií při výuce
Je obecně známo, že člověk si zapamatuje nejvíce vizuálních a auditivních vjemů. Výzkumy ukázaly, že informace vstupují do našeho mozku následujícím způsobem: 87 % zrakem 9 % sluchem 4 % jinými smysly Psychology bylo dokonce zjištěno, že člověk je schopen zapamatovat si asi 70% informací, o kterých diskutuje a až 90% informací, které sám realizuje. Proto odborníci považují za nejlepší typ moderní výuky výuku s využitím interaktivního systému. Pro multimédia představují školy patrně nejvhodnější prostředí. Vzhledem k problémům s financováním sice mají školy problémy s obstaráváním nových technologií, přesto může nasazení multimédií při výuce zcela změnit samotný výukový proces. Z učitelů se stávají spíše průvodci neomezeným světem informací a rádci při cestě žáků a studentů za získáváním znalostí. Tato vize je v současné době pro většinu vyučujících velmi provokující a i z toho důvodu se výukové programy využívají především jako obohacení klasických výukových metod a ne jako jejich plnohodnotná náhrada. 1.2.1. Proč používat vizuální proces předkládání informací Vizuální proces předkládání informací má oproti verbálnímu několik hlavních výhod, které je nutno zvažovat při realizaci vizuálního procesu a to: •
Upoutávání pozornosti, ignorovat text či schéma nebo obrázek s využitím multimediálních prostředků je obtížné a v okamžiku, kdy student sleduje vizuální informace (data), není jeho pozornost odváděna jinými zrakovými podněty. Upoutat pozornost ve věku využívání informačních technologií není snadné a všichni přitom potřebují využívat veškeré zdroje pomoci. 3
•
Přinášejí změnu, vizuálně předkládané informace přinášejí změnu a stávají se tak dynamičtější, z čehož plyne, že vzbuzují větší zájem.
•
Napomáhají konceptualizaci, v této oblasti lze spatřovat významnou až hlavní výhodu vizuálního procesu s využitím multimediálních prostředků. Mnoha pojmům a myšlenkám se porozumí spíše vizuálně než verbálně. Např. praktickým dovednostem při tvorbě schémat ovládání tekutinových obvodů.
•
Jsou snáze zapamatovatelné, z výzkumů vyplynulo, že většina lidí si lépe pamatuje vizuální než verbální informace.
•
Jsou projevem zájmu učitele, jestliže pedagog tráví čas přípravou vizuálních pomůcek, studenti zaznamenají zájem pedagoga, že mu záleží na tom, aby získali znalosti dané disciplíny a dovedli je implementovat do konkrétních podmínek praxe. To je však třeba ještě podpořit sebevědomým a znalým postojem při prezentaci takto vytvořených materiálů a pomůcek.
1.2.2. Omezení a výhody multimediálních přednášek Při sestavování vizuálního procesu s využitím multimediálních prostředků je třeba si uvědomovat některá omezení, zejména z hlediska studentů samotných (Jako je třeba rychlost střídání stran. Z vlastní zkušenosti mohu říci, že snad nejvíce dokáže posluchači přednášející probíranou látku „znechutit“ tím, že si přednášku plete s video sekvencí. Pro tento způsob rychlé výměny jednotlivých stran se mezi studenty vžil název Slide show.) a jaký zisk za vynaložené úsilí autora čeká.
Materiály pro vizuální proces by měly být sestaveny na základě následujících pravidel: •
Předkládat jen nutné znalosti, pro zajímavost uvést „něco navíc“ a nejlépe nakonec doplnit praktickým příkladem.
•
Trvanlivost, mělo by být co nejméně pravděpodobné, že materiály zastarají.
•
Neviditelná technika, pedagog ani jeho projev by neměl být zastíněn složitou technikou, ovládání programu by mělo probíhat více méně intuitivně.
Informace zpracované pro multimediální prostředky formou vizuálních procesů mají tyto výhody: •
Informace je velmi snadné aktualizovat, jde o velmi podstatnou výhodu, protože většina oborů se stále vyvíjí velmi rychle. I v případě, že data zůstávají nezměněna. Téměř vždy je možno dospět k tomu, jak je možné materiál ještě zlepšit, poté co byl poprvé použit.
4
•
Materiál má profesionální úroveň, což je výhodou samo o sobě. Pedagogové se také díky tomu méně ostýchají navzájem si půjčovat své materiály, což šetří čas při přípravě a umožňuje vzájemné zapůjčení materiálů a jejich úpravu tak, aby vyhovovaly potřebám jiného pedagoga.
•
Jednoduché uchovávání a přenositelnost, je mnohem jednoduší uchovávat data, než stohy papíru.V dnešní době není vůbec žádný problém uchovávat data např. na HDD, ZIP, CD nebo CD-RW. Jsou také jednoduše přenositelná, díky své velikosti a kompatibilitě počítačů.
•
Snadné kopírování materiálů, díky rychlým vypalovacím CD-R, RW mechanikám je možno udělat kopii celého CD za necelé čtyři minuty. Ke snadnému šíření materiálů v datové podobě také přispívají lokální počítačové sítě a takřka zásadní vliv v této oblasti má globální počítačová síť Internet.
1.3.
Dostupná multimediální zařízení k použití při výuce
1.3.1. Multimediální počítač Abychom mohli využít možnosti multimediálních programů, musíme si zajistit potřebný hardware a software, který nám toto umožní. Jako multimediální můžeme označit každý počítač, protože každý má zobrazovací možnost, zvukový výstup a možnost vstupu dat od uživatele. Ale pro kvalitní práci s multimediálním programem jistě využijeme zvukovou kartu s reproduktory, kterou je možno doplnit mikrofonem pro záznam vlastních zvukových stop. Dalším zařízením pro přenos multimediálních záznamů je síťová karta, jejíž pomocí je možné se připojit k dalším počítačům. Nejznámější počítačová síť využívající multimédií je Internet. Ke každému multimediálnímu zařízení jeho výrobce dodává potřebný software pro integraci zařízení do systému a zároveň pro jeho použití. Jinými slovy, jestliže si zakoupíme zvukovou kartu, zároveň dostaneme potřebný software pro instalaci, aby byla karta rychle a plně využitelná. 1.3.2. Zpětný projektor Zpětné projektory se využívají pro zobrazování průhledných předloh, nejčastěji fólií. Zpětné projektory nejsou tedy elektronickým přístrojem nýbrž pouze optickým. Na pracovní plochu „zpěťáku“ se položí fólie, která je přes optickou soustavu promítána na projekční plochu. Rozhodujícími parametry již není rozlišení, ale především výkon (jas) měřený v lumenech (lm), přenosnost a uživatelské vybavení. Existují dva druhy zpětných projektorů, které se liší pouze způsobem zobrazení fólie do optické soustavy. První způsob je klasický, průsvěcový. Na pracovní plochu se položí průhledná fólie, která je prosvěcována lampou, umístěnou pod pracovní plochou. Nad pracovní plochou umístěná optická soustava pak promítá zvětšenou fólii na projekční plochu. Druhý způsob je tzv. metoda reflexní. Ta na rozdíl od průsvěcové metody má umístěnu lampu nad pracovní plochou, která je tvořena zrcadlem a způsobem reflexe je fólie přenášená do optické soustavy a následně na projekční plochu. Kromě tohoto rozdělení pak dělíme zpětné projektory následně.
5
Stolní nejlevnější, zpravidla velké a těžké (cca 10 - 15 kg). Nemají výraznější uživatelské funkce, jejich svítivost je menší. Nejčastější použití ve školách (známý Meotar) pro nenáročné prezentace zpravidla textu. Konferenční přístroje vypadají stejně jako stolní, mají však širší škálu uživatelského vybavení a i výkon bývá vyšší. 1.3.3. Data video projektory Data video projektory se využívají pro velkoplošné zobrazování počítačového nebo video signálu. Nejsou tedy zdrojem signálu, musí být vždy připojeny na nějaké zařízení jako např. PC, Macintosh, notebook, videorecorder, satelit, DVD, digitální fotoaparát, kameru apod. SVGA projektory se používají pro klasické aplikace Windows, Office, pro prezentace všeho druhu, pro znázorňování textu apod. Kromě toho je z ekonomických důvodů vhodnější i pro video signál, který má menší kvalitu než právě nižší počítačový signál. Data video projektory jsou nejčastěji pořizovány školami všech stupňů, společnostmi využívající aplikace s nenáročnou grafikou atd. XGA projektory jsou vhodné už pro náročnější grafické aplikace, pro prezentaci grafických modulů, obrázků apod. Mají větší tendenci růstu, poněvadž skýtají přeci jen větší spektrum možností. Během dvou let by mělo plně nahradit SVGA rozlišení, které by mělo ustoupit do pozadí stejně jako nyní VGA rozlišení. 1.3.4. Vizualizéry Vizualizér je zařízení velice podobné zpětným projektorům. Na rozdíl od těchto „zpěťáků“, dokáží vizualizéry promítat nejen průsvitné fólie, ale také jakékoliv tiskopisy či prostorové předměty. Ve spojení s počítačem, můžeme říct, že jde o 3D scanner. Pořízením vizualizéru získáte několik přístrojů v jednom. Jednak je schopen zobrazit průhledné fólie, takže není potřeba zpětného projektoru. A zároveň je schopen zobrazit i neprůhledné tiskopisy, nahrazuje tedy beze zbytku episkop. Navíc dokáže zobrazit prostorové předměty. Podstata a funkce vizualizéru je velice jednoduchá. Předmět je položen na pracovní plochu, kde jej snímá pár speciálních video kamer. Kvalita zobrazovaného obrazu je pak přímo úměrná ceně přístroje. Aby byl výsledek zobrazení co nejlepší, přisvěcuje se předmět zabudovanými světly, které jsou směrové a nevadí tak ani přítomným ve výhledu. Kamery vizualizéru mají řadu funkcí, jako např. optický ZOOM, automatické ostření apod. Vizualizér se nejčastěji používá ve spojení s data video projektorem, poněvadž až s jeho pomocí dokáže vytvořit obraz v solidní velikosti. Kromě tedy čistě prezentačnímu využívání vizualizéru, je zde ještě věc, kterou jsme již nakousli na začátku, a to 3D scaner. Své uplatnění nalézají tedy především v grafických studiích, kde s jeho pomocí dokáží oskenovat jakýkoliv předmět v libovolné pozici a velikosti. Hmotnost vizualizérů je velice příjemná. Pohybuje se již od 4 kg .
6
2. KOMPRIMACE DAT Komprese či komprimace se stala během posledních několika let nenápadným společníkem našich životů. Používá se všude, kde je možnost setkat se s multimédii. Tak např., když si pustíte film na DVD, tak tento film ač ve skvělé kvalitě je komprimován. Stejně tak, když si pouštíte mp3 na vašem počítači nebo stahujete data z internetu je zde komprese přítomna. Samozřejmostí zde je, že data různého charakteru vyžadují rozdílný přístup k jejich kompresi. Tzn., že textový soubor se komprimuje jinak než třeba video.
2.1.
Rozdělení komprimace
Komprimace se dá rozdělit podle několika základních hledisek: •
bezztrátová a ztrátová komprimace
•
fyzická a logická komprimace
•
symetrická a asymetrická komprimace
•
adaptivní a neadaptivní komprimace
2.1.1. Bezztrátová a ztrátová komprimace Bezztrátová komprimace se používá všude tam, jak už název napovídá, kde si nelze dovolit jakoukoliv ztrátu dat. Tento typ používají známé pakovací (od angl. pack - zabalit) programy jako Winrar či Winzip. Stejně tak se používá při přenosu dat na internetu. Ztrátová komprese se používá tam, kde ztráta některých informací nevadí. Používá se například u obrázků, videa nebo zvuku. Její princip je založen na nedokonalosti lidských smyslů, tedy uší a očí. Není to tak, že by jste ve své oblíbené muzice přišli třeba o bicí. Ztrátovou kompresi většinou ani nepoznáte. 2.1.2. Fyzická a logická komprimace Rozdíl mezi fyzickou a logickou komprimací spočívá v tom, zda komprimační algoritmus při komprimaci přihlíží nebo nepřihlíží k logické informační hodnotě komprimovaných dat. Logická komprimace používá logické substituce sekvence znaků jinou, úspornější řadou. Konkrétním příkladem jsou zkratková slova jako Čedok (nahrazující někdejší plný název Československá dopravní kancelář) nebo Svazarm(Svaz pro spolupráci s armádou). Fyzická komprese probíhá bez zřetele na logiku dat, se kterými se manipuluje. Vytváří se nová sekvence znaků (bajtů, bitů atd.), jejíž vztah k původním datům lze rozpoznat výhradně s použitím nekomprimačního algoritmu. Bez znalosti tohoto algoritmu je informační hodnota komprimovaných dat nulová. 2.1.3. Symetrická a asymetrická komprimace Toto rozdělení je založeno na porovnání množství práce, která se podle algoritmu vykoná při kompresi a dekompresi dat. Pokud je doba (a tím většinou i počet a druh operací) potřebná pro kompresi a dekompresi dat přibližně stejná jedná se o symetrickou kompresi. Některé algoritmy jsou však záměrně konstruovány jako asymetrické. Většina takových komprimačních algoritmů provede větší množství operací při kompresi dat. Krátká doba
7
dekomprimace je výhodná například tam, kde soubor dat ukládáme na disk sice v komprimovaná podobě, ale často s ním pracujeme. 2.1.4. Adaptivní a neadaptivní komprimace Tyto algoritmy se rozlišují podle své schopnosti přizpůsobit se charakteru dat, se kterými pracují. Neadaptivní algoritmy jsou určeny výhradně pro komprimaci specifického druhu dat. Většinou obsahují předdefinované slovníky nebo řetězce znaků, o kterých je známo, že jejich pravděpodobnost výskytu v souborech dat je vysoká. Adaptivní algoritmus je naproti tomu schopen dosáhnout určité nezávislosti na komprimovaných datech. Takové algoritmy neobsahují žádné statické slovníky řetězců, ale budují si je pro každý komprimovaný soubor dat znovu dynamicky v průběhu kódování. Obecně lze říci, že adaptivní algoritmy platí za svou přizpůsobivost a větší šíři použití menší rychlostí ve srovnání se specializovanými neadaptivními algoritmy. To však jistě nikoho nepřekvapí.
2.2.
Komprimační algoritmy
Ačkoli k používání kompresních programů zpravidla není třeba žádných zvláštních znalostí, problematika komprimačních algoritmů (dále jen KA) je natolik zajímavá, že se jí vyplatí alespoň částečně „ochutnat“. 2.2.1. RLE (Run-lenght Encoding) Jedná se KA, který lze použít na jakýkoliv druh dat. Na charakteru těchto dat však velmi silně závisí dosažený kompresní poměr. Ačkoliv se RLE ve většině případů nemůže pochlubit tak dobrou kompresí jako jiné složitější algoritmy, jeho výhoda tkví v jednoduchosti celého algoritmu a s tím související poměrně vysoká rychlost komprimace a dekomprimace. Její princip spočívá v tom, že některé znaky se vyskytují vícekrát za sebou. Řetězec opakujících se znaků se nazývá proud. Tento proud znaků je vždy zkomprimován do formy jednoho paketu RLE. Tento paket obsahuje vždy 2 informace. Proudové číslo, které udává počet znaků proudu snížený o jedničku a následující proudovou hodnotu, jež se shoduje s hodnotou opakujícího se znaku v proudu. Pokud by tedy text vypadal následovně:
„AAAAkkRRRRRm“,
byl by zakódován do této podoby:
„3A1k4R0m“.
Tento algoritmus se sice nehodí ke komprimaci textu, protože slova jako „aaaaaaaaa“ se nevyskytují příliš často, k čemu se ale hodí je komprimace jednoduchých obrázků s malou barevnou hloubkou (maximálně 256 barev). To jsou např. obrázky ve formátu PCX [2]. 2.2.2. LZW (Lempel-Ziv-Welch) algoritmus Komprimační algoritmus LZW je jednou z nejrozšířenějších komprimačních metod, kterou používají (v různé formě) jak kompresní programy (např. ARJ, PKZIP, ZOO, LHA atd.), tak i různé grafické formáty obrázků. Jedná se o tzv. substituční (adaptivní slovníkovou) metodu. Základním principem tohoto KA je vyhledávání stejných posloupností bajtů v originálním souboru. Pomocí odkazů na tyto posloupnosti dat algoritmus buduje datový slovník.
8
Komprimace pak probíhá podle následujícího schématu: •
Pokud se posloupnost bajtů (řetězec) ve vytvářeném slovníku nevyskytuje, je tato posloupnost přidána do slovníku a v nezměněné formě zapsána do komprimovaného výstupního toku dat.
•
Pokud se výstupní posloupnost bajtů ve slovníku již nachází, zapíše se do výstupního toku dat pouze zástupná slovníková hodnota odpovídající nalezené vstupní posloupnosti. Díky tomu, že zástupná hodnota je vždy menší než čtená posloupnost, dochází ke kompresi dat.
Dekomprimace je inverzním procesem, při kterém algoritmus čte komprimovaný tok dat a stejným způsobem vytváří datový slovník posloupností řetězců bajtů. Dekompresor tedy postupně komprimované kódy, zapisuje na výstup příslušné řetězce a přidává nové řetězce do slovníku. Existují dvě základní schémata tohoto KA. Jeho počátky jsou spojeny se jmény Abraham Lempel a Jakob Ziv. Tito pánové vypracovali v letech 1977 a 1978 KA, které vešly do povědomí pod zkratkami LZ77 a LZ78. V roce 1984 na jejich práci navázal Terry Welch, který modifikoval KA LZ78 pro potřeby hardwarových zařízení, konkrétně diskových řadičů. Tak vznikla podoba Lempel-Ziv-Welch algoritmu známého pod zkratkou LZW [2].
LZ77 Komprimační část algoritmu LZ77 funguje tak, že se pokouší vyhledat co nejdelší opakující se posloupnosti znaků. Pokud takovou posloupnost nalezne, zapíše na výstup pouze odkaz na předcházející výskyt řetězce. Například vstupní řetězec:
„Leze po železe“
Se zakóduje do podoby:
„Leze po že[10,4]“.
Znaky [10,4] je třeba považovat za schématicky zapsaný offset udávající, že dekodér má z předcházejících deseti znaků vybrat první čtyři. Dekomprimace souboru zkomprimovaného touto metodou je velice jednoduchá a rychlá. Vždy když dekomprimační algoritmus narazí na offset udávající ukazatel a délku řetězce, prostě tento řetězec zkomprimuje na výstup.
LZ78 Zatímco metoda LZ77 vytváří svůj dynamický slovník pomocí odkazů do již komprimovaného textu, vylepšený algoritmus LZW patřící do třídy algoritmů LZ78 používá slovníkové odkazy odlišně. Metoda LZW vytváří dynamický slovník opakujících se řetězců v průběhu komprimace. Různé modifikace algoritmů třídy LZ78 se liší ve způsobu vytváření slovníku. Slovníková komprese LZW je založena na následující velmi jednoduché strategii. Algoritmus postupně rozpoznává a ukládá do tabulky řetězce znaků a tyto řetězce nahrazuje ve výstupním textu přirozenými čísly s předem definovaného intervalu. Definice intervalu je závislá na charakteru komprimovaných dat. Například při kódování řetězce znaků zobrazených v osmibitovém zobrazení (znaků ASCII) je prvních 255 čísel vyhrazeno pro zobrazení 9
samostatných znaků z původního souboru. Čísla nad 255 se pak přidělují jednotlivým nalezeným řetězcům. Při tom se vytváří slovník (tabulka) již rozeznaných řetězců, který se v průběhu komprimace udržuje v paměti počítače. Běh algoritmu začíná s prázdným slovníkem a řetězcem W obsahujícím první znak zdrojového souboru. Vždy po přečtení dalšího znaku c zjistí, jestli se řetězec W+c vyskytuje ve slovníku. Pokud ano, pouze prodlouží řetězec o znak c, jinak zapíše nový odkaz na řetězec do slovníku. Pokud řetězec W obsahuje jediný znak, bude do slovníku zanesen pouze jediný znak. Vzhledem k tomu, že do slovníku se zapisují čísla větší než 255, je nutné i tento jediný znak zapsat v příslušné podobě. K vyjádření odkazu na řetězec se většinou používá 12bitová hodnota (0-255 jednotlivé znaky, 256-4095 řetězce znaků) [2]. Pro větší názornost si ukažme konkrétní příklad. Mějme například vstupní řetězec znaků: WEB/WEB/WEB! Tabulka 1 Kódování řetězce algoritmem LZ78
Řetězec W Přečtený znak Výstup Nová položka ve slovníku W W E W (256) = WE E B E (257) = EB B / B (258) = B/ / W / (259) = /W W E WE B (256) (260) = WEB B / B/ W (258) (261) = B/W W E WE B WEB ! (260) (262) = WEB! ! (eof) ! Při dekompresi se slovník řetězců vytváří znova z komprimovaného souboru (tedy není součástí souboru). Vytvořený slovník je pak totožný s tím, který se vytvořil při kompresi a dekompresi nic nebrání. Výhody: •
velmi dobrý kompresní poměr
•
rychlá komprese i dekomprese
•
možnost kontinuálního vysílání zkomprimovaných dat
Nevýhody: •
když zaplním velikost paměti pro slovník – smaže se
•
velký slovník – dlouhá doba hledání řetězce
2.2.3. Huffmanovo kódování Huffmanovo kódování je nejznámějším zástupcem skupiny algoritmů, které pracují na principu různých četností znaků v kódovaných datech. 10
Základní myšlenku této skupiny algoritmů lze popsat takto: při komprimaci se postupuje tak, že nejprve komprimační algoritmus zjistí pravděpodobnosti výskytů jednotlivých znaků (případně jejich kombinací) a každému znaku (kombinaci znaků) přiřadí jedinečný kód. Takovéto kódy se liší svou bitovou délkou. Tato část algoritmu je nejdůležitější a musí být navržena tak, aby přiřazení kódů znakům respektovalo požadavek na přiřazení bitově nejkratších kódů znakům s častějším výskytem a bitově delších kódů znakům s méně častým výskytem. Pak již jen algoritmus postupně načítá znaky vstupního souboru, nachází odpovídající předem přiřazené kódy a tyto kódy zapisuje na výstup. Příklad: Potřebujeme zkomprimovat soubor, který obsahuje pouze znaky: A, 8, 0, K, R. Zjištěná pravděpodobnost výskytu těchto znaků je: A – 50 %, 8 – 12,5 %, 0 – 6,25 %, K – 6,25 %, R – 25 %. Vytvoříme tzv. binární strom Huffmanova kódování, kde seřadíme jednotlivé znaky podle jejich výskytu.
Obrázek 1 Strom Huffmanova kódování
Dle stromu přiřadíme kódy jednotlivým znakům:
A: 1 8: 011 0: 0100 K: 0101 R: 00
Toto funguje bezproblémově pokud pravděpodobnosti výskytu znaků jsou mocninou 2. To se však stane jen málokdy. Pokud jsou pravděpodobnosti jiné, pak se zaokrouhlují. Při tomto zaokrouhlování musí být dodrženy dvě základní zásady: součet všech procentuálních hodnot 11
musí dávat hodnotu 100% a v každém patře vytvářeného stromu může být maximálně určitý počet listů a uzlů. Tento počet je dále omezen již vytvořenými patry stromu. Pokud se navíc stane že dva znaky mají stejnou pravděpodobnost a nemohou být zaokrouhleny oba nahoru, pak se zkrátka jeden zvolí a jemu přiřazen větší počet bitů než druhému.
Shanon-Fanovo kódování Shanon-Fanovo kódování (dále jen S-F) je velmi podobné Huffmanovu. Rozdíl mezi oběma algoritmy spočívá v konstrukci binárního stromu. Tvorba binárního stromu v S-F modifikaci je poněkud jednodušší. Lze ji shrnout do dvou následujících kroků: •
Rozděl soubor symbolů na dvě skupiny se stejnou nebo co nejpodobnější celkovou pravděpodobností znaků obsažených v obou skupinách. První skupině se přiřadí binární symbol nuly a druhé binární symbol jedničky.
•
Opakuj první krok na všechny dosud vytvořené skupiny, dokud každá nebude obsahovat jediný znak.
Rozdíl mezi způsoby vytvaření binárních stromů v Huffmanově a S-F variantě je v tom, že Huffmanovo kódování vytváří strom od koncových listů směrem ke kořenu, zatímco S-F metoda postupuje obráceně – od kořene k listům [2]. Příklad: Mějme soubor se znaky s těmito pravděpodobnostmi výskytu: A – 46%
8 – 22 %
0–5%
K–5%
R – 22 %
První skupina pak bude obsahovat pouze znak A (46%) a druhá ostatní znaky (54%). Binární strom pak bude vypadat následovně:
Obrázek 2 Strom Shanon Fanova kódování
12
Kódy jednotlivých znaků pak jsou: A: 1 8: 000 0: 001 K: 010 R: 011
Aritmetické kódování Základní myšlenku použitou v této komprimační metodě lze popsat ve stručnosti takto: aritmetické kódování reprezentuje celou zprávu jako číslo z intervalu <0,1). Na začátku kódování uvažujeme celý tento interval. Jak se zpráva prodlužuje, zužujeme postupně interval tzn. přibližují se k sobě horní a dolní mez nově vytvářeného intervalu. Na konec stačí zapsat libovolné číslo z výsledného intervalu – to samo o sobě reprezentuje celou zprávu. Algoritmus komprese lze nastínit jako následující sekvenci kroků: •
zjištění pravděpodobnosti výskytu jednotlivých znaků ve zdrojovém souboru
•
Rozdělení intervalu <0,1) na podintervaly, jejichž vzájemný poměr velikostí odpovídá poměru pravděpodobností jednotlivých znaků (seřazených dle abecedy).
•
Uložení tohoto základního rozdělení intervalu <0,1).
•
Vlastní komprese víceznakové zprávy: Komprese víceznakové zprávy bude probíhat tak, že se nejprve vybere první znak vstupního souboru. Ten zúží interval <0,1) na podinterval příslušející tomuto znaku tak, jak mu byl přidělen v druhém bodě celkového algoritmu aritmetického kódování. Tento podinterval bude rozdělen stejným způsobem jako dříve celý interval <0,1). Po načtení dalšího znaku bude podinterval dále zúžen podle načteného znaku. Tak to půjde dále až do načtení posledního znaku zprávy.
•
Posledním bodem je vybrání kteréhokoliv zlomku náležejícího do výsledného nejjemnějšího podintervalu a jeho převedení do binární formy
Nejjednodušeji lze tento algoritmus pochopit na příkladu: Naším úkolem bude za pomoci aritmetického kódová ní zakódovat tříbajtovou zprávu obsahující znaky „XXY“. V souladu s prvním bodem algoritmu aritmetického kódování zjistíme, že zpráva obsahuje pouze dva znaky: Pravděpodobnost výskytu znaku X je 2/3, pravděpodobnost výskytu znaku Y je 1/3. V dalším kroku rozdělíme v tomto poměru (tedy 2:1) interval <0,1) a rozdělení si zapamatujeme. Nyní již přistoupíme ke kódování vstupního souboru. Načteme první znak souboru, kterým je písmeno X a zjemníme původní interval na podinterval <0, 2/3). Tento interval opět rozdělíme v poměru 2:1. Dělícím bode bude v tomto případě bod 4/9. Načteme další znak – je jím opět písmeno X, které nám podinterval opět zúží na <0, 4/9). Tento interval opět rozdělíme v poměru 2:1 – dělícím bodem je v tomto případě 13
zlomek 8/27. Následujícím znakem zprávy je písmeno Y, jež opět zúží interval, o který se budeme zajímat, na <8/27, 4/9). Vzhledem k tomu, že třetí znak je v našem vstupním souboru také znakem konečným, je konečný i tento interval. Zbývá již jen vybrat libovolnou hodnotu z tohoto intervalu, která převedena do binární formy bude reprezentovat celou vstupní sekvenci. Vyberme číslo 3/8.
Obrázek 3 Tabulka aritmetického kódování
Dekomprese zakódované zpráva do původního stavu je prostá. Načteme rozdělení intervalu <0,1) na podintervaly podle poměru pravděpodobností jednotlivých znaků a počet znaků původní zprávy. V našem příkladu budeme postupovat takto: Načteme kód 3/8, který reprezentuje vstupní posloupnost znaků. Tento zlomek náleží do intervalu <0, 2/3), který odpovídá znaku X. Zapíšeme tento znak na výstup. Nová hodnota kódu bude (3/8 - 0) / (2/3) = 4/9 Zlomek 4/9 náleží opět do podintervalu <0, 2/3). Jako druhý znak zapíšeme na výstup opět X. Úprava kódu bude nyní následující: (4/9 - 0) / (2/3) = 2/3 Zlomek 2/3 náleží do podintervalu <2/3, 1). Tento interval odpovídá znaku Y, který je tudíž třetím znakem původní zprávy. Víme, že originální sekvence se skládala právě ze tří znaků, a proto dekomprimaci ukončíme.
14
Shrnutí Huffmanovo, Shannon-Fanovo ani aritmetické kódování se v praxi nepoužívají samostatně, ale zpravidla v kombinaci s nějakou slovníkovou metodou. Výhody: •
velmi dobré kompresní poměry ve spojení se slovníkovou metodou
•
poměrně jednoduchý algoritmus dekomprese
Nevýhody: •
Huffmanovo a Shannon-Fanovo kódování je nejefektnější pravděpodobnosti výskytů, jež jsou celočíselnou mocninou čísla ½
•
aritmetické kódování má vysoké nároky na technické vybavení počítače
•
u aritmetického kódování je nutná softwarová manipulace s čísly o desetinném rozvoji na 20-30 desetinných míst, přičemž je nutné vyvarovat se jakéhokoliv zaokrouhlování – relativně dlouhá doba komprese
při
hodnotách
2.2.4. Další metody
DCT (diskrétní kosinová transformace) a JPEG Při kompresi plně barevných obrázků s mnoha barevnými přechody nejsou metody RLE a LZW příliš efektivní. Kvalitní obrázky mají jen málokteré sousední pixely shodné. Pro takové obrazy byla navržena metoda, při níž je kompresní poměr řízen požadavkem na výši kvality dekomprimovaného obrazu. V praxi se ukazuje, že snížení kvality na 75% je pro většinu uživatelů nepozorovatelné. Metoda řízení ztrátové komprese využívající DCT se nazývá JPEG. Je vhodná především pro kódování fotografií. Metoda není vhodná pro obrazy s nižším barevným rozlišením.
Obrázek 4 Posloupnost operací při kompresi JPEG
Fraktální komprese Je to moderní a teprve se rozvíjející metoda ztrátové komprese a patří mezi nesymetrické kompresní postupy (výrazně se liší čas komprese a dekomprese). Je to jedna z nejperspektivnějších metod komprese. Je založena na principu vyhledávání podobností v různě velkých částech obrazu. Je překvapivé, jak velké množství podobných a opakujících se detailů a motivů můžeme najít na obrázcích z reálného světa i generovaných počítačem. Výsledný soubor na takto komprimované obrázky se nazývá FIF (Fractal Image Format). Algoritmus FIF se snaží nejprve vhodně rozdělit obraz na menší, nestejně veliké části a poté z nich pomocí různých transformací poskládat celý obraz.
15
3. ZVUK 3.1.
Co je to zvuk
Zvuk je podélné mechanické vlnění hmotného prostředí s kmitočtem v rozmezí přibližně od 16 Hz do 20 kHz, které působí na lidský sluchový orgán a vyvolává v něm subjektivní sluchový vjem. Zvukové vlny se od zdroje zvuku šíří všesměrově. Rychlost šíření zvuku je závislá na vlastnostech prostředí; v případě vzduchu je to zejména teplota a atmosférický tlak. 3.1.1. Frekvence a Amplituda Zvuk slyšíme prostřednictvím chvění našich ušních bubínků. Tyto mohou kmitat dvacetkrát až dvacet tisíckrát za sekundu. Toto kmitání se nazývá frekvence a měří se v hertzích (Hz). Maximální rozlišení, které je ucho schopno slyšet, jsou zvuky mezi 20Hz a 20kHz. Hudební nástroj při hře vibruje. Příkladem může být struna houslí, blána bubnu, či kužel reproduktoru. Tyto vibrace se přenášejí na molekuly vzduchu a ty pak zvuk přenášejí k našemu uchu. Je-li frekvence vibrací nízká, slyšíme nízký tón, je-li vysoká, slyšíme vysoký tón. Jsou-li vibrace jemné, způsobují pouze nepatrný pohyb vzduchu, slyšíme tichý zvuk. Tento pohyb se nazývá amplituda. Je-li amplituda tak vysoká, že při ní drnčí okna slyšíme hlasitý zvuk. Amplituda se měří v decibelech (dB). Citlivost našich ušních bubínků v decibelech je velice těžko určitelná, záleží totiž ještě na frekvenci daného zvuku. Dá se ale přibližně říci, že lidské ucho je schopno zaznamenat zvuk spektra 0-120 dB [14]. Zajímavost: Jednotka frekvence dostala svůj název na počest Heinricha Hertze, který roku 1888 formuloval teorii o vztahu mezi zvukovými cykly a jejich frekvencí.
3.2.
Zvuk v počítači
3.2.1. Vzorky a MIDI Pokud se pracujete s počítačem jistě jste si již všimli, že hudba je zde prezentována dvěma základními způsoby – vzorky a MIDI. Zatímco u vzorků se jedná o digitalizovaný záznam zvuku (zvukové vlny), MIDI dává pouze řídící data popisující hudbu ( dají se přirovnat k jakýmsi složitějším notám). Z tohoto plyne základní rozdíl v použití. To jestli je soubor MIDI nebo vzorek, určuje způsob práce s hudbou v počítači i hardwarové a softwarové prostředky potřebné pro tuto práci. Je důležité zmínit se o tom, že MIDI soubory jsou spíše používány hudebníky, zatímco vzorky jsou užitečné hlavně pro toho, kdo chce pracovat se zvukem. Proto se budeme zabývat spíše vzorky a standart MIDI bude popsán jen okrajově na konci části o zvuku. 3.2.2. Mono a Stereo Dovolte, abych použil vysvětlení výrazu stereofonie ze slovníku cizích slov. Tedy: stereofonie - systém záznamu, přenosu a reprodukce zvuku s použitím nejméně dvou elektroakustických kanálů umožňujícím zachování směrového a prostorového vjemu.
16
Zásadní rozdíl mezi mono a stereo nahrávkou je tedy především v tom, že stereo zvuk je uložen ve více kanálech (standardně ve dvou – levém a pravém), zatímco mono jen v jednom. Stereo zvuku se dosahuje tak, že zvuk je snímán dvěma mikrofony zaráz. 3.2.3. Digitální zvuk Digitálně vytvářený zvuk vzniká výpočty v počítači, který pracuje s digitálními daty. Není třeba žádné fyzické akce, které jsou nutností pro tvorbu zvuku analogového. Záznam digitálního zvuku a jeho konverze do digitální podoby se nazývá vzorkování a lze ho definovat, jako proces přeměny zvuku vytvořeného analogovým zdrojem na digitální data. Na vstupu zvukové karty je A/D převodník, který velmi často snímá úroveň vlny a převádí ji do číselné podoby. Takto se v počítači získá zvuk ve formátu PCM, což je pulzní kódová modulace. Kvalita digitálního zvuku je pak určena vzorkovací frekvencí a rozsahem hodnot zaznamenávané amplitudy vlny.
Teorie o digitálním záznamu zvuku Vzorkovací frekvence, která určuje počet vzorků za sekundu, musí být alespoň dvakrát vyšší, než je nejvyšší zaznamenaná frekvence daného zvukového vzorku. Vzorkovací frekvencí většiny digitálních nahrávek se stalo 44 100 Hz, protože tato frekvence je dvojnásobkem maxima slyšitelného lidským uchem. Zajímavost: V roce 1928 formuloval matematik Harry Nyquist teorii, založenou na vlastních zjištěních. Zjistil, že pokud navzorkuje změny zvuku nejméně dvakrát během každé periody vlnové křivky, dokáže tuto vlnovou křivku reprodukovat. V praxi to znamená, že pokud máte zvuk o frekvenci 20Hz potřebujeme nejméně 40 vzorků, abyste jej mohli reprodukovat.
Obrázek 5 Zpracování zvuku
Digitální reprezentace dat nabízí mnoho výhod. Mezi ně například platí snadná přenositelnost, snadná reprodukce, vysoká odolnost proti vzniku šumu (hlavně při vytváření kopií). Digitální uložení také nabízí možnost digitálních úprav – mixování na počítači, filtrování, přidávání a ubírání basů, výšek atd.
Kvalita vzorkovaného zvuku Když vzorkujeme zvuk, můžeme ho zaznamenat v různých úrovních kvality. Kvalita vzorkování je definována: •
vzorkovacím kmitočtem, který se měří v Hertzech (Hz). Vzorkovací kmitočet určuje, kolikrát za sekundu počítač zapíše hodnotu amplitudy analogového zvuku (44 kHz = 44.000 měření za sekundu). Pozn. vzorkovací kmitočet a vzorkovací frekvence jsou totéž. 17
•
šířkou slova (rozlišení), která vyjadřuje počet bitů použitých na vyjádření hodnoty vzorků. Šířka slova může být 8-bitová, 16-bitová, 24-bitová a 32-bitová. Tabulka pod tímto textem uvádí minimální a maximální hodnoty pro některá hlavní bitová rozlišení audiosignálu.
Tabulka 2 Bitová rozlišení zvuku
Rozlišení 16 bitů 24bitů 32 bitů
Minimální Maximální hodnota hodnota -32 768 32 767 -8 388 608 8 388 607 -2 147 483 648 2 147 483 647
Dynamický rozsah 96 dBFS 144 dBFS 193 dBFS
Prostor na pevném disku (min/mono) 5 168 Kb 7 752 Kb 10 336 Kb
Poznámka: dBFS - napěťové hodnoty s tímto označením se používají u digitálních zařízení, při měření úrovní na vstupech a výstupech. Zkratka „FS" je odvozena z anglického „full scale". Maximální hodnota na stupnici zároveň určuje maximální hranici signálové úrovně, která nesmí být překročena, protože pak dochází k přebuzení AD převodníků a tím pádem ke zkreslení. Tento vrchol decibelové stupnice u digitálních zařízení se označuje jako 0 dBFS.
Tyto dvě základní vlastnosti vzorků mají vliv na to, kolik vzorek zabere místa v paměti na disku. Vhodná volba těchto parametrů je obzvláště z hlediska jejich velikosti velmi důležitá. Pokud se jedná o záznam mluveného slova, není zapotřebí žádná závratně vysoká kvalita a stačí, když bude mluvenému slovu rozumět. Pokud ale vzorkujete hudbu, je výhodné použít nejvyšší možnou kvalitu. Vzorek tak sice zabere více místa, ale jeho kvalita je prakticky totožná s kvalitou originálu. Konec konců, vždy je tu ještě možnost vzorek zkomprimovat. V následující tabulce je uvedeno několik příkladu kvality vzorkování a velikosti vzorku v MB. Tabulka 3 Příklady kvality vzorkování zvuku a velikosti
Kmitočet (Hz) 11 kHz 22 kHz
Délka slova 8 bitů 8 bitů
Velikost na disku (10s) 110 kB 220 kB
44 kHz
8 bitů
440 kB
11 kHz 22 kHz 44 kHz
16 bitů 16 bitů 16 bitů
220 kB 440 kB 880 kB
Výsledná kvalita Velice nízká zvuková kvalita vhodné pro mluvené slovo Relativně dobrá zvuková kvalita, ale při tomto vzorkovacím kmitočtu byste měli použít 16 bitů Odpovídá průměrnému nastavení Dobrá kvalita CD kvalita (pokud je nahrána stereo)
Důležité je ještě vědět, že vzorek může být zaznamenán buďto mono nebo stereo. Při stereofonním vzorkováním se pochopitelně velikost vzorku dvojnásobně zvětší. Stejně tak 16 bitový záznam bude zabírat dvakrát více než 8bitový. V tabulce uvedená data o velikosti na disku jsou pro mono vzorky. K tomu, abyste však mohli nahrávat s rozlišením 24 nebo 32 bit potřebujete zvukovou kartu, která toto rozlišení podporuje. Standardní zvukové karty podporují 16 bit a to, že nahrávání nastavíte na 32 bit pouze způsobí, že nahrávka zabere více místa, ale kvalita bude pouze 16 bit. Je proto dobré znát své vybavení.
3.3.
Zpracování zvuku
První fází procesu zpracování zvuku je tedy snímání zvuku, kdy se pomocí různých měničů (mikrofony, snímače kytary...) převádí akustická energie na energii elektrickou. Nejčastěji používaným měničem je mikrofon. Protože se zvuk snímá v určitém prostředí, je vždy jeho 18
součástí i zvukový projev prostředí, tedy reakce na samotný zvuk (odrazy, dozvuk, rezonance místnosti nebo těles v ní). To může být do značné míry negativním prvkem, zcizujícím původní signál. Proto např. nahrávací studia pracují s mikrofony v zatlumených nebo speciálně akusticky upravených prostorách. Další postupy se liší podle přístupu a našich možností. Pojmenujme si jako profesionální a amatérský. I když tato pojmenování nejsou zcela přesná či výstižná pro náš účel jsou dostačující. Stejně tak jen podrobný popis nahrávacího řetězce by vydal rozsahem na samostatnou práci a proto bude popisován velmi zjednodušeně. 3.3.1. Profesionální postup Zvuk transformovaný na elektrický signál jde od mikrofonu k mixážnímu pultu a přídavnému zařízení (outboard gear). Zde lze jednotlivé zvuky směšovat do sebe, dynamicky je upravovat, měnit jejich zabarvení, ladění, přidávat jim prostor atd. Zde se také zvuk zaznamenává. Poté je elektrický signál prostřednictvím výkonového zesilovače (power amplifier) a elektroakustického měniče (reproduktorové soustavy – studiových monitorů) převeden zpět na zvuk. 3.3.2. Amatérský postup Zvuk z mikrofonu jde přímo do zvukové karty počítače, kde je přeměněn A/D převodníkem na digitální. Veškeré korekce zvuku (krom hlasitosti) jsou prováděny až po záznamu zvuku. Zpětná vazba je zde realizována reproduktory počítače.
Obrázek 6 Amatérská cesta záznamu zvuku
Poslechové monitory v režii či reproduktory vašeho PC slouží vlastně ke kontrole jakéhokoli procesu v předchozích fázích, a proto je jejich kvalita (společně s vhodnou akustikou místnosti) rozhodujícím faktorem ovlivňujícím výsledek. Snímání zvuku a jakékoli jeho další zpracování totiž přizpůsobujeme tomu, co slyšíme, a tudíž se logicky dopouštíme tím méně chyb, čím ideálnější je kontrolní poslech.
3.4.
Komprese Zvuku
Wav – formát nekomprimovaného zvuku Standard vzorkování zvuku 44 100 Hz byl pojmenován Pulse Code Modulation (PCM) a je tím nerozšířenějším standardem pro současné vzorkování zvuku. Jen hrstka vyvolených s perfektním sluchem a se špičkovým vybavením pozná rozdíl mezi takto vzorkovaným zvukem a analogovým originálem. Je tedy docela jednoduché, pomocí dnešního softwaru, převést jakýkoli analogový zvuk pomocí počítače do digitální podoby. Výsledkem tohoto 19
převodu bude zatím ještě nekomprimovaný zvuk s uživatelsky nastavenou vzorkovací frekvencí. Dejme tomu, že převedeme klasické Audio CD (CD-DA). Protože je Audio CD (CD-DA) vzorkované 44 100 Hz, nemá smysl ho převádět na vyšší vzorkovací frekvenci. Máme tedy na disku WAV soubor nesoucí informace o zvuku (jsou identické s těmi zaznamenanými na CD). Trošku matematiky na úrovni ZŠ nám pomůže k vypočítání velikosti tohoto zvukového souboru. Každý vzorek má 16 bitů, nebo dva byty podle definice 8 bitů = 1 bajt. Každou sekundu proběhne 44 100 vzorků, a protože je dnes skoro vše nahráváno stereo, musíme počet vzorků vynásobit dvěma. Tím dojdeme k číslu 176 400 bajtů, které udává velikost jedné sekundy digitálně uloženého zvuku na našem disku. Přesně 10 584 000 bajtů, přibližně 10 MB je potřeba k uložení jedné minuty zvuku nehledě na typ zvuku (ticho se vzorkuje stejně jako fanfára). Archivace takto velikých souborů už v dnešní době není tak problémová, na druhou stranu manipulace s těmito daty je pořád náročná a proto je vhodné audio záznam zkomprimovat. 3.4.1. Bezztrátová komprese Bezztrátová komprese využívá několik kompresních algoritmů na zmenšení původní velikosti při stoprocentním zachování integrity a podoby původního zdroje. To znamená, že po dekompresi bude zvuk naprosto identický s originálem. V dnešní době je poměr komprese (angl. compression ratio) dosažitelný bezztrátově, přibližně 1 : 2. Technika komprese je stejná jako u datové komprese textu, například pomocí algoritmů zip či rar... Protože ale ani zip ani rar nejsou koncipovány pro kompresi zvuku, používají se k těmto účelům algoritmy jiné. Jak už je zvykem, formátů je hned několik na výběr. Každý má svůj klad, ale žádný nezahrnuje všechny výhody těch ostatních, a proto se nedá říci, že by byl některý ve všem výrazně lepší než ostatní. Neexistuje totiž ani dostatečná podpora a rozšířenost. K úspěchu jakékoli kompresní technologie je potřeba její nezávislost na platformě (Windows, Linux, MacOS), rychlost komprese a dekomprese, stabilita a příslušná dokumentace, která umožní přístup k formátu i ostatním komerčním/nekomerčním subjektům.
Teorie bezztrátové komprese Pokusím se nastínit práci bezztrátového kodeku. I když se bude jednat o práci algoritmu vyvinutého pro flac (Free Loseless Audio Codec), ostatní algoritmy jsou u jiných bezztrátových formátů téměř totožné. Flac (stejně jako všechny kompresní algoritmy) pracuje v několika krocích. Zvukový soubor je v prvním kroku rozdělen do jednotlivých bloků. Ty se mohou lišit velikostí a jejich podobu určuje několik faktorů včetně vzorkovací frekvence, spektrální charakteristiky v daném čase. Dalším krokem je kanálová dekorelace, při níž dochází k porovnávání obou stereo kanálů mezi sebou. Dále se snaží enkodér jednotlivé bloky matematicky vyjádřit. Ne vše se ale dá vyjádřit matematicky přesně, a právě tyto případy řeší poslední krok, při němž jsou matematické nepřesnosti (předpoklady) popisovány zvlášť. Velice zjednodušeně se dá říci, že bezztrátová komprese spočívá v matematickém popisu audio souboru podle pravidel, která jsou určována každým kodekem zvlášť. Vždy je potřeba enkodér, jenž nekomprimovaný zvuk komprimuje, a posléze je potřeba dekodér, který komprimovaný zvukový soubor opět uvede do stavu před kompresí [15].
20
K čemu je bezztrátová komprese? Bezztrátová komprese nemá pro obyčejného uživatele valného využití, naopak ti kdo archivují, či hromadně digitalizují vysoce kvalitní nahrávky (např. nahrávací studia), najdou v bezztrátové kompresi určitě využití.
Některé kodeky pro bezztrátovou kompresi Nejrozšířenějším bezztrátovým formátem, alespoň podle jeho zastoupení na výměnných serverech a diskusních fórech je monkey's audio (www.monkeysaudio.com). Jeho největší výhoda, kromě vysoké popularity v rámci bezztrátových kompresních formátů, je nejlepší kompresní poměr. Dalším z těch úspěšných je wavpack, který zase nad ostatními vyčnívá rychlostí komprese (www.wavpack.com). Tím nejuniverzálnějším se dnes jeví Free Loseless Audio Codec, zkráceně flac (flac.sourceforge.net). Flac je jedním ze zdárných příkladů výsledku práce open-source komunity. Jedná se tedy o multiplatformní software a je zdarma. 3.4.2. Ztrátová komprese Na otázku, který formát je ten nejlepší, opět nelze podat uspokojivou odpověď. Ztrátových kompresních kodeků, které stojí za zmínku podle své použitelnosti, ztráty na kvalitě originálu, rychlosti a kompresního poměru, je jen několik. Jedná se o Musepack (mpc), Ogg Vorbis (ogg), MPEG-1 Layer 3 (mp3) a Advanced Audio Coding (aac). Další formáty jako Windows Media Audio (WMA), VQF či RealAudio (RA) se mezi uživateli myslícími to s hudbou vážně příliš neprosadily, a i přes snahy jistých komerčních subjektů neprosadí díky nekompatibilitě, špatnému poměru kvality nebo velikosti komprimovaného výstupu.
Teorie ztrátové komprese Pokusím se demonstrovat, jakým způsobem ke kompresi dochází u formátu mp3. Komprese je tolik účinná v imitaci audio kvality původního CD díky metodě maskování. Pokud se ve stejný čas objeví silnější zvukový signál, který nedovolí posluchači zachytit signál slabší, je ten slabší při kompresi vymazán. Zjednodušeně - když nad námi například přelétává letadlo jen pár set metrů, hluk motorů nám brání v rozhovoru. Zvukové vlnění naší konverzace je rušeno silnějšími vlnami letícího letadla. Mp3 tedy hledá ve všech audio souborech podobné zvuky letadla, které maskují zvuky ostatní, a sází na to, že všichni mají natolik otupělý sluch, že nikdo nic nepozná. Místo dat, která bychom stejně neslyšeli, ukládá jen to, co papírově slyšet můžeme. Stejně jako u komprese bezztrátové, i zde dochází ke kompresi v několika krocích. Nejdříve projde zvukový signál filtrem, jenž rozdělí zvukovou stopu na jednotlivé frekvence. Současně prochází takto filtrovaný zvuk psychoakusticky modelovaným filtrem, zjišťujícím ono maskování neslyšitelných frekvencí těmi slyšitelnými. Posledním krokem je tzv.bit allocation, metoda, která se zbaví nežádoucího šumu. Po zpracování všech těchto informací dojde k oddělení neslyšitelného obsahu od samotného souboru, a komprimovaný mp3 je na světě. Při oddělování neslyšitelných frekvencí se také uplatňuje teorie, že lidské ucho není schopno zaregistrovat frekvence nižší než 15 Hz a vyšší než 20 kHz. Vše, co skladba obsahuje mimo tuto hranici, se vymaže také [15].
21
Aplikací všech těchto pravidel a teorií mohou dosáhnout formáty mp3 nebo Ogg Vorbis zmenšení velikosti až na 10 % originálu při průměrné kvalitě. Kvalita zvuku se po kompresi vyjadřuje šířkou datového toku (angl. bitrate). Audio CD (CD-DA) má datový tok 1 411 200 bitů za sekundu (stereo), což se dá také vyjádřit jako 1411 kbps (kilobits per second, kilobitů za sekundu). Typicky komprimované soubory (nehledě na použitý kodek) budou mít datový tok 64-256 kbps a uložená informace, tedy zvuk, bude znít našemu uchu většinou stejně jako originál.
Krátce o některých formátech ztrátové komprese Formát MPEG-1 audio Pro přenos audia v normě MPEG-1 slouží tři „vrstvy“ (od angl. layer). Tyto vrstvy jsou jakýmsi označením verzí, kde Layer 1 je nejstarší a Layer 3 nejnovější. Jednotlivé vrstvy se od sebe liší hlavně kvalitativně. Všechny společně využívají frekvenční maskování (silnější zvuk je překryt slabším) a poslední dva navíc ještě Temporal Masking, který využívá nedostatečné rychlosti přizpůsobení sluchu při přechodu z hlasitého signálu na tichý. Layer 3 (tedy mp3) je v současnosti nejrozšířenějším kodekem ztrátové komprese a je využíván i pro komerční účely jako je obchodování s hudbou na internetu.
Windows Media Audio (WMA) Firma Microsoft pro své video formáty WMV a ASF (používaný zejména pro streamování videa a hudby po internetu) vyvinula zvukový kodek WMA. Tento formát patří mezi nejrozšířenější hlavně díky politice firmy Microsoft, která je jej implementuje do svých operačních systémů. Využívá toho, že průměrnému uživateli stačí jednoduché rozhraní a přítomnost přehrávače hned po instalaci, než aby instalovaly jiný, třeba i lepší přehrávač. Hlavní rozdíl mezi WMA a ostatními formáty je možnosti zachování autorských práv (v praxi to ovšem často znamená spíš omezení než výhodu). Formát WMA dosahuje lepších výsledků než mp3 pouze při nízkých datových tocích. Dokazuje to hlavně několik testů mezi mp3 datového toku 128 kbps, jenž se kvalitou rovná WMA datovému toku 64 kbps. Navzdory tomuto faktu tento formát na ostatních „liniích“ prohrál.
ACC (Advanced Audio Coding) Kodek AAC je přímým nástupcem mp3. Při jeho vývoji byly vypuštěny problematické části mp3 a přidány funkce a možnosti, o nichž se při vývoji mp3 ještě ani nevědělo. Psytel AAC je nejkvalitnějším kodekem, k němuž se může koncový uživatel volně dostat. Je vyvíjen Ivanem Dimkovičem a jeho práce a samotný kodek AAC je považován za vrchol současného oboru ztrátové komprese. Kodek umožňuje práci až s 48 samostatnými kanály a vzorkovací frekvencí až 96 kHz. Formální testy s mp3 dokázaly, že AAC s datovým tokem 96 kb/s se kvalitou vyrovná mp3 komprimovaným 128 kb/s. Formát AAC byl vybrán pro systém DRM (Digital Radio Mondiale – digitální rozhlasový přenos na krátkých, středních i dlouhých vlnách AM).
Muse Pack (MPC) Musepack je ztrátový kompresní formát vyvíjený Andree Buschmannem na základech starších algoritmů mp2 (MPEG-1 Audio Layer 2). Disponuje podporou jednoduchého sterea a v současné stream verzi 7 (sv7) vzorkovací frekvencí 44 100Hz. Podle několika neformálních testů se ukázal musepack jako nejkvalitnější ze všech dostupných ztrátových formátů v 22
datovém toku nad 160 kbps. Jeho vlastnosti a základní algoritmus ho odsuzují pouze k tomuto jedinému vítězství nad ostatními. V datovém toku pod 160 kbps je horší než většina ostatních kodeků. Vývojáři se pokusili nastavení vlastností kodeku co nejvíce zjednodušit, a proto nabízí kodek jakýchsi sedm stupňů. Nejnižší, nazvaný „telephone“, komprimuje nejméně kvalitní monoaureální zvuk nejvíce využitelný v audio knihách a při komprimaci mluvené řeči. Sedmý stupeň, pojmenovaný „braindead“, byl uveden až v sv7 a (podle očekávání) se nachází na opačné straně spektra než telephone. Nabízí tedy nejkvalitnější komprimovaný výstup v rámci možností mpc.
Ogg Vorbis (OGG) Vývoj tohoto kodeku ze sféry open-source započal roku 1993 v rámci projektu Squish. Jeho vývoj byl motivován snahou o postupné vytlačení a nahrazení komerčních formátů mp3 a WMA. Díky zásahu mnoha programátorů a vývojářů je vývoj ogg velice živý a neustále se objevují nové verze. Se zlepšováním kvality komprimovaného výstupu jsou i soubory komprimované nejnovější verzí stále kompatibilní se starými přehrávači. Nejnovější verze a současně první stabilní verze je ogg 1.0. V mnoha ohledech se ogg podobá projektu LAME (mp3), s nímž má i mnoho společného. Obě iniciativy jsou totiž open-source, a protože je LAME (mp3) považován za favorita domény mp3, je přímým konkurentem ogg. Protože si oba formáty jsou velice blízko, a dá se konstatovat, že jsou kvalitativně identické. Pokud se tedy člověk rozhoduje mezi těmito dvěma formáty a jde mu především o kvalitu a současně o kompatibilitu, pak je asi lepší mp3. Na druhou stranu co se týče komprese vyšší a kvality nižší (při malých datových tocích), ogg se poslouchá přirozeněji, protože zvýrazňuje basy a výšky, zatímco LAME mp3 spíše střední frekvence. Při porovnávání (poslechem) v tocích nad 256 kbps se už však nevyskytují žádné rozdíly.
Méně populární kodeky ztrátové komprese a2b (MPEG-2 AAC Low Complexity Profile Audio Coding) Komprese založená na ACC, dokáže dosáhnout kompresního poměru až 1:20, vývoj společnosti AT&T, dokáže současně se zvukem zobrazit i text, grafiku, titulky apod. Veřejně dostupný je pouze přehrávač.
AC-3 (Dolby Digital Multichannel Perceptual Coding) Používán při kompresi surround zvuku 5.1 pro domácí kina, oficiální formát HDTV (technologie digitálního televifzního vysílání ve vysoké kvalitě), využíván mnoha DVD a při přenosech kabelové televize a satelitu.
ATRAC3 (Adaptive Transform Acoustic Coding 3) Původně vyvinuto pro Sony Digital Walkman, Obsahuje ochranu autorských práv, kompresní poměr až 1:12, založeno na ATRAC - formátu využívaného MiniDiskem. Nejsou k dispozici žádné softwarové enkodéry a dekodéry.
LQT (Liquid Audio Track) Založeno na úspěšném AAC, umožňuje ochranu autorských práv. Veřejně existuje jen softwarový přehrávač. Vytvoření prvního distribučního systému elektronické hudby. Umožňuje zobrazovat odkazy na grafiku, texty, titulky a webovou stránku umělce.
23
RA/RAM G2 (Real Audio) Prosadil se hlavně dříve u streamového audia (internetová rádia apod.). Dnes jen chabě konkuruje ostatním kodekům, nedokáže se jim vyrovnat ani kvalitou ani kompresním poměrem.
VQF (Transform-domain Weighted Interleave Vector Quantization) Odlišný od mp3 a AAC, algoritmus vyvinut japonskou společností NTT Human Interface Laboratories, licence patří společnosti Yamaha. Kompresní poměr až 1:20, více zatěžuje procesor při přehrávání a déle se komprimuje, kvalitnější než mp3 při nižším datovém toku. Dekodér i enkodér je zdarma na www.dalnetvqf.com, také proto se velice rychle prosazuje na internetu.
WMA9 (Windows Media Audio 9) Nejnovější verze WMA od Microsoftu, uvedeno ve třetím čtvrtletí 2002, podporuje multikanálovou kompresi (Dolby ProLogic apod.) a ochranu autorských práv. Stal se jedním z favoritů při prodeji hudby na internetu. V nižších datových tocích předčí mp3, v datovém toku 128 kb/s a výše nejsou mezi mp3 a WMA9 patrné výraznější rozdíly v kvalitě.
3.5.
Základní editace vzorku
Samotný záznam zvuku je pouze začátek. Mnoho programů, ať už volně šiřitelných nebo těch placených, nabízí řadu funkcí pro změnu původního zvukového vzorku, nejčastěji souboru wav, až k nepoznání. Samotná editace však začíná prostým stříháním, tj. kopírováním, vlepováním a výmazem označených částí vzorku, a to stejně jednoduše pomocí myši, jako když upravujete text ve „Wordu“. Pokud zapnete některý z programů na úpravu zvuku a načtete v něm vámi zvolený vzorek (wav), pak se vám na obrazovce zobrazí jeho vlnová forma. Tuto vlnovou formu si pak můžete různě přehrávat, označovat, zvětšovat či zmenšovat. Takto můžete najít ve vzorku např. ticho na začátku záznamu nebo jedno slovo v mluveném projevu. S označenými částmi pak můžete libovolně manipulovat (kopírovat, vkládat), či na ně aplikovat různé efekty. Stejnou cestou je možno například získat z hudebních skladeb zvukové vzorky, které později využijete při vlastní tvorbě hudby nebo při jejím mixování, nebo seskládat z různých slov mluveného projevu nový projev.
Obrázek 7 Nahrávka slova „Multimedia“ (8bit, 44100 Hz, mono)
24
3.5.1. Vyřezávání / mazání segmentu (označené části vzorku) Pokud chcete část vzorku vymazat (kupříkladu zbytečné ticho na začátku nebo na konci písničky), označte jej pokud možno přesně myší (využijte lupu) a stisknete klávesu DEL. Označená část tak bude vymazána. 3.5.2. Speciální funkce a efekty Všelijakých efektů je celá řada a jejich popis, ač zajímavý, by určitě vydal na jednu celou publikaci, nám však bude stačit seznámení s několika základními.
Rap Pokud označíte ve vzorku určitou jeho část a aplikujete funkci „Rap“, pak se tato označená část překopíruje, respektive vloží, za označenou část vzorku. Opakováním této funkce můžete kupříkladu dosáhnout efektu přeskakování jehly na gramofonové desce.
Insert Silence Tato funkce vygeneruje v označeném místě ve vzorku ticho. Po zvolení této funkce je ještě třeba nastavit délku ticha (v milisekundách). Praktické využití této funkce je např. pokud potřebujete na určitém místě vzorku vytvořit mezeru.
Fade In / Fade Out Fade je ideální efekt, vhodný k použití na počátek nebo konec vzorku. Umožňuje vám totiž nastavit si počáteční a koncové zesílení/zeslabení amplitudy a tuto změnu provede na označeném segmentu lineárně (v profesionálních programech je možno křivku zesílení nastavil i např. logaritmickou). Pokud jste tedy zaznamenali vzorek, v jehož pozadí je šum nebo jiný druh ruchu, je vhodné upravit úvod vzorku tak, aby byl náběh plynulý – tedy z ticha na standardní úroveň nebo obráceně. Po zvolení funkce je často možno nastavit pouze procento konečného/počátečního zeslabení (0% = ticho, 100% = původní hlasitost) a zdali funkci aplikovat na oba, nebo jen na jeden z kanálu (u stereo záznamu). Tato funkce je často používaná na konci hudebních souborů, kdy se hudba postupně zeslabuje až zanikne. Při porovnání následujícího obrázku s obrázkem je jasně vidět aplikace efektu Fade In. Fade out není tak znatelný z toho důvodu poklesu hlasu na konci slova.
Obrázek 8 Demonstrace efektu Fade In / Fade out na našem zvukovém vzorku
25
Reverse Tento efekt, jak už název napovídá, způsobí, že se označená část vzorku (nebo celý vzorek) bude přehrávat obráceně, tedy od konce k začátku. V případě stereo záznamu si také můžete vybrat, zdali chcete efekt aplikovat na oba kanály nebo pouze na jeden.
Echo/Reverb Tento efekt přidává do označeného segmentu „prostor“. Kupříkladu tak u záznamu mluveného slova lze vytvořit dojem, že bylo pronášeno namísto v „malém kumbálu“ ve velkém koncertním sále či sportovní hale.
Delay Efekt s názvem delay vytvoří k dané části vzorku ozvěnu, a to tak, že k našemu vzorku přidá slabší kopii a posune ji o určitý časový úsek. Počet opakování a posunutí kopírovaného vzorku (chcete-li kolikrát se vám ozvěna vrátí a za jak dlouho) přitom můžete nastavovat téměř libovolně.
Equalizer (česky ekvalizér ) Ekvalizéry se používají k zvýraznění nebo potlačení určitého pásma. S ekvalizérem se pravděpodobně potkáváte téměř denně i když jen částečně. Takovým malým ekvalizérem je i ten „čudlík“, kterým „roštujete“ basy na vašem stereu.
Invert Waveform Tato funkce převrátí sinusoidu záznamu kolem své horizontální osy. Zajímavé efekty se dostaví v případe, že převrátíte pouze jeden kanál u stereofonního záznamu.
Mute Použijeme ji tehdy, pokud chceme, aby se hlasitost (amplituda) označeného segmentu změnila na nulu. Je to vhodné kupříkladu k „odmazání“ části vzorku s tím, aby odmazaná část nebyla vystřihnuta, ale zastoupena tichem. Takto se někdy ve studiích odmazávají např. nádechy zpěváků z nahrávek.
Phase Shift Zajímavá funkce, která provede fázový posun jednoho zvoleného kanálu u stereo záznamu. Znamená to, že přehrávání druhého kanálu se zpozdí o vámi zvolený časový úsek.
Swap Channels Zaměňuje levý kanál s pravým. Samozřejmě pouze u stereo záznamu.
Volume Volume je změna hlasitosti. Hodí se, když jste nahráli svůj zvukový záznam, ale zjistíte, že jeho úroveň není dostatečně vysoká. Hlasitost můžete nastavit pomocí táhel (šavlí) pro každý kanál zvlášť a to v rozsahu 0-500% (0% = ticho, 100% = původní hlasitost).
26
3.6.
MIDI
Samotné slovo MIDI je zkratka názvu Musical Instruments Digital Interface, což by mohlo v češtině znamenat něco jako Digitální propojení hudebních nástrojů a k tomu také v zásadě MIDI slouží. Pomocí signálů MIDI může hudebník ovládat mnoho různých věcí, např. když propojí dvoje klávesy může hrát jen na jedny, ale zvuk půjde s obou. Tak docílí toho, aby mu třeba zvuk klavíru hrál dohromady se zvukem kontrabasu. Tento příklad je však jen jehlou v kupce sena a MIDI signály se dají použít i v mnoha jiných oborech, které s hudbou souvisí jen okrajově (ovládání pódiových světel) či vůbec (spínání zavlažování trávníku). My se však budeme zabývat tou hudební stránkou věci [11]. 3.6.1. MIDI a jeho záznam Mohlo by se zdát, že se záznamem zvuku MIDI nesouvisí, ale opak je pravdou. Signály MIDI se totiž dají zaznamenat a poté reprodukovat. V praxi se k nahrávání používají klávesy a říká se tomu „nahrávání do MIDI“. Funguje to tak, že do počítače nebo sekvenceru se zaznamenávají data o stisku a puštění klávesy, o síle a rychlosti stisknutí, případně číslo použitého zvuku, banky apod., ale nikoli samotný zvuk. Při přehrávání se pak zaznamenaná data „čtou“ a jsou jim zpětně přiřazovány zvuky. Další možností jak tvořit hudbu pomocí MIDI je využít některého z programů. Na trhu je hromada aplikací (např. Sibelius), ve kterých vepíšete noty do notové osnovy, jak jste zvyklí, a program tento zápis potom převede do MIDI a přehraje. Nebo můžete využít nějakého softwarového sekvenceru (Fruity Loops). 3.6.2. Konektory pro MIDI Pro doplnění základních znalostí o MIDI je třeba ještě vědět jaké konektory se pro propojování zařízení podporujících MIDI používají. Základním konektorem je DIN (pětikolík). Tento typ konektoru je v jiných odvětvích v současnosti už zastaralý, ale u MIDI se stále používá a domnívám se, že se ještě používat bude. Pokud však budete chtít nahrávat do počítače, což je velmi pravděpodobné, pak zřejmě začnete tento konektor na zadním panelu vašeho počítače hledat a asi ho ani nenajdete. Propojení s počítačem se totiž uskutečňuje pomocí patnácti-kontaktového konektoru vaší zvukové karty, do kterého zpravidla zapojujete joystick či gamepad. Na toto propojení je však třeba redukce, kterou si budete muset koupit.
Obrázek 9 Konektory DIN
27
4. ULOŽENÍ OBRAZU A VIDEA V DIGITÁLNÍ PODOBĚ 4.1.
Jak dostat obraz do počítače a jak se tam uloží
•
jak získávám obraz (scanner, foto, malování)
•
formáty – rastrový a vektorový
•
jak se mění velikost souboru se změnou velikosti obrázku
Obraz můžu získat a uložit do počítače skenováním. Do scanneru vložím obrázek jako do kopírky a v programu na skenování (např. Adobe Photoshop) obrázek skenuji. Můžu ho také upravit a poté uložit do počítače v požadovaném formátu. Dále můžu získat obraz nebo fotku z digitálního fotoaparátu a to propojením fotoaparátu s počítačem pomocí USB kabelu. Počítač najde nové zařízení a já můžu vyfocené fotky zkopírovat do počítače. Tyto fotky dále můžu upravovat podle libosti. Obraz či fotku si můžu také nakreslit v kreslícím programu jakou jsou CorelDraw nebo Photoshop a uložit ve vhodném formátu. 4.1.1. Rastrové formáty
PCX Grafický formát vyvinutý firmou ZSofr patří mezi nejstarší, dodnes však patří mezi nejrozšířenější. Umožňuje kódovat 2, 4, 8 a 24 bitové obrázky. Na kompresi používá RLE kódování (viz dále). Tento formát byl původně optimalizovaný na 16 barev. Tomu je přizpůsobena i hlavička, která má prostor pro nadefinování maximálně 16 barev. Barevně bohatší obrázky (24 bitů/pixel) musí být zapisovaný do tří samostatných bloků pro jednotlivé složky R, G a B.
GIF GIF (Graphics Interchange Format) je grafický formát s využitím komprese LZW. Použitá kompresní metoda přináší pro většinu obrázků velké zmenšení objemu dat. Umožňuje však jen maximální počet 256 barev. Původní určení pro přenos obrázků po telefonních linkách se projevuje ve složitější struktuře formátu, je však vítané pro síťové multimediální aplikace. Umožňuje ukládat animované gify, což jsou jednotlivé obrázky zobrazované v určitých intervalech. Tento formát se velmi rozšířil díky internetu, protože umožňoval postupné zobrazení obrázku už po načítání 1/8 dat. Mezi základní charakteristiky a možnosti patří: − více obrázků v jednom souboru, každý z nich může mít vlastní barevnou paletu. − možnost prokládání řádků je vhodná pro přenos obrázků po síti.
PNG PNG (Portable Graphics Network) je poměrně nový formát, který má ambice stát se nástupcem formátu GIF. Je primárně zaměřen na přenos obrazu po síti. Tento formát je schopen ukládat obraz v mnoha barevných rozlišeních, jako kódování je zvolena metoda LZW. 28
Zásadní novinkou tohoto formátu je zavedení předzpracování každého pixelu. Existuje několik metod, jak pracovat s pixelem. Žádná z metod není ztrátová, předzpracované pixely jsou ukládány pomocí běžného LZW kódování. Dalším rysem je dvojrozměrné prokládací cháma, PNG dovoluje rozdělit přenášené informace do sedmi skupin. Dekódované pixely pak mohou vyplňovat čtvercové a obdélníkové oblasti, jejichž vzhled je postupně zjemňován. Další vlastností PNG je schopnost ukládat obrazy v barevném rozlišení true color (reprezentace 3 barev ve třech bytech, tj. 24 bitů) a to bezeztrátově. Nevýhodou oproti formátu GIF je to, že formát PNG je určen pro uložení pouze jediného obrazu v jednom souboru.
TGA Formát TGA (Targa) používá kompresi RLE, mezi programátory je však oblíbena především jeho varianta bez komprese, umožňující po uložení jednoduché 18-bytové hlavičky zaspat obrázek v 24 bitech/pixel do souboru přímo pixel po pixelu. Oproti formátu PCX nedovoluje TGA ukládat obrázky po jednotlivých barevných rovinách. Formát TGA byl prvním 24-bitovým obrazovým formátem na platformě počítačů PC a je podporován i v operačním systému UNIX. Dokáže uložit obrázky v barevném rozlišení 1, 8, 16, 24 a i 32 bitů/pixel.
TIFF Tento formát je příkladem velmi univerzálního grafického formátu, to však přináší velkou složitost a odlišnost při načítání toto formátu. Formát prošel poměrně velkým vývojem a je tudíž schopen zapsat obrazy v nejširší škále barevných rozlišení a modelů. Podobně jako GIF dokáže uložit více obrázků do jednoho souboru.
BMP Tento grafický formát používá operační systém Microsoft Windows. Původně byl určený pro 16-ti barevní obrázky, dnes umožňuje až 32b hloubku barev. Podporuje jen jednoduchou kompresi. Formát je jednoduchý a rychlý, záporem je velká velikost obrázku. 4.1.2. Jak se mění velikost souboru se změnou obrázku Obraz je při bitmapovém vyjádření vyjádřen pomocí bodů - pixelů, přičemž u každého bodu je určeno nastavení jeho barvy. Kvalita reprodukce u bitmapového obrázku je určena rozměry (udávanými v pixelech nebo taky jiných délkových jednotkách, jako jsou centimetry, milimetry apod.) a rozlišením (udávaným obvykle v počtu bodů či pixelů). Čím jsou oba uvedené parametry vyšší, tím je obvykle kvalitnější i obrázek. S nárůstem kvality a velikosti však roste i velikost souboru. Můžeme se setkat s barevným rozlišením 16 barev, 256 barev, 16 High color, 24 True color a 32 True color. •
při rozlišení 16 High color se zobrazí až 216 barev
•
při rozlišení 24 True color se zobrazí až 224 barev
•
při rozlišení 32 True color se zobrazí až 232 barev
Příklad: Původní obrázek je uložen ve formátu JPEG a má velikost 1792x1200 a barevnou hloubku 24 bitu.Velikost tohoto obrázku je 502 kB. 29
Obrázek 10 Výřez původního obrázku
Ten samý obrázek ve formátu JPEG a s 90% kompresí má velikost 179 kB.
Obrázek 11 Výřez obrázku v 90% kompresi JPEG
Ve formátu BMP a barevné hloubce 32b má obrázek velikost 8,2 MB
Obrázek 12 Výřez obrázku ve formátu BMP a barevné hloubce 32b
30
Nakonec obrázek ve formátu BMP a o 16-ti barvách má velikost 1,02 MB.
Obrázek 13 Výřez obrázku ve formátu BMP a o 16-ti barvách
4.2.
Přenos videa do počítače
Počítač umožňuje zpracovávat video pouze v digitálním (binárním) signálu, proto se data z analogového formátu musí převádět na digitální. Analog – pokud máme analogovou kameru, obraz i zvuk se nahrává v analogovém formátu. K převedení do digitálního formátu je potřeba zachytávací videozařízení, které provede digitalizaci, např. videokarta instalovaná v počítači. Rozdíly mezi jednotlivými videokartami jsou v tom, jaké signály dokáží zpracovávat a v kvalitě digitalizace. Tomu samozřejmě odpovídá i jejich cena. Digital – v současnosti jsou velmi rozšířené digitální videokamery, které převádí snímaný signál do digitální formy přímo uvnitř kamery. Počítač tak může rovnou zpracovávat data. Digitální kamery používají formát známý jako DV (Digital Video). Pro přenos signálu mezi kamerou a počítačem se nejčastěji používá rozhraní IEEE 1394 známé jako FireWare. Rozhraní IEEE 1394 – původně vyvinuté firmou Apple Computers. Je to velmi rychlé sériové rozhraní. Kabel IEEE 1394 přenáší všechny informace včetně obrazu, zvuku, časového kódu a příkazů pro ovládání zařízení. IEEE 1394 je rozhraní nejen pro přenos videa, ale je to obecné digitální rozhraní pro připojení jiných digitálních zařízení jako jsou pevné disky, scannery nebo počítačové sítě.
Obrázek 14 IEEE 1394
FireWire je ve skutečnosti tvořen celkem šesti dráty. Dva páry slouží k obousměrnému přenosu dat, zatímco třetí je napájecí s rozsahem 8 až 40 voltů. V praxi se proto můžete setkat s dvěma typy konektorů 4-pinovým, který najdete právě v digitálních kamerách, nebo 6pinovým. V druhém případě je pak možné využít elektrické napájení například pro externí disky, čímž je u mobilních počítačů zajištěna plná nezávislost na elektrické zásuvce, nebo třeba pro nabíjení akumulátorů v periferním zařízení.
31
Obrázek 15 FireWire
Stávající standard IEEE 1394 podporuje přenosovou rychlost 400Mbps pro vedení s maximální délkou 4.5 metru. Pokud tuto vzdálenost překročíte, klesne na 100Mbps. V současné době přichází do praxe inovovaná varianta IEEE 1394.b, která nejen zvyšuje datovou propustnost až na 800Mbps, ale především využívá namísto původních měděných drátů optické vedení, které zajišťuje zachování maximální přenosové rychlosti i na větší vzdálenosti. 4.2.1. Typy konektorů XLR se používá pro připojení mikrofonů a jiných vyvážených audio zařízení a pro digitální audio AES/EBU.
Obrázek 16 XLR konektor
RCA se používá pro připojení běžných audio a video zařízení jako jsou video přehrávače, radiopřijímače a CD přehrávače.
Obrázek 17 RCA konektor
BNC se používá pro připojení nejrůznějších video zdrojů jako jsou analogové zdroje kompozitního nebo komponentního video signálu a pro připojení digitálního sériového rozhraní SDI.
32
Obrázek 18 BNC konektor
S-Video je použit pro připojení S-Video zařízení jako jsou SVHS kamery a video disky.
Obrázek 19 S-Video konektor
4.2.2. Změna velikosti videa Standardní velikost videoobrazu v našich končinách je 768 x 576 bodů pro normu PAL při 25-ti snímcích za sekundu a 24 bitové barevné hloubce. Pokud bychom chtěly toto video zachytit v nezměněné podobě, znamenalo by to uložit do počítače každou sekundu cca 32 MB dat. Běžný počítač není samozřejmě schopen takový datový tok zpracovat a proto ho musíme nějakým způsobem snižovat na přijatelnou hranici. Způsobů jak toho dosáhnout je několik : •
Zmenšit formát videa
•
Snížit počet snímků za sekundu
•
Zvýšit kompresi videa pomocí kodeku
•
Snížit barevnou hloubku
Formát videa (frame size) 768x576 - Tento formát je samozřejmě nejkvalitnější (rozlišení PAL), lze ho ovšem použít většinou pouze na dražších kartách s hardwarovou kompresí MJPEG, která je poměrně kvalitní, ale hlavně velice rychlá. Ostatní karty mají s tímto formátem trochu problémy, protože komprimaci velkého toku dat (cca 32MB/s) bez použití právě hardwarové komprese, zpravidla není schopen procesor počítače zvládnout v reálném čase. Taky ho nepodporují všechny softwarové kodeky. 384x288 - Tento formát je poloviční PAL a je srovnatelný s kvalitou VHS. Nabízí největší možnost různých variant nastavení a je nejvíce podporovaný pro běžné zpracování videa. Většina karet zvládne tento formát zachytit i bez nutnosti použít jakoukoliv kompresi (tok dat cca 8MB/s), tudíž s minimální ztrátou kvality a umožní ho přehrát v uspokojivé kvalitě v plné velikosti obrazovky.
33
192x144 - Tento formát je možno použít v ostatních případech, kdy nepotřebujeme zachycené video přehrávat přes celou obrazovku. Své uplatnění najde např. na internetu, nebo při tvorbě nenáročných multimediálních prezentací. Tento formát videa má bez komprese tok dat cca 2MB/s. Ostatní formáty 768x288, 384x576 - Tyto formáty videa jsou různými kombinacemi poloviny výšky nebo šířky plného PALu, vznikly pro potřebu snížení toku dat na polovinu.
Počet snímků (frame rate) Standardně je použito v PALu 25 snímků za sekundu. Snížením počtu snímků za sekundu, lze dosáhnout snížení datového toku videa, ale není to zrovna ten nejvhodnější způsob. Snížení je možno provést tam, kde není nárok na bezvadně plynulé video, např. při vytvoření nějakého náhledu ukázky apod. Při snížení na polovinu standardu (tj na 12,5) se snižuje i datový tok videa na polovinu.
Komprese (compression) Komprese je další způsob, který může ovlivnit velikost datového toku videa. Zvýšením komprese videa, se snižuje datový tok, ale zároveň i kvalita videa. Pro použití komprese videa, je nutno mít v počítači nainstalován tzv. "kodek", který tuto kompresi provede. Existuje několik různých kodeků, které se od sebe vzájemně liší např. velikostí, rychlostí, nebo kvalitou provedené komprese. O kompresi podrobněji níže.
Barevná hloubka (color format) Tak jako obrázek může mít 256-ti barevnou nebo 16-ti bitovou barevnou hloubku tak i video má svoji barevnou hloubku. Standardně je barevná hloubka 24 bitů. Snížením barevné hloubky lze dosáhnout snížení datového toku, ale opět na úkor kvality videa. Např. snížení z 24-bitové hloubky na 16-bitovou je datový tok dvoutřetinový. Některé kodeky pracují pouze v určitých barevných hloubkách. Nastavení 32 bitů nemá význam protože víc barev video nemá.
34
5. OBRAZ 5.1.
Barvy v počítačové grafice
Různé barvy, které se používají při vytváření obrazu, jsou tvořeny kombinací několika základních barev. Na barevné obrazovce vidíme barvu jako výsledek tří složek – červené (R, red), zelené (G, green) a modré (B, blue). Barvy lze pak vyjádřit barevným vektorem, jehož složky nabývají hodnot z intervalu <0, 1> nebo v celočíselném rozsahu 0-255. Počet kombinací barev reprezentovaných trojicí bytů je 2563, což je přes 16 milionů. Ne vždy jde takové množství barev zobrazit současně a proto bývá počet barev před vykreslením uměle snížen. Konkrétní reprezentace barvy může být různorodá. Rozlišujeme-li stavy mezi černou a bílou, jde o informaci jednobitovou. Reprezentace tří barev ve dvou bytech (16 bitů) je známá jako High color, pro zápis ve třech bytech jako True color (24 bitů). 5.1.1. Barevné modely Barevné modely určují, ze kterých základních barev se budou ostatní skládat, jaký bude poměr jednotlivých základních barev a jakým způsobem se budou základní barvy míchat. Lidské oko vnímá barvu na základě podráždění tří barevných receptorů na sítnici a u většiny lidí jsou tyto receptory nejvíce citlivé na tři základní barvy, respektive jim odpovídající vlnové délky. Tomuto způsobu vnímání se nejvíce podobá barevný výstup na klasických RGB monitorech, kde jsou barevné odstíny vytvářeny kombinací tří základních barev červené (Red), zelené (Green) a modré (Blue). 5.1.2. Model RGB Jeho základní vlastností je součtové, aditivní skládání barev – čím více barev složíme (sečteme), tím světlejší je výsledek. Barevný rozsah můžeme v modelu RGB zobrazit prostorově jako jednotkovou krychli umístěnou v osách označených postupně r, g a b (Obrázek 20). Počátek souřadnic odpovídá černé barvě, vrchol o souřadnicích [1, 1, 1] odpovídá bílé. Vrcholy krychle, které leží na osách, představují základní barvy a zbývající vrcholy reprezentují doplňkové barvy ke každé ze základních barev.
Obrázek 20 Model RGB
35
Obrázek 21 Model CMY
5.1.3. Modely CMY Model RGB je technicky orientovaný, vhodný pro displeje. Lidská zkušenost s mícháním barev však vychází z cela jiné práce s barvami. Například pro malíře je běžné, že nové barvy vytváří mícháním jednotlivých barevných pigmentů, přičemž každé přidání pigmentu vytvoří tmavší barvu. Takové skládání se nazývá subtraktivní. Složením všech barev vznikne černá, což je opačná situace oproti aditivnímu skládání barevného světla. Obsahuje tři základní barvy - tyrkysovou (Cyan), fialovou (Magenta) a žlutou (Yellow). Jde o model používaný v tiskařské technice. Barevný rozsah tohoto modelu můžeme opět zobrazit jako jednotkovou krychli (Obrázek 21), která je do jisté míry shodná s krychlí RGB. Sčítání hodnot CMY ovšem odpovídá subtraktivnímu skládání barev, takže vrchol [1, 1, 1] reprezentuje černou barvu. Převod mezi modely RGB a CMY je velmi jednoduchý. Vyjádříme-li bod v prostoru RGB jako tříprvkovou matici [r g b], pak bod v prostoru CMY určíme pomocí následujícímu odčítání matic:
c 1 r m = 1 − g z 1 b Při tisku jsou barevné obrazy reprodukovány jako soutisk tří obrazů, tvořených základními barvami C, M a Y. Tyto základní barevné pigmenty nesmí být dokonale krycí neboť nové barvy vznikají vzájemným překrýváním. Složením všech tří barev v praxi nevznikne žádoucí černá, ale pouze špinavě hnědá. Z tohoto důvodu se černá tiskne jako samostatná barva. Lze ji použít i ke ztmavení ostatních barev. Proto se v polygrafii místo modelu CMY častěji používá model CMYK, který vzniká přidáním černé (blacK) jako čtvrté základní barvy. Při tvorbě obrazu v počítači se ve většině případů pracuje s barvami v modelu RGB, které jsou případně později převáděny do jiných modelů.
36
5.1.4. Modely HSV a HLS Modely RGB a CMY jsou přímo použitelné pro odpovídající technická zařízení, ale nejsou až tak blízké intuitivnímu popisu barev. První z modelů, které jsou blízké k lidskému chápání světla, se nazývá HSV. Jeho základními proměnnými jsou barevný tón (Hue), sytost (Saturation) a jasová hodnota (Value). Barevný tón označuje převládající spektrální barvu, sytost určuje příměs jiných barev a jas určuje množství bílého (bezbarvého) světla. Pro prostorové zobrazení tohoto modelu se nepoužívá krychle, ale šestiboký jehlan, jehož vrchol je umístěn do počátku souřadnicového systému a podstava je otočena kolmo vzhůru (viz Obrázek 22 vlevo). Na vertikální ose je zanesena hodnota V, na horizontální ose je sytost S. Obě tyto hodnoty se mohou pohybovat v intervalu <0,1>. Barevný tón H se vyjadřuje jako úhel svírající s osou S o hodnotě z intervalu <0°, 360°). Vrchol jehlanu reprezentuje černou barvu. Jas roste směrem k podstavě jehlanu. Střed podstavy reprezentuje bílou barvu. Sytost je tedy znázorněna jako vzdálenost bodu od osy jehlanu. Z toho plyne, že dominantní barvy leží na plášti jehlanu a čisté barvy leží na obvodu podstavy. Při pohybu po obvodu ve stejné výšce od základny se postupně mění barevný tón, sytost a jas zůstávají nezměněny. Tento model má několik nedostatků. Jedním z nich je jehlanovitý tvar, který způsobuje, že ve "vodorovném" řezu se musí bod o konstantní hodnotě s pohybovat při změně h po dráze ve tvaru šestiúhelníka, nikoli po kružnici, což by bylo přirozenější. Dalším nedostatkem je nesymetrie modelu z hlediska jasu.
Obrázek 22 Modely HSV a HLS
Tyto nedostatky jsou odstraněny v modelu HLS, jehož základními proměnnými jsou barevný tón (Hue), světlost (Lightness) a sytost (Saturation). Tento model je obdobou modelu HSV, ale tentokrát se reprezentuje dvěma kužely (viz Obrázek 22 vpravo). Černá barva je ve vrcholu spodního kuželu, bílá na vrcholu horního. Nejjasnější čisté barvy mají tedy souřadnice s = 1 a l = 0,5 a leží na obvodu podstav kuželů. Tvar modelu HLS plně odpovídá skutečnosti, že nejvíce různých barev vnímáme při „průměrné“ světlosti (oblast podstav). Schopnost rozlišit barvy klesá jak při velkém ztmavení, tak při přesvětlení. Modely HSV a HLS umožňují postupně měnit barevné charakteristiky při zachování ostatních typických vlastností barvy. To je příjemné pro uživatele, kteří chtějí určovat barvy pomocí jim typických vlastností, jako jsou sytost, světlost a dominantní barva. 37
5.2.
Zpracování obrazu
Vlastní průběh zpracování a rozpoznávání obrazu v reálném světě obvykle rozdělujeme na několik kroků. 5.2.1. Snímání Snímání obrazu je převod optické veličiny na elektrický signál, který je spojitý v čase i úrovni. Vlastní proces snímání můžeme též chápat jako radiometrické měření. Na výsledný sejmutý obraz má samozřejmě vliv mnoho různých faktorů. Může to být například ozáření snímaného objektu a jeho vlastnosti. Pokud ale předem známe některé veličiny, zlými jsou např. právě ozáření a odrazivost povrchu, mohou nám pomoci částečné rekonstrukci 3D scény z 2D obrazu, který získáme při snímání. Vstupní informací při snímání nemusí být vždy jen jas z kamery či scanneru, ale mohou jí být i jiné veličiny, jako jsou intenzita rentgenového záření, ultrazvuk či tepelné záření. 5.2.2. Digitalizace Dalším krokem při získávání obrazu vhodného pro další zpracování v počítačích je převod spojitého analogového signálu na signál digitální – digitalizace. Při získání digitálního obrazu dochází k přechodu od spojité funkce f (x,y) k diskrétní funkci I (x, y), a to jak v definičním oboru funkce f (x, y),tak v jejím oboru hodnot. Tento proces probíhá ve dvou nezávislých krocích: •
kvantování
•
vzorkování
Kvantování Principem kvantování je diskretizace oboru hodnot obrazové funkce. Obor hodnot funkce se rozdělí na intervaly, jimž je pak přidělena jediná, zástupná hodnota . Rozdělení: •
uniformní – používá konstantní délku intervalu
•
neuniformní – používá proměnnou délku intervalu. Používá se méně často.
Kvantování je zdrojem tzv. kvantizační chyby, která se projevuje u ploch s náhlou změnou barev. Původně hladký barevný přechod je nahrazen skokovou změnou. Kvantizační chyba tedy působí rušivě a lze ji částečně eliminovat neuniformním kvantováním a vhodnou zástupnou hodnotou. Vzorkování Vzorkování (sampling) je zjišťování hodnot (vzorek) v pravidelných intervalech. Můžeme to chápat jako přechod ze spojitého na diskrétní případ. Jedna z vlastností vzorkování je, že pixel není bod, ale plocha určité nenulové konečné velikosti. Na základě jediného čísla (obyčejně získaného ze středu pixelu) přiřazujeme konstantní hodnotu celé oblasti – ploše pixelu.
38
Obrázek 23 Vzorkování
Pro vzorkování platí pravidlo, že data musí být vzorkována frekvencí, která je alespoň 2x větší než nejvyšší frekvence v datech. Pokud není vzorkovací frekvence dostatečně vysoká dochází k podvzorkování a vznikají artefakty (aliasy). 5.2.3. Alias a antialiasing Vzniká při podvzorkování spojité funkce pod Nyquistův limit a projevuje se jako nízkofrekvenční informace, která nebyla v původním signálu zastoupena. Alias je tedy informace, která se původně v signálu nevyskytovala. S aliasem se setkáváme i v běžném životě. Například v továrnách, kde se pracuje s rotačními stroji, by se neměli používat k osvětlení zářivky. Když zářivka svítí na rychle se otáčející objekt, může se těleso jevit, jako by se otáčelo pomalu, vůbec nebo dokonce na opačnou stranu. Jiným příkladem je například obrazovka snímaná kamerou. Na obrazovce vnímáme tmavé, různou rychlostí se pohybující pruhy či blikání. Odstraňování aliasu se nazývá antialiasing. Základní metoda antialiasingu je prosté oříznutí vysokofrekvenční části funkce. Ořezání vysokých frekvencí rozmazává obraz. Antialiasing je v počítačové grafice vždy kompromisem mezi věrností či jemností detailu a rozmazáním obrazu.
39
5.3.
Digitální foto
5.3.1. Základní Pojmy
Na co hledět při koupi fotoaparátu stěžejním kritéria při rozhodování: •
cena
•
druh a rozlišení snímacího čipu
•
kvalita optiky a zoom
•
rychlost
•
design a rozměry
•
podporované paměťové médium
Obrázek 24 Průřez digitálním fotoaparátem
Snímací prvek Jednou z nejdůležitějších informací, podle které se budete rozhodovat, je rozlišení optického snímače CCD (Charge Coupled Device) či CMOS (Complementary Metal Oxide Semiconductor). Snímač je plocha posázená buňkami, které jsou citlivé na světlo. Jeho rozlišení se udává podle počtu těchto prvků, také nazývaných body (pixely) - odtud také název Megapixel (Mpix), který značí milion takových bodů. Fotoaparáty jsou pak označovány jako např. dvoumegapixelové nebo číslem 2,0 MPix. Počet bodů na snímacím čipu se v podstatě rovná velikosti výsledné digitální fotografie. Samotný snímek má poněkud menší rozlišení, než je dostupný počet bodů na snímači. Tyto „volné body“ mohou být využity například v okamžiku poruchy některého z aktivních pixelů. Většina aparátů dokáže vytvořit snímky nejen v tzv. fyzickém rozlišení čipu, ale také v několika menších velikostech. Počet prvků, který umožňuje alespoň zhruba podobný výstup jako nejlevnější kinofilm, se však pohybuje až nad hranicí 4 500 000 prvků. Klasickou fotografii formátu 9 x 13 cm však můžete vytvořit i ze snímku s méně než 1 500 000 body. Optika a věci s ní související Spolu se snímacím prvkem je nejdůležitějších součástí každého fotoaparátu optika. Ať se jedná o kinofilmový, nebo digitální fotoaparát, je kvalita snímků přímo závislá na optickém 40
vybavení fotoaparátu. Zde je třeba dát si pozor především u výrobců, kteří jsou známí na poli elektronickém, ale s výrobou optiky nemají téměř žádné zkušenosti. I oni se však poučili a nabízejí u svých fotoaparátů optiku značkových výrobců. A tak lze celkem jednoduše informaci o dodavateli optické části digitálního fotopřístroje zjistit z objektivu. Další informace o objektivu by měly obsahovat jeho světelnost a ohniskovou vzdálenost. Dobrá světelnost, neboli schopnost propouštět světlo, se ve spolupráci s vyšší citlivostí vyplatí například při horších světelných podmínkách. Standardem bývá hodnota F 2,8. Čím je tato hodnota menší, tím lépe. Informace o ohniskové vzdálenosti dovolí uživateli zjistit, zda je přístroj vybaven optickým zoomem. Tak jako u analogových fotoaparátů, i zde najdeme přístroje s fixním ohniskem a fotoaparáty s proměnnou ohniskovou vzdáleností, tedy se zoomem. Obvyklé je trojnásobné přiblížení, což u běžných objektivů odpovídá přibližně hodnotám 7-21 mm. V porovnání s objektivy u analogových přístrojů je odpovídající hodnota mezi 35 a 105 mm. Kvalitní objektiv obvykle mění se změnou ohniskové vzdálenosti světelnost jen minimálně. U některých fotoaparátů je dále uveden ještě tzv. digitální zoom. Na něj již optické vybavení nemá vliv a mnohdy podobnou funkci zastane lepší grafický editor. Výsledný snímek je totiž v podstatě výřezem ze snímku, který je softwarově zvětšen na nastavené rozlišení. Digitální zoom má smysl používat při focení snímků v menším než maximálním rozlišení. Jinými slovy, údaje o digitálním zoomu by měl mít při výběru digitálního fotopřístroje brány spíše jako doplňková informace než zásadní údaj, podle něhož by se měl uživatel rozhodovat. Lepší přístroje nabízejí automatický fokus s možností nastavení priorit středu či vícebodové ostření. Zvláště druhá metoda má zásadní vliv při tvorbě složitějších snímků, kdy je potřeba mít dostatečně ostré objekty v různé vzdálenosti. Čím více zón či bodů, z nichž aparát získává údaje, tím přesnější bude nastavení optiky. Modely vyšších kategorií nabízejí také ostření manuální, buď s ručním nastavení vzdálenosti na displeji, či přímo za pomoci prstence na objektivu. Zvláštní vlastností optiky je tzv. makro režim. Ten umožňuje zaostřit na předmět vzdálený od objektivu jen několik centimetrů a snímat tak například detaily povrchu či miniaturní předměty.
Rychlost Jednou z disciplín, v níž digitální fotoaparáty zaostávají za klasickými, je rychlost. Zatímco analogový přístroj lze vzít a okamžitě s ním fotit, digitálnímu chvíli trvá, než se „probudí“. Je potřeba si uvědomit, že se jedná o elektronický přístroj, který při zapnutí spouští své vnitřní programy obsažené v tzv. „firmware“. To však není jediný problém s rychlostí. Ten druhý souvisí se samotným vytvořením snímku. Každý digitální fotopřístroj potřebuje nějaký čas na přípravu expozice. Proto má práce se spouští dvě fáze. Při té první (hovoří se o „namáčknutí“) se provádí měření a ostření a teprve poté je možno spoušť „domáčknout“ a vytvořit výsledný snímek. Čím je první fáze rychlejší, o to dříve samozřejmě snímek pořídíte. Také čas, který uplyne, než můžete nafotit další snímek, může být až nepříjemně dlouhý. Závisí to jak na kapacitě vnitřní paměti, tak na paměťovém médiu, ale i na náročnosti scény, která se také odrazí ve velikosti výsledného souboru. Je dobré nespoléhat se jen na údaje výrobce, ale získat informace z nezávislých zdrojů či si rychlost ověřit v praxi.
Paměťové médium Pro fotografa - i toho amatérského - snad není nic horšího, než když předpokládaný životní snímek nemá na co vyfotografovat. U digitálních fotoaparátů je situace trochu odlišná. Až na výjimky se fotografie zachycuje na vyměnitelné paměťové médium. To znamená, že můžete kterýkoliv snímek smazat a místo něj vyfotit jiný. Mimo smazání snímku může být řešením 41
již zmíněné menší rozlišení výsledného snímku, který potom samozřejmě zabere méně místa. Protože jsou snímky většinou ukládány ve formátu JPEG, máme na výběr mezi několika úrovněmi ztrátové komprese. Při účinnější kompresi je výsledný soubor menší a na médium se tak vejde více snímků - ovšem na úkor jejich kvality. Obrázky pak mohou být lehce rozostřené s menším množstvím detailů a horším barevným podáním.
Obrázek 25 Paměťová média
Blesk Drtivá většina fotoaparátů již nabízí blesk a každý z takových přístrojů podporuje redukci jevu tzv. červených očí. Pro opravdu kvalitní snímky v horších světelných podmínkách bude uživatel potřebovat možnost použít i blesk přídavný. Ten se nasazuje na patici Hot-Shoe, kterou ale amatérské fotoaparáty většinou nejsou vybaveny.
Další softwarové funkce Každý digitální fotoaparát umožňuje mazání již pořízeného snímku. Některé umí pořízený snímek zvětšit. Drtivá většina je vybavena i náhledovým LCD displejem, kde je možno snímky prohlížet. Často je možno k snímku přidávat čas pořízení, či jiné podtitulky. Některé fotoaparáty nabízejí některé funkce grafických editorů, a tak se například snímek převede do černobílé, nebo se na něj použije některý z filtrů. Tyto funkce se hodí v případě, že uvedený snímek chcete rovnou z fotoaparátu vytisknout nebo ukazovat přes videovýstup na televizi a ne jej nejdříve upravit na počítači. Co se přímého tisku z fotoaparátu týká, zde je potřeba si zjistit, jaký formát přímého tisku přístroj podporuje a zda jej případně zvládne i vaše tiskárna.
Baterie Ve většině případů jsou dodávány k přístrojům firemní dobíjecí akumulátory. Jsou to především lithio-iontové (Li-Ion), případně nicklometa-hydridové (NiMH) baterie. Li-ion baterie mají větší výdrž a jsou také dražší. V některých případech je možné je kombinovat s klasickými bateriemi. Jsou i fotoaparáty, které jsou pouze na klasické baterie. Zde se vyplatí investovat do kvalitních vysokokapacitních akumulátorů a jejich dobíječky (pokud přístroj sám nepodporuje dobíjení) než nakupovat horu baterií. Kapacitu a následnou výdrž baterií ovlivňují některé faktory. Výdrž baterií je nepřímo úměrná počtu snímků s bleskem. Dalším velkým „žroutem“ energie je LCD displej, zvláště jeho podsvícení. Někteří výrobci nyní 42
dodávají tzv. nízkoteplotní LCD, které mají sníženou spotřebu. Řada digitálních fotoaparátů využívá jako hledáček pouze náhledový displej. Hlavní nevýhoda tohoto přístupu spočívá v tom, že se při slabých bateriích v důsledku energetické náročnosti displeje nemůžete kontrolovat, co fotíte, nebo pořídit ani jeden snímek. S LCD je u starších modelů problém mírného zpoždění zobrazení snímaného prostoru.
Zvuk a video Digitální fotoaparát může obsahovat mikrofon. Ten slouží k hlasovému popisu fotografie, nebo jej využijete při vytváření videozáznamu, který některé fotoaparáty umějí. Jedná se většinou o krátké, několik desítek sekund až minut trvající záznamy se zvukem či bez. Jejich kvalita a rozlišení je několikanásobně horší než u jednotlivých snímků. 5.3.2. Clona a expoziční čas Jak souvisejí pojmy CLONA a EXPOZIČNÍ ČAS s kvalitou fotografie? Dobrý fotograf se pozná jednak dle výběru zajímavé kompozice a také především díky umění nastavit všechny parametry při fotografování, kde výše uvedené výrazy jsou jedny z nejdůležitějších.
Expozice Aby se obrázek zachytil na filmu, musí být film vystaven po určitou dobu světlu. Během fotografování je velmi důležité měřit intenzitu světla, jelikož příliš mnoho světla, stejně jako jeho nedostatek, může fotografii zcela znehodnotit. Fotoaparát používá k nastavení množství pronikajícího světla dva údaje – jsou jimi: •
Clona
•
expoziční čas
Obrázek 26 Expoziční čas
Expozičním časem se nastavuje, po jakou dobu zůstane po stisknutí spouště na fotoaparátu clona otevřená. Po stisknutí spouště se clona rychle otevře a po uplynutí nastaveného času zavře, během čehož na film dopadnou paprsky světla. Protože film reaguje na světlo, tak čím déle bude světlu vystaven, tím světlejší obrázek bude. Hodnoty expozičního času (v
43
sekundách) a jeho vhodné nastavení podle osvětlení fotografovaného prostředí je znázorněno na vedlejším obrázku. Důležité taktéž je, že lze nastavit nejen to, na jak dlouho se při stisknutí spouště clona otevře, ale též jak moc se otevře. Laicky řečeno se v podstatě jedná o otvor, který propouští více světla když je otevřen šíře, než když je otevřen méně. Nejnázornější je přirovnání k zornici u lidského oka. Různé hodnoty clony a jejich příslušnost k šířce jejímu otevření jsou znázorněny na obrázku. Platí, že čím větší je hodnota clony, tím méně světla objektiv propustí. Volba expozičního času závisí na tom, zdali fotografujeme statický, nebo pohybující se objekt. Když chci fotit vozy WRC na Barum Rally, nemohu nastavit čas na 1/100 – výsledek by byl rozmazaný. Rychle se pohybující objekty bychom měli fotit s časem 1/1000 a menším. Jaký nejnižší expoziční čas je k dispozici, to záleží na kvalitě fotoaparátu. U lepších fotoaparátů lze nastavit čas i na 1/8000, čímž lze doslova ostře zachytit kulku vystřelenou z pistole. U levnějších automatických fotoaparátů naopak nedosahuje expoziční čas příliš nízkých hodnot, kupříkladu pouze 1/500 s. Pokud chcete s tímto fotoaparátem nerozmazaně zachytit třeba rychle jedoucí auto, je třeba jej v hledáčku fotoaparátu stále sledovat, tedy i během stisknutí spouště. Okolí sice bude rozmazané, ale auto ne. Tedy za předpokladu, že jste jej měli během focení stále v centru hledáčku, což chce bezesporu notnou dávku citu a zkušenosti.
Obrázek 27 Clona
Rovněž u kvalitnějších fotoaparátů si lze nastavit takzvanou prioritu času nebo prioritu clony. Jejich význam je v tom, že pokud si nastavíte jednu z těchto hodnot (čas nebo clonu), ta druhá se automaticky dorovná tak, aby byl film správně exponován. Ovšem pozor – když nastavíte velkou clonu ve tmavé místnosti (tedy při nedostatku světla), nastaví se automaticky expoziční čas na příliš vysokou hodnotu a váš sebemenší pohyb s fotoaparátem fotku rozmaže. Pokud používáte fotoaparát s manuálním nastavením expozičního času i clony, je vhodné k jejich určení používat takzvaný expozimetr. Jedná se o měřič světla, který ukáže hodnotu světla v luxech a podle tabulky, která se k němu dodává, určíme optimální hodnotu clony a času. Expozimetr se buďto dodává zvlášť, nebo je přímo součástí fotoaparátu.
44
Různé kombinace nastavení expozičního času a clony jsou alfou a omegou fotografování. Kupříkladu lze měnit hloubku ostrosti, kterou ovlivňuje právě nastavení clony. Když použiji velkou clonu, tak budu mít ostré předměty ve velmi širokém rozptylu od objektu, který primárně zaostřuji. Naopak když použiji malou clonu, bude ostrý jen objekt, který primárně zaostřuji, a jeho okolí (popředí a pozadí) bude více či méně rozmazané. Srovnání nastavení clony můžete vidět na srovnávacím obrázku se třemi fotografiemi. Jak vidíte, pozadí je na obrázku vpravo zcela rozmazané a na obrázku vlevo jakž takž ostré. Je to tím, že u ostrého obrázku je foceno s nízkou clonou f 2.8, takže vzdálenější objekty jsou vrženy dále od ohniska zaostření. No a pokud je clona vysoká (třeba f 22), je objekt na pozadí ostřejší. Nicméně v takovém případě bylo zapotřebí více světla, tudíž delší expoziční čas a pokud by se objekty v popředí pohybovaly, byly by rozmazány zase ony.
Obrázek 28 Nastavení expozice
5.3.3. Programy na úpravu obrazu Tato kapitola je zaměřena na software pro zlepšení kvality barevných či černobílých obrazů získaných z vizualizačních experimentů, které mají charakter fotografií a na počítači jsou uložené ve formě bitových map. Software pro úpravu kvality obrazů obvykle obsahuje: •
Nástroje pro práci s obrazovými soubory – vytváření souborů, načítání souborů s různým rozšířením, ukládání souborů s různým rozšířením, tisk obrazů, scannování obrazů, snímání obrazů z fotoaparátu či kamery apod.
•
Základní editační nástroje - návrat a opakování posledního úkonu, mazání, kopírování a vkládání části obrazu, přesouvání částí obrazu, změna měřítka zobrazení obrazu, apod.
•
Nástroje pro úpravy geometrie obrazu - zvětšování okrajů obrazu, definování dočasně aktivních vnějších či vnitřních oblastí, a to obdélníkových, kruhových či polygonálních, změna počtu bodů v obraze, ořezání obrazu, různá překlopení a otočení obrazu, apod.
•
Nástroje pro globální úpravy kvality obrazů - kontrast a jas, vytvoření negativu, změna barevných tónů, zmenšení hloubky barev či šedých odstínů, konverze barevných 45
obrazů na černobílé (i opačně), „červené oči“ (což je odstranění červených očí z fotografie), filtry pro vyhlazení či zvýraznění zrnitosti v obraze, speciální filtry pro různé další efekty v obraze, nástroje pro požadované deformace obrazů, nástroje pro skládání obrazů, nástroje pro histogram, ekvalizaci apod. •
Nástroje pro lokální úpravy obrazů - razítkování, zvětšování a zmenšování intenzity, rozmazávání a různé kreslící nástroje (kreslení bodů, úseček, obdélníků, polygonů, hvězdic, kružnic, křivek, vyplňování oblastí stejné barvy jinou barvou, vyplňování oblastí po hranici s definovanou barvou, záměna barev v obraze, aplikace spreje, štětce či gumy, psaní textů, nastavování barev a tlouštěk čar pro kreslení apod.).
•
Nástroje umožňující některé uživatelské úpravy software - uspořádání oken jednotlivých obrazů a ovládacích panelů, zobrazení měřítek okolo obrazu a další.
•
Nástroje poskytující různé informace - o poloze a barvě na pozici kurzoru, o velikosti okna či vkládaného objektu, o parametrech obrazu, o operačním systému a počítači, informace o autorech, návod k obsluze apod.
Na trhu se lze setkat s celou řadou komerčně dostupných počítačových produktů pro úpravu kvality obrazů. Známé jsou programy Adobe PhotoShop, Aldus Photo Styler, Corel Draw, Microsoft Photo Editor, Paint Shop Pro apod. Komerční produkty obsahují stále širší nabídku možností v oblasti úprav kvality obrazů.
ACDSee Nejpopulárnějším a také nejspíš nejlepším prohlížečem obrázků je prohlížeč ACDSee. ACDSee je nejrychlejší dostupný prohlížeč, konvertor grafiky a nástroj pro sdílení obrázků určený pro systémy Windows – nyní i možností odstranění „červených očí“. Poskytuje nejvýkonnější grafické nástroje, funkce dávkových souborů a podporu plug-in, takže můžete vylepšovat, konvertovat a bezprostředně sdílet své obrázky na Internetu. S ACDSee rovněž získáte rychlý prohlížeč obrázků typů TIFF & JPEG a thumbnail náhledů. Je to ideální software pro zpracování grafiky, podporu digitálních fotoaparátů a fotografické služby.
Media Explorer 5 Program vytvořený brněnskou firmou Zoner software. Media Explorer 5 dosáhla prestižního ocenění Best of Invex a zařadila se mezi absolutní špičku mezi grafickými prohlížeči a editory pro úpravu digitálních fotografií.
46
5.4.
Morphing a warping
5.4.1. Warping Warping znamená aplikaci transformace na jediný obrázek, která se touto transformací mění jako v křivém zrcadle. Český bychom mohli říct, že warping znamená kroucení nebo muchlání obrazu.
Obrázek 29 Warping
5.4.2. Morphing Jednou z klíčových vlastností počítačové animace je dynamika. Objekty se mohou různě pohybovat, vzájemně interagovat a v některých případech i měnit svůj tvar. Změna tvaru je přirozeným fenoménem i v přírodě – rostliny a živočichové během svého života rostou a mění tak svůj tvar, stromy se rozvětvují, květiny rozkvétají, živočichové nabírají sílu. Pokud chceme tento jev zachytit i v počítačové animaci, používáme animační techniku známou jako morphing. Morphing - je tedy proces počítačové grafiky, kdy se jeden obrázek postupným přechodem přeměňuje v druhý. Proces morfování lze pomocí mnoha parametrů, řídících bodů a křivek dokonale řídit a docilovat tak velmi přesvědčivých efektů. Morphing samozřejmě nemá uplatnění pouze v animaci přírodních jevů (růstové simulace), ale používá se zejména pro tvorbu nejrůznějších speciálních efektů nebo v oblasti designu, kde lze kombinacemi existujících tvarů vytvářet tvary nové.
Obrázek 30 Morphing
47
6. ZPRACOVÁNÍ VIDEA 6.1.
Základní pojmy
Ve slovníku pod pojmem „video“ najdeme definici: Přívlastek označující cokoli, co se týká zobrazování a zobrazovacího signálu. Nepřesně řečeno je to všechno to, co je zobrazováno na obrazovce, televizi či monitoru. Obecně je video sekvencí obrázků rychle po sobě jdoucích tak, že vznikne pro diváka iluze pohybu. Samozřejmou součástí videa je zvukový doprovod pohybujícího se obrazu. Bylo zjištěno, že postačuje poměrně nízká snímková frekvence, aby došlo k iluzi pohybu. 6.1.1. Analogové a digitální video První věc, kterou si vysvětlíme je rozdíl mezi analogovým a digitálním videem. Televize či video monitor jsou analogová zařízení. Analogový signál je tvořen plynulou řadou měnících se vlnových průběhů. To znamená, že úroveň signálu se může v daném čase pohybovat mezi minimální a maximální hodnotou. Digitální signál přenáší hodnoty úrovně signálu ve vybraných okamžicích průběhu. Typ digitálního signálu je binární, popisuje danou hodnotu jako řadu maximální (jednička) a minimálních (nula) hodnot. Tato řada jedniček a nul může být na přijímacím konci interpretována jako čísla vyjadřující původní informaci. (Obrázek 31)
Obrázek 31 Videosignál
Největší nevýhoda analogového signálu je ta,že nelze rozpoznat na přijímacím zařízení užitečný signál od šumu (Obrázek 32), který se vždy přidá během přenosu. Při opakovaném přenosu nebo kopírování se přidává další šum a z toho vyplývá nižší věrnost přenosu.
48
Obrázek 32 Šum
V digitálním signálu je daleko snazší odlišit užitečný signál od šumu a tím je zajištěna velmi vysoká věrnost při přenosu. Z toho důvodu je možné digitální signál přenášet a kopírovat bez ztráty kvality. V současnosti dochází k velkému přechodu z analogové a digitální technologie. Mnoho domácností již přijímá digitální signál pomocí kabelu nebo satelitu. Také při střihu video se opouští od analogového střihu a přechází se na střih nelineární. 6.1.2. Lineární a nelineární střihové systémy Pokud lineární systém zjednodušíme, můžeme říci, že je tvořen dvěma stroji - příspěvkovým (playerem) a nahrávacím (recorder). Samotný střih pak probíhá tak, že v přehrávači běží pásek s originálním záznamem a na recorder se nahrávají pouze vybrané záběry v požadovaném pořadí a délce. Limity takového řešení jsou přitom zřejmé na první pohled: neustále musíte převíjet kazetu s originálním záznamem (nemluvě o náročné orientaci v hodinách natočeného materiálu) a především není možné zpětně upravovat již provedené střihy. Ačkoliv jsou lineární střižny dosti neohrabané, lze se s nimi dodnes setkat například v televizním zpravodajství, kde není třeba žádné velké kreativity a navíc často nezbývá čas na přenášení záznamu do počítače. V běžné filmové nebo dokumentární tvorbě však stále více ustupují počítačům. Vznik NLE (Non-Linear Editing) neboli nelineárních střihových systémů byl umožněn stoupajícím výkonem počítačových procesorů a rostoucí kapacitou pevných disků s vysokou přenosovou rychlostí. Jako nelineární je nazýván proto, že umožňuje záznam v počítači roztřídit do jednotlivých záběrů a ty pak libovolně skládat v požadovaném pořadí. Během střihu se navíc můžete kdykoliv vrátit a libovolný záběr zkrátit nebo změnit pořadí. To vše pouhým přetažením myší. Do určité míry tedy můžeme říci, že rozdíl mezi lineárním a nelineárním střihem je stejný jako mezi psaním na mechanickém psacím stroji a v textovém editoru. Jakékoliv místo lze dodatečně upravit a donekonečna tak bez větších obtíží pilovat finální podobu filmu, nemluvě o snadné orientaci ve zdrojovém záznamu, který lze organizovat stejně jednoduše jako soubory na pevném disku například do složek podle jednotlivých scén atp. 6.1.3. Snímková rychlost a rozlišení Snímková rychlost – počet snímků, který se vystřídá za vteřinu. Pro plynulý pohyb je potřeba minimálně 10 snímku za vteřinu. Filmy, které jsou promítány v kině jsou promítány
49
rychlostí 24 snímků za vteřinu. Filmy, které vidíme v televizi mají snímkovací rychlost 25 snímků za vteřinu. Rozlišení – množství informace obsaženo ve snímku. Rozlišení je reprezentováno počtem pixelů (obrazových bodů), které jsou na obrazovce. Jsou dány počtem horizontálních krát vertikálních bodů. Jinak řečeno výškou a šířkou, respektive počtem řádků a sloupců. Standardní rozlišení obrazu jsou 320x200, 640x480, 1024x768, 1280x1024, 1600x1200. Čím vyšší rozlišení, tím vyšší kvalita obrazu. 6.1.4. Vysílací normy Existují tři televizní normy v celém světě. Tyto formáty jsou známy pod zkratkami NTSC, PAL a SECAM. Je možné provádět konverze mezi jednotlivými normami, ale kvalita signálu bude díky rozdílné snímkové frekvenci a rozlišení snížena. Tabulka 4 Vysílací normy
Vysílací Země formát NTSC Severní Amerika, Japonsko, Korea PAL Austrálie, Čína, většina Evropy (ČR), Jižní Amerika SECAM Francie, střední východ, většina Afriky
Rozlišení 525 řádků 625 řádků
625 řádků
Snímková frekv. 30 snímků/s 25 snímků/s 25 snímků/s
6.1.5. Prokládané a neprokládané video Pokud budeme prezentovat video na běžném televizním přijímači, použijeme tzv. prokládané video. Při skutečném televizním přenosu se pohyb paprsku rozdělí na 625 řádků, kdy se snímají nejdříve liché řádky a pak řádky sudé. To znamená, že elektronový paprsek nejprve projede všechny liché řádky a poté se vrátí na začátek a projíždí řádky sudé. Těmto dvěma sadám řádků říkáme „horní“ (liché) a „dolní“ (sudé) půlsnímky. Televize, která zobrazuje 25 snímků za sekundu ve skutečnosti zobrazuje 50 půlsnímků za sekundu. Jak to vlastně funguje? Elektronový paprsek přejíždí přes vnitřní stěnu stínítka obrazovky, kde jsou naneseny luminoforové vrstvy. Luminofor potom září světlem, které vidíme. Intenzita paprsku řídí intenzitu vyzařovaného světla. Paprsek projíždí postupně řádky obrazovky a když dosáhne spodního okraje, vrací se zpět na začátek. V prvních televizích měli dostupné luminofory velmi krátkou dobu svítivosti (tzn. po krátké době po ozáření elektronovým paprskem přestávaly vydávat světlo). Proto za čas, než paprsek proběhl až na dolní konec obrazovky luminofory na horní části již přestávaly svítit. Promítání prokládaného videa na počítačích skýtá drobné problémy. Obrazovky monitorů jsou mnohem dokonalejší zařízení, než televizní obrazovky. Nejenže zvládají mnohem vyšší snímkové (obnovovací) frekvence (75, 85, 100, některé až 150Hz), ale také vykreslují celý obraz najednou. Zachytávací karty, ale i video z digitálních kamer ukládají video frekvencí 25 snímků za vteřinu a to tak, že zkombinují dva půlsnímky, jeden s lichými řádky a druhý se sudými řádky, do jednoho snímku. Při přehrávání obyčejným přehrávačem je přehrávání špatné, protože přehrávač zobrazuje 25 snímků za sekundu. Každý snímek ale obsahuje dva půlsnímky z jiného časového okamžiku a půlsnímky mohou být vůči sobě posunuty. Při přehrávání tedy dochází k nepříjemnému efektu proužkování. 6.1.6. Barevné modely RGB – je způsob popisu barvy založen na barevných složkách R(červená), G(zelená), B(modrá). RGB systém má běžný počítačový monitor.
50
Každý bod, který vidíme, se skládá z červeného, zeleného a modrého světla luminoforů, které jsou velmi blízko u sebe. Naše oko složí jednotlivé složky a my vidíte jeden barevný bod. Tři barevné složky RGB jsou v počítačovém světě běžně nazývány barevné kanály. Počítač ukládá a přenáší barvy jako 8 bitovou informaci pro každý barevný kanál RGB, to dává dohromady24 bitovou informaci, tedy více než milion možností barvy pro každý jednotlivý bod. Tento systém zobrazování barev je znám také jako „24-bitová barva“.
Obrázek 33 Barevný model RGB - video
Barevné televize přišly až o několik desítek let později po černobílých televizích. To mělo za následek, že inženýři museli vyvinout systém, který by byl kompatibilní, aby bylo možné zobrazovat barevný obraz na černobílých televizích, samozřejmě černobíle, a naopak aby bylo možné přehrávat černobílé vysílání na barevných televizích, samozřejmě černobíle. YUV – televizní signál je přenášen a ukládán v YUV. Používá se proto, aby byla zajištěna kompatibilita černobílého a barevného vysílacího signálu. „Y“ je luminance používaná v černobílé televizi a „U“ a „V“ znamenají nové barevné složky, určují odstín a barvu bodu. Luminance potom jeho jas. Při ukládání videa v počítači se při převodu do číslicové formy nejprve oddělí jasová složka „Y“ od barevné. Následuje převod pomocí rychlých A/D převodníků, každá složka zvlášť, přičemž barevné složky se vzorkují poloviční frekvencí než jasová, protože informace v signálu stejně není. Výsledkem pak je jeden snímek o 567 řádcích a 720 jasových a barevných bodech, což odpovídá šířce pásma (rozlišení) normy PAL. Máme tedy tři složky: jasovou Y a barevnou U, V. Tomuto formátu se říká YUV. S těmito formáty se ale pracuje špatně, protože je nelze jednoduše sčítat, průměrovat apod., tedy editovat. Převádí se proto do formátu RGB, kdy se přepočítá jasová a barevné složky na známou trojici červená R, zelená G a modrá B. S tímto formátem již lze provádět výpočty, které jsou potřeba například pro počítání přechodových efektů, korekci barev apod. Převody mezi formáty RGB a YUV ale nejsou přesné a při převodech dochází ke ztrátě informace, a proto je třeba se vyhnout zbytečným několikanásobným převodům mezi těmito formáty. Rovnice pro převod mezi RGB a YUV:
51
6.1.7. Vzorkování barev Pokud pracujeme s obrazem RGB, používáme stejný počet bitů pro uložení třech barevných komponent. Pokud ovšem pracujeme s videem YUV, můžeme s výhodou využít vlastností lidského oka, které má vyšší citlivost na změnu jasu (luminance), než nazměnu barvy (chrominance). Místo toho, aby se všechny informace ze složek YUV ukládaly, stačí pro uložení v profesionální kvalitě uložit jen polovinu bavevných informací na rozdíl od složky Y (luminance). Toto je barevná komprese 4:2:2 barev, což znamená, že každé čtyři vzorky obsahují jen dva vzorky každého barevného signálu. Tento systém umožňující uspořit šířku pásma ve vysílaném analogovém signálu můžeme použít pro úsporu datového místa v digitálním signálu. Signál YUV může být kompresován metodou barevného vzorkování 4:2:0. Kamery DV ukládají pro úsporu datového prostoru video s kompresí 4:2:0 (pro systém PAL). Systém 4:2:0 spočívá v tom, že každé dvě řádkové informace luminance používají společný řádek chrominance v kompresi 4:2:2, čímž je barevné rozlišení sníženo na polovinu nejen ve vertikálním, ale i v horizontálním směru. Barevná informace je tedy čtvrtinová oproti původní. Snížení barevného rozlišení na polovinu může, v některých případech, mít za následek viditelné „artifakty“ v barevném obraze.
Obrázek 34 Barevné vzorkování
6.1.8. Analogové video formáty Existují tři základní typy analogového video propojení: a) Kompozitní – je to nejjednodušší propojení, používá se kompozitní kabel. Kabel používá jediný vodič pro přenos obrazového signálu. Luminance a barvonosná složka signálu jsou smíchány a přenášeny najednou. Je to nejméně kvalitní spojení,protože spojuje dva signály do jednoho kabelu.
52
b) S-video – kabel senátně přenáší luminanci a barvonosnou složku po zvláštních vodičích. Jednotlivé separátní vodiče jsou uvnitř jediného společného kabelu. Je to kvalitnější spojení. c) Komponentní – nejlepší typ analogového spojení. Každý signál YUV má svůj vlastní kabel Tabulka 5 Základní formáty videa
Formát pásky Formát videa VHS Kompozitní S-VHS, Hi-8 S-Video BetaSP Komponentní
6.2.
Kvalita Dobrá Lepší Vynikající
Typické použití Domácí video Náročný uživatel, průmysl Průmysl, vysílání
Video komprese
Velikost nekompresovaného videa je obrovská, proto je nutná jeho komprese. Jeden nekomprimovaný snímek má velikost asi 1MB. Lze to spočítat tak, že násobíme horizontální rozlišení vertikálním (např. 720 x 625) a vše ještě třemi byty RGB barevné informace. Běžná snímková rychlost je 25 snímků za sekundu, takže vychází na každou sekundu nekompresovaného videa asi 25MB datového prostoru, pro každou minutu asi 1,5GB. Cílem komprese je zmenšení datového toku při zachování kvality obrazu. Formát komprese může být například 5:1 což znamená, že video je kompresováno na pětinu původní velikosti. Video na Internetu může mít kompresi 50:1 i více.
Typy komprese a) Zmenšení velikosti – např. snímek o velikosti 640x480 je zmenšen na 320x240 a zabírá tak 4x méně místa na disku. b) Snížení snímkové rychlosti – např. video o 25 snímcích za sekundu může být sníženo na 12-ti snímkové. c) Oříznutí barevné informace – lidské oko je více citlivé na změny jasu obrazu, než na změny barvy. Proto tato techniku pracuje tak, že odstraní velkou část barevné informace z obrazu. Intra-frame – je komprese, kdy je každý snímek kompresován samostatně. Inter-frame – neukládá každý snímek, ale uloží jen rozdíly od předchozího snímku. Kodek – řídí kompresi a dekompresi videa. Kodek je tedy mechanismus, který snímky daného videa zakóduje do menší podoby a při přehrávání videa jej zase dekóduje již v reálném čase. Kodeky můžeme dále rozdělit na ztrátové a bezeztrátové. Bezeztrátové kodeky mají tu výhodu, že video neztratí žádnou informaci. To je ale vykoupeno nízkým komprimačním poměrem, většinou se poměr komprese pohybuje 1:2. Ztrátové kodeky naopak využívají toho, že obraz nemusí být naprosto dokonalý, dokonce může být zkreslený, až drasticky. Různé kodeky se dále liší kvalitou, rychlostí a výslednou velikostí komprimovaného videa, která je většinou v poměru k nekomprimovanému originálu 1:4-1:100.
53
6.2.1. Bezeztrátové kodeky
RAW RAWnení to vlastně žádný kodek, ale již zmíněný nekomprimovaný formát. Pro plný PAL (720x576) má datový tok 31,1 MB/s, pro poloviční PAL (352X288) má datový tok 7,6 MB/s
HuffYUV Tento kodek komprimuje video s použítím Huffmanova kódování. V nejlepším případě komprimuje až na 40% původní velikosti. Zvládá kompresi obrazu v barevném formátu RGB i YUV, je velmi rychlý a je zdarma. 6.2.2. Ztrátové kodeky
D1 D1 byl první nekomprimovaný digitální formát pro záznam obrazu a zvuku, vyvinutý firmou SONY v roce 1986. Ačkoliv je stále brán v úvahu jako referenční signál s maximální kvalitou, je i pro profesionální použití příliš nákladný.
Komprese DV Objevila se s příchodem DV kamer, používá se v DV systémech. Díky digitálnímu způsobu záznamu se dosahuje vynikajícího horizontálního rozlišení kolem 500 řádek s neomezenými možnostmi bezeztrátového kopírování a počítačových úprav. Obraz je komprimován DV procesorem v kameře a následně ukládán v digitálním formátu na kazetu. Při přehrávání na analogový výstup se zpětně provádí dekomprese. Používají speciální kazety s páskou, tzv. mini-DV. Kvalita DV pásek je vyšší než kvalita pásek analogových, menší rozměry pásku přinášení menší DV kamery. Velikost mini –DV se rovná polovině běžné audio kazety. Video s kompresí DV může být uloženo v běžných datových nosičích jako je pevný disk nebo CDROM. V počítači se upraví a zase se může nahrát zpět do kamery. Nejpoužívanější typ DV komprese používá pevný datový tok pro video 25 Mb/s. Tato komprese se jmenuje DV25. Výhody DV – Kamera DV provádí snímání ve velmi vysoké kvalitě. DV zvuk je v porovnání s analogovým zvukem také kvalitnější. Je nahráván se vzorkovací frekvencí 48kHz a s rozlišením 16 bitů. Protože spojení s počítačem je digitální, nedochází ke snížení kvality videa při přenosu.
Komprese DV25 DV25 používá napevno nastavený kompresní poměr 5:1. V přenosu je obsažen také zvuk a řídící signály, takže datový tok je nakonec 3,6MB/s. To znamená, že jedna hodina kompresovaného DV videa potřebuje asi 13 B datového prostoru. Z toho vyplývá, že každá 60-ti minutová mini-DV kazeta představuje 13GB datového prostoru.
Komprese MJPEG Tento formát je zkratkou Motion JPEG. Jedná se o sekvenci snímků JPEG po sobě tvořící video. Jeho velkou výhodou je snadnost střihu, protože komprese se provádí v jednotlivých snímcích. Tento kodek má většinou volitelný kompresní poměr v rozmezí 6:1 do 16:1. Při kompresním poměru 1:8 je kvalita obrazu stále ještě velmi dobrá a datový tok se pohybuje kolem 4 MB/s a dosahuje tak dobrého poměru kvalita/velikost. Velikou předností tohoto kodeku je, že každý snímek je komprimován samostatně a je tedy vždy klíčový. Proto je tento kodek velmi vhodný pro střih videa na počítači. Zároveň je implementován hardwarově v
54
mnoha polo-profesionálních zachytávacích kartách a zachytávání pak funguje bezproblémově i na velmi pomalých počítačích (stačí CPU 300MHz). Častou nevýhodou takto hardwarově implementovaného kodeku je nemožnost přehrát zachycené video na jiném počítači bez tohoto hardware.
Formáty MPEG MPEG vyvinula společnost „Motion Picture Experts Group" - mezinárodní organizace filmových a video profesionálů, která se zabývá vývojem tohoto standartu. Výhodou je nezávislost na platformě. V současné době se používají tyto formáty:
MPEG-1 Tento formát existuje již od roku 1991. Komprese spočívá v tom, že každý x-tý snímek je uložen kompletní (I-snímek) a ostatní jsou definovány jako rozdíly mezi nimi (P-snímek a Bsnímek). I snímky jsou snímky klíčové, jsou komprimovány obdobně jako MJPEG, ale navíc s možností komprimovat různé části obrazu různým stupněm komprese. P-snímky jsou kódovány s ohledem na nejbližší předchozí I nebo P-snímek. B-snímky jsou pak dopočítávané jako rozdílové snímky mezi nejbližším předchozím I nebo P-snímekm a nebližším následujícím I nebo P-snímkem. Celá sekvence snímků (od jednoho I po další I snímek) se pak nazývá GOP (Group of Pictures) a standardní MPEG stream používá pořadí IBBPBBPBBPBBPBBPBB. Z pohledu zabíraného místa pak I snímky zabírají nejvíce místa, po nich jsou P snímky a úplně nejméně místa zabírají snímky B. Komprese MPEG-1 se nehodí pro střih videa z důvodu vzdálených klíčových snímků. V dnešní době je již tento kodek zastaralý, přesto je to nejkompatibilnější formát. Jeho hlavním kritériem bylo zachování rozumné kvality při redukci datového toku na přijatelnou mez.
MPEG-2 MPEG-2 byl dokončen v roce 1994 a stal se standardem pro kompresi digitálního videa. Jeho základní princip je stejný jako u MPEG-1, ale umožňuje datový tok až do 100Mbitů/s pro digitální TV, video filmy na DVD a pro profesionální studia. Také rozlišení bylo zvětšeno a dává daleko lepší výsledky než MPEG-1. Formát MPEG-2 je výborný pro distribuci, ale málo vhodný pro přímé nahrávání a editaci videa. Používá kompresní schéma jak inter-frame (snímková komprese), tak intra-frame (mezisnímková komprese). Typ intra-frame spočívá ve sledování pohybu částí obrazu ve snímcích. Tento systém je velmi časově náročný. Vyžaduje mnohonásobně více času pro kompresi videa než pro jeho dekompresi při přehrávání, což velmi zatěžuje procesor počítače. Dále musí mít k dispozici najednou mnoho okolních snímků pro správný výpočet komprese. Příklad: Chceme provést změnu snímku 128, musí se načíst navíc ještě snímky 124, 125, 126 a 127 pro výpočet aktuálního snímku 128.
MPEG-4 Vývoj standardu MPEG-4, jehož formální označení je ISO/IEC 14496, byl dokončen v říjnu 1998 a jako mezinárodní standard byl přijat v březnu 1999. Je to nejnovější video formát a jeho cílem je dát co nejlepší kvalitu při co nejnižším datovém toku 10kbit/s - 1Mbit/s. Byl použita nová metoda pro přístup k objektům obrazu, takže mohou být zpracovávány samostatně. Hlavním použitím je přenos videa přes internet a při mobilní komunikaci.
55
ASF, WMV Firma Microsoft vyvinula formát ASF (Advanced Streaming Format), určený především pro stream videa. ASF je formát i komprese, vychází z formátu AVI a dovoluje použít pouze kompresi Microsoft MPEG4. Firma Microsoft uvedla i formát WMV, který je novější verzí ASF. Komprese ASF částečně implementuje MPEG4, nepodporuje totiž B-snímky. Nevýhodou tohoto formátu je jeho uzavřenost. Nelze ho použít jinými programy než od firmy Microsoft. Dále umožňuje maximální rozlišení pouze 352x288.
DivX 3.11 a Alpha Je nelegální a upravená verze kodeku ASF MS-MPEG4v3. Microsoft v beta verzi tohoto kodeku umožňoval ukládání videa do formátu AVI, ale ve finální verzi toto zakázal. Přesto se skupině programátorů podařilo upravit finální kodek tak, aby umožňoval dále kompresi do formátu AVI. Vznikem tohoto nelegálně upraveného kodeku byly také odstraněné některé špatné vlastnosti kodeku ASF. Již nebylo omezeno maximální rozlišení na 352x288. Tento kodek byl velice populární. Na jedno cd se s jeho pomocí podaří uložit až 1 hodina filmu ve velmi dobré kvalitě. Snížením datového toku lze samozřejmě nahrát více, ale na úkor kvality. V dnešní době jsou již novější verze tohoto kodeku, které už jsou legální.
DivX 4 Skupina lidí, kteří upravili kodek DivX 3.11 Alpha se rozhodla vytvořit vlastní kodek. Z výchozího projektu nazvaný OpenDivX vyšla první verze nazvaná DivX 4, bohužel však nedosahovala kvalit kodeku DivX 3.11. Kodek DivX 4 podporuje několik variant komprese. •
jednoprůchodová s daným datovým tokem Snaží se při kompresi videa dodržet daný datový tok. Mnohdy jej ale nedodrží a vytvoří kódované video mnohem větší než předpokládané.
•
jednoprůchodová s danou kvalitou Komprimuje tak, aby kodek dosáhl dané konstantní kvality. Nevýhodou je nepředvídatelná velikost souboru.
•
dvouprůchodová. Provádí se dvěma průchody komprimovaného videa. Při prvním průchodu se analyzuje komprimované video a zapisují se získané informace do osovacího souboru. Při druhém průchodu se využívá informace z prvního průchodu a efektivněji se využívá datový tok. Pro scény s vyšší Komprese DivX 4 používá I a P snímky. Podporuje také proměnlivou vzdálenost I-snímků.
DivX 5 Tento kodek je kompatibilní s MPEG-4, komprimuje do formátu MPEG-4 Simple Profile a zvládá přehrávání předchozích verzí kodeku DivX, MPEG-4 Simple Profile, MPEG-4 Advanced Simple Profile a H.263 (videokonference). DivX 5 používá pokročilejší techniky při kompresi a oproti DivX verze 4 dosahuje zlepšení kvality až o 25% při zachování velikosti souboru. DivX 5 má integrované některé nástroje/filtry v sobě a umožňuje tak přímo při kompresi změnit rozměry obrazu, ořezat obraz a jiné. Dále implementuje algoritmy pro zvýšení komprese využitím tzv. psychovizuálního modelu. Při něm se dosahuje lepší komprese bez znatelné ztráty kvality a to díky znalostem o lidském vizuálním systému. Implementuje
56
obousměrnou kompresi, tedy B-snímky. Dále tzv. globální kompenzaci pohybu, což je algoritmus, který optimalizuje kompresi pro panorámování, roztmívání obrazu, přibližování, náhlé změny jasu (exploze), stagnující plochy (voda) a další. Kodek také umí export čistě do MPEG-4 formátu a konverzi mezi ním a AVI formátem. Také podporuje barevné formáty YUV a RGB.
XviD Někteří programátoři pracující na OpenDivXu si vzali zrodové kódy a začali vyvíjet vlastní verzi kodeku zvanou XviD. XviD je opět MPEG-4 kompatibilní kodek a implementuje mnoho vlastností MPEGu 4, bohužel zatím nepodporuje obousměrné kódování (B-snímky). Kodek zajišťuje vysokou kvalitu videa při nízkém datovém toku. Umožňuje bohaté nastavené kodéru, na druhou stranu to vyžaduje vyšší nároky na znalosti uživatele. Rozdíly mezi XviD a DivX jsou velmi malé, spíš jde o subjektivní záležitost. Při nastavení obdobných parametrů je DivX o něco rychlejší, XviD má zase o něco lepší kompresní poměr. Největší rozdíl je v tom, že XviD je, na rozdíl od DivX, zdarma.
6.3.
Programu pro střih videa
Virtual Dub Tento freeware je v plné verzi dostupný zdarma na internetu (např. www.stahuj.cz). Na pevném disku vám tento program zabere pouze 2 MB, instalace není potřebná - prostě jej rozbalíte ze ZIP archívu a spustíte. Program umožňuje základní střihové operace (zkrácení, spojování videosekvencí, vystřižení špatných záběrů apod.). To lze provádět pouze s AVI soubory a MPG soubory ve formátu MPEG-1. Po otevření programu vypadá základní obrazovka prázdně a neutěšeně, ale to se změní po otevření nějakého souboru ke zpracování. Objeví se dvě okna - zdrojové a cílové, ve kterém je vidět výsledek všech aplikovaných změn a filtrů. Hlavní síla programu je v použití filtrů. Filtr je vlastně funkcionalita programu, která umožňuje provádět určité transformace s videem. K dispozici jsou základní filtry jako změna velikosti obrazu, odstranění prokládání videa, rotace obrazu, vložení titulků v textovém formátu SSA apod. Desítky těchto základních filtrů jsou v programu již obsaženy, a protože je u tohoto programu k dispozici zdrojový kód, mohou si jednotliví programátoři vytvořit libovolné další filtry. Tyto vytvořené filtry si můžete stáhnout z internetu a po zkopírování do složky "Plugins" jsou okamžitě dostupné z programu i pro vás. Ve finále celé práce lze uložit výslednou videosekvenci ve formátu AVI s libovolným kodekem pomocí menu "Compression" . Pokud chcete video otevírat např. v Adobe Premiere, je třeba jej uložit pomocí příkazu "Save Old Format AVI" ve formátu DirectShow a nebo pro operační systém Windows 98 je nutné rozdělit soubory na max. 2GB celky (formát VFW). Toho dosáhnete automatickou funkcí pro rozdělování "Save Segmented AVI", u které můžete nastavit velikost jednotlivých souborů (to se hodí např. při přenášení velkého videopořadu jinam, kdy jej můžete rozdělit na 650 MB části a vypálit na jednotlivá CD). Virtual Dub umožňuje automatické načtení všech částí videopořadu jako jeden celek.
Adobe Premiere Tento software je v současnosti asi jeden z nejpoužívanějších střihových programů. Využívají jej amatéři, zabývající se střihem digitálního i analogového videa v domácích podmínkách. Jeho cena překračuje 20.000,- Kč, ale většinou bývá prodáván za cenu pod 20.000,- Kč v 57
balíku s některou kvalitní střihovou kartou. Možnosti práce s videosekvencemi jsou téměř neomezené, je možno upravovat délku videosekvencí, odstranit nehodící se části záznamu, zrychlovat, zpomalovat a obrátit videosekvenci, vkládat digitální střihy (efekty), klíčovat pohyblivé videosekvence na jakékoliv videosekvence s převládající jednobarevnou plochou, mixovat zvukové stopy a nastavovat jim náběh a doznění zvuku a aplikovat na jednotlivé videosekvence video i audio filtry. Detailní popis tohoto programu naleznete jak v tištěné, tak v elektronické uživatelské příručce.
Ulead Media Studio Tento střihový program je co do funkcionalit srovnatelný s programem Adobe Premiere, avšak jeho ovládání a možnosti jsou zcela jinak koncipovány. Zatímco produkty společnosti Adobe jsou prvotně vytvářeny pro operační systém Macintosh a programy mají ovládání a vzhled vycházející z tohoto systému, společnost Ulead Systems šije své programy na míru uživatelům operačních systémů Windows. Program umožňuje zhruba stejné funkce jako Adobe Premiere, i když má určité odlišnosti, zvláště v ovládání. Další výraznou odlišností je rozdělení celého programového balíku na samostatné programové celky, vzájemně propojené.
TMPGEnc Tento program vám umožní jednoduchou konverzi videa ve formátu MPEG-1/2 na DVD, které si pak můžete přehrát ve svém domácím DVD přehrávači. Obsahuje mimo jiné i zabudovaný videoeditor, který dovoluje provádět úpravy bez nutnosti re-encodingu a ztráty kvality. Uživatelské rozhraní programu používá pětikrokový přístup, kdy vyberete zdrojový video soubor, zeditujete ho, pokud je to nutné, a máte možnost vytvořit DVD menu s rozdělením na jednotlivé kapitoly. Výsledek je vypálen na DVD (pokud máte DVD vypalovačku) nebo je vytvořen ISO obraz tohoto DVD pro pozdější vypálení. TMPGEnc DVD Author podporuje více zvukových stop a obsahuje vypalovací software. Další možností je uložení výsledného videa v MPEG nebo AVI formátu. Shareware verzi tohoto programu si můžete stáhnout na www.stahuj.cz. Minimální hardwarové požadavky jsou Pentium 800 MHz a program je primárně určen pro operační systémy s NT jádrem (Windows XP/2000), ale není vyloučeno, že bude fungovat i pod Windows 95/98/ME.
Pinnacle studio 9 Zdrojem videa u Studia 9 může být stejně u předchozí verze programu buď DV kamkordér připojený na rozhraní FireWire či USB. Při nahrávání videa můžete u Studia 9 opět využít možnosti automatické detekce scén ze zdroje obrazových dat nebo manuálního rozdělování videoscén.. Video, zvukové soubory a obrázky samozřejmě můžete do programu také importovat a poté je "naházet" do ikonkového Storyboardu. Zobrazení názvů klipů je pochopitelně rovněž k dispozici. Hlavní inovací týkající se zpracování videa je totiž následná "automatická editace" obrazu a zvuku. Studio 9 obsahuje několik editačních stylů, které můžete použít na editaci videa včetně titulků, přechodových a video efektů. Při nahrávání analogového videa ze starších pásek lze během editace použít filtr na samočinné čištění obrazu. Jednou z novinek úpravy obrazu či zvuku je například filtr na stabilizaci roztřeseného obrazu natáčeného videokamerou. Stabilizace obrazu funguje překvapivě dobře. Součástí Studia 9 je také několik nových filtrů a přechodových efektů pro efektové úpravy videa - například inovovaný efekt starého filmu, imitace světelných odlesků objektivu apod. Ve Studiu 9 můžete také částečně zkorigovat hladinu šumu ve zvukovém záznamu a potlačit tak různé nežádoucí šumy a ruchy. Součástí programu je tedy sada několika audio efektů jako například různé druhy ozvěny, ekvalizér a také poměrně zajímavé možnosti práce s 58
prostorovým zvukem. Velkou výhodou je to, že lze k programu stáhnout i český manuál, který je velice obsáhlý
6.4.
Přehrávače
Na přehrávání videa existuje spousta přehrávačů. V operačním systému Windows je implementován přehrávač Windows Media Player. Dále je možno použít volně dostupné programy jako jsou BSplayer, Micro DVD player, mv2player atd.
Obrázek 35 Windows Media Player
Micro DVD Player Micro DVD Player se už stal klasikou mezi přehrávači a byly doby, kdy byl téměř jediný. Má plno zajímavých schopností. Nevýhodou je, že je rozhraní kompletně anglicky.
BS Player BS Player je velice dobrý přehrávač, možná ještě lepší než Micro DVD. Podporuje obrovské množství skinů a jeho vývoj je poměrně rychlí, každou chvíli vychází nový "build". Samozřejmostí je bezchybná práce s titulky, změna velikosti okna, mnoho jazykových verzí včetně češtiny, příkazová řádka a množství dalších funkcí.
Obrázek 36 BSplayer
59
mv2player mv2player je český produkt. A to velice kvalitní, protože takové možnosti nastavení, jaké zde máte téměř nikde jinde nenajdete. Podporuje inteligentní detekci filmu i příslušných titulků, velké množství multimediálnách formátů, funkce Komix a Historie. Přímo v přehrávači si můžete nastavit takové věci jako jas, kontrast a mnoho dalších. Vývoj je také poměrně usilovný, nové verze vycházejí poměrně pravidelně.
Obrázek 37 mv2player
Všechny tyto programy umožňují video přehrát, posunout v čase dopředu i nazpět, měnit rychlost přehrávání, zoom, poměr stran apod. Dále pak umožňují přehrávání titulků, měnění fontu, barvy a velikosti. Posunutí titulků dopředu nebo nazpět, nahoru či dolů.
QuickTime Dokáže přehrávat jak lokální soubory stažené z internetu, tak i přímo pouštět video z internetu. Umožňuje přehrávat audio soubory, video soubory, zobrazit texty a dokonce si poradí i s virtuální realitou. Mezi podporované formáty patří: AVI, MPEG, MP3, AVR a mnoho dalších (přibližně na 200). Pozor - nepodporuje formáty RealMedia.
Obrázek 38 QuickTime
60
Přehrávač QuickTime je nejrozšířenějším programem na platformách Apple Macintosh. Později byl předělán i pro operační systém Windows, kde se také hojně využívá na přehrávání multimediálních souborů typu MP3, MOV atd. Nejnovější verze 6.0 byla předvedena nedávno jako nový a mohutně vylepšený přehrávač. Jeho hlavní novinkou je podpora nového formátu MPEG 4, což je nový standard pro kvalitní streaming po Internetu, na nějž Apple vsadil především.
6.5.
Titulky
Externí titulky nejsou přímo ve videu ale v souboru zvlášť (v textovém souboru). Existuje několik formátů externích titulků, nejpoužívanější je většinou formát MicroDVD, a také se často používá formát SubRip.
MicroDVD (*.*) Tento formát je velice používaný. Začátek a konec se zadává do závorek {}. Je stvořen programátory od kterých je Micro DVD player, který tento druh titulků samozřejmě podporuje. Jedinou nevýhodou je snad to, že hodnoty se udávají ve snímcích a tak vetšinou potřebujete vědět framerate. Zalamování řádků se značí symbolem |. Příklad: {402}{497}Sebastiane, Sebastiane, přestaň|špulit pusu. {503}{536}Omlouvám se. Obrázek 39 Formát titulků - MicroDVD
Sub Rip (*.srt) Hodnoty jsou zadány v čase takže fungují u jakéhokoliv framerate. Všechny titulky jsou očíslovány. Zalamování se zde nijak neznačí pouze se text dalšího řádku napíše pod předchozí. Příklad: 1 00:00:16,114 --> 00:00:19,902 Sebastiane, Sebastiane, přestaň špulit pusu.
2 00:00:20,154 --> 00:00:21,473 Omlouvám se. Obrázek 40 Formát titulků - Sub Rip
61
SubViewer (*.sub) Podobný jako SubRip, ale je rozšířený o autora, zdroj atd. Hodnoty jsou zase zadány v čase a k zalomení řádku se používá příkaz [br]. Dá se zde také nastavit barva, velikost a font písma. Společně se Sub Rip patří mezi nejpoužívanější formáty.
Příklad: [INFORMATION] [AUTHOR] [SOURCE] [PRG] [FILEPATH] [DELAY] [CD TRACK] [COMMENT] [END INFORMATION]
[SUBTITLE] [COLF]&HFFFFFF,[STYLE]no,[SIZE]18,[FONT]Arial 00:00:16.11,00:00:19.90 Sebastiane, Sebastiane, přestaň[br]špulit pusu. 00:00:20.15,00:00:21.47 Omlouvám se.
00:00:21.91,00:00:25.87 -Jsem pitomec.[br]-Nejsi pitomec.
Obrázek 41 Formát titulků – SubViewer
62
Substation Alpha (*.ssa) Hodnoty jsou udané v čase, každý řádek titulků začíná slovem Dialogue. Příklad: [Script Info] Title: Original Script: Original Translation: Original Editing: Original Timing: Original Script Checking: Synch Point: Script Updated By: Update Details: ScriptType: v4.00 Collisions: Normal PlayResY: 864 PlayDepth: 0 Timer: 100.0000
[V4 Styles] Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour,TertiaryColour,BackColour, Bold, Italic, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, AlphaLevel, Encoding Style: Default,Arial,50,65535,65535,65535,-2147483640,-1,0,1,3,0,2,30,30,30,0,0
[Events] Format: Marked, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: Marked=0,0:00:16.11,0:00:19.90,*Default,1,0000,0000,0000,,Sebastiane, Sebastiane, přestaň špulit pusu. Dialogue: Marked=0,0:00:20.15,0:00:21.47,*Default,2,0000,0000,0000,,Omlouvám se. Dialogue: Marked=0,0:00:21.91,0:00:25.87,*Default,3,0000,0000,0000,,-Jsem pitomec.-Nejsi pitomec.
Obrázek 42 Formát titulků - Substation Alpha
63
7. PROGRAMY PRO SDÍLENÍ MM SOUBORŮ Peer-to-peer (p2p) programy se zabývají výměnou souborů mezi jednotlivými uživateli internetu. Vyměňovat můžete libovolný soubor. Nejčastěji se ale používají soubory, které mají příponu: MP3, WAV, WMA, MPG, MPEG, AVI, MOV, JPG, GIF, BMP, ISO, IMG, EXE, RAR, ZIP apod. Každý program se zaměřuje na určité typy souborů, které lze tímto vyměňovat. Sdílení souborů po internetu v masovém měřítku odstartoval Napster, který bohužel doplatil na obrovský zájem uživatelů, který pochopitelně nemohl ujít zájmu velkých a mocných mediálních koncernů. Z Napsteru se postupně stává placená služba, což v podstatě znamená, že zájem uživatelů se postupně obrací k jiným formám sdílení souborů po internetu.
7.1.
Jak to funguje
Každý kdo chce využívat tento systém si musí na svůj počítač nainstalovat nějaký peer-topeer program. Instalační soubory těchto programů jsou poměrně malé, většinou do 3 MB. Po nainstalování programu si musíte zvolit jméno (nick) a heslo (password). Pomocí těchto údajů se do systému přihlašujete. Program uloží tyto údaje do registru a pak je za Vás při startu programu pošle na domácí server programu. Domácí server – je server bez kterého by peer-topeer nemohl vůbec fungovat. Po nainstalování programu musíte vybrat, které soubory chcete sdílet (shared) mezi ostatními uživateli. Vaše jméno, heslo a informace o sdílených souborech příjme domácí server. Ten pracuje jako velká vyhledávací databáze, kde jsou uloženy všechny informace o uživatelích a sdílených souborech. Domácí server pracuje tedy jako prostředník mezi jednotlivými uživateli peer-to-peer programů a je to nejdůležitější článek. 7.1.1. Jak probíhá výměna V programu se zadá název souboru, který chceme vyhledat. Program pošle data domácímu serveru a ten prohledá databázi a pokud najde soubory se stejným názvem a pošle informace, kteří uživatelé tento soubor vlastní. Pak záleží na nás, kterého uživatele si vybereme a od koho začneme stahovat. Poté necháme daný soubor stahovat. Soubor se začne stahovat nebo čeká na uvolnění linky. Rychlost stahování závisí na způsobu a rychlosti připojení k internetu druhého uživatele. Mezi nejznámější programy patří: Napster, Morpheus, Kazaa Media Desktop, Grokster, WinMX, Direct Connect, iMESH, MediaSeek a programy sítě Gnutella.
Napster Účelem Napsteru je jednoduché vyhledání a stažení oblíbené hudby v MP3 formátu. Proti jiným programům zaměřeným na vyhledávání MP3 souborů pracuje na jiném principu. Server Napsteru tvoří centrálu internetové sítě vlastníků těchto souborů, kteří volně nabízejí své soubory ostatním zájemcům. Původně protokol specificky pro mp3 byl rozšířen o možnost sdílení jakéhokoliv typu dat. Napster žalovala americká asociace zastupující zájmy hudebních společností (RIAA Recording Industry Association of America) za podporu ilegálního kopírování a distribuce nahrávek. V USA se také množí případy blokování přístupu k Napsteru v univerzitních sítích, neúnosně zatížených studenty stahujícími a vyměňujícími MP3 skladby. Budoucnost výměnného systému založeného Napsterem závisí hlavně na rozhodnutí amerických soudů.
64
Gnutella Program Gnutella pochází od firmy Nullsoft, tvůrce nejpopulárnějšího MP3 přehrávače Winamp. Gnutella převzala myšlenku, se kterou se prosadil program Napster, umožnit výměnu MP3 souborů pomocí Internetu. Principem je zpřístupnění vlastních sbírek MP3 souborů ostatním zájemcům přes Internet. Vzniká tak obrovská databáze skladeb, které je možné bez jakéhokoliv omezení zkopírovat do svého počítače. Protože takový systém nezaručuje žádnou ochranu autorských práv ke kopírovaným zvukovým souborům, je trnem v oku zejména hudebním společnostem a organizacím, které je zastupují (RIAA). Napster již čelí několika žalobám z napomáhání k nelegálnímu šíření nahrávek. Gnutella se do takových potíží ani nestačila dostat, protože ji internetová společnost AOL, jejíž součástí je nyní i Nullsoft, přikázala odstranit ze serveru. Pár hodin, po něž byla volně k dispozici, však stačilo k tomu, aby se program dostal k tisícům lidí a nyní se po Internetu šíří neomezeně dál. Na rozdíl od podobných systémů založených na sdílení MP3 souborů (Napster, iMesh) není Gnutella závislá na hlavním serveru. Strukturu gnutellaNetu vytváří propojený řetěz všech uživatelů, z nichž každý je klientem i serverem zároveň. Takový systém se prakticky nedá zlikvidovat. Další záležitost, kterou se tak podařilo obejít, je možnost blokování přístupu, která hrozí Napsteru zejména v přetížených sítích amerických univerzit. Jelikož Gnutella netvoří centralizovaný systém, potřebujete k připojení do sítě IP adresu jednoho funkčního serveru = jednoho připojeného uživatele. Tuto adresu musíte zadat spolu s číslem portu. Jakmile se jednou připojíte do sítě gnutellaNet, získáte od serveru seznam všech k němu připojených IP.
Morpheus Původního Morpheus byl založen na síti FastTrack. Bohužel firma StreamCast Networks vlastnící Morpheus nezaplatila licenci na užívání této sítě. A tak byl Morpheus odpojen. Firma na to reagovala tak, že přeprogramovala program Gnucleus, který využívá síť Gnutella.
KaZaA KaZaA Media Desktop patří v současnosti mezi nejlepší p2p programy. Používá síť FastTrack, kterou kdysi užíval i Morpheus. Tato síť podporuje kvalitnější vyhledávání a zároveň podá velké množství informací o hledaných souborech. Zjistí Vám velikost souboru, bitrate, délku přehrávání, přibližnou dobu stahování, uživatele vlastnícího soubor atd. KaZaA se nedávno přestěhovala z Holandska do Austrálie, protože zákony v Holandsku zakázaly tuto činnost. U nové verze programu umožňuje vyhledávání MP3 nad kvalitu 128 kbit. Mezi další vylepšení programu patří mimo jiné i možnost přizpůsobit si vzhled programu, podobně jako je to např. u programu Winamp, na základě skinů. Mezi další novinky patří hledání tzv. playlistů, to umožňuje stahovat celá alba. Poprvé se objevuje také hodnocení uživatelů o kvalitě souborů. Podle intenzity hodnocení dává KaZaA přednost ve stahování. Program obsahuje plno nastavení. Má vlastně všechny funkce, které používají dobré p2p programy a sice: nastavení počtu stahovaných souborů najednou, nastavení maximálního počtu sdílených souborů (upload), filtry, firewall a mnoho dalších užitečných funkcí.
Direct Connect DC Pracuje na systému kanálů (hubů). Uživatel si vybere do kterého kanálu se chce připojit (např. Czechchannel) a pokud splňuje podmínky vstupu, bude připojen. Po přihlášení můžete začít vyhledávat a stahovat. Mezi podmínky vstupu většinou patří sdílení určité velikosti souborů. Některé kanály chtějí i několik GB. To mi připadá jako omezení, které naštěstí 65
programy typu FastTrack nemají. Zároveň zde ale odpadají uživatelé, kteří mají svůj anglický název "freeloaders", neboli uživatelé, kteří stahují, ale nic nesdílejí. Součástí programu je i chat. Nainstalováním a spuštěním aplikace Direct Connect se stáváte běžnými uživateli sítě. Není se třeba nikde registrovat, jen si zvolit libovolné uživatelské jméno, nastavit adresáře pro sdílení, zkontrolovat parametry sítě a stáhnout si z domovského serveru seznam přípojných bodů - hubů. Huby mezi sebou nejsou propojeny, jak je tomu v případě Gnutelly, každý prakticky funguje jako samostatný server. Seznam hubů obsahuje ikonu indikující rychlost připojení, jeho název, popis a počet připojených uživatelů. Nyní je venku verze DC++, která má řadu vylepšení oproti starší verzi. Po jednoduché instalaci stačí program spustit. V současné době DC++ patří mezi nejrozšířenější p2p programy a zároveň také mezi nejlepší.
BitTorrent BitTorrent je p2p systém, který se v poslední době těší velké oblibě a je předpokládáno, že se v příštích letech stane důstojným nástupcem DC++. Celý systém je založen na velmi jednoduché myšlence: Uživatelé, kteří si stahují velký soubor, si mohou mezi sebou kopírovat to, co si již stáhli. V praxi to vypadá tak, že velký soubor je rozdělen na několik desítek až stovek menších souborů a tyto jsou potom stahovány. Jakmile stáhnete jednu tuto malou část stáváte se okamžitě jejím šiřitelem. Tzn. další uživatelé jí od vás mohou začít stahovat. Navíc stahujete od více lidí zaráz a tak je vše daleko rychlejší.
Obrázek 43 Distribuce souboru standardní cestou
66
Obrázek 44 Distribuce souboru pomocí BitTorrentu
67
8. MULTIMÉDIA NA INTERNETU 8.1.
Rádio přes internet
Internetové rádia, či chcete-li rádia přes internet, jsou poměrně nová záležitost. S rozvojem internetu a s čím dál kvalitnější kompresí zvuku se i toto médium rozvíjí a jednou pravděpodobně, z větší či menší části, nahradí standardní terestrické vysílání. Jen u nás poslouchá internetová rádia až 30 tisíc lidí denně. Velkou výhodou internetových rádií je, že si svou oblíbenou stanici můžete pustit kdekoliv na celém světě, bez rozdílu kvality zvuku. Navíc jsou dnes rádia, která se specializují jen na určitý hudební žánr a tak můžete celý den poslouchat např. jen jazz nebo třeba metal. Abyste se mohli stát internetovými posluchači, nepotřebujete žádné speciální úpravy svého počítače. Stačí vám k tomu zvuková karta, reproduktory či sluchátka a vhodný multimediální přehrávač. Samozřejmostí je připojení k internetu. 8.1.1. Typy vysílání internetových rádií Vysílání internetových rádií můžeme rozdělit dle dvou hledisek. Z hlediska dramaturgického, podle toho jestli se vysílá „živě“ nebo ze záznamu (pro toto vysílání se používá anglický název on-demand, česky na vyžádání), a z hlediska technického, dle toho jestli se používá streaming archívu či klasický download (pouze u vysílání on-demand). Výhodou streamingu oproti downloadu je téměř okamžitý příjem sekvence, kterou slyšíme, hned po kliknutí na odkaz a také to, že nemusíme stahovat celé zvukové soubory. Streamované audio je schopné automaticky zvolit připojovací rychlost a přizpůsobit tak kvalitu zvuku. V rámci jedné stanice je možné jednotlivé formy vysílání kombinovat, každá metoda ovšem vyžaduje jiná technická řešení. 8.1.2. Co je to streaming a co je oněm dobré vědět Streaming je technologie pro distribuci audio a video vysílání po internetu. Díky streamingu je mediální obsah posílán ze serveru ke klientovi v reálném čase. Soubory se neukládají k posluchači na disk, ale jsou s mírným zpožděním přehrávány, jakmile přicházejí [15].
Komprese: Při streamingu se používá ztrátová komprese, protože digitalizovaný zvuk v CD kvalitě je poměrně náročný na datový tok (přibližně 1,41 Mbps) a v nezkomprimované podobě by se většině uživatelům nedal přes internet distribuovat. V praxi se navíc používá rezerva datového toku zhruba 25 %, to znamená, že pokud je stream určen posluchačům s modemem 56 kbps, je jim většinou určeno vysílání o rychlosti 32 kbps, pro uživatele s 28,8 kbps pak stream o síle 20 kbps atd.
Buffering: Všechny přehrávače využívají při streamingu vyrovnávací paměť (buffer), která (podobně jako například u discmanů) zabraňuje výpadkům zvuku v důsledku nevyrovnaného datového toku. Ten je přímo závislý na vytížení sítě, a tak zvuk rozkouskovaný na jednotlivé packety může dorazit později, než je potřeba. Stream je v důsledku nutného bufferingu někdy až o desítky sekund zpožděný.
68
Šířka pásma: Další podstatnou věcí, s níž je potřeba při streamování zvuku počítat, je šířka pásma, kterým zvuk prochází. Musíme přitom vzít v úvahu, že každý posluchač zatíží linku k serveru o datový tok, v němž poslouchá. Pokud je překročena šířka pásma, stream začne vypadávat. 8.1.3. Jak streaming funguje neboli cesta z rádia k posluchači Cestu streamu od zdroje k posluchači lze obecně rozdělit do několika kroků, lišících se v detailech podle systému, který jsme si pro vysílání vybrali. Na straně vysílání máme zdroj zvuku, což je například výstup z mixážního stolu nebo playlist v přehrávači, jenž je zapojený do vstupu enkodéru (streaming server). Na něm je program, který signál enkoduje a stará se o správu a distribuci archivních souborů. Tento server pak přenáší jednotlivé streamy podle požadavků posluchačů. Ke spojení se serverem distribuujícím stream se je možné dostat několika způsoby: přes odkaz v nějakém z přehrávačů, přímým odkazem (zadáním IP adresy) nebo cestou nejobvyklejší, tj. do internetového prohlížeče zadáme adresu rádia, kde klikneme na ikonku, která nás přesměruje přímo na IP adresu streaming serveru. Tím vyšleme požadavek, aby server začal komunikovat s naším počítačem. Server začne hledat program, který spustí a s nímž začne spolupracovat. Tyto programy (např. Windows Media Player, Winamp, Real Media Player, QuickTime, iTunes, XMMS atd.) jsou schopné stream zpracovat (buffering, dekomprese, výstup do zvukovky) a často ovládají více formátů. Kromě toho poskytují různé nadstandardní funkce, jako je ekvalizér, různé pluginy, nebo zmíněné přímé odkazy na rádia. 8.1.4. Streamové formáty a příslušné multimediální přehrávače
Windows Media Microsoft vstoupil na pole streamovaného zvuku poměrně pozdě. Přesto si se svým formátem ASF (Advanced Streaming Format) a především integrováním přehrávače Windows Media Player do operačního systému Windows vydobyl dobré postavení. Podle firemních informací poskytuje ASF kvalitu srovnatelnou s formátem Mp3 při poloviční velikosti souborů, nezávislé testy však potvrdili, že toto tvrzení platí pouze pro nízké datové toky. Přehrávače Windows Media Player podporují technologii streamingu od verze 7.1. Microsoft také nabízí celou řadu produktů, které nabízí řešení pro širokou škálu uživatelů. Počínaje vybavením pro velká rádia přes možnosti firemních prezentací až po jednoduché aplikace, které vyhoví jakýmkoliv amatérským pokusům.
Real Media Formát Real Audio (.ra) patří mezi průkopníky streamování médií. Byl vyvinutý firmou Progressive Networks (dnes Real Networks) již v roce 1985, byl to tedy v podstatě první software určený ke streamování audia. Soubory s příponou *.ra je možné přehrát v programu RealOne Player, jehož základní verze je volně ke stažení. Tento přehrávač podporuje širokou škálu dalších formátů. Real Networks stejně jako řada jiných platforem v této oblasti těží z výhod otevřeného formátu díky účasti v "open source" projektu Helix. Zdrojový kód formátu je možné zdarma využít, když je vývojáři softwarových nadstaveb zdarma poskytnou zpět k volnému užití. Real Player poskytuje celou řadu možností využití skriptů jak na bázi Internet Exploreru (skrze ActiveX kontrolu), tak v Netscape (skrze pluginy). Je možné využít JavaScript a SMIL. Je možné tvořit skiny, pluginy a jakékoliv nadstavby, to závisí již na jednotlivých projektech.
69
Verze pro vývojáře je dostupná zdarma díky licenci Real Network Public Source License (RPSL). Pro komerční využití pro zájemce, kteří chtějí systém, jenž by nemuseli sami tvořit na základě zdrojového kódu, je určena licence Real Networks Community Source License (RCSL), je ovšem zpoplatněna.
QuickTime QuickTime je služba vyvinutá společností Apple, která umožňuje práci se širokou škálou multimediálního obsahu: od grafiky přes hudbu, zvuky a video až po počítačové animace a speciální efekty - to vše ve velmi širokém množství formátů. Tento systém byl vyvinut pro počítače Macintosh, ale je použitelný i v jiných platformách. QuickTime spolupracuje zejména s multimediálním standardem MPEG-4 a s novými formáty, které z něho vychází například pro vysokorychlostní bezdrátový přenos 3 GPP (.3gp), 3 GPP2 (.3g2). Apple prosazuje audio kodek AAC (Advanced Audio Coding), který je součástí jádra MPEG-4. Přehrávač QuickTime Player je volně ke stažení na stránkách firmy Apple. Zde se dají stáhnout verze pro MacOS X v.10.2.6 - 10.3.x, MacOS 8.6/9, Win 98/Me/2000/XP a PC verzi s přehrávačem iTunes, jenž je asi nejznámejší aplikací pro přehrávání audia postavenou na platformě QuickTime. Program QuickTime Pro ve verzi 6.5 za 30 dolarů umožňuje vytváření MPEG-4, mediálních skinů, export a import médií a jejich přípravu na streaming, automatizaci pracovních postupů. Quick Time také nabízí řadu programů pro rádia. Jsou to např. QuickTime Streaming Server pro OS X (platforma Mac), nebo Darwin Streaming Server pro systémy Linux, Solaris, FreeBSD a Windows, který je zdarma.
Streamované Mp3 Nejznámější a nejrozšířenější kodek byl primárně určený pro download a uchování hudby. Pro CD kvalitu mu stačí v mnoha případech jen 12x méně dat, než je tomu u nezkomprimovaného wavu. Mnoho firem zabývajících se streamováním zvuku se proto chopilo aktivity, aby mp3 mohly být streamovány. Zatímco například real producer potřebuje dosáhnout komprese 1 : 50, aby dostal zvuk z CD kvality do streamu o síle 30 kbps, Mp3 stream je potřeba dále zeštíhlit pouze v poměru 1 : 5. Streamované empétrojky mají příponu m3u. Streamováním formátu mp3 se zabývá například firma Nullsoft, která vyrábí server Shoutcast (www.shoutcast.com) a známý přehrávač WinAmp. Shoutcast je media server, v němž si volíme vstupy a výstupy. Kromě toho je možné vkládat playlisty a ovládat distribuci on-demand archivních streamů. Shoutcast je zadarmo stejně jako WinAmp. Ogg Vorbis Na úvod bych měl poznamenat, že Ogg je kontejner, který může obsahovat mnoho typů multimediálních kodeků, a Vorbis představuje ztrátový kompresní zvukový kodek Již od počátku bylo rozhodnuto, že formát bude distribuován jako Public Domain - musí být šířen zdarma jak pro nekomerční, tak komerční užití. Kodek je koncipován tak, aby byl maximálně flexibilní. Umožňuje použití až 255 kanálů. Standardně je nastaven VBR management, ale je možné zvolit CBR nebo ABR. Jednou ze zajímavých vlastností Ogg Vorbis je "bitrate peeling", který umožňuje snížit velikost přenosovou rychlosti bez nutnosti znovu zakódovat soubor. Ogg Vorbis je možné streamovat serverem Icecast, jenž je volně ke stažení. 70
8.1.5. Internetové vysílání a zákon Pokud se rozhodnete založit si internetové rádio, musíte brát v úvahu autorská práva. Pokud se rozhodnete vysílat jen vlastní výtvory, pak je vše v pořádku. Pokud se však rozhodnete vysílat cokoliv co spadá pod autorský zákon, pak budete muset platit správcům autorských, interpretačních a vydavatelských práv, jako kdokoliv jiný. V případě české republiky jsou to OSA (správce práv autorů), Intergram (správce práv výkonných umělců a vydavatelů) a Dilia (správce autorů literárních, dramatických a hudebně dramatických děl). Na druhou stranu se, oproti standardnímu terestrickému vysílání, za vysílání po internetu neplatí žádné licence. 8.1.6. Kam za rádii Jako poslední důležitou informaci zbývá dodat, kam se na internetu za poslechem rádia vydat. Na internetové adrese http://www.radia.unas.cz nalezneme jak frekvenční rádia, které znáte z našich FM vln, tak i rádia ryze internetová. Stránka je velmi přehledná a většina posluchačů ji volí právě pro svou jednoduchost a možnost střídat rádia jen jedním klikem myši. Na stránkách http://www.abradio.cz můžeme poslouchat pouze internetové rádia. Najdeme tu ale takřka každý hudební žánr, na který si vzpomeneme. Pokud jste však náročnějšími posluchači a dáváte přednost zahraničním rádiím, zavítejte na http://www.mikesradioworld.com. Zde autor stránek nashromáždil stovky frekvenčních a internetových rádií z celého světa. Vybírat mezi nimi můžete podle žánru, nebo země, z které rádio vysílá.
8.2.
Web kamery
Obecně by se dala webová kamera popsat jako zařízení, které buďto v reálném čase nebo s určitým zpožděním poskytuje záběr určitého místa. Údajně první webová kamera byla namířená na kávovar a to z čistě primitivního důvodu – aby si pracovníci jisté firmy ušetřili cestu ke kávovaru přes celou kancelář. Dnes se webové kamery využívají k nezměrnému množství účelů v různých odvětvích průmyslu nebo i v domácnosti, ovšem patrně nejzajímavější využití je z hlediska „webové turistiky“, kdy mají uživatelé Internetu možnost navštívit tisíce míst na světě z pohodlí svého domova s minimem potřebných nákladů. Webovou kamerou je vybavena spousta měst taktéž v České republice, a tak je velice snadné si pomocí internetu zjistit, jaké počasí je právě v Praze nebo jestli je v Krušných horách ideální stav na lyžování.
Obrázek 45 Web kamera
Na podobném principu najdou webové kamery využití i v bezpečnostním systému, stejně jako pro provizorní záznamy videa a statických snímků. Technologie webových kamer je v současnosti velice oblíbená pro relativně jednoduché zpestření webových stránek s minimem nákladů. Provozujete-li své vlastní webové stránky, firemní stránky nebo stránky města či obce, je pořízení webové kamery vhodným doplňkem pro oživení stránek. 71
8.2.1. Princip webových kamer Webové kamery jsou konstruovány tak, aby mohly snímat v pokud možno co nejvyšší kvalitě jak jednotlivé obrázky, tak video, a tyto soubory pak sdílet přes internet. Kamera může být umístěna na monitoru, na pracovním stole nebo pomocí držáků (bývají součástí dodávky) připevněna k notebooku nebo LCD displeji. Umožňuje nejen videokonference ze stolního či mobilního PC, ale i pořizování statických snímků, s pomocí vhodného software může například monitorovat pohyb v místnosti a fungovat jako zabezpečovací zařízení. Novější konstrukce objektivu umožňují dosáhnout vysoké kvality obrazu při snímání videa až do rozlišení 640x480 pixelů a u jednotlivých snímků až 1024 x 768 pixelů. Připojení přes rozhraní USB dovoluje rychlé ukládání obrázků a nahrávání videosekvencí. 8.2.2. Typy a připojení webových kamer Především je možno si kamery rozdělit na ty, které ke svému provozu potřebují připojit k nějakému počítači a kamery, které v sobě počítač již obsahují a připojují se přímo do počítačové sítě. Prvně jmenovanou skupinku kamer je možno k počítači připojit různými způsoby. Většinou přímo na některý z komunikačních portů. Jsou jimi: •
sériový port
•
paralelní port
•
USB port
•
Firewire/IEEE-1394
•
pomocí karty pro přímé zachytávání video signálu
Sériový a paralelní port není pro připojení kamery kvůli své malé rychlost příliš vhodný, ale v některých případech je dostatečný. V současnosti se již kamery s těmito porty téměř nevyskytují a tak pokud ji budete potřebovat (třeba kvůli operačnímu systému), dá vám asi dost práce takovou kameru sehnat. V současnosti nejrozšířenější jsou kamery používající USB port. Pořídit si takovouto kameru je otázka relativně snadná a to jak z hlediska finanční náročnosti tak z hlediska jednoduchosti připojení k počítači. Kvalita snímků z těchto kamer se sice nemůže vyrovnat kvalitě digitálního fotoaparátu, ale jako záběr webové kamery většinou dostačují. Drtivá většina současných operačních systémů obsahuje podporu pro tento typ portu a díky snadné dostupnosti potřebných ovladačů je instalace takové kamery zvládnutelná bez větších problémů. Kamery využívající Firewire/IEEE-1394 jsou zatím málo rozšířené a také podpora ze strany operačních systémů je nevalná. V případě, že máte zájem o maximálně kvalitní snímky, je zde možnost využít karet pro přímé zachytávání video signálu, ke kterým lze připojit obyčejnou video kameru. Toto uspořádání má několik výhod a také několik nevýhod. Mezi výhody patří právě vysoká kvalita výsledných záběrů, možnost využití zoomu pro nastavení požadovaného záběru a využití spousty dalších možností. To je ovšem vyváženo poměrně vysokou finanční náročností tohoto řešení a také nutností uvážlivé volby jak ostatního hardwaru, tak i softwaru. Druhý typ webových kamer, tzv. síťové kamery, je možné připojit přímo do počítačové sítě. Toto řešení je vhodné pro kamery umístěné jak v interiérech, tak hlavně v exteriérech. K jejich provozu není potřeba připojení k počítači. Tyto kamery vynikají kvalitou snímků i snadností obsluhy. To je ovšem vyváženo jejich cenou.
72
Budeme-li se zabývat pouze v současnosti standardním připojením webové kamery přes USB port, je její připojení a vlastní instalace velmi jednoduchou záležitostí. Stačí při zapnutém PC, vybaveném operačním systémem Windows 98/98SE/ME/2000/XP, zasunout USB konektor Web kamery do zásuvky PC nebo notebooku, po výzvě systému („průvodce přidáním nového hardwaru“) vložit dodané CD nebo disketu s ovladači a po dokončení instalace se Vaše kamera objeví v přehledu zařízení. Počet připojených USB zařízení (např. digitální fotoaparát, scanner myš, ...) není prakticky omezen (max. 127 zařízení), takže nemusíte mít strach, že to váš počítač nezvládne. 8.2.3. Rozdělení webových kamer
Podle cíle záběru webové kamery V tomto směru je možné rozdělit kamery na: •
vnitřní (indoor)
•
venkovní (outdoor).
Převážnou část "vnitřních" webkamer tvoří webkamery osobní, které jsou zpravidla umístěny v místnosti - případně přímo na monitoru - a sledují majitele webkamery při různých činnostech. Další významnou skupinou vnitřních kamer jsou kamery sledující provoz v kancelářích podniků nebo například v radiových nebo televizních studiích. Venkovní kamery, jak je z názvu patrné, snímají nějaké "venkovní" místo kdekoliv na světě. Právě těchto kamer je využíváno při „webové turistice“.
Podle toku obrazu Jak již bylo zmíněno výše, webkamerou lze snímat: •
jednotlivé obrázky
•
neustálý tok obrázků tedy videozáznam - označovaný jako stream.
Jednotlivé obrázky Výhodou tohoto řešení je relativně malé zatížení vašeho připojení. Nevýhodou je to, že návštěvník vašich stránek uvidí nový snímek pouze jednou za určitý časový interval (několik vteřin, minut, hodin, dnů). Většina programů umožňuje nahrávat obrázky pomocí protokolu FTP přímo na váš webový server, kde již budou k dispozici jednotlivým návštěvníkům. Díky tomu je možné tento způsob použít i v případě, že se připojujete pomocí modemu a je vám vždy přidělena jiná IP adresa. Nastavení těchto programů je poměrně jednoduché a po prostudování návodu jej zvládne i začátečník.
Videozáznam (Stream) Zde je tomu právě naopak. Neustále vysíláte proud (stream) dat podobně jako televize. Díky tomu může návštěvník v každém okamžiku sledovat co se děje před objektivem vaší kamery. Vzhledem k větší datové náročnosti na propustnost linky je ale většina takovýchto "vysílání" poskytována v menší kvalitě. Nastavení programů pro tento způsob vysílání není většinou úplně nejjednodušší. Také potřebujete mít přiřazenu pevnou IP adresu (i bez ní to není nemožné, nicméně je to velmi komplikované), jelikož se uživatelé Internetu připojují přímo na váš počítač.
73
9. VYPALOVÁNÍ Vypalování CD se v posledních letech neskutečně rozšířilo. Stalo se tak především vlivem rapidního snížení cen. Zhruba před pěti lety (1998) se cena vypalovačky pohybovala v desítkách tisíc korun a cena média sotva klesla pod 100 kč. Dnes lze koupit vypalovačku za jeden tisíc korun a médium v průměru za patnáct korun. Vypalování se tedy stalo nesmírně lacinou záležitostí, prakticky vytlačilo ze světa diskety a pro většinu uživatelů je tak běžným krokem, jako kopírování dat na harddisku.
9.1.
Teorie
9.1.1. 9.1.1 Kompaktní disky – CD Je logické, že k vypalování jsou zapotřebí 3 věci: vypalovací mechaniky, program na vypalování a čistý kompaktní disk (dále jen CD). Existují dva typy médií, na něž lze zapisovat data: •
CD-R (Read)
•
CD-RW (Read Write)
Rozdíl mezi nimi je takový, že na CD-R lze data vypálit pouze jednou, CD-RW je tzv. přepisovatelné cédéčko a lze na něj zapisovat vícekrát, a to minimálně tisíckrát (údaj uváděný výrobci). Trvanlivost CD-R závisí mimo jiného na použitém barvivu. Nejčastější jsou barvy modré, zelené a zlaté. Asi nejpodstatnějším údajem každého CD je kromě jeho výrobce (záruka kvality/nekvality) jeho kapacita. Ještě před pár lety bylo standardem 74min CD, na které se vejde 74 minut audia a zhruba 640 MB dat (1). V současnosti se ale za prakticky stejnou cenu dají koupit 80min CD, na než se vejde 80 minut audia a 700 MB dat. Údajnou nevýhodou je, že hustší forma zápisu audia u 80 min CD může vyústit v problémy u přehrávání na hifi věžích a jiných audio přehrávačích. V současnosti již existují i CD s kapacitou 90min a 99min, nicméně ty prozatím nejsou příliš rozšířené. Způsob uložení dat na CD je naprosto odlišný kupříkladu od staré známé gramofonové desky. Na rozdíl od ní se data zaznamenávají v jedné nebo více dlouhých spirálách od středu a ne od vnějšího okraje. Tato skutečnost má jednu zajímavou výhodu a to, že CD může být jakkoliv velké, dokonce může mít i jakýkoliv tvar. CD tedy nemusí být kulaté, ale může mít tvar hvězdy, obdélníku, květinky – prostě jakýkoliv. Je ale pochopitelné, že zápis je možný pouze na plně kruhovou část CD, tudíž je kapacita takových CD výrazně omezena, většinou se jedná pouze o reklamní účely. Poznámka: (1) Mějte na paměti, že neplatí převod 1 KB = 1000 B, ale platí 1 KB = 1024 B. Proto kupříkladu 640 MB = 671.088.640 B. Proto pokud budete vypalovat data o velikosti kolem 670.000.000 B (jak ukazuje kupříkladu program Windows Commander) na 640 MB CD, nemusíte mít obavy, že by se tam nevešly. 9.1.2. Rychlost vypalování Teoreticky rychlost vypalování závisí pouze na dvou limitujících faktorech – maximální rychlosti vypalovačky (standardem je v současnosti 32x rychlostní) a rychlosti, jakou je možno na dané CD zapisovat (vždy uvedeno na obalu CD). Skutečnost je ovšem mnohem 74
složitější. Jak již bylo uvedeno výše, při zápisu dat v mechanice CD-R je na médiu vytvářena jedna dlouhá, spirálová stopa. Protože mechanika CD-R nedokáže vyhledávat konec záznamu tak snadno jako pevný disk, musí záznam plynule pokračovat od začátku až do konce. To však znamená, že použitý software pro vypalování spolu s hardwarem vašeho počítače musí být schopen dodávat do mechaniky CD-R nepřetržitý proud dat. Z tohoto důvodu si většina programů pro vypalování vytváří dočasné zásobníky dat na pevném disku. Pokud má být záznam proveden kupříkladu se čtyřnásobnou rychlostí, musí počítač dodávat do mechaniky data rychlostí 600 KB/s. Není-li kterákoliv hardwarová součást schopna udržet takovou rychlost, je výsledkem záznamu zničené médium. Schopnost počítače dodávat data do vypalovačky takovou rychlostí je ovlivněna pěti hlavními faktory: •
typem rozhraní (SCSI nebo IDE/ATAPI)
•
velikostí zásobníku (standard je 8 MB)
•
umístěním a stavem vypalovaných dat
•
rychlostí záznamu
•
ostatními činnostmi prováděnými počítačem během zápisu dat
Proto je vhodné volbu rychlosti vypalování volit vhodně tak, aby během vypalovacího procesu nedošlo k vyprázdnění zásobníku. Pravdou ale je, že tato hrozba je v současnosti již prakticky nulová, protože všechny moderní vypalovačky podporují funkci Burn-proof (BURN = Buffer Under RuN). Tato funkce zajišťuje, že když počítač nestačí vypalovačku zásobovat daty, bude vypalování dočasně zastaveno. Po tuto dobu pak čeká vypalovačka, až se buffer zase naplní, pak provede synchronizaci dat a pokračuje ve vypalování od místa, kde předtím skončila. 9.1.3. Mode 1 / Mode 2 Při vypalování datových CD je možné použít dva různé módy. Pro běžná datová CD se používá Mode 1 (poskytuje možnost opravy dat v případě poškození CD), Mode 2 je možné použít tam, kde na datech příliš nezáleží (například u hudby nebo videa – drobná chyba je prakticky nezaznamenatelná, v případě programových dat by ovšem znamenala fatální problém). 9.1.4. Logický formát ISO 9660 Pod logickým formátem se skrývá způsob, jakým jsou na CD uloženy názvy souborů a jak je bude počítač číst. Je to v podstatě obdobné, jako u pevných disků. Aby se toto formátování sjednotilo, byl ustanoven standardní formát ISO 9660. Podporují ho systémy Windows, Linux i MAC OS. Tento formát je ještě rozdělen na dvě úrovně – Level 1 a Level 2. Level 1 umožňuje zapisovat soubory s názvem o délce 8+3 (8 znaků název, 3 znaky přípona), Level 2 umožňuje až názvy dlouhé až 30 znaků (což ale stále není dost – až budete vypalovat hudební soubory MP3, jejichž názvy obsahují interpreta, skladbu a ještě její verzi, pocítíte to sami. Řešením je použití vlastního formátu systému Windows. Jmenuje se Joilet a umožňuje zápis souborů o délce až 64 znaků). Pokud jsou názvy vypalovaných souborů menší než je horní limit, program vám dá již při přípravě CD možnost názvy souborů manuálně zkrátit, a nebo je zkrátí sám (což ale nedoporučuji – usekne jim totiž i koncovku a soubory tak nepůjdou načíst v programech, pro něž jsou určeny).
75
9.1.5. Typy formátů vypalovaného CD No a nakonec se dostáváme k tomu nejdůležitějšímu. Pod pojmem „formát CD“ lze zjednodušeně chápat to, co je na CD uloženo. Dva hlavní formáty jsou „Hudební“ a „Datové“, s nimiž přišel do styku snad každý a jejichž popis není nutný. Mezi další formáty patří „Kombinované CD“, na němž se nachází jak data, tak audio, a „Video CD“. Všechny čtyři formáty si nyní stručně vysvětlíme. 9.1.6. Kombinované CD Kombinované CD je takové, na kterém jsou smíchána jak data, tak i audio stopy. Podobný formát se v poslední době často vyskytuje u her (audio je zde jako soundtrack) nebo u originálních hudebních CD, kde jsou písničky doplněny buďto nějakou mini hrou nebo dokumentacemi o umělci, atp. I tokového CD je vždy první stopa datová a další hudební. Obojí tvoří dohromady jednu session (nejedná se tedy o multisession CD). Takové CD dokáže rozpoznat audio přehrávač i počítač – audio přehrávač datovou stopu přeskočí a začne přehrávat až tu hudební, počítač naopak zobrazí pouze data (přičemž audio stupu lze pochopitelně přehrát v jakémkoliv softwarovém audio přehrávači). 9.1.7. Video CD Video CD je ekvivalent k obyčejnému datovému CD, na němž máte uložený video záznam. Výhodou Video CD je ovšem ten, že takové CD dokáže přečíst stolní video přehrávač nebo dokonce stolní DVD a vy se tak nemusíte na film dívat jen na počítači, ale klidně na televizní obrazovce. V případě Video CD ale musí být video záznam uložen v přesně specifikované formě. Za prvé musí být film uložen ve formátu .MPG, nikoliv .AVI! Za druhé musí mít specifikovanou velikost a počet snímků za vteřinu. K dispozici jsou dvě možnosti: 352x240 při 29,97 snímcích a 352x288 při 25 snímcích. A konečně za třetí: Specifikovaný formát musí mít i audio stopa. Nutné parametry jsou následující: 16 bitů stereo 44,1 kHz. Poslední podmínkou je, že video musí mít pevný datový tok 1,15 MB/s, čímž je předem určena jeho kvalita a maximální velikost – na CD se vejde maximálně 74 min záznamu. Pro úspěšné vytvoření Video CD je nutné splnění všech čtyř uvedených podmínek. To se může zdát být na první pohled nemožné, ale vězte, že nic není tak složité. Nero si totiž dokáže jakýkoliv video záznam, který chcete vypálit jako Video CD, sám překonvertovat do správného formátu. Chvíli mu to sice potrvá a trochu tím utrpí kvalita, ale ne nějak výrazně. 9.1.8. Super Video CD Formát Super Video CD je prakticky pouze vylepšená verze standardního Video CD. Používá kompresovaný obraz i zvuk a na CD lze uložit obraz v rozlišení 480x576 bodů (opět s frekvencí 25 snímků za vteřinu) a zvuk ve formátu MPEG 2 s kódováním 32 až 384 kb/s. Jiné rozdíly oproti Video CD zde nejsou.
76
9.2.
Program NERO – základní pojmy
9.2.1. Několikanásobné vypalování (tzv. multisession) Výrazem „session“ se rozumí oblast CD, která je uložena jako jeden samostatný blok. Tento může obsahovat i více tracků, ať už datových, nebo audio. Nicméně velmi často je výhodné na CD zapisovat vícekrát, ať už z důvodů zálohování dat nebo jejich přenosu. V takovém případě je možno na CD vypálit více bloků, tedy více sessions (odtud název „multisession“). CD se pak při čtení bude chovat jakoby bylo vypálené najednou. Výjimka se může objevit pouze u starších mechanik, které mohou mít se čtením takovýchto multisessions CD problémy. 9.2.2. Stopa CD Každé CD se skládá z takzvaných „Tracků“, kterým česky říkáme „stopy“. Datové CD se skládá z jedné velké stopy, která pokrývá celý objem dat, u hudebního CD může být stop více a každá reprezentuje jeden audio úsek (například jednu písničku). V každé session tedy může být jedna datová stopa, libovolný počet audio stop a nebo obojí dohromady (v případě kombinovaného CD – viz níže). Pro odlišení stop slouží takzvané mezery „gap“, minimální délka jedné stopy jsou 4 sekundy. 9.2.3. Metody vypalování Track-at-once (TAO) / Disc-at-once (DAO) Jedná se o dvě základní metody vypalování, z nichž jednu si vždy musíte zvolit při vypalování každého CD. Základní rozdíl je takový, že metoda DAO vypálí celé CD najednou, naopak metoda TAO vypálí CD po částech. Při zvolení metody TAO se mezi každou stopou vypne a zapne laser a při vypalování audio CD se tak mezi stopy umísťují dvousekundové mezery! Tato metoda je jediná možná při vypalování multisession CD (logicky – metoda DAO vypálí celé CD najednou, pak ho uzavře a zabrání tak dalšímu možnému zápisu). Naopak využití metody DAO je výhodné při vypalování audia, jelikož vás zbaví zmíněných dvousekundových mezer. 9.2.4. Overburning Každé CD má ve skutečnosti vyšší kapacitu, než se uvádí na jeho obalu. Většinou se jedná řádově o několik minut – kupříkladu na 74min CD se dá namačkat v průměru 76 až 78 minut – záleží na značce CD a jeho výrobci. Vypálení většího množství dat, než je uváděná kapacita CD, se říká „overburning“. Za normálních okolností je zbytečné snažit se na CD vměstnat o tu trošku dat víc, nicméně řada lisovaných audio i datových CD využívá zvýšené kapacity a pokud si takové CD chcete přepálit (nebo řekněme raději „zálohovat“), je nutné tuto funkci použít. Takové CD lze ale vypálit POUZE metodou disc-at-once!!! 9.2.5. Vytvoření / vypálení tzv. IMAGE Image = obraz CD na pevném disku. Jedná se o jeden soubor na disku, v němž je uložený kompletní obsah CD. Tato funkce je používána buď pro urychlení několikanásobného rozmnožování CD, nebo v případě, že máte pouze jednu CD mechaniku (tedy vypalovačku) a chcete-li zkopírovat CD, je nutné jeho obsah nejdříve zkopírovat na disk (tedy vytvořit jeho IMAGE) a ten pak vypálit na čisté CD.
77
10. DVD Tím nejlepším co dnešní elektronický svět ve spojení zvuku a obrazu pro běžné uživatele nabízí je bezpochyby souhrn technologií označovaných jako DVD. Podle původního záměru mělo DVD nahradit videokazetu, která vykazuje mnoho nedostatků, zejména nízkou kvalitu obrazu i zvuku a rychlé opotřebovávání média při přehrávání. Proto zkratka DVD původně znamenala Digital Video Disc (Digitální video disk), avšak později byla změněna na Digital Versatile Disc (Digitální univerzální disk), a to hlavně z důvodů, že DVD se začala používat jak pro záznam dat na počítači (DVD-ROM), tak i pro záznam zvuku v mnohem vyšší kvalitě, nežli má klasické CD (DVD-Audio). Disky DVD se rodily poměrně dlouho. Nebylo to však zapříčiněno nedostatečnou úrovní technologie umožňující záznam relativně velkého množství obrazových dat na fyzicky omezený prostor. Důvody zdržování a pomalého nástupu disků DVD lze spatřovat spíše ve snaze velkých filmových společností zajistit ochranu svých autorských práv. Dlouho se tak vymýšlela různá omezení a technologie zabraňující nelegálnímu přehrávání, kopírování a šíření DVD. Dnes již můžeme říci, že tyto snahy byly od samého začátku poměrně naivní. Počítačové technologie a možnosti postupují vpřed mnohem rychleji než standardy, které musí kvůli uživatelům používajícím samostatný (stolní) přehrávač DVD připojený k televizoru zůstávat relativně beze změn.
10.1. Seznamte se, DVD Podíváme-li se na DVD, je na první pohled takřka nerozeznatelné od CD. Jedná se tedy o umělohmotný disk o průměru 120 mm s dírkou uprostřed o průměru 15 mm. Datová vrstva začíná 21 mm od středu disku. Z tohoto místa se odvíjí spirála až k okraji disku. Ve spirále jsou pomocí takzvaných landů (místo odrazu) a pitů (místo rozptýlení) uloženy digitální informace, stejně jako u CD. Jak je tedy možné, že se na DVD vejde více dat než na CD? Odpověď je jednoduchá. Výrobci DVD použili lepší technologie, které umožňují na stejně velkou plochu zaznamenat větší hustotu dat. Konkrétně to znamená, že došlo ke zmenšení landů a pitů, a tak i prodloužení celé spirály disku. Navíc DVD mechaniky používají laserový paprsek jiné vlnové délky, který dokáže přečíst mnohem menší (či chcete-li větší) detaily. Na otázku, kolik se toho na jedno DVD vejde, je poměrně složitá odpověď. Je to způsobeno tím, že data na disku mohou být ve dvou vrstvách, a to navíc z obou stran disku, což nám dává dohromady několik kombinací. Uvážíme-li jednovrstvý disk, výrobci udávají kapacitu 4,7GB. Poznámka: Těchto 4,7GB je poněkud zavádějící informace, jelikož ve skutečnosti se jedná o 4 700 000 000 bajtů. Jeden kilobajt (kB) má 1024 bajtů, jeden megabajt (MB) 1024 kilobajtů a jeden gigabajt (GB) 1024 megabajtů. Z toho vyplývá, že kapacita tohoto disku může být reprezentována i jako 4,38GB, přičemž jsou obě hodnoty správné. Při zjišťování velikosti vypalovaných dat mějte stále na mysli, že se musíte vejít do 4,38GB. Jednovrstvé DVD má tedy kapacitu 4,38GB. V současné době se však již dá vypalovat do dvou vrstev, avšak toto vypalování není ještě tak rozšířené a to hlavně kvůli stále vysoké ceně dvouvrstvých médii, která se pohybuje kolem 160 Kč bez DPH za kus.
78
10.2. Lisovaná DVD S lisovanými DVD jste se zatím setkávali nejčastěji. Jedná se totiž o všechna DVD média, na která narazíte ve videopůjčovnách a poslední dobou stále častěji i v podobě příloh časopisů s počítačovou tematikou a podobně. Podle toho, zda jsou na DVD data ve více vrstvách, z obou stran či obojí, jsou disky označovány podle následujícího seznamu: •
DVD-5 – jednostranný jednovrstvý disk s kapacitou 4,7 GB
•
DVD-9 – jednostranný dvouvrstvý disk s kapacitou 8,54 GB
•
DVD-10 – oboustranný jednovrstvý disk s kapacitou 9,4 GB
•
DVD-18 – oboustranný dvouvrstvý disk s kapacitou 18,1 GB
Pozornému čtenáři jistě neuniklo, že kapacita dvouvrstvého disku není dvojnásobkem disku jednovrstvého. Je to tím, že spodní vrstva má o něco menší hustotu vinutí spirály nežli vrstva horní, a z toho vyplývá, že se na ni vejde i menší množství dat. Zajímavost: Možná jste si při sledování filmu z DVD všimli, že přibližně v polovině filmu dojde ke chvilkovému zastavení nebo rozmazání obrazu. Je to dáno tím, že laserový paprsek přepíná na jinou vlnovou délku a chystá se číst jinou vrstvu z disku. Jak dlouho toto pozastavení trvá, záleží na způsobu uložení dat ve vrstvách. Data totiž mohou být uložena paralelně, což znamená, že po skončení jedné vrstvy data pokračují na druhé vrstvě opět od středu disku. V tomto případě může pozastavení obrazu trvat i vteřinu, jelikož čtecí hlava musí přejet na druhý konec disku a přeladit na jinou vlnovou délku. Jindy mohou být data uložena protichůdně. Po ukončení první vrstvy data pokračují na druhé vrstvě od téhož místa zpět ke středu disku. V tomto případě je přechod mezi vrstvami mnohem rychlejší, a občas ho ani nemusíte zaznamenat.
10.3. Vypalovaná DVD Vypalované DVD je takřka shodné s DVD lisovaným, obsah tedy může být naprosto stejný. Rozdílem je především omezená kapacita vypalovaných DVD, a to buď 4,7GB nebo 8,5GB. Aby to však nebylo tak jednoduché, hlavně z komerčních důvodů existují tři formáty DVD – DVD+R, DVD-R a DVD-RAM. Všechny tyto formáty budou dále podrobněji popsány.
10.4. Vlastnosti DVD Již bylo uvedeno, že hlavním účelem DVD disku je nahradit nevyhovující videokazetu. Teď však přišel čas říci si něco o vlastnostech DVD, které platí pro lisované, tak i pro vypalované disky. Obraz DVD může být zaznamenán ve dvou formách – PAL nebo NTSC. Norma NTSC se používá v USA a v Japonsku, kdežto norma PAL je standardem v Evropě. Proto již dále nebude norma NTSC rozebírána, i když většina nové spotřební elektroniky podporuje normy obě. Nejdůležitějším údajem normy PAL je rozlišení obrazu, tedy počet horizontálních a vertikálních bodů. Počet bodů musí být 720x576. Další podmínkou je komprese videozáznamu, která musí být ve formátu MPEG-2. Naštěstí většina programů dokáže akceptovat i video v jiných rozlišeních anebo s jinou kompresí, avšak před vytvořením disku program převede obraz do potřebného rozlišení.
79
Pomineme-li, že již samotná kvalita obrazu je na DVD mnohem lepší než na videokazetě, další výhodou je možnost uložení více úhlů obrazu. Je-li například jedna scéna ve filmu natočena více kamerami, nabízí DVD možnost libovolně přepínat, z jakého úhlu chcete záznam vidět. V praxi se však s tímto řešení zatím často nesetkáte. Proti videokazetě má také DVD nesrovnatelně lepší zvukový záznam. Zatímco na videokazetě je zvuk maximálně stereofonní, na DVD se nejčastěji setkáme s šestikanálovým zvukem, označovaným jako 5+1. Symbol 5+1 označuje počet stop, pro něž je zaznamenán zvuk. Zatímco v případě stereofonního zvuku se jednalo pouze o dva přední kanály, v 5+1 se jedná o dva přední reproduktory, centrální reproduktor, dva zadní reproduktory a poslední stopa je pro takzvaný subwoofer, tedy reproduktor, který přehrává pouze nízké kmitočty. Kromě toho nabízí DVD i možnost zaznamenat zvuk do osmi i více zvukových stop. U filmů je to tedy například originální zvuková stopa spolu s českým dabingem a podobně. V případě vlastního záznamu můžete jako jednu zvukovou stopu ponechat originální zvuk a do druhé vložit například hudbu. Další výhodou DVD je schopnost zapnout anebo vypnout titulky. Titulků může být u jednoho filmu až 32.
10.5. Rychlosti DVD Jestliže jste již vypalovali kompaktní disky, jistě víte, že na CD se dají data vypalovat různými rychlostmi, a to podle rychlosti vypalovací mechaniky a rovněž podle toho, jakou rychlost vůbec snese vypalované médium. Podobná situace je i u DVD. Základní rychlost je 1x, touto rychlostí se otáčí disk uvnitř stolního DVD přehrávače. Při této rychlosti je za jednu vteřinu přečteno 1350kB dat. Vezmeme-li v úvahu základní rychlost CD, která je 150kB za vteřinu, je zřejmé že DVD při základní rychlosti čte téměř 10krát rychleji nežli CD. I když je tato rychlost dostatečná pro přehrávání filmu, pro čtení či vypalování dat již dostatečná není. Proto se, podobně jako u kompaktních disků, přistoupilo k rychlejšímu otáčení disku v DVD mechanikách, což má za následek i zvýšení rychlosti čtení nebo zápisu. Maximální rychlost, jakou je DVD schopno dosáhnout, je šestnáctinásobek jeho základní rychlosti, tedy 16x. Těžko bude dosaženo větší rychlosti, poněvadž disk dosahuje v mechanice tak vysokých otáček, že jejich zvýšením by se mohl disk poškodit (prasknout), anebo dokonce úplně rozbít. Výše uvedené hodnoty však platí pro disky DVD+R/RW a DVD-R/RW. U DVD-RAM je rychlost čtení i zápisu přibližně trojnásobek základní rychlosti [13].
10.6. Regiony DVD Aby se předešlo pirátskému kopírování filmů, prosadily filmové vydavatelské společnosti takzvaný region, tedy oblast, ve které se dá disk používat. Tímto způsobem je svět rozdělen do šesti oblastí: •
Severní Amerika
•
Evropa, Japonsko, Jižní Afrika, Střední východ
•
Jihovýchodní Asie
•
Jižní Amerika, Střední Amerika, Austrálie, Nový Zéland
•
Severozápadní Asie
•
Čína 80
Znamená to, že disk zakoupený například v Severní Americe není možné přehrát na přehrávači v Evropě, proto je nutné dát si při nakupování DVD v cizině pozor. Regiony se týkají pouze zakoupených disků DVD-Video, na disky vypalované nemají vliv. Naštěstí existují přehrávače, které regiony ignorují. Stejně tak se dají odstranit regiony v počítačových DVD mechanikách pomocí speciálních programů, například DVD Region Free. U DVD-ROM mechanik je možné si region mechaniky zvolit, ale ve většině případů to jde pouze pětkrát. Jestliže si tedy přinesete domů mechaniku, případně DVD vypalovací mechaniku, musíte nejprve určit region, v jakém se nachází. Pokud vyčerpáte všechny možnosti změny regionu, jsou další změny vyloučeny. Nepomůže vám ani přeinstalování Windows, ba ani vložení mechaniky do jiného počítače. Region je totiž napevno uložen v paměti DVD mechaniky.
10.7. Formáty DVD Formáty DVD se dělí na fyzické a logické. Nyní se na ně podíváme podrobněji a řekneme si jaké jsou mezi nimi rozdíly pro uživatele. 10.7.1. Fyzické formáty
DVD+R a DVD+RW Formát DVD+ existuje ve dvou verzích. DVD+R je nejmladší z DVD formátů, nejprve existoval jen DVD+RW, který byl vyvinut ještě dříve nežli DVD-R. Formát DVD+R je určen pouze pro jeden zápis a nedá se přepisovat. Naproti tomu formát DVD+RW přepisovatelný je a dle tabulek média DVD+RW snesou až 1000 přepsání. První verze DVD+RW médií měla kapacitu 2,6GB, ale nynější verze mají již standardních 4,7GB. Média DVD+R dále existují ve 8,5GB verzi, s jinými se nesetkáte. Disky DVD+R, lze v současnosti zapisovat již plnou rychlostí (16x). U dvouvrstvých médií a disků DVD+RW je zatím možné zapisovat jen čtyřnásobnou rychlostí, tedy 5400kB za vteřinu. Touto rychlostí je disk vypálen přibližně za 17 minut.
DVD-R a DVD-RW Formát DVD-R vychází z technologie klasického kompaktního disku a existuje tedy ve dvou verzích – DVD-R (podobně jako CD-R), na které se dá pouze zapisovat, a DVD-RW (obdoba CD-RW), které lze přepisovat. Již na počátku byl tento formát navržen tak, aby byl co nejvíce kompatibilní s lisovanými DVD disky, tedy DVD-ROM. Proto vykazuje nejvyšší kompatibilitu i s DVD mechanikami či přehrávači, které vznikly dříve, nežli se na DVD dalo vůbec zapisovat. V dnešní době se tato výhoda poněkud vytrácí, protože snad již všechny vyráběné přehrávače či DVD mechaniky dokáží přehrávat jak DVD-R, tak i DVD+R média. Co se týče kapacity, u DVD-R se můžeme setkat s 3,95GB a 4,7GB. Varianta 3,95GB byla původní kapacitou a až později byla nahrazena 4,7GB verzí. 3,95GB média však v současnosti už asi neseženete. Disky DVD-RW existují pouze s kapacitou 4,7GB, jiná varianta neexistuje.
DVD-RAM Formát DVD-RAM je již ze základu koncipován jako přepisovatelný, proto se v jeho případě nesetkáte s pouze zapisovatelkou formou. Na rozdíl od CD anebo ostatních DVD formátů je DVD-RAM uložen v ochranném pouzdře. Podle tvaru pouzdra a podle toho, zda lze disk z 81
pouzdra vyjmout, se rozděluje na různé typy, přičemž typů zatím existuje 9. Nejčastěji se používá typ 1, u kterého disk z pouzdra vyjmout nejde, dále pak typ 2 a 4, ze kterých je disk možné vyjmout. Rozdíl mezi typem 2 a 4 je v tom, že typ 2 je jednostranný, kdežto typ 4 je oboustranný. DVD-RAM existuje ve dvou verzích, starší verze umožňuje nahrát na jednu stranu disku 2,6GB dat, v případě oboustranného disku je to tedy 5,2GB. Dnes se však nejčastěji setkáte s disky, které umožňují zaznamenat na jednu stranu disku 4,7GB dat, oboustranně pak tedy 9,4GB. Disky DVD-RAM se dají přečíst pouze v DVD-RAM mechanikách nebo DVD-ROM mechanikách. Na těch však musí být uvedeno, že dokáží podobná média číst. To staví DVD-RAM trochu do omezené pozice, protože i když si tuto technologii pořídíte, máte minimální šanci použít tyto disky někde jinde. Z toho plyne, že tyto disky se tedy více hodí na zálohování dat nežli na uchovávání filmů. A to hlavně proto, že tato média mají nejblíže, co se týče způsobu ukládání, ke klasickým disketám anebo ZIP diskům. Toto přirovnání jen utvrzuje fakt, že DVD-RAM musíte před použitím naformátovat (není-li již naformátováno od výrobce) a poté na něm můžete pracovat se soubory či složkami stejným způsobem, jako by to byl pevný disk.
Výhody a nevýhody jednotlivých formátů DVD+R/RW, DVD-R/RW •
Tyto formáty podporuje většina prodávaných stolních DVD přehrávačů, rovněž je přečte drtivá většina počítačových DVD mechanik, a to i starších.
•
Vypalovací mechaniky jsou levnější a je jich na trhu větší množství.
•
Prázdná média, a to hlavně DVD+R nebo DVD-R, jsou mnohem levnější než média DVD-RAM, lze na ně však zapsat pouze jednou.
•
Média DVD+RW a DVD-RW mají omezený počet přepsání, výrobci udávají kolem 1000, lze se však setkat i s disky, pro které je údaj tisíce přepsání jen science fiction.
•
Je komplikované přidávat na DVD±R další data. To samé platí i pro DVD±RW, ale u nich se tato nevýhoda eliminuje možností přepisování.
DVD-RAM •
Málokterý stolní přehrávač dokáže přehrát DVD-RAM.
•
Žádná mechanika DVD-ROM nepřečte média DVD-RAM, není-li k tomu uzpůsobena.
•
Média DVD-RAM jsou dražší než-li média DVD+R/-R a DVD+RW/-RW.
•
Naproti tomu média DVD-RAM se dají přepsat až 100 000x, což je teoreticky neomezený počet přepsání disku.
•
Disky DVD-RAM se po naformátování chovají stejně jako pevné disky v počítači. Můžete na ně tedy kopírovat soubory bez použití jakéhokoliv vypalovacího softwaru, je však zapotřebí mít nainstalovaný speciální ovladač.
82
10.7.2. Logické formáty Vedle fyzických formátů existují ještě formáty logické, které určují, jakým způsobem jsou data na disku zapsána. Pro DVD- a DVD+ se používají formáty ISO a UDF. Pro DVD-RAM to bývají UDF anebo FAT32. Formáty mezi sebou nejsou kompatibilní [13].
ISO Tento formát je základním formátem jak pro CD, tak i pro DVD. Jedná se o univerzální formát, který by měl být čitelný ve všech počítačích a operačních systémech tedy nejen Windows, ale i v Linuxu, Unixu, Mac OS a mnoha dalších. Existuje více úrovní tohoto formátu, přičemž nejvyužívanější jsou Level 1 a Level 2. Tyto úrovně se od sebe odlišují tím, jak dlouhý název souboru může být použit, kolik vnořených složek (adresářů) může na disku být, a podobně. Nemá cenu rozepisovat omezení každé úrovně, jelikož si je hlídají samotné vypalovací programy. Norma ISO9660 Level 2 jich však podporuje mnohem více nežli norma ISO9660 Level 1.
Joliet Společnost Microsoft si vyvinula vlastní rozšíření normy ISO, nazvané Joliet. Toto rozšíření funguje tak, že na disku jsou paralelně uloženy dva názvy souborů, jeden odpovídá normě ISO Level 1, tedy formát souboru 8+3 (osm písmen pro název a tři pro příponu). Rozšíření Joliet však umožňuje mít na disku i druhý název, a to mnohem delší (64 znaků). Vložíte-li takto vypálený disk do počítače, v systémech Windows uvidíte plné názvy souborů, kdežto v ostatních systémech uvidíte pouze klasický název 8+3. Dá se říci, že při použití OS Windows je rozšíření Joliet ideální.
UDF Zkratka UDF znamená Universal Disc Format (Univerzální formát disku). Jak název napovídá, mělo by se jednat o univerzální formát všech DVD disků. Existuje v několika verzích, například verze 1.5 se používá pro tzv. paketový zápis na DVD. Pod pojmem paketový zápis si můžete představit zápis, při němž data jsou na disku jinak organizovaná nežli v případě použití ISO. Výhodou tohoto zápisu je to, že použijete-li speciální program, můžete poté s DVD+RW a DVD-RW pracovat podobně jako s pevným diskem (anebo s DVD-RAM). Rovněž nemá cenu se zabývat detaily formátu UDF, poněvadž vypalovací programy si sami pohlídají, abyste se nepokusili vypálit něco, co na disk vypálit nejde. Dáse však říci, že formát UDF má velice málo omezení.
FAT32 Formát FAT32 je dílem společnosti Microsoft a můžete se s ním setkat v OS Windows. Je to stejný formát, se kterým se můžete setkat u pevných disků. Rozhodnete-li se tento formát použít, bude vaše DVD-RAM použitelné na počítačích s OS Windows 98 a vyšších (2000, XP).
10.8. Adresářová struktura a soubory na DVD-Video Struktura DVD je složena zpravidla ze dvou základních adresářů – AUDIO_TS a VIDEO_TS. Jejich názvy by mohli svádět k myšlence, že v jednom adresáři jsou uloženy veškeré obrazové informace a ve druhém všechen zvuk. To by však byl fatální omyl. Jak bylo již v úvodu řečeno, je DVD velmi „pružné“ médium a používá se jak k distribuci filmů, tak k
83
i vysoce kvalitního audia (zpravidla hudby). Odtud pak vyplývá pravé využití adresářů. AUDIO_TS se tedy používá pro DVD-Audio, kdežto VIDEO_TS pro DVD-Video, tj. všech dat týkajících se filmu včetně dat zvukových a všech menu. Pokud se na disku DVD-Video vyskytují ještě další adresáře, budou nejspíš obsahovat doprovodné materiály k disku, které jsou určeny pouze pro PC. Jsou to zpravidla spořiče, různé skiny, hry či jiné doprovodné materiály s tématikou k danému filmu. I s velmi rychlým rozvojem formátu DVD se distribuce hudby na tomto médiu ještě tolik nerozvinula a hudebnímu průmyslu zatím spokojeně kraluje klasický kompakt (CD). Můžete se ohradit, že k některým CD se disky DVD již přidávají. Pokud však takové DVD je skutečně přiloženo, obsahuje jen doprovodné materiály jako záznam live koncertu, videoklipy či rozhovory s muzikanty, a ve složce AUDIO_TS by jste asi hledali cokoliv úplně marně. Proto zde bude rozebrán jen formát DVD-Video. V adresáři VIDEO_TS se vždy vyskytují tři druhy souborů. Jsou to soubory s příponami vob, ifo a bup. Navzdory nic neříkajícím formátům je celý systém důmyslně promyšlen a zmíněná trojice se spokojeně podepíše na vašem úsměvu při shlédnutí vašeho oblíbeného filmu. 10.8.1. Soubory s příponou VOB Nejvíce je ve složce souborů s příponou VOB (Video Objects). Soubory VOB představují objekty videa. Každý objekt VOB je rozdělen na úseky, které mají délku odpovídající necelému jednomu gigabajtu nebo jsou menší. Menší velikost má téměř vždy poslední část (soubor) celého objektu a občas také některý ze středních souborů, pokud je předěl mezi částmi objektu zároveň přechodem mezi dvěma vrstvami záznamu dat na jedné straně fyzického média DVD. Kompletní objekt VOB může být tedy rozdělen na části nazvané např. Vts_01_1.vob až Vts_01_9.vob. To představuje 9 částí objektu VOB. Obsah takového objektu VOB je skutečně mimořádný, protože většinou má hlavní objekt VOB na disku jen pět či šest částí. Na disku nemusí být jen jeden objekt videa a zpravidla také není. Tyto další objekty jsou pak pojmenované třeba Vts_02_1.vob, Vts_03_1.vob, Vts_04_1.vob. Často také mají podstatně menší velikost a není je zapotřebí rozdělovat do několika součástí. Nyní je již celkem zřejmé, že každý objekt VOB má jednak pořadové číslo určené střední částí názvu souborů a jednak číslo své části, což je poslední údaj v názvu souboru. Jednotlivé objekty VOB často odpovídají titulům na DVD, jak je nabízejí některé softwarové přehrávače. Objektů VOB může být na disku mnoho, většinou se však jejich počet pohybuje v jednotkách. Každý objekt VOB může mít libovolnou velikost (omezenou jen fyzickými možnostmi média) a každý představuje nějakou ucelenou část obsahu DVD. Jeden objekt videa tak představuje celý film, jiný objekt pak třeba dokument o natáčení, další galerii snímků, jiný zase hudební klip k filmu, dále reklamu na film promítanou v kinech atd. podle nabídek daného disku. Pořadí objektů VOB může být libovolné, takže filmový materiál nemusí mít vždy pořadové číslo 01. Protože některé z těchto dodatečných materiálů jsou rovněž objemné a přesahují hranici 1 GB, i jejich objekt VOB pak je rozdělen na více součástí nazvaných třeba Vts_02_2.vob, Vts_02_3.vob atd. Už dříve bylo upozorněno na to, že každý ucelený objekt začíná částí s číslem 1. Ve struktuře souborů jsou však také části s pořadovým číslem 0, tedy třeba soubor Vts_01_0.vob. Tyto soubory představují jakýsi úvod k hlavnímu objektu se stejným pořadovým číslem. V takové úvodu k filmu se ve většině případů nacházejí všechny nabídky vztahující se k danému filmu, kde graficky vybíráte jazyk, titulky apod., jistě víte o čem je řeč. Podobně mají úvodní 84
soubory i další doplňkové objekty VOB, ty jsou však často úplně prázdné. Z pohledu zálohování tedy vyplývá, že soubory s pořadovým číslem 0 nejsou podstatné, zato nejdůležitější je největší objekt VOB a jeho části od jedničky výše. Na videodisku je ještě jeden soubor VOB nazvaný Video_ts.vob. Podobně jako soubory s pořadovým číslem 0 představovaly úvod k určitému ucelenému objektu VOB, představuje tento soubor úvod k celému disku DVD. Proto se také volí v rámci spouštění DVD z pevného disku v programu PowerDVD. Mezi obrazovými materiály, které se v tomto souboru často nacházejí, lze jmenovat různá úvodní upozornění na autorská práva, loga distribučních společností, loga nebo videosekvence použitých technologií (např. Dolby Digital) apod. VOB se skládá z několika streamů, které jsou spojeny (video, audio a titulky). Video je ve formátu MPEG-2. Audio může být AC-3, Lineární PCM, MPEG 2 multikanálový nebo MPEG1 layer2 dvoukanálový zvuk (tedy mp2). AC3 je standard a MPEG-2 multikanálový může být k vidění pouze na malém počtu DVD, protože byl původně určen pouze pro Region2 (Evropa a Japonsko) a později se od něj upustilo. PCM je nejvíce používáno na hudebních DVD a MP2 na levných DVD. PCM je vysoce kvalitní nekompresované audio, které zabírá hodně místa, proto není právě ideální pro filmy a vícejazyčné filmy. AC3 streamy mají datový tok mezi 192kbps a 448kbps. 192kbps je používán pro dvoukanálový zvuk a 384448kbps pro 5.1 kanálový prostorový zvuk. VOB může obsahovat jeden hlavní video stream a několik víceúhlových streamů, které umožňují přepínat pohledy během filmu. Maximální datový tok video streamu je 9.8mbit/s. Video a audio musí mít maximálně 10mbit/s. Je možné mít až 9 různých zvukových streamů, které je možno přepínat v průběhu filmu. Je také možné mít až 32 různých titulkových streamů. Titulky jsou 4 barevné bitmapy, které jsou překryty přes video stream, takže nejsou zakomponovány přímo do video streamu [12]. 10.8.2. Soubory s příponou IFO K orientaci v objektech VOB slouží přehrávači soubory pojmenované jako úvody k videoobjektům jen s příponou IFO (Informations). Informace obsažené v těchto nešifrovaných souborech slouží k velmi důležité navigaci na DVD a bez nich není možné přehrání disku. Příkladem informací uložených v těchto souborech jsou údaje o jazycích jednotlivých zvukových stop, předěly mezi kapitolami a navigační údaje umožňující zobrazování titulků. Pokud vám tedy nějaký z nástrojů vytváření zálohy neumožní načíst soubor IFO, nedokáže vás ani informovat o tom jaký jazyk představuje určitá zvolená zvuková stopa nebo tok titulků. 10.8.3. Soubory s příponou BUP Soubory BUP (Backup), jak název napovídá, jsou pouze záložní soubory k IFO a nejsou tedy zakódovány.
85
11. SLOVNÍČEK POJMŮ A: -
A/D převodník (analogově/digitální převodník) – zajišťuje konverzi analogového (spojitého) signálu na digitální (diskrétní)
-
AAC (Advanced Audio Coding) – jeden ze ztrátových kodeků audia
-
ABR (Average Bit Rate) – průměrný bitový tok, jeho hodnota určuje kvalitu zvuku po kompresi (čím vyšší, tím kvalitnější)
-
aditivní skládání barev – je založeno na jevu, že čím víc barev složíme dohromady tím světlejší je barva výsledná
-
alias - informace, která vznikla podvzorkováním analogového signálu
-
amplituda – u zvuku je zpravidla přímou úměrou k hlasitosti
-
antialiasing – odstraňování aliasů
-
ASF (Advanced Streaming Format) – formát pro streamování audia a videa firmy Microsoft
B: -
Bajt – jednotka informace. 1 bajt = 8 bitů
-
bezztrátová komprese – komprese dat, při níž se žádná data neztrácejí, jde zpravidla o zjednodušení zápisu komprimovaných dat
-
bit – základní a zároveň nejmenší jednotka informace. Obsahuje buď nulu nebo jedničku.
-
BMP - formát pro ukládání obrázků užívaný operačním systémem Windows
-
BNC – konektor používaný pro připojení nejrůznějších video zdrojů nebo u počítačových sítí
-
buffer – vyrovnávací paměť
-
BUP (Backup) – přípona souboru, který je záložní kopií souboru s příponou IFO na discích DVD Video
-
Burn-proof – funkce, která při podtečení zásobníku u vypalovaní CD zabrání znehodnocení vypalovaného média
C: -
CD (Compact Disc) - kompaktní disk – optické médiu používané nejčastěji pro distribuci audio nahrávek vydavatelskými společnostmi či k záloze dat
-
CMY – barevný model osahující tyrkysovou (Cyan), fialovou (Magenta) a žlutou (Yellow) barvu
-
CMYK – barevný model založený na modelu CMY, který navíc obsahuje samostatnou černou barvu
-
color format – barevná hloubka
86
D: -
DAO (Disc-at-once) – metoda vypalování disku, která mezi jednotlivými stopami (tracky) nevypíná laser vypalovací mechaniky
-
dBFS - napěťové hodnoty s tímto označením se používají u digitálních zařízení, při měření úrovní na vstupech a výstupech. Zkratka „FS" je odvozena z anglického „full scale". Maximální hodnota na stupnici zároveň určuje maximální hranici signálové úrovně, která nesmí být překročena, protože pak dochází k přebuzení AD převodníků a tím pádem ke zkreslení. Tento vrchol decibelové stupnice u digitálních zařízení se označuje jako 0 dBFS.
-
decibel (dB) – jednotka hlasitosti
-
dekodér – program, který je schopen přečíst komprimovaná data
-
dekomprese – rozbalení, opak ke kompresi
-
Dilia - správce autorů literárních, dramatických a hudebně dramatických děl
-
DIN konektor (pětikolík) – konektor, který se používá k propojování přístrojů podporujících MIDI, dřív se také používal u klávesnic PC
-
download – stahování souborů ze sítě (zpravidla internetu)
-
DVD (Digital Versatile Disc) – optické médium, které je v současnosti využíváno pro distribuci velmi kvalitního kompresovaného videa a audia či k záloze dat uživateli
E: -
enkodér – kodér
F: -
FAT32 – souborový systém společnosti Microsoft
-
flac (Free Looseless Audio Codec) – jeden z nejznámějších bezztrátových audiokodeků
-
FM (frekvenční modulace) – modulace audiosignálu používaná při vysílání pozemními rádii
-
frame rate – počet snímků za sekundu
-
frame size (rozlišení videa) – udává informaci o počtu pixelů, které tvoří jeden snímek videa
-
frekvence – počet kmitů za jednotku času
G: -
GIF (Graphics Interchange Format) - formát pro ukládání obrázků. Používá LZW kompresi.
-
grabování – převod audia z CD do některého ze ztrátových kompresních formátů
H: -
HLS – barevný model, u kterého se požadovaná barva vytváří zvolením poměru mezi barevným tónem (Hue), světlostí (Lightness) a sytostí (Saturation)
-
Hot-Shoe – patice pro připojení externího blesku u fotoaparátů
87
-
HSV - barevný model, u kterého se požadovaná barva vytváří zvolením poměru mezi barevným tónem (Hue), sytostí (Saturation) a jasovou hodnotou (Value)
I: -
IEEE 1394 – FireWire – velmi rychle rozhraní používané např. pro propojení počítače s digitální kamerou
-
IFO – soubory s touto příponou jsou jednou z hlavních součástí disků DVD-Video a obsahují informace o jazycích jednotlivých zvukových stop, předěly mezi kapitolami, navigační údaje umožňující zobrazování titulků atd.
-
Image – obraz CD na pevném disku
-
Inter-frame - je způsob komprese videa, kdy se neukládá každý snímek, ale uloží se jen rozdíly od předchozího snímku
-
Intergram - správce práv výkonných umělců a vydavatelů
-
Intra-frame – je způsob komprese videa, kdy každý snímek je kompresován samostatně
-
ISO – normovaný logický formát, který určuje jak jsou zapsána data na optických médiích
J: -
Joliet – rozšíření logického formátu ISO, umožňující uložení dlouhých názvů oproti klasickému formátu 8+3
K: -
kbps (kilobit per second) – jednotka datového toku
-
kmitočet – viz. Frekvence
-
kodek – kodér + dekodér. Kodér je program (nebo část programu) pro zápis zvuku nebo videa v komprimované podobě (MP3, OGG, ..). Dekodér je program (nebo část programu) pro čtení zvuku nebo videa v komprimované podobě.
-
korekce – např. na mixážním pultu pro úpravu hlasitosti či ekvalizaci
L: -
land – u CD nebo DVD místo, které odrazí čtecí laserový paprsek. Pomocí odrazu či rozptýlení se určí jestli je zapsána logická úroveň 1 či 0.
-
luminofor – část obrazovky obsahující barevné body 3 barev (červená, zelená, modrá) pomocí nichž se vytvářejí barvy, které potom vidíme na obrazovce
-
LZW (Lempel-Ziv-Welch) – algoritmus pro bezztrátovou kompresi
M: -
Macrovision – standardní ochranný systém používaný u videonosičů, zabraňuje kopírování analogovou cestou (např. z DVD na VHS)
-
MIDI, MID (Musical Instruments Digital Interface) – digitální rozhraní pro komunikaci hudebních nástrojů
-
mixážní pult – zařízení pro úpravu hlasitosti a ekvalizaci vstupního signálu
88
-
mono – zvuk nahrávaný jen do jednoho kanálu. Při zvuku v režimu mono hrají oba reproduktory tentýž zvuk, nevzniká tedy dojem, že by některé složky zvuku přicházely z různých míst v prostoru.
-
mp3 – ztrátový kompresní formát audia
-
mpc (Musepack) - ztrátový kompresní formát audia
-
multiplatformní software – programové vybavení, které je použitelná na více platformách (PC, Mac)
N: -
NLE (Non-Linear Editing) – nelineární stříhací systém. Umožňuje rozdělení videa na jednotlivé záběry a jejich libovolné seřazení.
-
NTSC – televizní norma používaná v Japonsku a USA
O: -
Ogg – balík ztrátových kompresních formátů audia
-
on-demand – u internetových rádií vyžádaný poslech relace (poslech ze záznamu)
-
open source – programy s volně dostupným zdrojovým kódem. Zpravidla jsou ke stáhnutí zdarma.
-
OSA (Ochranný Svaz Autorský) – správce práv autorů
-
outboard gear – přídavné zařízení, např. efektové procesory
-
Overburning – technologie pomocí, které je na CD možnost vypálit o něco větší množství dat než je uvedeno na obale
P: -
p2p (Peer-to-peer) – systém, jehož programy se zabývají výměnou souborů mezi jednotlivými uživateli internetu
-
PAL – televizní norma používaná v Evropě
-
PCM - pulzní kódová modulace
-
PCX – formát pro ukládání obrázků. Používá RLE kompresi.
-
pit - u CD nebo DVD místo, které rozptýlí čtecí laserový paprsek. Pomocí odrazu či rozptýlení se určí jestli je zapsána logická úroveň 1 či 0.
-
pixel – nejmenší jednotka obrazu – jeden bod obrazu
-
PNG (Portable Graphics Network) - formát pro ukládání obrázků. Používá LZW kompresi.
-
plugin - malé programy, které rozšiřují vlastnosti původního programu
-
podvzorkování - pokud není vzorkovací frekvence dostatečně vysoká dochází k podvzorkování a vznikají artefakty (aliasy)
R: -
ra (Real Audio) – ztrátový kompresní formát pro streamování médií
-
RCA konektor (cinch) – konektor, který se používá pro propojení audio a video zařízení.
89
-
rekomprese – dekomprese a opětná komprese pomocí jiného kompresního formátu
-
RGB – barevný model obsahující 3 barvy (červená, zelená, modrá)
-
RIAA (Recording Industry Association of America) - americká asociace zastupující zájmy hudebních společností
-
RLE (Run-lenght Encoding) – algoritmus bezztrátové komprese
S: -
SECAM - televizní norma používaná ve Francii, na středním východě a ve většině Afriky
-
shared – takto se označují sdílené soubory
-
stereo – zvuk nahraný zpravidla ve dvou samostatných stopách. Při zvuku v režimu stereo hrají oba reproduktory různý zvuk, takže vzniká dojem, že by některé složky zvuku přicházely zleva, jiné zprava a další ze středu.
-
stream – proud zvuku, například nepřetržité vysílání u internetového rádia
-
studiové monitory – vysoce kvalitní reproduktory, které se používají v režii nahrávacích studií
-
subtraktivní skládání barev - je založeno na jevu, že čím víc barev složíme dohromady tím tmavší je barva výsledná
-
SVCD - Super Video Compact Disc
-
S-Video konektor - je použit pro připojení S-Video zařízení jako jsou SVHS kamery a video disky.
Š: -
šířka slova (rozlišení) - vyjadřuje počet bitů použitých na vyjádření hodnoty vzorků. Zpravidla bývá 8-bitová, 16-bitová, 24-bitová nebo 32-bitová.
T: -
TAO (Track-at-Once) – vypalovací metoda při níž je laser při dokončení jedné stopy na malý okamžik vypnut
-
TGA (Targa) - formát pro ukládání obrázků. Používá RLE kompresi.
-
terestrický - pozemní – často spojován s klasickým rádiovým vysíláním
-
TIFF - formát pro ukládání obrázků
U: -
UDF (Universal Disc Format) – logický formát disků DVD, pomocí nějž a speciálního programu lze s DVD diskem pracovat podobně jako s pevným diskem
-
USB (Universal Serial Bus) – komunikační rozhraní používané v současnosti spoustou počítačových periferií
V: -
VBR (Variable Bit Rate) – proměnný datový tok. Používá se u komprese audia pro dosažení lepších výsledků tím, že pro navzorkování audiosignálu je potřeba menší bitový tok v tichých částech než v hlasitých
90
-
VCD - Video Compact Disc
-
VOB - soubory s touto příponou jsou jednou z hlavních součástí disků DVD-Video a obsahují komprimované video ve formátu MPEG-2
-
vzorek – navzorkovaný audiosignál, zpravidla se tak označují soubory typu wav
-
vzorkovací frekvence - určuje počet vzorků za sekundu, musí být alespoň dvakrát vyšší, než je nejvyšší zaznamenaná frekvence daného zvukového vzorku
W: -
wav – nekomprimovaný formát audia (navzorkovaný analogový signál)
-
wma (Windows Media Audio) - ztrátový kompresní formát známé společnosti
X: -
XLR konektor – konektor používající se pro připojení např. mikrofonů
Z: -
zoom – přiblížení
-
ztrátová komprese – komprese, založená na nedokonalosti lidských smyslů. Při ztrátové kompresi se vypouští data, která jsou pro člověka nepostřehnutelná. Např. zvuky o frekvenci nad 20kHz.
91
OBSAH 1.
MULTIMÉDIA...................................................................................................................1 1.1.
1.1.1.
Multimédia a virtuální realita..............................................................................3
1.1.2.
Multimédia a hry.................................................................................................3
1.2.
Proč používat vizuální proces předkládání informací.........................................3
1.2.2.
Omezení a výhody multimediálních přednášek ..................................................4
Dostupná multimediální zařízení k použití při výuce .................................................5
1.3.1.
Multimediální počítač .........................................................................................5
1.3.2.
Zpětný projektor..................................................................................................5
1.3.3.
Data video projektory .........................................................................................6
1.3.4.
Vizualizéry..........................................................................................................6
KOMPRIMACE DAT ........................................................................................................7 2.1.
Rozdělení komprimace ...............................................................................................7
2.1.1.
Bezztrátová a ztrátová komprimace....................................................................7
2.1.2.
Fyzická a logická komprimace ...........................................................................7
2.1.3.
Symetrická a asymetrická komprimace .............................................................7
2.1.4.
Adaptivní a neadaptivní komprimace .................................................................8
2.2.
3.
Využití multimédií při výuce ......................................................................................3
1.2.1. 1.3.
2.
Kde se multimédia nejlépe uplatní..............................................................................2
Komprimační algoritmy..............................................................................................8
2.2.1.
RLE (Run-lenght Encoding) ...............................................................................8
2.2.2.
LZW (Lempel-Ziv-Welch) algoritmus ...............................................................8
2.2.3.
Huffmanovo kódování ......................................................................................10
2.2.4.
Další metody .....................................................................................................15
ZVUK ...............................................................................................................................16 3.1.
Co je to zvuk .............................................................................................................16
3.1.1. 3.2.
Frekvence a Amplituda .....................................................................................16
Zvuk v počítači .........................................................................................................16
3.2.1.
Vzorky a MIDI..................................................................................................16
3.2.2.
Mono a Stereo ...................................................................................................16
3.2.3.
Digitální zvuk....................................................................................................17
3.3.
Zpracování zvuku......................................................................................................18
3.3.1.
Profesionální postup..........................................................................................19
3.3.2.
Amatérský postup .............................................................................................19
3.4.
Komprese Zvuku.......................................................................................................19 92
3.4.1.
Bezztrátová komprese .......................................................................................20
3.4.2.
Ztrátová komprese ............................................................................................21
3.5.
3.5.1.
Vyřezávání / mazání segmentu (označené části vzorku) ..................................25
3.5.2.
Speciální funkce a efekty ..................................................................................25
3.6.
4.
MIDI a jeho záznam..........................................................................................27
3.6.2.
Konektory pro MIDI .........................................................................................27
ULOŽENÍ OBRAZU A VIDEA V DIGITÁLNÍ PODOBĚ ............................................28 Jak dostat obraz do počítače a jak se tam uloží ........................................................28
4.1.1.
Rastrové formáty...............................................................................................28
4.1.2.
Jak se mění velikost souboru se změnou obrázku ............................................29
4.2.
Přenos videa do počítače...........................................................................................31
4.2.1.
Typy konektorů.................................................................................................32
4.2.2.
Změna velikosti videa .......................................................................................33
OBRAZ .............................................................................................................................35 5.1.
Barvy v počítačové grafice .......................................................................................35
5.1.1.
Barevné modely ................................................................................................35
5.1.2.
Model RGB.......................................................................................................35
5.1.3.
Modely CMY ....................................................................................................36
5.1.4.
Modely HSV a HLS..........................................................................................37
5.2.
Zpracování obrazu ....................................................................................................38
5.2.1.
Snímání .............................................................................................................38
5.2.2.
Digitalizace .......................................................................................................38
5.2.3.
Alias a antialiasing............................................................................................39
5.3.
Digitální foto .............................................................................................................40
5.3.1.
Základní Pojmy.................................................................................................40
5.3.2.
Clona a expoziční čas........................................................................................43
5.3.3.
Programy na úpravu obrazu ..............................................................................45
5.4.
6.
MIDI .........................................................................................................................27
3.6.1.
4.1.
5.
Základní editace vzorku............................................................................................24
Morphing a warping..................................................................................................47
5.4.1.
Warping.............................................................................................................47
5.4.2.
Morphing...........................................................................................................47
ZPRACOVÁNÍ VIDEA ...................................................................................................48 6.1.
Základní pojmy .........................................................................................................48
6.1.1.
Analogové a digitální video ..............................................................................48
93
6.1.2.
Lineární a nelineární střihové systémy .............................................................49
6.1.3.
Snímková rychlost a rozlišení...........................................................................49
6.1.4.
Vysílací normy..................................................................................................50
6.1.5.
Prokládané a neprokládané video .....................................................................50
6.1.6.
Barevné modely ................................................................................................50
6.1.7.
Vzorkování barev..............................................................................................52
6.1.8.
Analogové video formáty .................................................................................52
6.2.
7.
Video komprese ........................................................................................................53
6.2.1.
Bezeztrátové kodeky.........................................................................................54
6.2.2.
Ztrátové kodeky ................................................................................................54
6.3.
Programu pro střih videa...........................................................................................57
6.4.
Přehrávače.................................................................................................................59
6.5.
Titulky.......................................................................................................................61
PROGRAMY PRO SDÍLENÍ MM SOUBORŮ ..............................................................64 7.1.
Jak to funguje............................................................................................................64
7.1.1. 8.
MULTIMÉDIA NA INTERNETU...................................................................................68 8.1.
Rádio přes internet ....................................................................................................68
8.1.1.
Typy vysílání internetových rádií .....................................................................68
8.1.2.
Co je to streaming a co je oněm dobré vědět ....................................................68
8.1.3.
Jak streaming funguje neboli cesta z rádia k posluchači ..................................69
8.1.4.
Streamové formáty a příslušné multimediální přehrávače................................69
8.1.5.
Internetové vysílání a zákon .............................................................................71
8.1.6.
Kam za rádii ......................................................................................................71
8.2.
9.
Jak probíhá výměna ..........................................................................................64
Web kamery ..............................................................................................................71
8.2.1.
Princip webových kamer...................................................................................72
8.2.2.
Typy a připojení webových kamer ...................................................................72
8.2.3.
Rozdělení webových kamer..............................................................................73
VYPALOVÁNÍ ................................................................................................................74 9.1.
Teorie ........................................................................................................................74
9.1.1.
9.1.1 Kompaktní disky – CD ............................................................................74
9.1.2.
Rychlost vypalování..........................................................................................74
9.1.3.
Mode 1 / Mode 2...............................................................................................75
9.1.4.
Logický formát ISO 9660 .................................................................................75
9.1.5.
Typy formátů vypalovaného CD ......................................................................76
94
9.1.6.
Kombinované CD .............................................................................................76
9.1.7.
Video CD ..........................................................................................................76
9.1.8.
Super Video CD................................................................................................76
9.2.
Program NERO – základní pojmy ............................................................................77
9.2.1.
Několikanásobné vypalování (tzv. multisession) .............................................77
9.2.2.
Stopa CD...........................................................................................................77
9.2.3.
Metody vypalování Track-at-once (TAO) / Disc-at-once (DAO) ....................77
9.2.4.
Overburning ......................................................................................................77
9.2.5.
Vytvoření / vypálení tzv. IMAGE ....................................................................77
10.
DVD..............................................................................................................................78
10.1.
Seznamte se, DVD ................................................................................................78
10.2.
Lisovaná DVD ......................................................................................................79
10.3.
Vypalovaná DVD..................................................................................................79
10.4.
Vlastnosti DVD.....................................................................................................79
10.5.
Rychlosti DVD......................................................................................................80
10.6.
Regiony DVD .......................................................................................................80
10.7.
Formáty DVD .......................................................................................................81
10.7.1.
Fyzické formáty ................................................................................................81
10.7.2.
Logické formáty................................................................................................83
10.8.
11.
Adresářová struktura a soubory na DVD-Video...................................................83
10.8.1.
Soubory s příponou VOB..................................................................................84
10.8.2.
Soubory s příponou IFO....................................................................................85
10.8.3.
Soubory s příponou BUP ..................................................................................85
SLOVNÍČEK POJMŮ..................................................................................................86
Seznam tabulek Tabulka 1 Kódování řetězce algoritmem LZ78.........................................................................10 Tabulka 2 Bitová rozlišení zvuku ..............................................................................................18 Tabulka 3 Příklady kvality vzorkování zvuku a velikosti ..........................................................18 Tabulka 4 Vysílací normy .........................................................................................................50 Tabulka 5 Základní formáty videa ............................................................................................53
Seznam obrázků Obrázek 1 Strom Huffmanova kódování ...................................................................................11 Obrázek 2 Strom Shanon Fanova kódování..............................................................................12 Obrázek 3 Tabulka aritmetického kódování .............................................................................14 Obrázek 4 Posloupnost operací při kompresi JPEG ................................................................15 95
Obrázek 5 Zpracování zvuku ....................................................................................................17 Obrázek 6 Amatérská cesta záznamu zvuku..............................................................................19 Obrázek 7 Nahrávka slova „Multimedia“ (8bit, 44100 Hz, mono)..........................................24 Obrázek 8 Demonstrace efektu Fade In / Fade out na našem zvukovém vzorku......................25 Obrázek 9 Konektory DIN ........................................................................................................27 Obrázek 10 Výřez původního obrázku ......................................................................................30 Obrázek 11 Výřez obrázku v 90% kompresi JPEG...................................................................30 Obrázek 12 Výřez obrázku ve formátu BMP a barevné hloubce 32b .......................................30 Obrázek 13 Výřez obrázku ve formátu BMP a o 16-ti barvách ................................................31 Obrázek 14 IEEE 1394 .............................................................................................................31 Obrázek 15 FireWire ................................................................................................................32 Obrázek 16 XLR konektor .........................................................................................................32 Obrázek 17 RCA konektor ........................................................................................................32 Obrázek 18 BNC konektor ........................................................................................................33 Obrázek 19 S-Video konektor ...................................................................................................33 Obrázek 20 Model RGB ............................................................................................................35 Obrázek 21 Model CMY............................................................................................................36 Obrázek 22 Modely HSV a HLS................................................................................................37 Obrázek 23 Vzorkování.............................................................................................................39 Obrázek 24 Průřez digitálním fotoaparátem ............................................................................40 Obrázek 25 Paměťová média....................................................................................................42 Obrázek 26 Expoziční čas .........................................................................................................43 Obrázek 27 Clona .....................................................................................................................44 Obrázek 28 Nastavení expozice ................................................................................................45 Obrázek 29 Warping .................................................................................................................47 Obrázek 30 Morphing ...............................................................................................................47 Obrázek 31 Videosignál ............................................................................................................48 Obrázek 32 Šum ........................................................................................................................49 Obrázek 33 Barevný model RGB - video ..................................................................................51 Obrázek 34 Barevné vzorkování ...............................................................................................52 Obrázek 35 Windows Media Player .........................................................................................59 Obrázek 36 BSplayer ................................................................................................................59 Obrázek 37 mv2player ..............................................................................................................60 Obrázek 38 QuickTime .............................................................................................................60 Obrázek 39 Formát titulků - MicroDVD ..................................................................................61
96
Obrázek 40 Formát titulků - Sub Rip ........................................................................................61 Obrázek 41 Formát titulků – SubViewer ..................................................................................62 Obrázek 42 Formát titulků - Substation Alpha .........................................................................63 Obrázek 43 Distribuce souboru standardní cestou ..................................................................66 Obrázek 44 Distribuce souboru pomocí BitTorrentu ...............................................................67 Obrázek 45 Web kamera ...........................................................................................................71
97