Technické aspekty sestřihu televizních pořadů na magnetických nosičích
Ing. Josef Pešek
Filmová a televizní fakulta AMU Katedra střihové skladby Habilitační práce
2
Obsah: Úvod ........................................................................................................................... 4 1. Přehled vývoje výroby televizních pořadů.......................................................... 5 1.1 Postsynchron a dabing televizních pořadů na pásku................................ 11 2. Vývoj magnetického záznamu televizního signálu na pásek .......................... 13 2.1 Rotující magnetické hlavy, konfigurace hlava-pásek................................ 14 2.2 Transformace obrazového signálu. .......................................................... 18 2.3 Rozdělení záznamové techniky z hlediska transformace obrazového signálu ............................................................................................................ 21 3. Sestřih televizního signálu na magnetickém pásku ........................................ 23 3.1 Mechanický střih....................................................................................... 23 3.2 Elektronický střih – záznamový stroj......................................................... 25 3.2.1 Střih pomocí tónových značek .................................................... 27 4. Sekvence barevných kompozitních signálů a přesnost střihové skladby..... 28 5. Požadavky na řízení záznamových strojů při střihu ........................................ 33 6. Časový a řídicí kód ............................................................................................. 35 6.1 Podélný časový kód SMPTE / EBU - LTC ................................................ 35 6.2 Vertikální časový kód – VITC.................................................................... 36 6.3 Užívání časového kódu ............................................................................ 37 6.3.1 Generátor a čtečka časového kódu na záznamovém stroji......... 39 7. Automatické (lineární) střihové systémy .......................................................... 41 7.1 Vedlejší příprava střihových dat – střih „off-line“....................................... 44 8. Komprese televizního signálu ........................................................................... 47 8.1 Obecné principy komprese televizního signálu ........................................ 47 8.1.1 Komprese digitální ...................................................................... 47 8.2 Kompresní metoda M-JPEG..................................................................... 49 8.3 Kompresní systém MPEG-2 ..................................................................... 51 8.4 Kompresní systém DV.............................................................................. 53 8.5 Střih komprimovaných televizních signálů................................................ 55 9. Nelineární editing................................................................................................ 59 9.1 Obecná struktura pracovní stanice – „workstation“................................... 60 9.2 „Embedded editing“ - střih na videoserveru .............................................. 62 9.2.1 Disková pole RAID...................................................................... 62 9.3 Střih filmu ................................................................................................. 63 10. Přehled záznamových formátů. ....................................................................... 66 10.1 Analogové kompozitní profesionální záznamové formáty....................... 66 10.2 Záznamové formáty pro domácí použití ................................................. 68 10.3 Analogové složkové profesionální formáty ............................................. 70 10.4 Digitální záznamové formáty .................................................................. 72 10.4 Akviziční digitální formáty ....................................................................... 75 Závěr ........................................................................................................................ 79
3
Technické aspekty sestřihu televizních pořadů na magnetických nosičích Úvod Realizace provozuschopného magnetického záznamu televizního signálu znamenala ve vývoji televize obrat natolik zásadní, že může být srovnávána, i když v odlišné rovině, se změnami, které přináší nastupující digitální televize. I přes svou počáteční technickou nedokonalost magnetický záznam velmi rychle vyřešil řadu problémů tehdejších televizních studií a komplexů. Dodatečné střihové a režijní zpracování pořadů vyráběných na magnetickém nosiči však bylo ve svých počátcích, zvláště ve srovnání s možnostmi filmového střihu, střihem velmi primitivním a omezujícím. V průběhu let však v několika vlnách dosáhlo takové úrovně, že proniklo i do filmové výroby a zásadně změnilo nejen technologickou stránku klasického filmového střihu, ale nabídlo navíc i nástroje, které nejen snižují pracnost, ale mohou zvýšit technickou i uměleckou kvalitu filmového střihu jako takového. V současné době se stal již běžným tzv. digitální film a prakticky všechna audiovisuální díla jsou zpracovávána elektronicky, bez ohledu na jakém nosiči byla pořizována, nebo budou šířena. Cílem této práce je vysvětlit základní principy magnetického záznamu obrazu, zmapovat jeho vývoj a technické problémy střihu jako discipliny, jež byla po dlouhou dobu nejslabším článkem a nevýhodou produkce pořadů vyráběných pomocí elektronické kinematografie, jak býval magnetický záznam zpočátku nazýván. Dále pak snaha umožnit tvůrčím složkám, především střihačům, hlubší proniknutí do dané problematiky. Vzhledem ke svému určení nezabíhá do technických detailů, blíže však vysvětluje s problematikou související oblasti televizní a záznamové techniky, které nejsou mimo příslušně zaměřenou odbornou veřejnost střihačům obecně známy.
4
1. Přehled vývoje výroby televizních pořadů Ačkoli byly zásadní technické problémy elektronické televize s vysokou rozlišovací schopností, jak byly moderní televizní systémy nazývány, vyřešeny v Evropě i Americe již před válkou, probíhal poválečný vývoj, snad s výjimkou BBC, v rozhodující míře ve Spojených státech, které tak získaly před Evropou několikaletý náskok v rozvoji televize obecně - a obzvláště jako média, které se stalo součástí životního stylu. I když některé aspekty byly specifické, protože vývoj v USA probíhal na bázi komerčních společností a musely být řešeny problémy, které přinášela potřeba pokrytí nesrovnatelně většího území, vývoj v Evropě se ve většině případů s určitým zpožděním opakoval. Na přelomu čtyřicátých a padesátých let televize uměla přenášet právě probíhající děje a snímaný filmový obraz, neexistoval však žádný technický prostředek, který by byl schopen televizní signál jako takový zaznamenat. Jedinou možností bylo filmování televizního obrazu z obrazovky pomocí speciální kamery, tzv. telerekording. Technickým problémem byl jednak požadavek na dokonale synchronní chod kamery, a zvláště požadovaná rychlost strhu filmu, který musel být proveden včetně uklidnění v době vertikálního zatemňovacího intervalu (cca 1,6 ms). Prakticky mohl být realizován pouze pro šestnáctimilimetrový film. V případě filmu 35 mm musel být strh proveden v době druhého půlsnímku, což snižovalo vertikální rozlišovací schopnost na polovinu, a navíc již byla silně patrná řádková struktura. Problémy byly samozřejmě i s rozptylem světla ve skle obrazovky a s odlišnou gradační křivkou filmu a obrazovky. Kvalita obrazu tedy byla ze samého principu nízká, materiál byl k disposici až po vyvolání a význam klasického telerekordingu spočíval prvé řadě v možnostech archivace a opakování živě vysílaných pořadů. Přesto se telerekording v řadě společností začal užívat i pro výrobu. Pracovalo se klasickou televizní technologií s více kamerami a postupně byly zaznamenávány jednotlivé sekvence obsahující řadu kamerových střihů. Ty mohly pak být celkem jednoduše sestřiženy. Pro televizní výrobu bylo sice možné použít klasickou filmovou technologii, avšak z hlediska nákladů a produktivity takto mohla být z počátku vyráběna pouze její určitá část. Jednalo se v prvé řadě o z zpravodajství, publicistiku, dokumenty a výrobu reklam. Ačkoli podíl filmově vyráběných pořadů v televizi stále stoupal, bylo nutné, aby se televizní společnosti v převážné míře orientovaly na živé vysílání. Vznikla tak vlastně zcela nová forma produkce zábavných, naučných, a hlavně uměleckých pořadů, které byly připraveny v televizních studiích a snímány několika kamerami. Vysílány byly živě s použitím primárního střihu, tj. volby jednotlivých kamer na režijní jednotce. Film se zde užíval pouze pro exteriérové dotáčky a případně pro úvodní a závěrečné titulky. Rozsah televizního vysílání byl tedy technicky omezen kapacitou studií a technického zařízení. Na vrcholu této éry v roce 1954 provozovala americká společnost CBS dvacet studií v New Yorku a pět v Hollywoodu [3] - ta produkovala sedmdesát hodin živého programu za týden.1 To vše navzdory skutečnosti, že se
1
Československá televize Praha, při nesrovnatelně nižší výrobě na konci padesátých a v šedesátých létech řešila kritický nedostatek studií využíváním přenosových vozů a snad všech vhodných i nevhodných sálů a tělocvičen v Praze a okolí.
5
tento způsob produkce pro některé typy pořadů nehodil a ve srovnání s filmovou produkcí obdobných žánrů je umělecky, a zvláště profesionálně degradoval. Řada filmových producentů ve Spojených státech si však již na počátku padesátých let uvědomila, jak náročné médium z hledisko spotřeby pořadů televize je a jak výhodné by bylo využití vysoce profesionálních lidských i technických kapacit existujících filmových studií, pokud by filmová výroba splnila časová a ekonomická kriteria televize. A to zvláště v situaci, kdy se již objevil v kinech pokles diváků. Po několika experimentálních pořadech se filmy začaly vyrábět během dnů namísto měsíců a s náklady, které se příliš nelišily od ekvivalentních živě vysílaných pořadů. Vznikly zcela nové postupy, začalo se natáčet více kamerami a v roce 1954 se objevil systém „Electronicam”. Zde došlo ke kombinaci filmové a televizní sekvenční technologie, kdy filmové kamery byly vybaveny pomocnými televizními kamerami. Televizní obraz na monitorech umožňoval jejich přesné vedení a návaznost záběrů. Filmové kamery pak byly dálkově spouštěny, takže jednotlivé záběry mohly být snadno spojeny v poměrně dlouhé sekvence. Ještě důležitější než tyto nové postupy byla skutečnost, že filmová kamera mohla pracovat v exteriérech, kam se tehdejší přenosové kamery nedostaly a záběrová technologie přinášela podstatně vyšší uměleckou i profesionální kvalitu, nemluvě o kvalitě technické. Filmová produkce začala obsazovat stále větší prostor v programových schématech vysílacích společností. V roce 1957 tak bylo v CBS již kolem 20 % pořadů produkováno na filmu, přičemž v hlavním vysílacím čase to byla více než polovina odbavovaných pořadů a bylo možno očekávat stálý nárůst [3]. Zdálo se tedy, že film se stane pro televizi jediným záznamovým a produkčním prostředkem. Vzdor tomu byla potřeba magnetického záznamu stále zřejmější a naléhavější. Jedině magnetický záznam mohl tehdy vyřešit možnost záznamu televizního signálu jako takového, jeho prakticky okamžitou reprodukci, a tím umožnit záznam živě vysílaných pořadů, jejich opakování a archivaci a v neposlední řadě i bezprostřední opakování důležitých pasáží živě vysílaných pořadů, zvláště sportovních. Magnetický záznam umožnil vyřešit elektronický transport pořadů mezi televizními středisky a jejich zpožďování pro různá časová pásma, což byl problém specificky americký. Provozuschopný magnetický záznam televizního signálu, který disponoval dostatečnou kvalitou a kapacitou, presentovala v roce 1956 firma AMPEX. Realizován byl na dvoupalcovém pásku pomocí čtyř rotačních hlav a označován jako příčný záznam (transversal recording) nebo „Quadruplex”. Tímto rokem, respektive rokem 1957, kdy začaly být prvé stroje dodávány, začal postupný přerod televizních studií a produkčních technologií. Technické řešení bylo natolik šťastné, že mohlo být zdokonalováno a tento záznam se stal se na dvacet let prakticky jediným celosvětovým profesionálním záznamovým standardem. Vývoj střihu televizního magnetického záznamu je tak do značné míry s tímto formátem spojen. Ačkoli první modely záznamových strojů trpěly řadou nedostatků, nebyly určeny k postprodukci a existovaly i problémy s kompatibilitou, začal být magnetický záznam pro výrobu pořadů užíván prakticky okamžitě. Protože elektronický střih nebyl technicky zvládnut, byl pásek stříhán mechanicky. Do značné míry se zde uplatnily analogie s filmem a magnetofonovým páskem, který, stejně jako film, mohl být téměř od samého počátku stříhán právě takto. Zatímco mechanický střih těchto nosičů je z technického hlediska velmi jednoduchý a přesný, je obdobný střih
6
televizního magnetického pásku obecně extrémně obtížný a mechanický střih byl s řadou omezení prakticky realizovatelný pouze u prvního, tj. kvadruplexního záznamového formátu. Přes veškeré problémy byl však již koncem roku 1957 vyroben ve společnosti CBS muzikál „The Red Mill”, který obsahoval v devadesáti minutovém pořadu neuvěřitelných 168 mechanických střihů [3]. Technická stránka mechanického střihu se pomocí různých přípravků a zařízení zdokonalovala, zrychlovala a zpřesňovala a v televizi se objevila se profese střihačů „on-line“, tj. střihačů, jež podle pokynů tvůrčích pracovníků vlastní střih realizovali. Hlavní omezení mechanického střihu z hlediska střihové skladby, možnost střihat pouze na obraz, nebo na zvuk s přesahem jedné, nebo druhé informace, však překonáno být nemohlo. Přesto se v celosvětovém měřítku v různé míře používal mechanický střih až do počátku sedmdesátých let. Jeho výhodou byla později paradoxně jeho rychlost, protože pásek nemusel být přepisován; z určitého pohledu se jednalo vlastně o střih nelineární a výsledkem byl originální záznam nedegradovaný přepisem. Prokazatelně byl v omezené míře užíván i při Olympijských hrách v Mnichově roku 1972 a údajně ještě na Mistrovství světa v kopané v Mexiku. V současné době je užíván pouze pro záchranu pořadu, pokud dojde k přetržení nebo poškození pásku, což se může vyskytnout zvláště při přepisu archivních materiálů. Elektronický střih, tj možnost postupného řazení nebo vkládání jednotlivých sekvencí na pásek při zachování kontinuity záznamového formátu, se objevil až v roce 1962 [14]. Střih se stal bezpečnějším, nebyl znehodnocován tehdy velmi drahý záznamový materiál a odstranil se již zmíněný přesah v obraze nebo zvuku. Proces však zůstával stále poměrně pracný a vyžadoval vysoce kvalifikovanou obsluhu záznamových strojů. Největším problémem však byla přesnost střihu. Bod nástřihu byl určován víceméně odhadem podle počítadla, počátek příspěvku závisel na startu příspěvkového stroje a jeho náběhu do vazby. Z tohoto hlediska se jednalo spíše o spojování vybraných sekvencí, než o střih „na snímek” ve filmovém slova smyslu. Vzdor tomu se i zde začala rodit profese střihačů „on –line”, z nichž někteří intuitivně dokázali stříhat takřka „na okno”. Dalším zlepšením byl střih pomocí tónových značek, jež pevně určily alespoň bod nástřihu a umožnily předvedení střihu (i když ne zcela přesně opakovatelné) před jeho realizací. Vzájemný souběh příspěvkového a záznamového stroje nebyl v průběhu šedesátých let obecně vyřešen, i když byly realizovány proprietární systémy užívající k souběhu tónové značky, nebo čítání impulsů řídicí stopy. V polovině šedesátých let se začal rodit časový a řídicí kód a v roce 1967 začaly v laboratořích CBS pokusné práce s jeho využitím pro řízení záznamových strojů [3]. Pro malou způsobilost první generace kvadruplexních strojů z hlediska řízení byly pro vývoj užívány nové půlpalcové transporty různých typů. Přestože začala být užívána k řízení i počítačová technika, výsledky byly málo přesvědčivé, takže pásek byl opuštěn ve prospěch experimentů se záznamem analogového televizního signálu na magnetický disk [10]. V tomto úsilí se technici laboratoří CBS spojili se společnosti Memorex, která na tomto poli již delší dobu experimentovala. V televizní praxi se tedy situace v šedesátých létech příliš nezměnila. Počátkem sedmdesátých let již byly kvadruplexní záznamové stroje běžnou součástí televizních komplexů, a zvláště v Evropě se staly hlavním prostředkem televizní produkce - podíl živě vysílaných pořadů stále klesal. Ve Spojených státech však byla filmová produkce velmi silná. Například u společnosti CBS představovala
7
výroba na pásek 43,3 %, výroba na film 37,6 % a 19,1 % bylo živé vysílání, z čehož 12,3 % připadlo na zpravodajství, takže živé vysílání zábavných pořadů tvořilo pouze 6,8 % vysílacího času [3]. Jak je patrné, výroba na pásek poněkud převažovala, avšak v hlavním vysílacím čase převažoval film v poměru téměř 2:1. Důvodem byla skutečnost, že televizní filmová výroba byla zvládnuta do té míry, že byla nejen kvalitnější, ale i rychlejší, a to i v případě, že byla pro elektronickou výrobu užita televizní, tj. sekvenční technologie. Například devadesátiminutová inscenace vyrobená na pásek vyžadovala včetně zkoušek mimo studio 25 dnů, přičemž při práci ve studiu participoval štáb téměř čtyřiceti techniků a jevištních asistentů. Naproti tomu obdobný program vyrobený na film vyžadoval pouze sedm dnů vlastního natáčení včetně exteriérů, při účasti maximálně dvaadvacetičlenného štábu. Střih a všechny ostatní práce byly provedeny během patnácti dnů. To vše při výhodách záběrové technologie a vyšší kvalitě. Pokud byla záběrová technologie použita pří elektronické výrobě podobného typu pořadu, vyžadovalo střihové zpracování neuvěřitelných pět set hodin, nemluvě o problémech s mobilitou tehdejších studiových televizních kamer. Nedostatky střihu obrazového magnetického pásu v této době jsou zmíněným příkladem dostatečně ilustrovány a na základě uvedených skutečností by se zdálo, že elektronická výroba televizních pořadů bude omezena na určitý typ méně náročných pořadů. V Evropě nedosáhla filmová výroba nikdy srovnatelné úrovně a podíl pořadů vyrobených na pásek byl vyšší, nicméně i zde platilo, že v případech, kdy byla vyžadována vyšší profesionální a umělecká kvalita, byl pro televizní výrobu použit film, i když velmi často šestnáctimilimetrový. Začátek sedmdesátých let byl však zároveň přelomový. Do praxe začal pronikat již zmíněný časový a řídicí kód, který adresoval každý televizní snímek a mohl být čten, kdykoli se magnetický pás pohyboval. Na trh přišla nová generace záznamových strojů s podstatně lepšími provozními vlastnostmi a možnostmi řízení a velký pokrok udělala počítačová technika. Jakmile byly totiž jednotlivé televizní snímky „očíslovány”, bylo možno bezpečně a opakovaně ve zvoleném čase vyhledat kterýkoli z nich. Navíc se objevila první přenosná televizní kamera a později i přenosné kvadruplexní záznamové stroje, s nimiž bylo možno pracovat i v náročných exteriérech. Velmi důležitou okolnost sehrála i skutečnost, že stále stoupal počet barevných pořadů, čímž prudce stouply náklady na filmovou produkci. U hodinového pořadu činily jenom na materiál a laboratorní zpracování 15 000 $. Pro intenzivní vývoj střihových systémů byly tedy splněny technické i ekonomické předpoklady. V lednu roku 1970 založily laboratoře společnosti CBS a firmy MEMOREX společný podnik s názvem CMX (CBS – MEMOREX – EXPEREIMENTAL), který sehrál ve vývoji střihových systémů pravděpodobně rozhodující roli [10]. Jejich prvním produktem byl systém označený CMX 600, jenž lze současnou terminologií označit jako hybridní a výrazně předběhl dobu. Skládal se ze dvou částí. Prvá část byla tvořena řídicím počítačem a stojanem s nezakrytými, vyjímatelnými paměťovými disky, v současné terminologii tedy diskovým polem (i když některé atributy z hlediska současného chápání diskových polí samozřejmě chyběly). Každý z těchto disků měl kapacitu 56 kB, což představovalo cca 5 minut černobílého obrazového záznamu v kvalitě přijatelné pro vyhledání střihových míst. Šest disků potom představovalo 30 minut pořadu, kde byl každý televizní snímek označen časovým a řídicím kódem a byl prakticky okamžitě přístupný. Jednalo se tedy již vlastně o
8
nelineární střihový systém pro vedlejší –„off-line”- přípravu dat.2 Ovládání bylo prováděno světelným perem a výsledkem byla děrná páska se střihovými daty pro lineární ”on–line” část označenou jako CMX 200, kde byl sestřih na kvadruplexních záznamových strojích typu AVR 1 realizován. Systém CMX byl velmi drahý a jeho cena bez záznamových strojů v té době přesahovala 500 000$. Přesto bylo v roce 1972 vyrobeno 5 sestav. Lineární část CMX 200 byla později nahrazena systémem CMX 300, kde kromě děrné pásky bylo možné zadávat data i z klávesnice, a vznikl tak samostatný lineární editor. Pro svoji vysokou cenu, nároky na údržbu a nízkou kvalitu obrazu z disků se systém CMX 600 dále nerozvíjel. Přesto však umožnil, aby v polovině sedmdesátých let byl určitý typ kinematografických filmů vyráběn přes magnetický pás s výsledným přepisem na film pomocí laserového telerekordingu. Vývoj lineárního editoru CMX 300, ve spolupráci s uživateli, nadále pokračoval a na výstavě NAB v roce 1978 byla presentována verse 340, později 3400 a 3400+, což již byl velmi pokročilý systém obsahující databázi ovládaný funkčními tlačítky a s tzv. „přátelským” uživatelským rozhraním, které již do určité míry osvobozovalo střihače od typicky počítačového stylu práce [10].Vyvíjeny byly i editory pro záznamové stroje poloprofesionálního formátu U-matic, který se ve Spojených státech, a později ve variantě HB i v Evropě, začal užívat pro elektronickou žurnalistiku. Nezanedbatelný při vývoji střihových technologií byl i přínos hlavního výrobce kvadruplexních záznamových strojů, firmy AMPEX. V prvé polovině sedmdesátých let tato firma realizovala souběhový systém RA 4000 řízený interní aritmetickou jednotkou s pevným programem. Umožňovala řídit souběh až šesti transportů ve dvou skupinách po třech a umožňovala též souběh typu A-B, tzv. „A-B roll”, kdy byly reprodukční stroje A a B startovány postupně, takže příspěvky mohly na sebe plynule navazovat. Systém neumožňoval řízení režijní jednotky a střihové adresy musely být zadávány postupně. Skutečným střihovým systémem, tak jak je v současné době chápán, byla až jednotka EDM-1 vyrobená ve spolupráci s firmou Central Dynamics. Tato jednotka byla až do konce osmdesátých let užívána v Československé televizi Praha a její název se zde stal synonymem pro sestřih a dodatečné zpracování pořadů na magnetickém nosiči. Jednalo se o optimálně řešený a vysoce výkonný systém a lze jen litovat, že jeho dalšímu vývoji a rozšíření zabránily neshody mezi výrobci. Velmi důležitá byla i skutečnost, že poslední modely kvadruplexních strojů firmy AMPEX byly již připraveny na práci s časovým kódem a na externí řízení a v druhé polovině sedmdesátých let byl presentován i tzv. inteligentní stroj AVR-3 vykonávající podle povelů samostatně dílčí úkoly a dálkově ovládaný pomocí sériového protokolu RS-232. Po dvacetileté vládě kvadruplexu přinesl konec sedmdesátých let nové profesionální jednopalcové záznamové formáty, vhodné pro konstrukci spolehlivých přenosných strojů, které spolu s kvalitními přenosnými kamerami umožnily filmový způsob práce i v náročných exteriérech. Nesegmentovaný jednopalcový záznamový formát „C” nabídl navíc zcela nové provozní vlastnosti. Byla to v prvé řadě možnost sledovat obraz i při převíjení - tzv. 2
Termíny „off-line / on-line“ byly převzaty z terminologie sálových počítačů, kdy s ohledem na jejich cenu a cenu provozu bylo nemyslitelné připravovat data a zadání přímo na nich. Analogie s kvadruplexními záznamovými stroji je zde zcela zřejmá.
9
viditelné vyhledávání a reprodukce obrazu nestandardními rychlostmi včetně obrazu stojícího. Na základě těchto vlastností byly vyvíjeny relativně laciné střihové systémy označované jako „střihové stolky”, jejichž provozní filosofií byla snaha osvobodit střihače od práce s čísly a co nejvíce se přiblížit způsobu práce na filmovém střihovém stole. Velmi známým představitelem tohoto typu byl editor HPE-1 (Helical Production Editor) dodávaný firmou Ampex. Jednotlivé transporty byly ovládány jediným víceúčelovým ovladačem – „joystick” a adresy mohly být velmi přesně zadávány letmo. Uvedený systém byl řízen jediným mikroprocesorem, záznamové stroje byly ovládány paralelně, a proto byl poměrně pomalý. Oproti počátečním velmi příznivým prognózám se však dále nerozvíjel a trh ovládly systémy větší, v Evropě v prvé řadě CMX, AMPEX a SONY. V této době však nastupují již i další výrobci, z nichž lze jmenovat firmy Grass Valley, Bosch Fernsehe, Paltex atd., a v prvé polovině osmdesátých let již existuje velmi široké spektrum zařízení nabízejících takřka neomezený střihový komfort. Nástup komponentních půlpalcových záznamových formátů, jmenovitě záznamového standardu BETACAM, umožnil konstrukci dlouho postrádaných ručních kamer s vysokou kvalitou obrazu, spojených se záznamovou jednotkou, tzv. kamkordérů, jejichž rozměry a váha odpovídaly šestnáctimilimetrovým filmovým reportážním kamerám. I když byl tento formát původně zamýšlen pouze jako akviziční formát a předpokládalo se, že natočené materiály budou přepsány a střihově zpracovány na studiových záznamových formátech, byl jejich úspěch takový, že k tomuto formátu byl vyroben úplný produkční řetěz a magnetický pás definitivně a celosvětově ovládl televizní žurnalistiku. Zdokonalená verze tohoto záznamového standardu BETACAM SP pak nabídla takové spektrum technického zařízení, že umožnila exteriérovou výrobu televizních pořadů se záběrovou, tedy filmovou technologií. Profesionální a umělecká kvalita již byla z technického hlediska omezena pouze kvalitou vlastního magnetického záznamu, jenž byl v této době v naprosté většině analogový, nebyl tedy plně transparentní a umožňoval pouze omezený počet záznamových generací. Digitální záznamové standardy D1 a D2, které se objevily po roce 1986, pak vyřešily problém transparentních přepisů a brzy se objevily postprodukční společnosti užívající komponentní digitální formát D1, který umožňoval režijní zpracování v mnoha vrstvách, což tehdy v krajních případech vyžadovalo i několik desítek generací. Osmdesátá léta mohou být klasifikována jako období, kdy byl lineární střih pořadů na magnetickém pásu plně zvládnut a elektronická výroba televizních pořadů, zvláště v Evropě, se stala metodou natolik dominantní, že televizní střediska, která měla vlastní filmovou výrobu, uvažovala o jejím zrušení. Tato situace se ovšem později s nástupem filmu Super 16 poměrně rychle změnila. Téměř ve všech případech však byl pro televizi filmový negativ dále zpracováván elektronicky. Vedlejší, „off–line“, příprava střihových dat se v televizních komplexech sice běžně prováděla, avšak z důvodů, které budou zmíněny později, byla oproti původním předpokladům poměrně primitivní. Ve Spojených státech byla situace poněkud odlišná. Zánik filmu jako výrobního prostředku zde prakticky nikdy nehrozil, naopak hlavním filmovým formátem pro inscenace se stal pětatřicetimilimetrový film. Kromě ekonomických hledisek zde svou roli jistě sehrála i skutečnost, že film jako takový je prakticky nezávislý na televizním standardu a jeho kvalita je více než dostatečná pro budoucí televizní systémy s vysokou rozlišovací schopností. Tato situace spolu s nutností
10
vyrábět ekonomicky vyústila ve snahy používat současně s filmem magnetický záznam jako pomocné médium pro kontrolu denních prací a v úsilí vyvinout střihový systém jako nástroj pro dokonalou přípravu filmového střihu s použitím poloprofesionálních i konzumních záznamových strojů, optických nebo magnetických disků ( tzn. editory lineární, hybridní i čistě nelineární). Koncem osmdesátých let již existovaly pro přípravu filmového střihu relativně dokonalé systémy, jako například „Montage”, „EditDroid”, „CMX 6000”, „Ediflex”, které mohly být samozřejmě užívány i pro přípravu lineárního sestřihu na magnetický pás [10]. Poslední desetiletí tohoto století je z hlediska vývoje televizních a počítačových technologií zcela přelomové. Vyřešení sériového rozvodu složkových digitálních televizních signálů, nástup tzv. nové generace digitálních záznamových strojů a digitální studiové techniky, která začala být cenově výhodnější než zařízení analogová, vedlo k přeměně analogových televizních studií na digitální daleko rychleji, než bylo předpokládáno. Vývoj počítačové techniky, která již byla schopna zvládnout ohromná množství dat reprezentujících obrazové televizní signály, zdokonalení a zlevnění technologií, jež byly tato data schopny kvalitně redukovat, a zvláště neustálé zvyšování paměťové kapacity pevných disků, to vše vedlo k masivnímu vstupu, a možno říci k vpádu, počítačové techniky do všech oblastí televizního provozu. Nelineární střihové systémy nejen ovládly přípravu dat pro střižny lineární, ale umožnily i střih komprimovaných i nekomprimovaných obrazových signálů v kvalitě „on-line”. Pro sestřih a režijní zpracování se objevily tzv. pracovní stanice „Workstation” na bázi počítačů PC nebo MacIntosh, zahrnující i řízení záznamových strojů a široké režijní zpracování. Do televize vstoupily videoservery, které jsou zvláště v oblasti zpravodajství schopné centrálně a přitom nezávisle zpracovávat veškerá příchozí obrazová data a umožňují jejich zrychlený zápis, přenos a případně i odbavení. Film a magnetický pás jsou využívány v symbiose a existuje prakticky bezeztrátová možnost vzájemného přepisu. Klasický střih filmu bez použití nelineárních editorů prakticky zmizel.
1.1 Postsynchron a dabing televizních pořadů na pásku Kontaktní zvuk na obrazovém pásku u prvních záznamových strojů nebylo možné prakticky oddělit, tj. přepsat na jiný nosič a po zpracování jej zcela bezpečně vrátit na původní místo. I když byl obrazový pás manuálně nějakým způsobem například s magnetofonem synchronizován, došlo velmi brzy ke značným časovým odchylkám, protože chyběla jakákoli vzájemná vazba. Zvuková složka musela být vyráběna vždy kontaktně při natáčení. Pokud bylo nutné zvuk z jakéhokoli důvodu upravit, bylo ve většině případů třeba pásek i s obrazem přepsat. Tato skutečnost samozřejmě měla vliv na technickou kvalitu zvukové složky, většinou však nebyla považována za závažný nedostatek. V pražském studiu byly navíc pro výrobu některých hudebních pořadů užívány unikátní výrobní postupy, kdy byla nejdříve vyrobena a na obrazový pás zaznamenána úplná zvuková verse, a herecké akce byly podle „playbacku“ na pásek živě nastřihovány. Takto byla například vyrobena často opakovaná opera „Prodaná nevěsta“ režírovaná F. Filipem. Dodatečná výroba zvuku – postsynchron, tak jak byla zcela běžná u filmu pomocí perforovaného magnetického filmu, nebyla velmi dlouho reálná a zcela běžnou se stala až koncem
11
sedmdesátých, a zvláště v osmdesátých letech, kdy i u magnetofonů začal být běžně užíván časový a řídicí kód. Daleko závažnějším problémem při stále stoupající mezinárodní výměně pořadů na magnetickém nosiči byl jejich dabing, a to zvláště v Československé televizi, protože divák navyklý z filmu na dabing vysoce technicky a umělecky dokonalý, nebyl v žádném případě ochoten se smířit s titulky (jejichž vkládání nebylo rovněž technicky dořešeno), a tím méně s překrytím původního zvuku čteným, byť několikahlasým překladem, tak jak to bylo zvykem v některých sousedních státech. Průzkumem bylo zjištěno, že v Evropě a pravděpodobně ani ve Spojených státech neexistoval systém, který by požadavky kladené Čs. televizí splnil. Bylo tedy rozhodnuto, aby technické provozní a vývojové složky ve spolupráci s předními dabingovými režiséry navrhly výrobní postup a technické zadání na maximálně automatizovaný sytém, který by v nejvyšší kvalitě umožnil výrobu úplně nové zvukové složky, počínaje dialogy a konče synchronními i nesynchronními zvukovými efekty a hudbou. Na tyto požadavky seriózně reagovala pouze firma AMPEX, která vyprojektovala a posléze dodala počítačem řízený systém, který se skládal z řady sekcí pro přepisy, úpravu textů, zakládání dat atd. Komplex měl vlastní studio pro výrobu dialogů, synchronních i nesynchronních zvuků, automatizovaný mixážní pult a několik čtyřstopých a šestnáctistopých magnetofonů, všechny s možností plného řízení časovým kódem. Opakování jednotlivých sekvencí neboli smyčkování pro výrobu dialogů bylo podle předem připravených dat časového kódu prováděno automaticky na pomocném obrazovém nosiči; na pomocných nosičích byly prováděna i příprava dat. (Bylo příznačné, že právě neprofesionální stroje pro smyčkování a přípravu dat byly Achillovou patou celého komplexu.) Výchozím a výsledným profesionálním formátem byl kvadruplex a později jednopalcový formát EBU „C“. Komplex byl v plném provozu v druhé polovině sedmdesátých let a ve své době byl světovým unikátem. Zde byla například dabována německá verse druhé části známého seriálu „Nemocnice na kraji města“, protože v tehdejším Západním Německu srovnatelný systém neexistoval. Komplex pracoval téměř do konce osmdesátých let, kdy byl nahrazen podstatně jednoduššími systémy zvukové výroby, která již v té době byla plně vybavena systémy „TAPELOCK“. Ty pracovaly tak, že na reprodukovaný časový kód řídícího transportu, v daném případě pomocného videomagnetofonu, se vázal reprodukovaný kód magnetofonu a zajišťoval tak stálý souběh obou transportů.
12
2. Vývoj magnetického záznamu televizního signálu na pásek První pokusy zaznamenávat magneticky televizní obraz se uskutečnily již v době mechanicko-optické televize. Technické problémy spojené se záznamem třicetiřádkového televizního systému byly jen o málo obtížnější než problémy spojené se záznamem zvuku a sám tvůrce této televize, Baird, presentoval předchůdce videodisku se 78 otáčkami za sekundu [7]. Již v roce 1927 ruský emigrant patentoval pod jménem Boris Rtcheouloff zařízení, které mělo s využitím principu Valdemara Poulsona umožnit záznam obrazu a jiných signálů na ocelový pásek, buben nebo disk. [7] S nástupem tzv. elektronické televize s vysokou rozlišovací schopností, v daném případě s rozkladovými systémy 405/50, 525/60 a později 625/50, však technické nároky na záznam těchto signálů vzrostly do takové míry, že byly velmi obtížně řešitelné až do druhé poloviny padesátých let a po dobu více než čtvrt století vyžadovaly špičkovou technologii, kterou byly schopny zvládnout a vyrábět pouze nejrozvinutější státy světa. I v současné době je schopno vyvíjet nové systémy pouze několik největších a nejrenomovanějších výrobců. Nejvyšší kmitočty výše uvedených televizních systémů, jež byly v padesátých létech používány, se pohybovaly od 3 MHz do 6 MHz, nejnižší, neuvažujeme-li stejnosměrnou složku, byly dány snímkovým kmitočtem tzn. 25 Hz v Evropě a 30 Hz v USA. Tento kmitočtový rozsah představuje 17 až 18 oktáv, což výrazně překračuje možnosti prakticky realizovatelného magnetického záznamu. Samotný záznam nejvyšších kmitočtů, při tehdy realizovatelné šířce štěrbiny magnetické hlavy několik mikrometrů a velikosti magnetických částic na pásku, vyžadoval záznamovou rychlost, tzn. posuv pásku vůči magnetické hlavě, podstatně větší než 10 m/s. Realizaci zařízení pro přímý podélný magnetický záznam televizního signálu stály tedy v cestě následující technické problémy: •
V praxi nepřekročitelné omezení sejmout pouze kmitočty v rozsahu deseti oktáv.
•
Vysoká záznamová rychlost, a tím spotřeba pásku vylučující při rozumné velikosti cívek dosáhnout dostatečné kapacity záznamu.
•
Velmi obtížné řízení konstantního posuvu pásku při uvedených rychlostech, jeho vedení a kmitání a s tím spojená časová stabilita snímaného signálu.
•
Velmi obtížné vyrovnání kmitočtové charakteristiky, obtížná kompensace poklesů amplitudy signálu nepřesným sledováním stopy, oddálením a kmitáním pásku, nehomogenitou magnetické vrstvy atd.
Vzdor výše uvedeným skutečnostem zpočátku vývoj na bázi podélného magnetického záznamu probíhal. Ve Spojených státech byl vyvíjen systém nazývaný podle jména společnosti „Bing Crosby”. Samotný televizní signál byl pro snížení oktávového rozsahu multiplexován do deseti podélných stop, v další stopě byly zaznamenány synchronizační signály a ve dvanácté stopě frekvenčně modulovaný zvuk. Zpočátku byl použit pásek široký 1 palec, který byl později zúžen na 3/4 palce. Posuvná rychlost pásku byla pouze 100 palců za sekundu, tj.cca 2,5 m/s. V říjnu roku 1952 byly získány rozeznatelné obrázky, poprvé v této kvalitě zachycené jinou než fotografickou technikou [7].
13
V roce 1954 demonstrovala firma RCA magnetický záznam barevného obrazu. Do tří podélných stop byly zaznamenávány složkové signály R,G,B, v další stopě synchronizační směs a v páté amplitudově modulovaný zvuk. Pásek o šíři 1/2 palce měl rychlost 360 palců a kapacita záznamu byla 4 minuty. Reprodukovaný signál neměl plnou šíři pásma, jeho kvalita však byla posuzována jako uspokojivá. Pro záznam monochromatických signálů měl být užit pásek o poloviční šíři, tedy 1/4 palce s dvěma stopami – úplný obrazový signál a zvuk. Posuv pásku byl později snížen na 240 palců a v roce 1955 byla firma RCA připravena předvést svůj pětihlavý systém jako provozuschopný výrobek na mezinárodní výstavě NBC [7]. Velmi podobným způsobem při záznamu barevných signálů postupoval systém „Crosby” a dosáhl takové kvality, že společnost CBS zamýšlela podepsat smlouvu na nákup. V Evropě byl společností BBC vyvíjen systém VERA, „Vision Electronic Recording Apparatus”, pro anglický rozkladový systém 405/50. Televizní signál byl rozdělen do dvou kmitočtových pásem, 0 až 100 kHz a 100 kHz až 3 MHz. Spodní pásmo bylo kmitočtově modulováno na nosnou vlnu 750 kHz a zaznamenáno do samostatné stopy, horní pásmo přímo do stopy druhé a třetí stopa obsahovala frekvenčně modulovaný zvukový signál. Pásek široký 1/2 palce měl u prvního modelu rychlost 200 palců za sekundu a záznamovou kapacitu 15 minut [7]. Zařízení umožňovalo jednoduchý střih a v provozuschopném stavu bylo v roce 1958. Všechny uvedené systémy byly však smeteny, když v dubnu 1956 malá a do té doby poměrně málo známá firma AMPEX na konferenci ”National Association of Television Broadcasters” v Chigagu představila plně funkční model záznamového systému „Quadruplex”, který se pak na téměř čtvrtstoletí stal prakticky jediným celosvětově rozšířeným profesionálním záznamovým formátem. U tohoto zařízení byly použity dva základní principy, používané všemi typy videomagnetofonů dodnes. •
Rotující magnetické hlavy jako prostředek dosažení potřebné záznamové rychlosti při nízké posuvné rychlosti pásku.
•
Transformace kmitočtového pásma televizního signálu za účelem snížení oktávového rozsahu a odstranění amplitudy jako nositelky informace.
2.1 Rotující magnetické hlavy, konfigurace hlava-pásek Použití rotujících hlav namísto hlavy pevné obhajoval již v roce 1932 ředitel firmy AEG, Fritz Schröter, v roce 1938 získal Luigi Marzocci v Itálii patent na záznam zvuku pomocí rotačních hlav a konečně v roce 1955 v Německu patentoval zaměstnanec firmy Telefunken, Eduard Schüller, řadu konfigurací pro záznam v šikmých stopách – ”helical scan” – které se užívaly a užívají u všech záznamových formátů, jež kvadruplexní záznam následovaly [7]. Samotná myšlenka použití rotačních hlav, stejně jako využití frekvenční modulace, nebyla tedy ničím novým. Pro řešení, které firma AMPEX použila, byla unikátní užitá konfigurace ve vztahu hlava - pásek, typ frekvenční modulace a realizace celého zařízení. Obecně jsou magnetické hlavy vždy umístěny na rotujícím disku nebo bubnu, jehož rovina otáčení je o určitý úhel odkloněna od podélné osy pásku. Pásek musí být veden, nebo vytvarován tak, aby s ním byly rotující hlavy po požadovanou dobu v kontaktu. Pokud se pásek pohybuje, je záznam prováděn v segmentovaných
14
magnetických stopách skloněných vůči podélné ose pásku o daný úhel. Obvodová rychlost hlav se podle druhu zařízení pohybuje rychlostí od několika m/s do desítek m/s, rychlost posuvu pásku v průběhu vývoje klesla z desítek cm/s na jednotky cm/s. Záznamová rychlost je pak dána vektorovým součtem těchto dvou rychlostí. Z uvedených hodnot sice vyplývá, že posuvná rychlost pásku nemá na záznamovou rychlost podstatný vliv, zcela zásadní vliv však má na dodržení záznamového formátu z hlediska rozložení stop na pásku. Spolu s úhlem podélné osy pásku vůči rovině rotačních hlav určuje úhel stop na pásku, vzdálenost jednotlivých záznamových stop mezi sebou, a tím šířku ochranného pásma, definovanou polohu synchronizačních impulsů v jednotlivých šikmých stopách tak, aby v sousedních stopách ležely na kolmici k těmto stopám – tak zvaný „sync line-up”. Ten umožňuje, nebo snad přesněji řečeno usnadňuje, reprodukci nestandardními rychlostmi. Podélná rychlost pásku musí být tedy při záznamu velmi přesně volena a dodržena. Moderní záznamové formáty ať již analogové, nebo digitální, mají navíc posuvnou rychlost volenu tak, že se jednotlivé stopy vzájemně dotýkají, čímž je lépe využita plocha pásku a zvýšena jeho záznamová kapacita. K zabránění nebo snížení přeslechu signálu ze sousedních stop se pak používají rotační hlavy jejichž štěrbiny vůči sobě svírají určitý úhel – tzv. azimutový záznam. Televizní signál je tedy při užití rotujících hlav nutně segmentován, nicméně obecně byl přijat úzus, že je-li na jednom segmentu, který je tvořen jedním průchodem záznamové hlavy (nebo paralelních hlav) přes pásek, zaznamenán celý televizní půlsnímek, je záznam označován jako nesegmentovaný. V uspořádání hlava - pásek existuje řada možností, v praxi však byla využita dvě principiálně odlišná řešení. Prvé použila již zmíněná firma AMPEX pro svůj kvadruplexní, příčný záznam. Pásek o šíři dva palce byl pomoci vakuového vodítka zformován do válcové plochy, vůči níž se v rovině kolmé na její osu otáčel bubínek se čtyřmi kombinovanými magnetickými hlavami umístěnými s úhlovou roztečí 90° radiálně na jeho obvodu. Opásání bubínku bylo cca 120°, takže jednotlivé stopy byly zaznamenávány s dostatečným překrytím. Při 240 ot./s (NTSC) nebo 250 ot./s byl jeden televizní půlsnímek segmentován do 16, respektive 20 příčných stop. Princip je na obr. 1.
Obr. 1 Kvadruplexní záznam, konfigurace hlava - pásek
15
Toto řešení bylo naprosto unikátní a všechny ostatní záznamové formáty užívají konfiguraci zcela odlišnou, kdy je pásek ovinut ve tvaru šroubovice kolem bubnu s rotujícími hlavami. Podle úhlu opásání se pak v praxi užívaly dvě možnosti. V prvém případě je opásání téměř 360o ve tvaru písmene Ω, viz obr. 2.
Obr. 2 Opásání bubnu typu omega Další možností je opásání podstatně menší, většinou v úhlu o málo větším než 180o ve tvaru písmene U, viz obr. 3, v některých případech však až 270o.
Obr. 3 Opásání bubnu typu U Je jasné, že v případech opásání Ω a U, není-li zaznamenávaný signál časově komprimován, musí být na bubnu více hlav, nemá-li být část zaznamenávané informace ztracena. V případě opásání Ω existuje teoretická možnost použít pouze jednu hlavu, pokud je část signálu, která je v době, kdy hlava není v kontaktu s páskem ztracena, umístěna do vertikálního zatemňovacího intervalu. V druhém případě jsou na průměru bubnu běžně umístěny protilehlé hlavy, které zajišťují kontinuální záznam.
16
S konfigurací Ω pracovala řada proprietárních formátů nižší kategorie, v profesionální sféře je typická pro formát SMPTE a EBU „C”. Třetí typ opásání je technicky i provozně nejvýhodnější, volbou otáček umožňuje vytvářet záznamy segmentované i nesegmentované, umožňuje používat pásek v kazetě, protože zakládání je relativně snadné a je používán všemi moderními záznamy počínaje kompozitními analogovými formáty, jako jsou systémy U-Matic a všechny typy tzv. domácího videa. Dále jej užívají profesionální složkové analogové záznamy, tj. formáty Betacam a M II a všechny typy záznamů digitálních, které ovšem potřebují vyšší záznamovou rychlost, používají vyšší počet otáček, takže jednotlivé půlsnímky jsou segmentovány. Nesegmentované záznamy měly historicky řadu výhod. Je to v prvé řadě již zmíněná skutečnost, že za určitých okolností mohla být na bubnu jediná kombinovaná magnetická hlava pro vlastní záznam, což zjednodušovalo obrazový systém. Odpadalo komplikované přepínání a zjednodušovalo se vyrovnání signálů z jednotlivých hlav, pokud jich bylo užito více. Degradace signálu, ke které u analogových systémů nutně dochází, je po celé ploše obrazu uniformní, a tím subjektivně podstatně méně pozorovatelná. Na rotující buben bylo možné bez problémů umístit i reprodukční hlavu, která mohla při záznamu sloužit jako hlava monitorovací. V případě, že pásek byl zastaven, nebo se pohyboval rychlostí nepříliš rozdílnou od rychlosti nominální, mohly být jednotlivé stopy, byť s určitou chybou, snímány, takže bylo umožněna jakási zpomalená, nebo zrychlená reprodukce a snadné vyhledávání. Jestliže pak hlavy byly dynamicky vychylovány, a tím bylo zajištěno přesné sledování stop, byla za pomoci korektoru časových chyb umožněna reprodukce obrazu nestandardní rychlostí v plné, nebo téměř plné kvalitě. Dále nesegmentovaný záznam umožňoval snímat signál v rozeznatelné kvalitě (opět za pomoci korektoru časových chyb) i při rychlém převíjení vpřed, či vzad a umožňoval tak zvané viditelné vyhledávání. Výše uvedené platí samozřejmě i u analogových nesegmentovaných systémů s opásáním 180°, tzn. minimálně s dvěma hlavami. V současné době jsou však zmíněné provozní vlastnosti zvládnuty i u moderních profesionálních záznamů digitálních, které jsou ve všech případech segmentované. Otáčky bubnu s rotujícími hlavami a posuv pásku musí být tedy velmi přesně řízeny televizním signálem při záznamu i reprodukci, tak aby signál byl zapisován podle stanoveného formátu a snímán v souběhu se zvoleným referenčním signálem. Při reprodukci musí být otáčky a fáze magnetických hlav navíc svázány s posuvem pásku, aby mohly být zaznamenané stopy s co největší přesností bezpečně sledovány.3 K tomu účelu je u naprosté většiny záznamových formátů na pásek zaznamenávána tzv. řídicí stopa, která označuje umístění obrazových stop a identifikuje jednotlivé typy půlsnímků. Pro záznamové formáty, které s řídicí stopou pracují, je při reprodukci zcela nezbytná, a pokud není nahrána, nebo je porušena, nelze záznam na většině záznamových strojů reprodukovat. Z hlediska funkce ji lze přirovnat k perforaci kinematografického filmu. U záznamových formátů, jež řídicí stopu nepoužívají, musí být do šikmých stop vloženy pilotní signály, které sledování zaznamenaných šikmých stop umožní.
3
Určitou výjimkou je snímání signálu u některých strojů formátu Betacam SX, který pracuje jako “mnohohlavý” systém a není tedy na přesném sledování stop závislý.
17
Ať je užita jakákoli konfigurace hlava – pásek, není televizní signál z hlediska časových relací zaznamenán, a zvláště reprodukován zcela přesně. Vlivem nedokonalosti systémů řídících otáčky hlav, tah a posuv pásku, vlivem jeho pružnosti, kmitání, dilatací způsobených teplotou a vlhkostí a praktické nemožnosti dosáhnout opakovaně naprosto stejných mechanických podmínek v celé dráze pásku, dojde v procesu záznam – reprodukce vždy k odchylce periodicity reprodukovaného televizního signálu. Tato tak zvaná „časová chyba” se projevuje nestabilitou obrazu, jeho geometrickým zkreslením, znemožňuje režijní zpracování a reprodukci barevných televizních signálů kódovaných v systému PAL / NTSC. Velikost této chyby je závislá na druhu záznamu a musí být u profesionálních zařízení odstraněna nebo minimalizována elektronicky pomocí korektorů časových chyb. Určitá „zbytková” časová chyba při reprodukci analogových záznamů vždy zůstává a podílí se na degradaci opakovaně přepisovaných signálů. U systémů digitálních je korekce časových chyb do určité míry inherentní vlastností reprodukční části stroje a vzhledem k tomu, že snímaná data musí být ukládána do pamětí, odkud jsou pomocí přesných hodinových impulsů čteny jednotlivé obrazové prvky, k časovým zkreslením reprodukovaného signálu prakticky nedochází.
2.2 Transformace obrazového signálu. Požadavky na transformaci vyplývají z již zmíněných skutečností a lze je shrnout do následujících bodů. 1. Snížení nadměrného oktávového rozsahu televizního signálu. 2. Zachování potřebné linearity v procesu záznam - reprodukce. 3. Kmitočtové spektrum transformovaného signálu musí být udrženo v rozumných mezích. V praxi bylo prokázáno, že požadavky uvedené v bodech 2 a 3 mohou být jen těžko splněny při použití amplitudové modulace a digitální záznam byl technickými prostředky padesátých šedesátých let prakticky nerealizovatelný. Jako optimální kompromis byla zvolena modulace kmitočtová, která se užívá u všech typů analogových záznamů. Ve svém principu se frekvenční modulace – FM užitá pro magnetický záznam neliší od modulace používané pro přenos zvukových signálů VKV, nebo zvukové složky televizního vysílání. Zásadní rozdíl je v hodnotách nosného kmitočtu, modulačního kmitočtu a změně nosného kmitočtu v závislosti na amplitudě kmitočtu modulačního tzv. frekvenčního zdvihu. Zatímco u běžných vysílačů VKV má nosná vlna kmitočet vyšší než 80 MHz, modulační kmitočet maximálně 15 kHz a frekvenční zdvih ±75k Hz, pohybují se nosné kmitočty, nebo lépe řečeno s ohledem na existenci stejnosměrné složky televizního signálu, střední kmitočty jednotlivých záznamových formátů, v rozsahu od 4 do 10 MHz, modulační kmitočty až do 5,5 nebo 6 MHz, a frekvenční zdvihy pro špičkové signály 1,5 až 3 MHz. Tento typ frekvenční modulace je tedy určen blízkostí charakteristických kmitočtů a běžně je definován právě těmito kmitočty pro úroveň temene synchronizačního impulsu, úroveň černé a úroveň bílé, případně pouze krajními kmitočty. Tak např. evropský záznamový standard „EBU C“ je z tohoto hlediska definován kmitočty:
18
•
ft = 7, 16 MHz odpovídající úrovni temene synchronizačního impulsu;
•
fz = 7, 68 MHz odpovídající úrovni signálu černé tj. zatemňovacího impulsu;
•
fb = 8, 9 MHz odpovídající úrovni signálu bílé.
Kmitočtová modulace umožnila záznam televizního signálu v kvalitě, která byla i pro televizní výrobu dostatečná, nicméně již v první generaci záznamu bylo možno v evropském systému dosáhnout odstupu signálu od šumu pouze 43dB pro signály kompozitní a 45dB u složkových. Poměr signál /šum se tedy zhoršil o 15 až 17dB (vztaženo k šumu referenčních, nebo současných primárních signálů) a signál byl dále degradován řadou lineárních i nelineárních kmitočtových a fázových zkreslení včetně ne zcela dokonale korigovaných krátkých výpadků, tzv. „drop outů”, a zbytkové časové chyby. Dosažené kvalitativní hodnoty byly při užitém principu konečné a technické inovace a nové materiály mohly přinést pouze malá zlepšení. S každým dalším přepisem se kvalita samozřejmě dále zhoršovala, takže pátá záznamová generace byla i pro nejdokonalejší záznamové formáty limitující a v praxi často nepřijatelná. Při pulsně kódové modulaci je analogový signál v daných, pravidelných časových intervalech vzorkován a amplituda vzorků je vyjádřena číselnou hodnotou v binární soustavě. Číselné hodnoty jsou tedy vyjádřeny kombinací dvou elektrických stavů. Pokud jsou vzorky časově absolutně přesné, jejich četnost je vyšší než dvojnásobek nejvyšších kmitočtů, a je tedy splněna Nyquistova podmínka, a vzorek amplitudy signálu by byl číselně vyjádřen naprosto přesně, pak takový digitální signál by byl dokonalým ekvivalentem signálu původního a v ideálním případě by mohl být opět bez jakékoli ztráty transformován zpět. Ze samého principu digitalizace však vždy musí dojít k chybám, protože při pulsně kódové modulaci existuje nekonečné množství hodnot, jichž může analogový signál v daném dynamickém rozsahu dosáhnout, vyjádřeno konečným počtem celých binárních čísel, která mohou definovat konečný počet úrovní, jimiž je původní signál reprezentován. Digitální signál je tedy vždy kvantován. Pokud jsou však chyby kvantování a chyby způsobené technickými prostředky pod rozlišovací schopností oka nebo ucha, lze pro daný účel tuto transformaci (pokud není užita ztrátová redukce, nebo jinak řečeno komprese bitového toku) považovat za transparentní. Výhody digitálních signálů spočívají jednak v možnostech manipulací, které nelze v analogovém prostředí realizovat, a hlavně v nesrovnatelně vyšší odolnosti vůči šumu a vůči všem zkreslením typickým pro analogové prostředí. Pokud mohou být bezpečně rozlišeny stavy reprezentující jedničku a nulu, a tím bezpečně čtena binární čísla, může být (s uvedeným omezením) vždy rekonstruován původní signál. Magnetický záznam digitalizovaného a nekomprimovaného televizního signálu může být tedy ve srovnání se záznamem analogovým prakticky transparentní a jeho přednosti mohou být shrnuty do následujících bodů: •
Digitální záznam televizního signálu není ničím jiným, než záznamem čísel vyjádřených dvěma stavy a jako takový umožňuje přepis beze ztrát, a tím teoreticky neomezený počet generací ve stejné kvalitě. To se samozřejmě týká jak obrazové, tak zvukové složky.
•
Z výše uvedeného vyplývá, že technické parametry reprodukovaného signálu závisí pouze na kvalitě digitalizace a principiálně jsou nezávislé na záznamovém médiu, kvalitě záznamových hlav a omezeních magnetického záznamu jako takového. Obecně tedy mohou být zaznamenány signály s libovolnou dynamikou, 19
šum, který je snímán s pásku přímo neovlivňuje výsledný signál, takže mohou být užity podstatně užší magnetické stopy, a tím lze dosáhnout vyšší hustoty záznamu. Navíc mohou být zaznamenávaná data podle požadavků v různé míře redukována, a lze tak volit různou kvalitu zaznamenaného obrazu. •
Drop – outy, které jsou inherentní součástí magnetického záznamu, mohou být skutečně korigovány, zatímco u analogového záznamu mohou být pouze kompenzovány. Binární čísla reprezentující jednotlivé obrazové prvky nebo vzorky zvuku jsou na výstupu čtena s maximální přesností z elektronické paměti, čímž je časová nestabilita signálu snímaného z pásku plně korigována. Reprodukovaný signál není tedy degradován ani z tohoto hlediska.
Způsoby digitalizace televizních signálů, jsou stanoveny mezinárodními standardy a doporučeními. Podle doporučení ITU–R 601 je jasový signál Y evropské standardní složkové televizní soustavy vzorkován kmitočtem 864xfH, tzn. 13,5 MHz, barvonosné složky Cr a Cb kmitočtem polovičním, tj. 6,75 MHz – obecně známé vzorkovací schéma 4:2:2, a kvantován do 8 nebo 10 bitů. (Americký televizní systém NTSC používá v případě složkových signálů kmitočty stejné.) V prvém případě to představuje bitový tok (13,5x106 + 2x6,75x106) x 8 (10), tzn. 216 Mb/s respektive 270 Mb/s. Sériový standardně multiplexovaný bitový tok složkových signálů je označován jako SDI. Pro kompozitní signály NTSC a PAL se užívá čtyřnásobek barvonosného kmitočtu a kvantování do osmi bitů. V tomto případě jsou bitové toky pro americký a evropský rozkladový systém odlišné, protože barvonosné kmitočty se liší a jedná se o cca 115 Mb/s a 142 Mb/s. Sériová forma těchto signálů bývá označována D2, případně SDI D2. Vzorkovací kmitočet zvukových signálů u profesionálních zařízení je 48 kHz a kvantování do 16 nebo 20bitových slov, tzn. do 216, nebo 220 úrovní, nejnověji až do 224 úrovní. Bitové toky složkových signálů jsou sice poněkud sníženy tím, že lze zaznamenávat pouze aktivní obraz (není nutné zaznamenávat zatemňovací intervaly), pro evropský standard tedy pouze 720 obr. prvků na řádek a 576 řádků. K celkovému bitovému toku je však třeba přičíst datové toky zvukových kanálů, a zvláště redundantní bity korekčních kódů, které mohou v některých případech zaznamenávaný bitový tok až zdvojnásobit. I při zjednodušené úvaze, že jedna perioda harmonického signálu může přenášet dva bity, představuje záznam výše uvedených bitových toků potřebu zaznamenávat ve srovnání s analogovým záznamem kmitočty cca desetkrát vyšší. Z hlediska spektra jsou však signály PCM vysokofrekvenční a z hlediska oktávového rozsahu relativně snadno zaznamenatelné. Jestliže má být zachována záznamová kapacita minimálně srovnatelná s analogovými formáty, nelze pouze úměrně zvýšit záznamovou rychlost, ale je třeba podstatně zvýšit hustotu záznamu. V praxi to znamená podstatné zkrácení minimální vlnové délky na pásku a zúžení záznamové stopy. Tím se ovšem zvýší nebezpečí chybného čtení dat vlivem šumu, drop-outů a nedokonalého sledování stop. Z předchozího však vyplývá, že pouze při bezchybném čtení zaznamenaných dat je digitální záznam transparentní. Zaznamenaný signál musí být tedy před možnými chybami zabezpečen, což se provádí již zmíněným záznamem korekčních kódů a záznamem dat na pásek v jiném pořadí, než jak po sobě přirozeně následují (prokládání a přeskupování dat) [15]. Skupinové chyby (velké drop-outy) se pak při 20
zpětné seřazení dat po reprodukci rozptýlí, chybná data jsou obklopena správnými, čímž je lze snáze korigovat a případně skrývat. Míra a efektivnost zabezpečení proti chybám je jedním ze základních kvalitativních ukazatelů digitálních záznamových formátů. Obecně lze říci, že transformace obrazového signálu má na střih magnetického záznamu obrazu vliv jednak z hlediska kvality jednotlivých generací a dále odolnosti použité transformace vůči chybnému sledování stop ke kterému, vzhledem k možnosti narušení formátu při střihu, může snadno docházet.
2.3 Rozdělení obrazového signálu
záznamové
techniky
z hlediska
transformace
Přímý záznam Takto je označován analogový magnetický záznam kompozitních signálů NTSC, PAL, SECAM, kdy je televizní signál přímo frekvenčně modulován a v plné šíři základního pásma zaznamenán na magnetický pás. Jedná se o profesionální zařízení s otevřenými cívkami, tj. kvadruplex, a jednopalcové formáty „B” a „C”. Výstupní signál je opět kompozitní. Záznam s konvertovaným signálem barvonosné – „Color Under” Analogový záznam kompozitních kmitočtově omezených televizních signálů, kdy je chrominanční kmitočet oddělen a konvertován pod pásmo frekvenčně modulovaného signálu jasového a při reprodukci je stabilizován heterodynním procesem, takže může být na běžných televizorech barevně reprodukován. Patří sem kazetové systémy U-matic a všechny systémy tak zvaného „domácího videa”. Výstupní signál je kompositní, bez použití korektoru časových chyb mají výstupní signály NTSC a PAL nedefinovaný fázový vztah mezi chrominančním a jasovým signálem, který musí být v případě postprodukce a profesionálního použití restaurován pomocí korektoru časových chyb. Analogové komponentní záznamy Jasový signál Y je frekvenčně modulován a zaznamenán na samostatnou stopu. Rozdílové barevné složky Pr, Pb jsou časově multiplexovány, frekvenčně modulovány a společně zaznamenány rovněž na samostatnou stopu. Výstupní signály jsou složkové i kompozitní. Do této skupiny patří například formáty Betacam/Betacam SP. Digitální záznamy nekomprimované Ačkoliv existoval oprávněný předpoklad, že kvalita digitálního záznamu se může projevit pouze v případě komponentního záznamu, protože artefakty kódování složkových signálů do kompozitního tvaru reprodukovaný obraz znehodnotí, byly z praktických důvodů, jako určitý mezistupeň, realizovány i dva digitální záznamové formáty kompozitní, kdy je na pásek zaznamenán kompozitní digitalizovaný signál vzorkovaný čtyřnásobkem barvonosného kmitočtu signálu PAL, nebo NTSC. Jednalo
21
se o formáty D2 a D3. V případě záznamů komponentních je na pásek zaznamenán digitálně kódovaný složkový televizní signál podle doporučení ITU-R 601 s plným bitovým tokem. Jasové a chrominanční signály jsou v magnetických stopách časově multiplexovány. Patří sem záznamové formáty D1 a D5. Komprimované digitální komponentní záznamy vizuálně bezeztrátové. Zaznamenán je digitálně kódovaný složkový televizní signál podle doporučení ITU-R 601 s bitovým tokem redukovaným na cca jednu polovinu. Použitá komprese je vnitrosnímková, založená na standardu JPEG4, avšak proprietární. Jedná se záznamové formáty Digital Betacam a DCTd. Akviziční záznamové formáty Původně určeny pro elektronickou žurnalistiku. Zaznamenán je digitálně kódovaný složkový televizní signál podle doporučení ITU-R 601s vyšší, do určité míry standardizovanou kompresí. Jeho představiteli jsou formát D7 (DVC PRO 25 Mb/s) s kompresí typu DV, formát D8 (Betacam SX 20 Mb/s) užívající proprietární variantu komprese MPEG 4:2:2 a dále formát D9 (Digital–S 50 Mb/s), kde je užito opět kompresní schéma DV, oproti předchozím však se vzorkováním 4:2:2 a bitovým tokem 50 Mb/s. Lze sem zahrnout i velmi populární formát DVCAM fy SONY se stejným typem komprese, avšak se vzorkováním 4:2:0. Záznamové schopností
formáty
pro
televizní
systémy
s vysokou
rozlišovací
Jediným specializovaným formátem pro HDTV se záznamem signálů s plným bitovým tokem je formát D6 zaznamenávající až 1200 Mb/s. Další záznamové stroje pro HDTV jsou odvozeny od zařízení pro standardní televizi, jmenovitě od formátu Digital Betacam, D5 a DVC PRO. Jedná se o verse HD zaznamenávající komprimovaný signál a jsou schopny zaznamenávat a reprodukovat televizní signál v různých rozkladových soustavách.
4
Problematika komprese digitálních signálů bude diskutována v samostatné kapitole.
22
3. Sestřih televizního signálu na magnetickém pásku Střih z technického hlediska znamená spojení nebo navázání původního a nového signálu ve zvoleném místě na pásku takovým způsobem, aby nedošlo k porušení záznamového formátu, a při reprodukci tak nedošlo k výpadku signálu nebo zhoršení jeho kvality. Z hlediska pravidel televizního střihu k tomu musí dojít mezi jednotlivými půlsnímky, tzn. v době vertikálního zatemňovacího intervalu. Teoreticky je toho možné dosáhnout buď mechanicky, to znamená rozstřižením a slepením dvou pásů mezi vybranými stopami, nebo přepisováním stříhaného signálu a uváděním záznamového stroje do režimu záznam tak, aby na záznam stávající přesně navazoval, to znamená elektronicky. Jak je patrné z obrázků 1, 2, 3, kde je naznačeno rozložení stop, mechanický střih přicházel v úvahu pouze u prvního, tj. kvadruplexního formátu, kde obrazové stopy byly prakticky kolmé. Záznamové stopy u šikmých a pološikmých záznamů jsou příliš skloněné a dlouhé a případně bez ochranného pásma, takže v těchto případech je mechanický střih prakticky nerealizovatelný. Pokud by byl pásek střižen kolmo tak, aby nebyl porušen záznamový standard a šikmé stopy na sebe správně navazovaly, k výpadku signálu by nedošlo, střih by se však projevil jako svislá „stíračka”. Nicméně v době, kdy se stroje se šikmým záznamem začaly profesionálně používat, byl elektronický střih z technického hlediska vyřešen a mechanické spojení pásku bylo používáno pouze v havarijních případech, tj. při přetržení pásku. Mechanický střih se tedy používal převážně v první etapě kvadruplexního záznamu, kdy záznamové stroje nebyly elektronického střihu schopny. Vzdor všem nevýhodám a problémům, které s ním byly spojeny, používal se, jak již bylo zmíněno, zcela běžně a masivně.
3.1 Mechanický střih Místo střihu bylo stanoveno stisknutím tlačítka STOP podle reprodukovaného obrazu, nebo zvuku. Místo na pásku pod magnetickými hlavami bylo na neaktivní straně speciální tužkou viditelně označeno, pásek byl vyjmut z vodítka a vytvořena dostatečně dlouhá smyčka. Bylo již řečeno, že střih musí proběhnout v době vertikálního zatemňovacího intervalu, a pásek tedy musí být přesně rozříznut ve středu ochranného pásma za stopou obsahující vertikální synchronizační impuls. To ovšem znamená, že tato stopa musela být nalezena a magnetický záznam na pásku musel být zviditelněn. K tomu se používaly extrémně jemné feromagnetické částice rozptýlené v těkavé kapalině, do níž byl pásek ponořen a částice zvířeny. Magnetické částice se usadily na zmagnetovaných místech, takže záznamové stopy byly viditelné a mohla být vyhledána stopa s vertikálním impulsem. Přesně ve středu mezery za touto stopou byl potom pásek rozříznut. Stejným způsobem byla nalezena a odstřižena navazující sekvence. Pásky pak byly k sobě sesazeny, fixovány a na zadní straně přelepeny velmi jemnou metalizovanou páskou. Aktivní strana magnetického pásku pak byla velmi pečlivě očištěna a střih mohl být ověřen. Kromě maximální možné mechanické přesnosti slepky bylo pro bezporuchový střih nutné, aby na lichý půlsnímek navazoval sudý, a naopak. Protože na řídicí stopě nebyl zpočátku zaznamenán tzv. střihový impuls označující televizní snímky a rozlišení
23
jednotlivých půlsnímků podle zviditelněné příčné magnetické stopy s vertikálním synchronizačním impulsem bylo velmi obtížné, existovala v praxi pouze padesátiprocentní pravděpodobnost, že z technického hledisky bude střih v pořádku, tj. že bude dodrženo střídání lichého sudého půlsnímku [3]. Pokud tomu tak nebylo, musel být střih proveden znovu a o jeden půlsnímek posunut. Pro usnadnění a zpřesnění práce brzy vznikla řada přípravků složených z mikroskopu a dráhy pro pevné vedení a fixaci pásku. Šířka stopy byla u příčného záznamu 253 mikrometru a u ochranného pásma 144 mikrometru. I když se tyto hodnoty ve srovnání se současnými záznamovými formáty, kde se šířka stopy pohybuje v desítkách mikrometru, jeví jako extrémně vysoké, je třeba si uvědomit, že provést řez přesně ve středu ochranného pásma o šíři 0,14mm nebylo snadnou záležitostí. Jednalo se tedy o práci velmi delikátní. Rychlost a kvalita mechanického střihu se podstatně zvýšila zavedením již zmíněného střihového impulsu na řídicí stopě a přípravků, které odstraňovaly nutnost zviditelňování magnetických stop, a navíc umožňovaly vyhledat místo střihu podle označení magnetickým impulsem zaznamenaným na režijní stopě pásku. Tyto tzv. střihací stolky měly dráhu, kde byl pásek přesně veden, mohl být posouván otáčením pryžových válečků a fixován pomocí podtlaku. Její součástí byly definovaně umístěné pákové nůžky. V místě řídicí a pomocné stopy byly umístěny rotační magnetické hlavy, jejichž výstup byl zobrazen na vestavěném jednoúčelovém osciloskopu. Programové místo střihu, pokud bylo označeno krátkým tónem s dostatečně vysokým kmitočtem, mohlo být snadno nalezeno a na osciloskopu zobrazeno. Přesné technické místo střihu pak bylo vyhledáno zobrazením střihového impulsu z řídicí stopy a pásek byl posunut tak, aby se tento impuls zobrazil v koincidenci s impulsem referenčním. Za tohoto stavu, pokud byl přístroj správně kalibrován, byly pákové nůžky přesně ve středu mezery za stopou obsahující vertikální impuls označeného půlsnímku, a pásek tak snadno a velmi přesně rozstřižen, fixován a následně slepen. Jakkoli byl mechanický střih primitivní a pouze překlenoval období, než byly zvládnuty alespoň základní problémy střihu elektronického, byl široce využíván i v průběhu šedesátých let. Jeho výhodou, pokud lze o nějaké přednosti vůbec mluvit, byla skutečnost, že výsledný pás mohl být tvořen originálem a pro daný záznamový standard měl tedy nejvyšší možnou kvalitu. Protože materiál nemusel být přepisován, byl při využívání střihových stolků vlastně velmi rychlý. Jeho nedostatky však jednoznačně převažovaly. Znehodnocovalo se velké množství tehdy velmi drahého záznamového materiálu, ať už ve formě odpadu, nebo pásků s mechanickými slepkami, které sotva mohly být znovu použity pro natáčení nových pořadů. Průchod slepek přes rotační hlavy snižoval jejich životnost, a v některých případech mohl působit drobné poruchy v místě střihu. I při úzkostlivém dodržování čistoty byl v okolí místa střihů zvýšený počet drop-outů vlivem znečištění aktivní vrstvy pásku. Nejzávažnějším nedostatkem z hlediska střihové skladby byla určitá nepřesnost a dále skutečnost, že vzhledem ke vzájemné poloze obrazových a zvukových hlav, které byly, časově vyjádřeno, vzdáleny 0,6 sekundy, střih mohl být proveden buď na obraz, nebo na zvuk, s přesahem (nebo ztrátou) jedné, nebo druhé informace. Místo střihu muselo být tedy voleno i s ohledem na tuto skutečnost. Přes uvedené problémy a nedostatky však mechanický střih v počátečním období kvadruplexního záznamu umožnil výrobu televizních pořadů na magnetickém
24
pásu a je nezanedbatelnou součástí vývoje tohoto média, jakožto media produkčního.
3.2 Elektronický střih – záznamový stroj Z technického hlediska znamená elektronický střih postupné zaznamenávání a „bezešvé” spojování jednotlivých sekvencí, nebo jejich vkládání do stávajícího již zaznamenaného signálu, přičemž je přes původní signál přepsán. Oproti normálnímu záznamu je činnost záznamového stroje značně komplikovanější a náročnější a ne každý záznamový stroj je elektronického střihu schopen. Pro objasnění celého problému uvažujme situaci, kdy je reprodukující stroj uveden stiskem příslušného tlačítka do režimu záznam. I za předpokladu, že je reprodukovaný signál v určitém synchronu se signálem, který má být zaznamenán (což první záznamové stroje neuměly), přechází stroj do nového režimu zcela bez ohledu na záznam stávající. Zapnuta je pevná mazací hlava, která je však umístěna v určité vzdálenosti před obrazovými i zvukovými hlavami, takže část původního záznamu zůstává nesmazána a je přepisována a některé servosystémy stroje přejdou do zcela odlišného způsobu řízení. Výsledkem je tzv. destruktivní střih – „crash recording”, který při reprodukci způsobí výpadek, jehož délka je závislá na druhu formátu a typu záznamového stroje. U první generace kvadruplexních strojů mohl takový výpadek s ohledem na dobu, než se stroj dostal znovu do vazby, trvat až 15 sekund. Při elektronickém střihu musí tedy stroj přecházet z režimu reprodukce do režimu záznam postupně, v přesně definovaných krocích, s ohledem na již zaznamenaný signál, aby záznamový formát byl v maximálně možné míře dodržen a chyba, která vznikne, nepřesahovala povolené tolerance. Technická náročnost elektronického střihu může být ilustrována například skutečností, že u kvadruplexních strojů musel být signál na pásku rotačními hlavami sledován s přesností větší než jedna setina milimetru, jestliže měl být střih z technického hlediska perfektní. U nesegmentovaných formátů tak vysoká přesnost nebyla nutná, nicméně s ohledem na velikost a hmotnost bubnů s hlavami a délku opásaného pásku jsou technické problémy stejně náročné, nemluvě o formátech digitálních. Činnost střihového systému záznamového stroje může být shrnuta do následujících bodů. •
Při reprodukci ve střihovém režimu musí být signál v plném souběhu s nastřihovaným signálem; u kompozitních barevných systémů i z hlediska barevné sekvence. (Problematika střihu barevných kompozitních signálů bude diskutována v samostatné kapitole.)
•
Rotační magnetické hlavy musí snímat signál na pásku vzhledem k vstupnímu signálu s maximálně možnou přesností, s respektováním času nutného pro zpracování a průchod tohoto signálu ze vstupu na magnetické hlavy. Je jasné, že tento čas u digitálních formátů může být i několik půlsnímků.
•
Hlavy musí sledovat magnetické stopy v plné šíři, aby nový záznam nebyl vůči původnímu posunut. Pokud stroj není vybaven příslušnými automatickými systémy, musí být sledování stop – „tracking” nastaveno před prvním střihem ručně. Problém přesného sledování stop nabývá obzvláštní důležitosti u digitálních záznamových formátů, které nemají s výjimkou formátu D1 ochranné pásmo mezi stopami a tyto stopy jsou extrémně úzké. (Záznamový formát Digital
25
Betacam například používá pro zajištění technické kvality střihu dva pilotní kmitočty.) Spolehlivost střihu, nebo jinak řečeno „střihová robustnost”, je v rozhodující míře u digitálních záznamů dána právě šířkou stop, která by v případě, že střih není vyžadován, mohla být menší a dále samozřejmě jejich délkou, volbou digitálního kódu na pásku a výkonností korekčních kódů. Zmíněná střihová robustnost je velmi důležitým parametrem jednotlivých digitálních formátů. •
Nastřižený signál začíná u analogových formátů vždy novou stopou, tj. celým segmentem. Původní signál však musí být napřed smazán. Standardní pevná mazací hlava, která maže pásek v plné šíři, mohla být pro střih použita pouze u kvadruplexu. U všech ostatních formátů jsou stopy příliš šikmé a dlouhé, takže pro střih musí být použity tzv. letmé mazací hlavy umístěné na bubnu. U digitálních formátů nemusí být data ve všech případech mazána a mohou být přepisována. Této skutečnosti využívá například formát D2. Pokud však nejsou hlavy umístěny přesně na stopu, což je vzhledem k jejich malé šířce velmi obtížné, může část segmentu zůstat nepřepsána a při reprodukci může dojít po střihu k zvýšení toku chyb. Proto se u digitálních formátů letmé hlavy vesměs používají, přičemž pro zajištění bezpečného mazání je jejich šířka o něco větší než šířka vlastní stopy.
•
U digitálních záznamových formátů nemusí být vždy začátek půlsnímku totožný se začátkem segmentu na okraji pásku - např. u formátu D1. Navíc jsou v šikmých stopách i zvukové signály, které musí být samostatně stříhatelné. Aby střih mohl být realizován i v průběhu segmentu, jsou data dělena do jednotlivých sektorů, ty jsou odděleny střihovou mezerou – „edit gap” U digitálních formátů, vzhledem k velmi komplikovanému zpracování signálu (prokládání a přeskupování dat a vytvoření korekčních kódů) a požadované přesnosti, je vstupní signál vždy zaznamenám na pásek z elektronické paměti.
•
Jestliže je vydán povel k nástřihu, jsou v daný okamžik nejprve zapnuty mazací hlavy, vstupní část stroje je v definovaný čas převedena do režimu záznam a kombinované hlavy jsou z režimu reprodukce do režimu záznam přepínány postupně, jakmile byla sejmuta poslední stopa, nebo sektor, které měly zůstat zachovány. Při odstřihu je postup v principu opačný.
Vlastní střih může být realizován v zásadě dvojím způsobem. V režimu označovaném jako „Assemble”, je prováděn postupný nástřih jednotlivých sekvencí, přičemž současná praxe je taková, že jsou na pásek nahrávány všechny magnetické stopy, šikmé i podélné, včetně stopy řídicí a časového kódu. Pásek musí po střihu zachovat stejnou posuvnou rychlost, jakou měl při předchozí reprodukci, kdy byl jeho posuv určován zaznamenanou řídicí stopou. V tomto režimu není odstřih zcela přesně definován a nelze samostatně stříhat obrazové a zvukové signály. Režim „Insert” umožňuje vkládat sekvence do zaznamenaného materiálu, je tedy definován nástřih i odsřih a dělený střih obrazu a zvuku. Řídicí stopa zůstává zachována a posuv pásku vlastně zůstává trvale v režimu reprodukce. U pořadů s velkým počtem střihů a dodatečným režijním zpracováním je výhodnější pracovat v tomto režimu, i když je pořad sestavován postupně. Na pásku musí být samozřejmě předem zaznamenán nějaký signál; obvyklý je signál černé a podélný časový kód. Některé typy záznamových strojů byly schopny v tomto režimu pracovat pouze se zaznamenanou řídicí stopou a časovým kódem, které navíc někdy mohly být zaznamenány s vyšší rychlostí posuvu pásku.
26
Moderní digitální záznamové stroje umožňují kromě ostrého střihu zvuku i přechody s definovatelným krátkým prolnutím snímaného a příchozího signálu – typ přechodu „X“, nebo stažením a vyjetím signálu – typ „V“, což zkvalitňuje přechod a odstraňuje možné „lupnutí“ ve zvuku. Dále většinou umožňují typ střihu označovaný jako „Preread“. V tomto případě je signál s dostatečným předstihem sejmut reprodukční hlavou, v digitální nebo analogové formě režijně zpracován – například prolnut, nebo mohou být na příklad vloženy titulky, a zpětně zaznamenán na původní místo. Pro uvedené příklady úpravy již zaznamenaného signálu tak není třeba pořizovat pomocné přepisy, a navíc dochází ke značné časové úspoře. Nahrazuje tak do určité míry další záznamový stroj. U kamkorderů je možno nastřihovat nové záběry metodou označovanou jako „Back Space Edit”. Jedná se vlastně o modifikovaný střihový režim „Assemble”, kdy po ukončení záběru (odstřihu) se pásek automaticky o daný úsek vrátí a nový záběr je pak automaticky nastřižen přesně na konec záběru předchozího. V tomto případě je možné použít pevnou mazací hlavu, protože se vychází z předpokladu, že pásek je smazán. Pokud tomu tak není, jsou první stopy přepsány. 3.2.1 Střih pomocí tónových značek Z předchozího vyplývá, že ke střihu dochází vždy s určitým zpožděním po vydání příslušného povelu, a má li být proveden přesně, musí být tento povel vydán s příslušným předstihem. U manuálního střihu kvadruplexních záznamů byla tato situace zvláště nepříjemná, protože mazací hlava byla předsunuta, časově vyjádřeno o 0,6 sekundy. To spolu s reakcí obsluhy, která vydávala povel podle počítadla (u řady strojů mechanického), a odezvou zařízení znamenalo, že k vlastnímu střihu docházelo cca 1 sekundu později. Přesné místo střihu tedy bylo odhadováno a v případě, že střih musel být opakován, což bylo naprosto běžné, musel být nutně (opět odhadem) předsunut, nebo při odstřihu přetažen, aby se v obraze neobjevil „stop trik”. Tato situace vedla k vývoji ovládacích jednotek, jež používaly k označení místa střihu krátký tón o kmitočtu 4 kHz, tzv. „pips” zaznamenaný na pomocné režijní neboli „CUE” stopě. Zaznamenán byl letmo při vlastním střihu, nebo režisérem, případně střihačem při natáčení primárního záznamu. V tomto případě se vlastně jednalo již o jakousi primitivní přípravu střihu. Tónové pulsy označující místo střihu pak byly pak při jeho realizaci sejmuty zvláštní předsunutou zvukovou hlavou umístěnou před hlavní hlavou mazací. Tím byl získán nutný časový předstih a místo střihu bylo na zaznamenávajícím stroji zcela přesné a opakovatelné. Navíc mohl být střih před realizací předveden a bod střihu posouván po jednotlivých snímcích v obou směrech. Ve své nejdokonalejší formě umožňoval střih pomocí tónových značek u černobílých signálů automatický postupný nástřih jednotlivých snímků, takže umožňoval i animaci. Střih pomocí tónových značek byl výrazným přínosem a široce se používal v šedesátých i sedmdesátých létech. Zůstal však omezen na první a druhou generaci kvadruplexních strojů, protože modernější stroje již byly schopny stříhat podle adresy určené elektronickým počítadlem, nebo časovým kódem.
27
4. Sekvence barevných kompozitních signálů a přesnost střihové skladby Barevná televize byla realizována na bázi kompozitních barevných systémů NTSC ve Spojených státech, PAL ve většině států západní Evropy a SECAM ve Francii a později ve státech bývalého východního bloku s výjimkou Československa, kde televizní studia pracovala v systému PAL. Ve všech těchto systémech byly barvonosné informace namodulovány na pomocný nosný kmitočet a vloženy do pásma stávajícího černobílého (jasového) signálu – tak zvaný kmitočtový multiplex. Tyto barevné signály přinášely jednak vyšší technické požadavky na záznamové stroje, a vzhledem k tomu, že jednotlivé televizní snímky nebyly technicky totožné, nebylo je možné libovolně spojovat, a zkomplikovaly tak sestřih. Relativně nejmenší problémy přinášel systém SECAM. Zde použitá frekvenční modulace činila tento systém velmi odolným a pouze se vzhledem ke střídavému přenosu barevných složek po řádcích lišila barevná informace v prvé řádce snímku n a n+1, takže vznikla dvousnímková sekvence, která, pokud střih měl být čistý, nesměla být přerušena a musela být respektována. Samotný kompozitní signál SECAM však jak takový nemohl být režijně zpracováván (musel být vždy částečně dekódován) a pro televizní výrobu se užíval ve velmi omezené míře. Z hlediska střihu magnetických záznamů přinesl největší problémy systém PAL, který způsobem kódování vytvořil dvousnímkovou - základní a čtyřsnímkovou úplnou sekvenci. Jejich sled, měl-li být střih technicky zcela dokonalý, musel být dodržen, což komplikovalo situaci z hlediska přesnosti střihové skladby. Pro hlubší pochopení celého problému a jeho důsledků, které byly zvláště s příchodem střihových systémů a dodatečného režijního zpracování velmi nepříjemné, bude tento problém rozebrán podrobněji. Kompozitní přenosový systém PAL je, jak známo, variantou systému NTSC, která do určité míry umožňuje při dekódování kompenzovat fázová zkreslení barvonosného signálu způsobující chyby barevného tónu, a to zvláště fázová zkreslení dynamická, závisející na úrovni jasového signálu. Obdobně jako systém NTSC využívá systém PAL k současnému přenosu jasového signálu a barvonosných složek skutečnosti, že: •
kmitočtové spektrum televizního signálu není spojité,
•
maxima energií leží v celistvých násobcích řádkového kmitočtu,
•
u přirozeného obrázku amplituda spektra směrem k vyšším kmitočtům klesá.
Mezery ve spektru v oblasti vyšších kmitočtů jasového signálu tak mohou být využity pro přenos barvonosných složek. Protože tyto složky mají spektrum obdobné a jsou kmitočtově omezené, mohou být po namodulování na vhodnou barvonosnou vlnu BN vloženy do mezer spektra signálu jasového. Kmitočet barvonosné vlny tedy musí být pevně svázán s řádkovým kmitočtem. Optimálním kmitočtem barvonosné vlny v systému NTSC je lichý násobek poloviny řádkového kmitočtu - podle známé formule (2n+1)xfH/2. Maximální amplitudy spektra barevných rozdílových složek R-Y, B-Y pak padnou mezi maximální amplitudy spektra signálu jasového. Protože barevné složky jsou dvě a pro dva barvonosné kmitočty ve spektru jasového signálu místo není, užívá se kvadraturní modulace, kdy dva vyvážené amplitudové modulátory (každý pro jednu ze složek) používají společnou BN. Pro jeden z modulátorů je však BN vůči druhému fázově posunuta o 90°. Po sečtení výstupu 28
z modulátorů vzniká současná amplitudová a fázová modulace, kde amplituda nese informaci o barevné sytosti, fáze pak o barevném tónu. I relativně malá fázová zkreslení však působí nepřijatelnou barevnou degradaci obrazu. Barvonosná vlna však při tomto způsobu modulace vymizí. Protože je však nutná pro demodulaci, musí být přenášena zvlášť ve formě synchronizačního impulsu barvy - burstu, který je vložen do zadní prodlevy řádkového zatemňovacího impulsu a jeho fáze je u NTSC volena tak, že je o 180° posunutá vůči BN, na kterou je namodulována složka B-Y. Vznik základní sekvence PAL Stejně jako v předchozím případě je u systému PAL (Phase Alternated Lines fázově přepínané řádky) použita kvadraturní modulace. Kompenzace fázových zkreslení se dosahuje tím, že fáze barvonosné vlny BN pro složku R-Y se v řádkovém sledu mění o 180°. To znamená, že vektory reprezentující chrominanční signál jsou v lichých a sudých řádcích vůči vektoru barvonosné vlny pro složku B -Y (kolmé na složku R-Y) komplexně sdružené. Jestliže např. dojde v řádku kódovaném s BN +180° k fázovému zkreslení o úhel ϕ, pak lze předpokládat, že v řádku následujícím, který je kódován s BN -180°, dojde k téže fázové chybě. Jestliže se v dekodéru tento signál přepne zpět do fáze stejné jako v předchozím řádku, projeví se zmíněná fázová chyba vůči původní, tj. nezkreslené, hodnotě jako úhel -ϕ, tedy opačně než fázová chyba předchozího řádku, což je využito pro kompenzaci. (Předpokladem pro úspěšnou kompenzaci je ovšem obsahová shodnost nebo podobnost obou řádků.) Tyto skutečnosti jsou obecně známé a jsou zde uváděny pouze pro usnadnění výkladu. Přepínání fáze pomocné barvonosné vlny BN pro složku R-Y má však několik důsledků. Prvým je skutečnost, že vzhledem k lichému počtu řádků v televizním snímku (v daném případě 625) se z hlediska kódování liší liché a sudé řádky dvou po sobě následujících televizních snímků a teprve další (tj. třetí) snímek je z tohoto hlediska shodný s prvním. Vzniká tak tzv. základní sekvence signálu PAL neboli „palský pár“ tvořený dvěma snímky, které musí po sobě následovat, podobně jako sudý půlsnímek musí následovat po lichém. Dále je třeba, aby dekodér získal informaci o tom, jak byl který řádek zakódován. Tato informace se přenáší tím, že fáze burstu se řádek od řádku mění o úhel ±135°, vztaženo ke fázi BN pro složku B-Y, a barvonosná vlna pro dekodér se získá jako průměr těchto dvou hodnot. Čtyřsnímková (osmipůlsnímková) sekvence signálu PAL Pro systém PAL nelze navíc volit barvonosný kmitočet tak, aby padl do středu mezi celistvé násobky řádkového kmitočtu, tj. s půlřádkovým kmitočtovým posuvem (ofsetem). Vzhledem k přepínání barvonosné vlny BN v ose R-Y se objevuje ve spektru chrominančního signálu kmitočet zhruba 7,8 kHz (polovina řádkového kmitočtu), který by pro barevnou složku ležící v této ose způsobil její přesunutí na celistvé násobky řádkového kmitočtu jasového signálu. To by způsobilo úplné smísení se signálem jasovým, a tím zhoršení obrazu. Z tohoto důvodu bylo nutno volit pro kmitočet BN čtvrtřádkový ofset podle formule (4n-1)xfH/4+ fV/2, konkrétně pro evropský televizní systém kmitočet (284 –1/4)xfH + 25 Hz, tj. 4,43361875 MHz. Kmitočet 25 Hz reprezentuje posuv BN o 1 cykl na televizní snímek, což znamená, že barvonosný kmitočet má v jednotlivých půlsnímcích opačnou fázi, čímž se snižuje rušivá viditelnost barvonosného signálu zejména na černobílých
29
obrazovkách. Kmitočtový ofset 25 Hz komplikuje kmitočtové spektrum a ztěžuje digitalizaci (při vzorkování čtyřnásobkem barvonosného kmitočtu, což je vzorkování nejvýhodnější a standardizované, jsou vzorky v jednotlivých řádcích posunuty o 1/625H a struktura vzorků není úplně ortogonální), protože se však jedná o kmitočtovou změnu o 1 cykl na snímek, nemá na sekvence systému PAL vliv a v dalších úvahách ji můžeme zanedbat. Zvolený barvonosný kmitočet znamená, že na jednom televizním řádku je 283,75 periody tohoto kmitočtu. Pokud by tedy začínal s celou periodou, tzn. s nulovou fází vůči počátku nějakého řádku (definovaném nástupnou hranou horizontálního synchronizačního impulsu), pak následující řádek začíná s fází BN 270° (360° - 90°) - viz obr. 4, třetí řádek s fází 180°, čtvrtý řádek s fází 90° a teprve pátý řádek začíná se stejnou fází BN jako řádek první.
Obr. 4 Řádkový posuv barvonosné vlny Čtyři typy řádků z hlediska fáze BN vůči počátku řádku, tzv. fáze Sc-H (Subcarrier tj. BN,. versus Horizontalní synchronizační impuls), znamenají, že začíná-li prvý řádek prvého snímku základní sekvence signálu PAL s Sc-H fází ϕ, pak následující snímek začíná s Sc-H fází (ϕ + 270°), třetí s fází (ϕ + 180°), čtvrtý (ϕ + 90°) a až pátý snímek je z tohoto hlediska shodný se snímkem prvním. Obr. 5 ilustruje tuto situaci pro ϕ = 0.
Obr. 5 Osmipůlsnímková sekvence signálu PAL Vzniká tím tzv. úplná osmipůlsnímková sekvence signálu PAL, která zahrnuje 4 snímky a má opakovací kmitočet 6,25 Hz. Druhá dvojice snímků se od prvé liší pouze opačnou fází BN. Tato skutečnost byla samozřejmě známa, avšak v prvních létech po zavedení soustavy PAL neměla praktický význam. V té době se pracovalo převážně ve studiích, zdrojem signálů byly televizní kamery nebo filmové snímače připojené na tentýž synchronizační generátor, tudíž po nafázování byly 30
všechny zdroje plně synchronní. První snímek v úplné sekvenci nebyl z hlediska fáze Sc-H definován a tato fáze se navíc u tehdejších synchronizátorů s časem posouvala. Vzhledem k tomu, že se tak dělo u všech signálů současně, byl tento fakt nepodstatný. Situace se však zcela změnila, když začaly být střihány a režijně zpracovávány pořady na magnetických nosičích s libovolnou a nedefinovanou fází Sc-H a první kvadruplexní stroje umožňovaly vazbu pouze na základní sekvenci. Existovala tak padesátiprocentní možnost, že z pásku bude snímán snímek typu jedna nebo tři. Pokud byl snímán snímek tři v okamžiku, kdy měl být snímán snímek jedna, nebo opačně, korektor časové chyby musel opačnou fázi barvonosné vlny opravit, to znamená horizontálně posunout obrázek tak, aby fáze souhlasila. Pro režijní zpracování signálů PAL je nutný jednak jejich přesný časový souběh, tj. časové vyrovnání počátků jednotlivých řádek, neboli nafázování horizontálních impulsů a za druhé zcela přesné sfázování barvonosné vlny (a tím barvonosného signálu, jehož fáze nese tón barvy). Jestliže signály snímané z pásku mají rozdílnou fázi Sc-H, pak po nafázování BN, kterou provedl automaticky korektor časové chyby, mají úměrně rozdílnou fázi horizontální. Při režijních přechodech nebo i střizích se pak nutně objevily horizontální posuvy obrazu, a to až o polovinu periody BN (110 ns), což na velké obrazovce představovalo posuv o více než dva milimetry. Pokud byl prováděn pouze ostrý střih do jiného prostředí, případný posuv obrazu nevadil, protože rastr na obrazovce je vždy větší než její stínítko. Pokud však došlo ke střihu na obsahově identický snímek, nebo byl proveden trikový režijní přechod, působily posuvy velmi rušivě. Záznamové stroje sice získaly možnost vazby i z hlediska úplné sekvence (tzv. „color framing“); s rozvojem sestřihu a dodatečného režijního zpracování se však situace stala natolik neúnosnou, že vyústila v potřebu jednoznačně fázi Sc-H v úplné sekvenci definovat. Stanovisko EBU D-23 z přelomu sedmdesátých let řešící tento problém bylo několikrát upřesňováno. V současné době je vztah BN vůči horizontálním impulsům, tedy fáze Sc-H, definována jako fáze složky +EU (B-Y) synchronizačního impulsu barvy (burstu) extrapolovaného k polovině nástupné hrany synchronizačního impulsu prvního řádku prvního půlsnímku úplné, tj. osmipůlsnímkové, sekvence signálu PAL . Preferovaná fáze Sc-H je 0° s tolerancí ±20°. Korektory časových chyb moderních kompozitních záznamových strojů analogových i digitálních (převedení signálu PAL do digitálního tvaru problém neovlivní) mohou v případě potřeby libovolně měnit jednotlivé snímky úplné sekvence, ovšem za cenu posuvů obrazu. Mění-li se první snímek základní sekvence na druhý (nebo opačně) dojde k vertikálnímu posuvu o jeden řádek (liché řádky se změní na sudé a naopak) a horizontálnímu posuvu o 55 ns (čtvrtina periody BN). Jeli třeba změnit první půlsnímek úplné sekvence na pátý (nebo opačně), dojde k horizontálnímu posuvu obrazu o 110 ns. Zdálo by se, že s přechodem na složkové záznamové stroje problém dodržování osmipůlsnímkové sekvence PAL zmizí. To platí však pouze v případě, že zaznamenané složkové signály nebyly nikdy zakódovány do signálu PAL. Při jejich dekódování totiž zůstávají zbytky chrominance v jasovém signálu Y, a pokud je takový signál znovu kódován podle referenčního signálu PAL s odlišnou základní, nebo úplnou sekvencí, může dojít k interakci původní a nové chrominance, a následné ztrátě rozlišovací schopnosti. Korektory tomu čelí přizpůsobením fáze reprodukovaného signálu, a tím i stejnými posuvy obrazu jako v předchozím
31
případě. Nemá-li k nim docházet, musí být vazba těchto strojů nastavena podle požadavků tak, aby se jednotlivé snímky nemusely měnit. Z tohoto důvodu mají i složkové záznamové stroje řady Betacam (analogové i digitální) možnost vazby na jeden snímek (2 V), dva snímky (4 V), nebo čtyři snímky (8 V). Umí se tedy vázat na základní nebo úplnou sekvenci signálu PAL, ačkoliv kompozitní signál PAL nezaznamenávají.
32
5. Požadavky na řízení záznamových strojů při střihu I když bylo místo nástřihu možno tónovou značkou definovat, zůstával dlouho nevyřešen problém, jak pevně a opakovaně zajistit, aby byl nastřižen první snímek požadované sekvence, nebo záběru z příspěvkového stroje. Všechny páskové záznamové stroje potřebují určitý, ne zcela přesně definovatelný, čas, než pásek dosáhne nominální rychlosti, najde požadovaný typ půlsnímku a signál je snímán v požadované vazbě. U zařízení prvních generací kvadruplexů se pohybovala doba náběhu v rozmezí 4 až 6 sekund. I když se tato doba se postupně zkracovala5 a u záznamových strojů nových standardů je již do značné míry konstantní, musí příspěvkový i záznamový stroj startovat z tzv. parkovacího bodu, umístěného před vlastním střihem. Pokud však nejsou stroje při náběhu řízeny, nelze opakovaně zaručit, že v daném okamžiku budou reprodukovány požadované snímky a že bude také požadovaný snímek nastřižen. Jaké jsou tedy minimální požadavky na nejjednodušší řídicí systém, který by mohl zajistit střih pořadu s přesností „na okno” při použití dvou záznamových strojů. Protože se pro dosažení požadovaného souběhu v první řadě jedná o řízení posuvu pásku, musí existovat informace o jeho pohybu. Zcela přirozeně se tedy nabízela možnost využít k tomuto účelu impulsy z řídicí stopy, které jsou, pokud je pásek založen, k dispozici kdykoli se pásek pohybuje. Tyto impulsy navíc mohou být transformovány do časových údajů. Bod nástřihu a začátek sekvence je možné určit letmo, tj. stisknutím příslušného tlačítka, v místě požadovaného střihu. Po vydání příslušného povelu, v současné terminologii „Park, Preroll, Cue Up”, mohou oba transporty být řízeny tak, aby byly vyhledány parkovací body 3 až 5 sekund před střihovým bodem. Jejich poloha je v tomto případě dána počtem sejmutých impulsů řídicí stopy. Jestliže je vydán povel k předvedení střihu – „Preview“, nebo jeho realizaci – „Edit“, je posuv příspěvkového stroje řízen tak, aby v konečné fázi, tj. před provedením střihu, byl počet sejmutých impulsů na obou transportech shodný – stroje jsou vzájemně synchronizovány a příslušným povelem z řídicí jednotky může být požadovaný provoz realizován. Dalším problémem pří realizaci souběhu bylo vlastní řízení strojů, které k tomu nebyly uzpůsobeny. Využito mohlo být pouze paralelní dálkové ovládání, pokud byly ovládané funkce dostatečné. Protože první generace zařízení neměly servosystém, který by při vyhledávání přímo řídil cívky s páskem (a respektoval i jejich setrvačnost) a umožňoval tak přímý nájezd na požadované místo (tzv. „Cue-Up Servo“), používala řídicí jednotka pro naparkování střídání povelu pro převíjení vpřed / vzad (tzv, „ping – pong”), dokud nebylo požadované místo s dostatečnou přesností nalezeno. Souběhu strojů po startu z parkovacích bodů může být dosaženo v režimu reprodukce přirychlováním nebo zpomalováním posuvu pásku pomocí změn rychlosti otáček motoru podélného posuvu pásku - funkce TSO – „Tape Speed Override“. Protože je výhodné řídit pouze jeden stroj vůči druhému a v naprosté většině bývá řízen stroj reprodukční vůči záznamovému, užívá se pro něj termín „Master” a pro příspěvkový stroj termín „Slave”. Předvedení střihu provedla řídicí jednotka
5
Firma Ampex dosáhla u strojů VPR3 a digitálního stroje DCTd náběhu do plné vazby za 20 ms, tj za dobu trvání jednoho půlsnímku (Sic!).
33
přepnutím signálu reprodukovaného na stroji „Master“ na signál příchozí, realizaci střihu vydáním povelu „střih” s příslušným předstihem. Popsaná činnost záznamového a příspěvkového stroje je vlastně základním principem lineárního sestřihu pořadů na magnetickém pásku a všechny řídící systémy takto, i když na podstatně vyšší úrovni pracují. Poslední generace kvadruplexních strojů mohla provádět přesný střih ze stroje na stroj i bez externí řídicí jednotky, navíc s použitím časového kódu. V první polovině osmdesátých let byly postupně touto možností vybaveny profesionální záznamové stroje všech formátů. Střihové systémy mohou samozřejmě ovládat větší počet transportů a umožňují režim označovaný jako „A - B Roll”. To znamená, že všechny transporty najedou na své parkovací body, nastřižena je sekvence ze stroje A a druhý příspěvkový transport – B je nastartován a synchronizován tak, že jeho příspěvek přesně navazuje na konec této sekvence. Vlastní střih tak může být realizován přepnutím signálu na režii stroj „Master” za této situace pokračuje v záznamu. Současné ovládání více příspěvkových transportů bylo navíc podmínkou pro trikové přechody.6 I když na bázi informací získaných z impulsů z řídicí stopy, nebo jinak řečeno počítadla, jsou samozřejmě schopny pracovat i nejdokonalejší lineární systémy, není takto získaná časová informace dostatečná, protože není jednoznačná. Daný snímek je totiž označen v závislosti na nastavení (vynulování) počítadla. Může docházet k nekorigovatelným chybám při snímání jednotlivých impulsů z řídicí stopy, a navíc, což je daleko důležitější, to samozřejmě prakticky vylučuje používat předem připravená střihová data. Pro skutečně kvalitní automatizovaný střih je naprosto nutné jednotlivé snímky pevně označit, jinak řečeno přiřadit jim jednoznačné a trvalé adresy.
6
U digitálních strojů může být, jak již bylo zmíněno, určitá forma režimu „A – B Roll“ realizována funkcí “Preread”.
34
6. Časový a řídicí kód Nejpřirozenější metodou pro automatické řízení záznamových strojů je jednotlivé snímky na pásku očíslovat, přičemž tato čísla – adresy - mohou být zapsána na zvláštní magnetickou stopu, nebo do neaktivní části obrazu, (případně do určeného sektoru – to u digitálních záznamových formátů, které k tomuto účelu podélnou stopu nemají, nebo nezaznamenávají neaktivní část obrazu, tzn. vertikální zatemňovací interval). S ohledem na uživatele je přirozené adresovat jednotlivé snímky ve formě časového údaje, který je určen počtem zaznamenaných, nebo reprodukovaných snímků v daném časovém intervalu v rámci dvaceti čtyř hodin. Adresa každého televizního snímku je tedy vyjádřena počtem hodin, minut, sekund a snímků ve tvaru: H10 H1 : M10 M1 : S10 S1 : F10 F1. Časový kód začal být používán počátkem sedmdesátých let a jeho forma byla do značné míry určena technickými možnostmi té doby a vlastnostmi kvadruplexních záznamových strojů. Protože byl zaznamenáván na pomocné (režijní) podélné stopě, vžilo se později, kdy začala být užívána jeho druhá varianta (tj. zápis do vertikálního zatemňovacího), označení LTC – „Longitidunal Time Code“ – podélný časový kód. Budiž řečeno, že tato forma je prioritně u páskových záznamových formátů užívána v téměř nezměněné formě dodnes.
6.1 Podélný časový kód SMPTE / EBU - LTC Základní technické a provozní požadavky na tento typ časového kódu mohou být shrnuty do následujících bodů: •
Musí být zaznamenán pomocí binárních čísel.
•
Každá adresa musí být zaznamenána v časovém intervalu jednoho televizního snímku a musí s ním být pevně svázána.
•
Musí být čitelný bez ohledu na směr pohybu pásku, a kromě rychlosti posuvů pásku blízkých nule v celém rozsahu rychlostí, v nichž se pásek pohybuje, tzn. i při rychlém převíjení.
•
Hodinové impulsy ohraničující jednotlivé bity a umožňující dekódování musí být odvozeny ze samotného zaznamenaného kódu.
•
S ohledem na jeho rozvod a způsob záznamu musí být nezávislý na polaritě a jeho spektrum musí být vhodné pro podélný magnetický záznam.
•
Kromě vlastních adres jednotlivých snímků by měl umožnit záznam dalších informací podle požadavků uživatele.
Jak vyplývá z názvu, je tento kód v podstatě shodný pro evropský i americký rozkladový systém a liší se v principu pouze periodou a čítáním snímků (0 – 24 pro evropský systém a 0 – 29 ve dvou variantách pro systém americký). Pro vlastní binární modulaci kódu je zde užit standard FM, označovaný také jako „Bi – Phase Mark”, nebo „Manchester I”. Ten je charakteristický tím, že bez
35
ohledu na polaritu signálu je stav, kdy v době bitové periody nedojde ke změně polarity, čten jako logická 0, přechod v polovině bitové periody je čten jako logická 1. Vložené informace pro jeden snímek jsou pak zakódovány ve formě osmdesátibitového slova ve formě BCD („Binary Code Decimal“), což znamená, že pomocí binárních čísel jsou vyjadřována dekadická čísla. Protože pro binární vyjádření čísel 0 – 9 jsou třeba čtyři bity a samostatná adresa obsahuje osm dekadických znaků, je použito osmi čtyřbitových skupin, tj 32 bitů. Stejnou kapacitu mají tzv. uživatelské bity, do nichž mohou být běžně vkládány číselné informace v dekadické, nebo hexadecimální soustavě, umožňují však i vkládání alfanumerických znaků, pokud je zařízení příslušně vybaveno. Uživatelské bity jsou běžně užívány pro vkládání čísla nahrané sekvence, nebo čísla pásku. Bity 64 – 79, tj. posledních 16 bitů, tvoří synchronizační slovo, které začíná dvěma nulami následovanými dvanácti jedničkami a končí nulou a jedničkou. Synchronizační slovo je tedy nesymetrické, a umožňuje tak určit jeli kód čten při pohybu pásku vpřed nebo vzad. Řada dvanácti jedniček se nemůže nikde v adresových ani uživatelských bitech objevit, a synchronizační slovo tak může být jednoznačně detekováno. Synchronizační slovo tedy jednotlivá kódová slova ohraničuje, určuje směr čtení a umožňuje dekódování. Čísla adresující jednotlivé snímky však v některých případech nemohou nabýt hodnot vyžadujících čtyři bity. Desítky hodin a snímků mohou mít pouze hodnoty 0 – 2, k čemuž stačí pouze dva bity, desítky minut a sekund mohou dosáhnout hodnot 0 – 5, jsou tedy potřebné pouze 3 bity. Nadbytečné bity mohou nést dodatečné informace, nebo mají hodnoty umožňující zlepšit dekódování, případně jsou označeny jako nepřiřazené. Z uživatelského hlediska jsou důležité bity 10 a 11 ve skupině desítek snímků. Bit číslo 10 je využíván pouze v systému NTSC. Skutečný snímkový kmitočet zde není 30 Hz, nýbrž ze známých důvodů pouze 29,97 Hz, tedy o 0,1 % nižší. Pokud jsou snímky čítány přesně, dochází ke stejné odchylce od reálného času, tj. o 3,6 sekundy za hodinu. V časovém kódu SMPTE existují dva pracovní režimy označované jako NDF („Non Drop Frame“) „nevypuštěný snímek”, nebo DF („Drop Frame“) „vypuštěný snímek”. V prvém případě je hodnota bitu 10 nula, jednotlivé snímky jsou čítány přesně a dochází k uvedené časové odchylce. V druhém případě, kdy je hodnota tohoto bitu 1, jsou vypuštěny adresy dvou snímků každou minutu vyjma každé minuty desáté, čímž je dosaženo souběhu s reálným časem – údaj časového kódu souhlasí se skutečnou délkou pořadu, nebo záběru.7 Evropy se tento problém netýká, a pokud je volba uvedených režimů časového kódu na zařízení pro evropský televizní systém, pak je nefunkční. Pokud má bit číslo 11 hodnotu 1, identifikuje definované přiřazení časového kódu z hlediska úplných barevných sekvencí kompositních signálů PAL , případně NTSC, kde je j úplná sekvence tvořena dvěma snímky.
6.2 Vertikální časový kód – VITC Podélný časový kód nemůže být bezpečně čten při velmi malých posuvných rychlostech pásku, které jsou typické při vyhledávání míst střihu v režimu „Jog”, tj. krokování. Tento problém lze sice různými způsoby technicky zvládnout,
7
Budiž zdůrazněno, že jsou vypuštěna pouze čísla, nikoliv televizní snímky.
36
nejdokonalejším řešením je užití novější verse časového kódu, který byl vyvinut speciálně pro stroje s možností reprodukce při podstatně nižší rychlosti pásku, než je standardní. Tento kód je vložen do volných řádek vertikálního zatemňovacího intervalu, je tedy součástí obrazového signálu a může být snímán když jsou rotační hlavy v pohybu a v kontaktu s páskem. Lze jej tedy snímat i při stojícím pásku. Při rychlém převíjení naopak bezpečně čten být nemůže, protože obrazové stopy nemohou být přesně sledovány. Může však být vzorkován, případně substituován. Důležité je, že kdykoli klesne rychlost pásku pod určitou hranici, je opětně bezpečně čten. V praxi je nejčastěji užíván v kombinaci s kódem podélným. Časový kód VITC má naprosto shodnou informační kapacitu, to znamená 32 adresových a 32 uživatelských bitů, čísla jsou opět uložena ve formě BCD. Pro systém NTSC má oba zmíněné provozní režimy a může nést informaci o barevných sekvencích kompozitních signálů. Uspořádán je poněkud odlišně, obsahuje navíc i osm kontrolních bitů CRC („Cyclic Redundance Code“) a kódové slovo je devadesátibitové. Protože je, jak již bylo zmíněno, součástí videosignálu, mohla být zvolena modulace typu „NRZ level” („Non Return to Zero“ – bez návratu k nule úroveň). Tento typ modulace je charakteristický tím, že vysoká úroveň signálu representuje trvale logickou jedničku a nízká nulu. Pokud se však informace v jednotlivých bitových periodách nemění, to znamená, že je přenášena řada jedniček nebo nul, zůstává v daném stavu. Hodinové impulsy mohou být získaný jako určený násobek kmitočtu horizontálních impulsů, bitová perioda je 0,55 mikrosekundy. Pro evropský televizní standard může obecně být VITC vložen do řádek 6 – 22, (319 - 335 u půlsnímku následujícího) vertikálního zatemňovacího intervalu. Aby však nedocházelo ke kolizi s jinými vloženými daty, organizace EBU (European Broadcasting Union) ve standardu N12-1994 určuje jeho umístění pouze do řádek 19 a 21 ( 332 a 334). Časové údaje (adresy) dekódované z kódů LTC a VITC (pokud byly stejně kódovány) musí být shodné. Tento požadavek se netýká uživatelských bitů. Jak je patrné, může být pro jeden televizní snímek vložen VITC celkem čtyřikrát, což zabezpečuje jeho bezpečné čtení a navíc umožňuje snadné rozlišení jednotlivých půlsnímků. Pro synchronizaci užívají časový kód i disková média, zde je však i součástí mechanismu přístupu a jako takový je proprietární. Vstupní a výstupní rozhraní pro samotný kód odpovídá standardu LTC.
6.3 Užívání časového kódu Podélný záznamový kód byl u kvadruplexnich záznamových strojů zapisován na pomocnou (režijní) stopu. Bitový tok LTC je pro evropský systém pouze 2 kb/s, což reprezentuje základní harmonický kmitočet 2 kHz respektive 4 kHz pro řadu logických jedniček. Záznam těchto kmitočtů nebyl samozřejmě problémem, průběh kódu je však obdélníkový s nástupnou hranou cca 50 mikrosekund, a navíc při rychlém převíjení, kdy musí být čten, stoupají uvedené kmitočty úměrně s převíjecí rychlostí, takže zvukový kanál pomocné stopy musel být příslušně upraven. První generace záznamových strojů nebyly samozřejmě generátory a čtečkami vybaveny. Používány byly samostatné jednotky, a pokud měly být alespoň základní funkce, tj. start a stop, dálkově ovládány, bylo záznamové stroje třeba
37
upravovat. Plně vybaven byl až poslední typ kvadruplexního záznamového stroje fy AMPEX AVR3. Teprve profesionální jednopalcové formáty již měly pro časový kód vyhrazenou podélnou stopu, přepínatelnou pro zvukový signál, nebo LTC. Začal být užíván i VITC a generátory a čtečky se postupně staly součástí základního vybavení záznamových strojů. Moderní profesionální záznamové formáty (s výjimkou D7 a D9) mají pro LTC jednoznačně dedikovanou podélnou stopu a zařízení je vybaveno generátory a čtečkami pro oba typy časového kódu. V závorce výše uvedené záznamové formáty zaznamenávají časový kód do sektoru subkódu šikmých stop, obsahujících pomocné informace. Skutečnost, že LTC byl zaznamenáván původně na zvukovou stopu, způsobila, že byl a převážně je rozváděn přes symetrické zvukové linky a užívá konektory XLR. Některá zařízení, obzvláště kamkordéry používají rozvod nesymetrický pomocí koaxiálního kabelu a koncovek BNC. Pokud je třeba propojit symetrický a nesymetrický LTC, mělo by být vždy být použito příslušné přizpůsobení. V případech, kdy je rozváděn na větší vzdálenosti, je přizpůsobení nutné, protože může dojít jednak k poklesu úrovně, a obzvláště narušení hran jednotlivých pulsů, což může kód znehodnotit do té míry, že nemůže být dekódován a je nečitelný. Kód VITC, je, jak již bylo zmíněno, součástí obrazového signálu a jako takový může být rozváděn. Protože generátor a čtečka u moderních záznamových zařízení spolupracují, bývá VITC při čtení běžně transformován do formy LTC, a může být tedy rozváděn a znovu v souběhu generován a zapisován jako VITC. Časové kódy LTC nebo VITC jsou samozřejmě součástí sériových komunikačních protokolů pro spolupráci jednotlivých strojů, střihových, nebo jiných řídicích systémů. Pokud se užívaly generátory a čtečky jako samostatné jednotky, byla jimi pro primární výrobu vybavována spíše jednotlivá pracoviště něž jednotlivé stroje a kód byl rozváděn podobně jako referenční signály. Některé televizní společnosti užívaly trvale běžící „centrální” generátor v souběhu s reálným časem. Nevýhodu byla skutečnost, že při primární výrobě takto zaznamenaný kód sice identifikoval celkovou délku natáčení, i přibližná délka natočeného materiálu musela však být poměrně pracně počítána. Navíc, pokud nebyla pro každý den natáčení užita cívka nová, mohl být narušen monotónně stoupající kód na jedné cívce, což je základní požadavek pro automatickou postprodukci. Za této situace bylo výhodnější natočený materiál kódovat dodatečně. Pro kódování při výrobě bylo výhodné generátor se záznamem jednotlivých sekvencí spouštět a zastavovat, případně jej nastřihovat. První typy však z hlediska dálkového ovládání většinou akceptovaly pouze povely „start“, „stop“, pro generátor a „freeze“ pro zastavení čtečky. Teprve později se objevovaly dokonalejší typy generátorů a čteček umožňující navazování kódu při záznamu, jeho regeneraci a stávaly se příslušenstvím záznamových strojů. V současné době jsou všechny profesionální záznamové stroje generátory a čtečkami jak LTC, tak i VITC vybaveny. Čtená i generovaná data mohou být navíc vložena ve formě alfanumerických znaků do obrazu jednoho z výstupů stroje. Samostatné generátory a čtečky se užívají spíše výjimečně. Pokud je časový kód přepisován, měl by být vždy regenerován, aby bylo odstraněno jeho tvarové zkreslení a časová nestabilita, a navíc, pokud je přepisován bez obrazu, musí být oba stroje řízeny shodným referenčním signálem, aby byl k jednotlivým snímkům pevně a jednoznačně přiřazen. Dodržet tento požadavek je samozřejmě nutné i v případech, kdy je kód přepisován z magnetofonu na videomagnetofon. Tento požadavek není v praxi příliš častý, pokud se však vyskytne,
38
je nutné, aby reprodukovaný kód byl v souběhu s jednotlivými snímky, což vyžaduje zvláštní řízení magnetofonu. 6.3.1 Generátor a čtečka časového kódu na záznamovém stroji V současné době jsou tyto jednotky součástí všech profesionálních strojů a podle požadavků spolupracují. Generátor profesionálních záznamových strojů běžně produkuje časově identické kódy LTC / VITC a vždy lze zvolit, zda budou zaznamenány oba kódy, nebo pouze kód požadovaný. Generátor může pracovat v různých provozních režimech, jejichž názvy jsou do značné míry ustáleny, i když se mohou jednotlivé výrobky i z tohoto hlediska lišit. V režimu „ FREE RUN“ běží generátor po spuštění od nuly, nebo předvolené hodnoty bez ohledu na režim záznamového stroje. Poznámka: V praxi se velmi často jako výchozí hodnota namísto nuly používá adresa 01:00:00:00, nebo 10:00:00:00, protože při nájezdu na parkovací bod, který je například o 10 sekund před těmito adresami, nemůže dojít k pokusu naparkovat na adresu 23:59:50:00, která v případě, že je pásek kódován od nuly, na pásku neexistuje. To může mást nejen obsluhy, ale i některé typy řídicích systémů, pokud nejsou příslušně ošetřeny. Režim „FREE RUN“ se užívá nejčastěji v případech, kdy se stroj používá jako zdroj kódu pro jiná zařízení, případně pokud má být kód identický s reálným časem. V režimu „REC RUN“ generátor běží pouze v době záznamu. Pokud je zvolen režim označovaný „JAM”, nebo u zařízení firmy SONY „REGEN/PRESET”, může být kód postupně nastřihován. To znamená, že kód, kterým předchozí záběr končil, je přečten, generátor je s tímto kódem svázán, takže kód plynule navazuje. V střihovém režimu často tímto způsobem pracuje generátor automaticky. Bylo již zmíněno, že pokud je na pásek zaznamenáván externí reprodukovaný kód, měl by být vždy regenerován. Pokud se tak nestalo na reprodukčním zařízení, lze využít režim generátoru označovaný jako „SLAVE”, nebo „EXT/REGEN”, kdy je příchozí kód čten a znovu generován. V tomto případě je však třeba mít na paměti, že pokud příchozí kód není přísně monotónní, jestliže například některé adresy z jakéhokoli důvodu chybí, bude odezva generátoru na tuto situaci specifická a přepsaný kód nemusí být zcela identický. Za této situace může být výhodnější přepisovat kód přímo, tj. bez aktivní regenerace. Čtečka je vlastně dekodér umožňující zobrazit zaznamenané kódy (včetně uživatelských bitů), nebo může časový údaj odvozovat od impulsů řídicí stopy – tento režim je běžně označovaný jako „CTL”, nebo „COUNTER” – počítadlo. V tomto případě je po dle snímaných impulsů generován časový kód, který je přiváděn minimálně do sériového řídicího signálu RS422 (viz dále), takže lze pracovat s řídicími, nebo střihovými systémy, i když není žádný časový kód zaznamenán. Stejným způsobem může být interpolován časový kód v případě, kdy není z jakéhokoli důvodu čten. Interpolace umožňuje správnou činnost řídících jednotek i za této situace. Tento stav je však vždy nějakým způsobem hlášen. Vždy lze zvolit, zda bude čten pouze podélný kód – režim „LTC”, nebo vertikální kód – režim „VITC”. Další možností je režim čtení „AUTO”, kdy je čten kód, který je zaznamenán, a v případě, že jsou zaznamenány oba kódy, je do určité
39
rychlosti posuvu pásku, obvykle ± 0,5 rychlosti nominální čten „VITC” a při rychlostech vyšších „LTC“. Adresu přiřazenou danému snímku lze dekódovat až po jejím přečtení, a může tedy být zobrazena s určitým zpožděním. Pro kód LTC se jedná o jeden snímek, pro VITC cca jeden půlsnímek. U prvních generací čteček „LTC” tedy byla zobrazena adresa snímku, který již nebyl na obrazovce, což mohlo přinášet určité provozní potíže, a navíc vznikal rozdíl mezi čteným „LTC” a „VITC”. Tento problém je odstraněn tím, že čtené kódy jsou časově korigovány, takže zobrazená adresa vždy souhlasí se snímkem, který je právě reprodukován. (EBU Standard N12 – 1994.) Adresy nebo informace v uživatelských bitech jsou zobrazeny na displeji stroje, a navíc mohou být vkládány do jednoho z výstupních signálů. Odečítání informací z obrazovky je po všech stránkách výhodnější, a nadto může být takový signál použit pro pomocný záznam a pro jednoduchou přípravu střihových dat. Za této situace však může dojít ke zpoždění vložené adresy o jeden snímek v případě, že jsou znaky vloženy do horní části obrazu. Tato situace je pro jednotlivá zařízení uvedena vždy v provozní dokumentaci.
40
7. Automatické (lineární) střihové systémy Jestliže je obrazový a zvukový magnetický pás opatřen časovým kódem, může být bezpečně a opakovaně vyhledána informace, kterou označuje, to znamená libovolný televizní snímek, nebo libovolný zvukový segment v délce jednoho televizního snímku u pásu magnetofonového. Proces přesného a opakovaného vyhledávání jednotlivých adres na různých transportech bylo možno provádět i manuálně. Zajištění jejich požadované koincidence, nebo jinak řečeno dosažení souběhu požadovaných programových sekvencí, nebo záběrů a vydávání povelů pro střih však již vyžadovalo nějaký typ řídicího systému. S výhodou však tyto procesy mohly být prováděny automatizovaně pomocí vnějších řídicích jednotek, a zvláště počítačových systémů vybavených vhodným programem. Základní informací pro výpočetní jednotku řídicích systémů byl reprodukovaný časový kód a samozřejmě stavová hlášení informující o režimu a okamžitém stavu řízeného transportu. Kvadruplexní záznamové stroje ani další technická zařízení první poloviny sedmdesátých let, která měla být řízena, však neuměly časový kód samostatně pro své řízení využívat, neměly tedy provozní vlastnost, která byla později označována jako „vlastní inteligence". Celý proces ovládání musel být prováděn řídicím počítačem a realizován přes interfejsy (převodníky), které přijímaly povely počítače, transformovaly je do tvaru povelů pro dálkové ovládání jednotlivých typů zařízení a zpětně vracely do řídicí soustavy informace o okamžitém stavu jednotlivých zařízení. Pokud byl řídicí počítač dostatečně výkonný a vybavený dostatečnou pamětí, mohla být uložena střihová data pro celý sestřih včetně režijních přechodů, systém mohl převzít i řízení obrazových a zvukových režijních jednotek a sestřih mohl probíhat po založení potřebných dat automaticky. Problémem takových střihových soustav byla jednak skutečnost, že zatím co řídicí počítač mohl pracovat velmi rychle, byla odezva jednotlivých řízených transportů velmi pomalá, a počítač tak byl využíván velmi neefektivně, protože vlastně většinu času čekal. Dále se stále rozšiřoval počet typů a druhů řízených systémů - kromě mnoha typů kvadruplexních strojů již přicházely nové záznamové standardy, řízeny již byly magnetofony a režijní jednotky, byla snaha řídit filmové snímače (případně i neprofesionální stroje pro přípravu dat), z nichž každý potřeboval unikátní převodník (interfejs). Spojovací kabely pro ovládání strojů byly mnohažilové, protože každý povel vyžadoval samostatný vodič. Příkladem takovéhoto střihového systému může být zařízení ESC 40 firmy Bosch Fernseh. Jednalo se velmi komplexní systém, včetně pracovišť pro přípravu dat, nabízející velký pracovní komfort. Vzhledem k technickému řešení však byl velmi drahý, těžkopádný, poruchový a vcelku neúspěšný. V druhé polovině sedmdesátých let se objevilo zcela nové technické řešení, které bylo označováno jako systémy s dělenou inteligencí – „distributive processing“, a znamenalo v oblasti střihových systémů zásadní průlom. Dostupnost mikroprocesoru umožnila konstrukci zcela nového typu interfejsu, který byl označován jako „Inteligent interface“ – „I2“. Jednalo se vlastně o dedikovaný mikropočítač který byl naprogramován a hardwarově upraven pro řízení požadovaného zařízení. Centrální počítač za této situace podle pokynů obsluhy vydával pro požadovanou operaci pouze povely, koordinoval činnost celého systému a vlastní provedení, například naparkování transportu, jeho synchronizaci, nebo
41
režijní přechod, prováděl inteligentní interfejs, který se stal vlastně součástí ovládaného zařízení, a dodával mu „chybějící inteligenci“. Propojení s centrálním počítačem bylo prováděno sériově a později se všeobecně používala a dodnes používá komunikace RS 422. Tato komunikace užívá dva kroucené vodiče na kanál, tzn. pro obousměrné spojení čtyři vodiče. Vzhledem k tomu, že propojení je symetrické, je značně odolné proti rušeni a je udáváno, že umožňuje připojení až na vzdálenost cca 1000 m. Tato skutečnost zpočátku vedla zpočátku k představám, že ke střihovému systému může být s využitím telefonních linek přiřazeno takřka libovolně umístěné zařízení. Praktické zkušenosti však ukázaly, že klasická střižna by měla vždy tvořit technologický celek. Možnost připojit v případě potřeby např. dislokovaný filmový snímač byla samozřejmě velmi výhodná. Komunikace RS 422 přenášela vždy časový kód, řídicí povely a zpětná stavová hlášení, jejich uspořádání a sled, tzv. komunikační protokol však záležel na výrobci. Nejběžnější byly protokoly fy CMX, AMPEX a později SONY, poslední zmíněný je v současné době vlastně standardem. Pro připojení je užíván normalizovaný devítipólový konektor. Uvolněná kapacita centrálního počítače umožnila připojení i desítek řízených jednotek, rozsáhlou redakci střihových dat, a tím i různé pracovní postupy. Běžnou se stala funkce „look ahead“, tj s pohledem vpřed, kdy jednotlivé transporty parkovaly v předstihu a byly startovány tak, že stroj „master“ mohl pokračovat v záznamu. Pokud byla vložena potřebná střihová data, mohl v ideálním případě sestřih proběhnout v čase odpovídajícím délce pořadu. V praxi to bylo ovšem nereálné. Další, i když v praxi nepříliš často užívanou metodou, byl tzv.“checkerboard“ (šachovnice), u nás nazývaný „mozaika“, kdy byly podle adres zaznamenány všechny dostupné sekvence a po založení dalších cívek byly mezery vyplňovány. Střihový program a střihová data u takových soustav mohly být zakládány z pružného disku (8 palců) nebo děrné pásky. Běžným vybavením již byla děrovačka a tiskárna. Ustálilo se již zakládání střihových dat ve formě tzv. střihových řádek, které obsahovaly všechna potřebná data, tj. číslo řádky, číslo cívky nebo transportu, signál, který má být zpracován, tj obraz, nebo zvuk, typ režijního přechodu atd. Uspořádání potřebných dat na obrazovce a formát EDL – „edit decision list“ – střihová soupiska – se lišily povětšinou podle výrobce.Typickým představitelem systémů této generace byl např. již zmíněné systémy CMX 340 a EDM1 firmy AMPEX instalovaný v televizním studiu Praha. Oba užívaly minipočítač PDP11/05. Prvý z nich byl modulární a umožňoval připojení až 32 řízených jednotek. Systém EDM1 mohl ovládat až 8 transportů ve skupinách po čtyřech, užíval komunikaci RS232 a byl unikátní v tom, že se jednalo o sytém kompaktní. V samostatném stojanu byl pouze centrální počítač a periferní zařízení. Vlastní systém byl tvořen pultem, který obsahoval obrazovou i zvukovou režijní jednotku s možností automatického, nebo manuálního ovládání, klávesnici a datový monitor. Unikátní v té době byla možnost manuálně připravit i velmi složité obrazové režijní přechody a efekty v délce až cca 30 sekund, které pak byly přesně opakovány. Tento systém nebyl sice ve srovnání se systémy CMX příliš rozšířen, byl však vysoce efektivní a v ČST Praha byl v provozu více než deset let. Řídicí soustavy umožnily požadovat spojení televizních snímků s libovolnými adresami. V případě kompozitních signálů však musely být respektovány jejich jednotlivé typy, což znamenalo, že některé snímky nemohly být bez posuvu obrazu spojeny, jak již bylo vysvětleno v kapitole 4. Kvadruplexní stroje navíc vůbec
42
nepřipouštěly přerušení základní sekvence, protože jejich korektory časových chyb neuměly změnit první snímek v druhý. Pokud by zvolené adresy například vyžadovaly spojení dvou snímků stejného typu, mohlo dojít ke kolizi mezi servosystémem stroje, který zajišťoval požadovanou synchronnost snímaného signálu, vůči signálu referenčnímu a řídicím systémem, který jejich spojení vyžadoval. Časový a řídicí kód adresující jednotlivé televizní snímky nebyl sám o sobě schopen označovat jejich jednotlivé typy (označení úplné barevné sekvence u signálů PAL v časovém kódu nebylo z počátku standardizováno). Bylo však možné přiřadit jednotlivé snímky jeho určitým hodnotám a z tohoto hlediska existují čtyři možnosti. Je li signál kódován tak, že prvními snímku úplné sekvence je přiřazena adresa 00:00:00:01, byl tento vztah označován jako standard A. Jestliže je na této adrese druhý snímek, jednalo se o nestandardní přiřazení A, byl-li na této adrese snímek tři, jednalo se o standard B a v případě snímku čtyři o nestandardní přiřazení B. Standardního přiřazení, tj, aby první a třetí snímky sekvence PAL byly označeny lichými čísly a druhé a čtvrté snímky čísly sudými, bylo možno relativně snadno dosáhnout přivedením příslušné informace do generátoru časového kódu, a pokud byl tento požadavek dodržen, nemělo docházet ke zmíněné kolizi. Pokud však po druhém snímku sekvence PAL byl místo třetího snímku nastřižen první, došlo k horizontálnímu posuvu obrázku, jehož důvod byl v kapitole 4 vysvětlen. To, jak již bylo zmíněno, při ostrém střihu nevadilo, takže běžně byl střih prováděn pouze z hlediska základní sekvence a v plné vazbě, tj. v souběhu na čtyři snímky pracoval pouze stroj záznamový – „master“. Řídicí soustava navíc podle požadavku zadávané adresy automaticky opravovala tak, že byl vždy dodržen „palský pár“. (Druhou možností bylo povolit chybu souběhu signálů ±1 televizní snímek.) Pokud však posuv v obraze vadil, bylo nutno dodržet úplnou sekvenci PAL, to znamená zajistit, aby po druhém snímku úplné sekvence byl nastřižen snímek třetí, po čtvrtém první atd. Nejjednodušším řešením, pokud k posuvu došlo, bylo modifikovat adresu příspěvku o dva snímky. Modernější systémy vyžadovaly, aby řídicí systém věděl, zda jsou pásky kódovány ve standardu A, nebo B, což běžně operátor zjišťoval zkusmo. Velmi elegantně tyto problémy řešily například novější generace střihových systémů firmy AMPEX, kde systém na požadavek operátora zjistil, jak jsou jednotlivé pásky kódovány a podle požadavků bez problémů zajistil střih z hlediska základní, nebo úplné sekvence signálu PAL, tzn. s případným horizontálním posuvem obrázku, nebo bez posuvu. Cenou samozřejmě byla omezená přesnost z hlediska střihové skladby, tj. možná chyba ±1, respektive ±2 snímky vůči požadavku střihače. Generace střihových systémů poloviny osmdesátých let již počítala s ovládáním „inteligentních“ zařízení, tedy takových, která podle vnějších povelů mohla pracovat samostatně. Navíc se objevily zcela unikátní konstrukce jednopalcových strojů formátu EBU C. Jednalo se v prvé řadě o stroj VPR 3 firmy AMPEX, který měl náběh do vazby pouhých 20 ms a ohromné akcelerační a decelerační profily při nájezdu na požadovanou adresu, a bezprecedentně tak střih zrychloval. Druhým unikátním systémem byl stroj firmy SONY (téhož formátu) určený speciálně pro animaci. Ten mohl zaznamenávat jednotlivé šikmé stopy bez pohybu pásku, takže stroj se nemusel opakovaně vracet, parkovat, rozjíždět a nabíhat do vazby. Po každém zápisu televizního půlsnímku byl pásek o krok posunut. Chybějící vektor rychlosti posuvu byl kompensován vychylovanou záznamovou hlavou a časovou expanzí signálu, takže záznam byl standardní a plně kompatibilní.
43
Jako centrální počítače se užívaly dedikované jednodeskové procesory a jednotlivá zařízení byla připojena přes karty ILC („Intelligent Line Controller“AMPEX), nebo IDC („Intelligent Device Controller“ - SONY). Jednalo se vlastně o mikroprocesorovou jednotku, která přizpůsobovala povely centrálního počítače pro jednotlivá zařízení řízená sériově komunikací RS 422. V hardwarovém vybavení začal být užíván pevný disk a 3,5palcové disketové jednotky. Novou provozní vlastností se stal tzv. „slow (nebo dynamic) motion editing“ – možnost řídit a naprogramovat příspěvky ze strojů reprodukující signál nestandardní rychlostí. V této době již razantně vstoupila na trh firma SONY se svou širokou a neustále doplňovanou řadou střihových systémů BVE. Lze říci, že střihové soustavy v této době již poskytovaly velkou tvůrčí svobodu omezenou jen sekvenčními problémy signálu PAL, počtem přepisů – v té době užívané palcové záznamové formáty poskytovaly dostatečnou kvalitu maximálně do čtvrté generace. Nástup složkového záznamového formátu BETACAM, respektive BETACAM SP a jeho proniknutí do oblasti studiové výroby na přelomu osmdesátých a devadesátých let odstranil (pokud byl signál udržován ve složkovém tvaru) problémy se střihovými sekvencemi kompozitních signálů, zvýšil minimálně o stupeň počet přepisů s přijatelnou kvalitou a na trhu se stále více prosazovala firma SONY. Když pak tato firma vyřešila rozhraní pro sériový rozvod digitálního složkového signálu SDI na bázi integrovaného obvodu a v devadesátých létech zvítězila se svým digitálním standardem „Digital Betacam“, stala se v této oblasti dominantní. V této době se lineární střižny běžných televizních středisek do značné míry unifikovaly, a převážně používají formát BETACAM analogový i digitální, případně stroje formátů akvizičních v počtu 2-3 pro žurnalistiku a 3 až 5 transportů pro standardní televizní výrobu. Nástup tzv. akvizičních formátů v polovině devadesátých let, spolu se stále se zvyšujícím stupněm integrace, umožnil konstrukci záznamových strojů natolik miniaturizovaných, že bylo možno realizovat lineární střihové systémy se dvěma transporty typu „lap top“, tj. „na klín“, které umožňovaly zpracovat natočené materiály přímo na místě nebo cestou do studia. První takový systém byl postaven firmou Panasonic pro formát DVC PRO, tedy D7, který užívá čtvrtpalcovou kazetu a následně firmou SONY i pro formát D8, tj. Betacam SX užívající kazetu půlpalcovou. Z technického i tvůrčího hlediska jsou současné páskové střižny omezeny pouze tím, že používají pásek, tedy skutečností, že jsou lineární. I když v žádném případě nelze předpokládat, že v dohledné době z televizních středisek zmizí, jejich vývoj je s naprostou pravděpodobností uzavřen.
7.1 Vedlejší příprava střihových dat – střih „off-line“ Od okamžiku, kdy sestřih pořadů na magnetickém pásku přestal být pouhým spojováním sekvencí, jejichž začátky a konce mohly být hrubě označeny údajem počítadla nebo tónovou značkou již při primárním záznamu, byla postrádána možnost přípravy pomocí pracovní kopie, protože na trhu nebyl dostatečně kvalitní a přitom laciný záznamový stroj. Jak bylo uvedeno v předchozích kapitolách, sestřih pořadů byl z počátku velmi pomalý a pracný. Výběr střihových míst a případné ověření střihu muselo tehdy být prováděno na kvadruplexních strojích, jejichž provoz byl velmi drahý a vzhledem k pořizovací ceně byl jejich počet téměř všude do určité míry limitován. Od automatizovaných střihových soustav bylo kromě zásadního
44
zvýšení tvůrčích možností očekáváno i výrazné zvýšení produktivity. Zatímco první předpoklad byl splněn takřka beze zbytku, produktivita se z počátku naopak propastně snížila. Poté, co tvůrčí složky objevily možnosti těchto systémů, změnila se i technologie výroby pořadů, začala se používat záběrová technologie a počet střihů v hodinovém pořadu vzrostl až o řád. Střihy včetně režijních přechodů mohly být navíc mnohokrát opakovány a modifikovány. Nutnost přípravy střihových dat pomocí pracovní kopie opatřené identickým časovým kódem se stala naprostým imperativem. V průběhu sedmdesátých let se již objevil kazetový systém U-matic, jehož spolehlivost i cena se zdály být k tomuto účelu vyhovující. Optimistické představy předpokládaly, že na základě tohoto stroje a technologie inteligentních převodníků bude možnost postavit střihové soustavy, kde bude pořízen zcela přesný sestřih, a získaná data poslouží pro automatický sestřih vysílací kopie. I když podobné systémy byly skutečně realizovány, narážely v praxi na řadu technických problémů. V prvé řadě se jednalo o to, že stroje U-matic prvních generací musely být pracně upravovány, aby byly schopny číst při převíjení časový kód a mohly být řízeny. Dalším závažným problémem byla skutečnost, že výstupní signál nemohl být režijně zpracováván bez korektoru časových chyb, který byl velmi drahý a v neposlední řadě transportní systém mechanicky nevydržel neustálé převíjení a změny rychlosti pásku, protože na tento provoz nebyl konstruován. Naprosto klasickým příkladem této situace byl již zmíněný kolaps strojů U–matic firmy JVC pro přípravu dat a smyčkování v dabingovém komplexu v Praze, a to vzdor skutečnosti, že firma AMPEX, která celý systém v druhé polovině sedmdesátých let dodávala, provedla velmi pečlivý výběr a testování. Požadavkům na stroje „off-line“ v řídicích soustavách vyhověly až výrobky druhé poloviny osmdesátých let. Příprava dat se tedy všeobecně prováděla podstatně jednoduššími způsoby, které se však ukázaly až překvapivě efektivní. V prvé řadě to byl pomocný záznam, jenž se pořizoval buď současně s primárním záznamem, nebo při technické kontrolní projekci. V každém případě s identickým časovým kódem, který byl navíc vložen do obrazu pomocného záznamu. Adresy jednotlivých sekvencí, nebo záběrů pak mohly být jednoduše odečítány z obrazovky při zastaveném posuvu pásku, tj při „stojícím“ obrázků a byla vypisována ručně psaná střihová soupiska. Dokonalejší metodou bylo doplnění stroje systémem s klávesnicí tlačítky dálkového ovládání transportu a komparátorem založené a čtené adresy, takže stroj požadovanou adresu samostatně vyhledal. Odzkoušení a upřesnění počátečních a koncových adres příspěvku navíc mohlo být realizováno metodou označovanou BVB, nebo VBV, tzn. „VIDEO - BLACK – VIDEO“, nebo opačně. Soupiska mohla již být vytištěna, případně uložena, na nějaký druh paměťového média (děrná páska, kazetová paměť, pružný disk). Naprosto unikátním způsobem byla několik let připravována data v ČST Praha. Režiséři nebo střihači byli zvyklí značit místa střihu již při natáčení tónovou značkou na pomocné stopě. Pokud byl však pásek při primárním záznamu kódován, musely by být zapisovány ručně adresy, což zvláště zpočátku naráželo u tvůrčích složek na téměř nepřekonatelný odpor. Bylo tedy ponecháno značení tónovými značkami - „pipsy“ při primárním záznamu a pásek byl kódován při technické projekci dodatečně. Použitý stroj VR 2000B byl však upraven tak, že předsunutá snímací hlava určená pro sestřih pomocí „pipsů (viz kap. 3) sejmula značku s dostatečným časovým předstihem před kombinovanou zvukovou hlavou zapisující časový kód, takže po příslušném zpoždění mohl být vydán povel pro generátor, aby vložil adresu střihu do uživatelských bitů. Určitý typ střihové soupisky tak vznikl přímo na
45
primárním pásku. Vzhledem k technickým možnostem pražské televize v tehdejší době však musely být adresy do střihové soustavy zapisovány ručně. Novátorskou metodou v ČST Praha, která již do určité míry předznamenávala pozdější „sňatek videa a filmu“, byl technologický postup výroby známého seriálu „Dobrá voda“ v roce 1982, který režíroval F. Filip. Pořad byl snímán dvěma filmovými šestnáctimilimetrovými kamerami, po laboratorním zpracování přímo z negativu přepsán na pásek a opatřen časovým kódem. Podle pracovní kopie na formátu Umatic s vloženým kódem pak byla vytvořena střihová soupiska, která pro první, sedmdesátiminutový díl obsahovala kolem šesti set střihů. Výkonnost automatizované střihové soustavy pak ilustruje skutečnost, že metodou „mozaika“, (tj. postupným zápisem sekvencí, které byly na příspěvkových strojích k dispozici, a následným vyplňováním mezer) byl celý sestřih včetně oprav a kontroly uskutečněn během osmihodinové sekvence. Střihová soupiska provedená touto primitivní metodou byla tehdy velmi dokonalá, vyžádala si však ohromné množství práce filmového střihače. Z tvůrčího hlediska byla největším nedostatkem přípravy dat pomocí jednoho stroje chybějící návaznost, a tím ověření rytmu střihu. Teprve v druhé polovině osmdesátých let byly k dispozici relativně laciné jednoduché střihové jednotky a spolehlivé stroje formátu U–matic, takže vedlejší příprava dat byla běžně prováděna sestřihem pomocných kopií na dvou strojích s vloženým kódem a adresy mohly být odečítány, případně pomocí proprietárních zařízení vytvářena některá ze standardních soupisek (EDL). Přesto i tímto způsobem vytvořené soupisky sloužily většinou pouze jako hrubý pracovní sestřih a finální sestřih byl dolaďován a dokončován „on–line“. Jakkoli nedokonalá metoda vedlejší přípravy dat však byla z hlediska produktivity a ekonomiky u rozhodující většiny pořadů naprostou nutností.
46
8. Komprese televizního signálu Realizace a rozšíření nelineárních střihových soustav pro přípravu dat byly podmíněny rozvojem počítačové techniky, jmenovitě kategorie patřící do osobních počítačů, a zvláště kompresí televizního signálu, aby požadované objemy dat reprezentujících televizní signál mohly být ekonomicky zaznamenány na disk. Kompresi používaly a používají i nelineární střihové soustavy s kvalitou obrazu bez pozorovatelné degradace, to znamená střihové systémy „on-line“. V současné době se v celém spektru televizní výroby, tj. pro záznam, střih i distribuci široce používají metody komprese označované M-JPEG, MPEG a DV. V následujících odstavcích budou uvedeny a vysvětleny jejich základní principy.
8.1 Obecné principy komprese televizního signálu Specifický typ komprese, nebo jinak řečeno úsporný způsob kódování televizního signálu, je užíván i v případě klasického analogového signálu. Jedná se v prvé řadě o prokládané televizní řádkování, které umožnilo snížit pásmo televizního signálu na polovinu a o užití tzv. Kellova faktoru, jenž přizpůsobením horizontálního rozlišení rozlišovací schopnosti vertikální umožnil dále snížit šířku pásma o jednu třetinu. Omezení pásem barvonosných složek a jejich modulace dovolily vytvořit barevné kompozitní systémy NTSC, SECAM a PAL, kdy v rámci kmitočtového spektra jasového signálu jsou umístěny i složky barvonosné. Kvalita barevného kompozitního televizního systému s prokládaným řádkováním je samozřejmě nižší než signálů neprokládaného a složkového, a jedná se tedy o kompresi ztrátovou. Ve své době však tato analogová komprese umožnila zavedení černobílé a posléze barevné televize včetně záznamu na pásek a později i na disk. Kapacita záznamu na disk však byla z počátku pouze desítky vteřin a později desítky minut. Skutečných úspor bylo možno dosáhnout pouze kompresí digitalizovaného signálu. 8.1.1 Komprese digitální Bylo již řečeno, že jasový signál evropské standardní složkové televizní soustavy digitalizované podle doporučení ITU-R 601 je vzorkován kmitočtem 864 x fH, tj. 13,5 MHz, barvonosné složky kmitočtem polovičním, tj. 6,75 MHz – obecně známé vzorkovací schéma 4 : 2 : 2. Takto vzorkované signály jsou pak kvantovány pomocí osmi, nebo desetibitových slov a jejich sériový přenos má tedy rychlost (13,5 + 6,75 + 6,75) x 10 (nebo 8), tzn. 270 Mb/s (216 Mb/s). Protože aktivní televizní řádek obsahuje pro jasový signál 720 obrazových prvků a každá z barevných složek 360 prvků, platí že jedna aktivní řádka obsahuje: 720Y + 360Cb + 360Cr = 1440 obr. prvků (pixelu). Z hlediska nároků na paměťové médium z toho vyplývá, že pro záznam jednoho aktivního televizního obrazu standardní evropské televize s 576 řádky při osmibitovém kvantování je vyžadována paměť: 1440x576 = 829 440 pixelů, tj. 830 kB. Pro jednu sekundu to představuje 830x25, tj. cca 21 MB, pro jednu minutu 21x60, tj.1,26 GB a jednu hodinu tedy 76 GB.
47
V současné době mohou být tyto bitové toky a objemy dat v rámci televizního střediska pomocí signálu SDI vcelku bez problémů šířeny i zaznamenávány na magnetický pás. Pro dálkové šíření a efektivní záznam na pásek, a zvláště na disk, však je (a zvláště byla) tato hodnota příliš vysoká a z důvodů technologických a později i ekonomických je výhodné, aby byla přiměřeně snížena. Při záznamu na disk, byl-li určen pro přípravu střihových dat, mohly být objemy dat nutné pro záznam jednoho televizního snímku snižovány až stokrát, v případě finální distribuce, tj. vysílání, musí být bitové toky sníženy více než třicetkrát. Snížení bitového toku dat nesoucích nějakou informaci, aniž by informace byla ztracena, nebo narušena, lze dosáhnout co nejúspornějším kódováním, jinak řečeno oddělením entropie zprávy od redundance. Termín entropie zde znamená míru informace ve zprávě obsažené, tedy data, která musí být zachována aby nedošlo ke ztrátám, nebo chybám. Redundance, jak vyplývá z významu tohoto slova, jsou informace, nebo data, jež jsou nadbytečná, tzn. určitý balast, který zachován být nemusí. V praxi není jednoduché naprosto přesně entropii od redundance oddělit, nicméně pokud je entropie bezpečně oddělena a redundance minimalizována, jedná se o kompresi bezeztrátovou, která je plně reversibilní. Pokud je snížena i entropie, jedná se o kompresi ztrátovou, tedy ne zcela reversibilní, a v tomto případě by bylo namístě mluvit o kompresi plus redukci bitového toku. V obou případech se však běžně užívá pouze termín komprese. Informace obsažená v televizním obraze je dána úrovní jednotlivých obrazových prvků, které jsou vyjádřeny pomocí desetibitových, nebo osmibitových slov. Pokud jednotlivé prvky nabývají nezávisle a nahodile všech hodnot, které musí být vyjádřeny deseti, nebo osmi bity, což je například případ bílého šumu, lze říci, že takový obraz má entropii deseti, nebo osmi bitů a nemůže být bezeztrátově komprimován. Normální televizní obraz obsahuje však entropii nižší; řada sousedních prvků má stejnou úroveň, data nemusí být tedy opakovaně přenášena, mohou mít úrovně, které lze popsat menším počtem bitů, a navíc existuje možnost, že se jednotlivé snímky opakují, nebo si jsou podobné. Takové signály jsou v signálu SDI zakódovány s určitou, někdy značnou, redundancí, a lze je tedy komprimovat. Pokud je odstraněna redundance pouze v rámci jednoho televizního snímku, mluví se o kompresi vnitrosnímkové (intraframe), pokud je odstraněna i redundance temporální, jde o kompresi mezisnímkovou (interframe). Prvá je vhodná pro magnetický záznam na pás nebo disk, protože signál může být bez problémů stříhán, druhá, při které lze dosáhnut vyššího stupně komprese, je vhodná pro distribuci. Při bezeztrátové kompresi lze bez využití temporální redundance dosáhnout komprese v průměru kolem 1,5 : 1, přičemž se bitový tok samozřejmě podle obsahu obrazu mění. Vyššího stupně komprese je možno dosáhnout odstraněním redundance psychovizuální, jinak řečeno relevance, to znamená využít necitlivosti lidského oka vůči některým chybám a zkreslením obrazu. Pokud tyto chyby nejsou pozorovatelné ani po několikanásobném přepisu a režijním zpracování, je taková komprese označována jako subjektivně, nebo vizuálně bezeztrátová. Při uvedených kompresních metodách, stávajících technologiích a vnitrosnímkovém kódování, kdy je odstraňována pouze redundance v rámci jednoho snímku (prostorová redundance), se jedná o kompresi v poměru zhruba 2 : 1 až 3,3 : 1. Při vyšších stupních komprese již mohou být chyby pozorovatelné. (U systému M-JPEG se někdy jako vizuálně bezeztrátová komprese označuje stupeň 4 : 1 až 8 : 1, druhá hodnota je však akceptovatelná pouze pro nekritické obrazy a jednoduché zpracování.)
48
Všechny v současné době v televizi používané metody komprese televizního obrazu vycházejí ze standardu JPEG (ISO/IEC 10918), a používají tedy diskrétní kosinovou transformaci DCT a Huffmannovo entropické kódování. Ke snížení bitového toku je dále používáno podvzorkování, nebo jinak řečeno rastrové kódování 4:1:1 nebo 4:2:0, a přenášen je pouze aktivní obraz. Vzorkovací schéma 4:1:1 znamená snížení šířky pásma rozdílových složkových signálů o jednu polovinu, tzn. na 1/4 šíře pásma signálu jasového, schéma 4:2:0 pak znamená, že barevné složky jsou přenášeny pouze každý druhý řádek. Vychází se zde ze skutečnosti, že v horizontálním směru jsou složkové signály přiřazeny každému druhému jasovému prvku, takže by mělo vlastně dojít k vyrovnání prostorové barevné rozlišovací schopnosti [1]. Rastrové kódování je znázorněno na obr.6.
Obr. 6 Rastrové kódování Nejvyššího stupně komprese pro danou kvalitu je možno dosáhnout odstraněním mezisnímkové, tj. temporální, redundance pomocí diferenční pulsně kódové modulace DPCM, jak to umožňuje např. systém MPEG 2 s dlouhou skupinou diferenčních obrázků.
8.2 Kompresní metoda M-JPEG Tato metoda je určitou proprietární extenzí kompresního standardu „JPEG“ (Joint Photographic Experts Group), který byl vyvinut s cílem sjednotit metody pro úsporné kódování, pro ukládání a přenos jednotlivých statických obrazů se širokými možnostmi volby kvality. M-JPEG tedy zpracovává televizní signál jako řadu samostatných snímků. Principiální blokové schéma je na obr. 7.
Obr. 7 Princip komprese typu M-JPEG
49
Aktivní televizní snímek obsahující 720 x 576 obrazových prvků je po blocích typicky 8x8 prvků pomocí dvojrozměrné diskrétní kosínové transformace převeden do spektrální domény. To znamená, že obrazové body reprezentované svojí úrovní vyjádřenou ve většině případů osmibitovým číslem jsou nahrazeny maticí se stejným počtem spektrálních koeficientů reprezentujících energii kmitočtů v bloku obsažených. Jednotlivé koeficienty mají přitom ve srovnání s původním blokem podstatně menší korelaci. Uspořádány jsou tak, že v levém horním rohu matice je koeficient určující stejnosměrnou složku bloku a v pravém spodním rohu je koeficient nejvyššího spektrálního kmitočtu. Pokud se provede diskrétní kosinová transformace přesně, je plně reverzibilní a sama o sobě žádnou úsporu nepřináší, protože některé koeficienty vyžadují 11 až 16 bitů. Její význam spočívá v tom, že u běžného televizního obrazu koeficienty směrem k vyšším složkám rychle klesají a řada z nich může být nulová, nebo blízká nule, a vytváří tak předpoklad pro efektivní entropické kódování. Rozhodující pro stupeň komprese je odstranění psychovizuální redundance pomocí váhového kvantování. Jednotlivé koeficienty zůstanou v závislosti na citlivosti lidského oka k jednotlivým spektrálním kmitočtům buď ponechány, nebo budou násobeny čísly menšími než jedna, a výsledné hodnoty budou navíc zaokrouhleny. Velikost vážení tedy určuje stupeň komprese a kvalitu obrazu, přičemž kvalita je dále závislá na tom, jak výhodně a vhodně je psychovizuální redundance pomocí váhových koeficientů odstraněna. V dalším kroku je získaná matice koeficientů s výjimkou koeficientu pro stejnosměrnou složku, která se zpracovává zvlášť, postupně diagonálně čtena. Čtením „cik cak“, jak je tato metoda označována, lze dosáhnout toho, že řazení koeficientů odpovídá stoupajícím prostorovým kmitočtům v matici a u přirozeného obrazu klesá jejich amplituda. Nenulové koeficienty jsou pak následovány řadami nul. Následná entropická, nebo statistická komprese je již bezeztrátová a provádí se pomocí kódovaní s proměnnou délkou slova – „VLC“ („Variable Lenght Coding“) a RLC („Run Lenght Coding“). Při tomto procesu jsou hodnotám, které se vyskytují s vysokou pravděpodobností, přiřazována slova s menším počtem bitů, hodnotám málo se vyskytujícím slova delší (VLC) a sekvence stejných hodnot, např. nul, jsou označeny počtem (RLC). Výstupní bitový tok kodéru M-JPEG se v závislosti na obsahu kódovaného obrazu mění, čímž je předurčen pro diskový záznam. Kvalita obrazu pro daný stupeň komprese zůstává však víceméně stálá. Pokud je vyžadován konstantní bitový tok, což je nutné zvláště v případě záznamu na magnetický pás, musí být kodér doplněn na výstupu vyrovnávací pamětí a zpětnou vazbou, jež řídí váhové kvantování, a tím stupeň komprese, aby mohl být udržován konstantní výstupní bitový tok. V tomto případě se však obrazová kvalita obrazu v závislosti na obsahu obrazu mění a náročné obrazy jsou nutně komprimovány více, a tím i více postiženy. Naopak v případě jednoduchých obrazů musí být pro zachování konstantního bitového toku vkládány tzv. výplňové bity. Systémy používající kompresní metodu M-JPEG pracují tedy s proměnným výstupním bitovým tokem a používají se v širokém měřítku pro nelineární střih, a to jak při přípravě střihových dat „off-line“, tak pro definitivní střih – „on-line“. M-JPEG není však žádným způsobem standardizován. Jedná se o metody proprietární, z hlediska současných potřeb zastaralé a v případě, že je pořad zpracováván postupně na různých systémech, může dojít ke značné degradaci obrazového signálu. Příslušnými mezinárodními organizacemi, jako je například EBU, není pro
50
nové technologie doporučován. Pro nelineární střih „on-line“ je stále více využívána komprese DV a MPEG 2 s pouze vnitrosnímkovým kódováním.
8.3 Kompresní systém MPEG-2 Kompresní systém MPEG-2 (Motion Picture Experts Group) [1] je standardizovanou kompresní metodou označovanou jako HDCT, tj. hybridní sytém používající pro odstranění psychovizuální prostorové redundance diskrétní kosinovou transformaci DCT s váhovým kvantováním a DPCM mezi jednotlivými snímky, nebo půlsnímky pro odstranění redundance temporální. Jak je patrné z obr. 8, je část kodéru pro odstranění prostorové redundance ve svém principu shodná s předchozím případem a konstantní bitový tok udržuje zpětná vazba řídící váhové kvantování.
Obr. 8 Princip komprese typu MPEG-2 Diskrétní kosinová transformace je opět aplikovaná na čtvercové bloky 8x8 obrazových bodů, v daném případě se však kódují jednak bloky s obrazovými prvky příchozího obrazového signálu, nebo i rozdíly hodnot stávajícího bloku a bloku predikovaného, jinak řečeno rozdíly mezi jednotlivými snímky. Pro skutečně efektivní predikci se používá kompenzace pohybu.Ta je založena na skutečnosti, že jednotlivé po sobě jdoucí snímky se velmi často liší tím, že se pohybuje pouze nějaký objekt, nebo se relativně pomalu posouvá scéna. Obsah jednotlivých bloků se příliš nemění, mění se pouze jeho souřadnice a novou polohu bloku je možno označit tzv. pohybovým vektorem. Ten určuje posuvy v obraze na úrovni makrobloků, na něž je snímek rozdělen. Jeden makroblok vždy tvoří čtyři bloky 8x8 prvků jasového signálu, jeden blok barevné složky Cr a jeden Cb v případě vzorkování 4:2:0 a dva bloky Cr a dva Cb v případě vzorkování 4:2:2. Při kompenzaci pohybu jsou porovnávána jasová data dvou po sobě jdoucích obrazů, přičemž první obraz se užívá jako reference. Podobnost mezi současným a následujícím, a případně předchozím, obrazem je v dané oblasti měřena ve všech možných směrech pohybu s rozlišením poloviny obrazového prvku a nová poloha je předpokládána tam, kde je naměřena nejvyšší korelace. Podle způsobu predikce mohou vzniknout tři typy obrázků označovaných jako I, P a B.
51
Jsou-li kódována pouze příchozí data, vytvoří se vnitrosnímkově kódovaný obrázek typu I, který je tedy nezávislý a je používán jako obrázek referenční nebo kotevní, zabraňuje šíření chyb a umožňuje přepnutí nebo střih. Vyžaduje však poměrně velké množství dat a pro distribuci signálu je snaha používat jej co nejméně. Obrázek typu P je jednosměrně diferenčně predikovaný od předchozího snímku, kterým může být obrázek typu I, nebo P a slouží rovněž jako referenční. (V některých případech se používá obrázek predikovaný od následujícího, někdy bývá označen jako R, jedná se však spíše o jednosměrně predikovaný obrázek B.) Obsahuje i data vektorů určujících, odkud byly z referenčního obrazu jednotlivé makrobloky převzaty, a korekční data. V porovnání s obrázkem I obsahuje zhruba jednu polovinu dat. Obrázek typu B je predikován obousměrně, tj. z předchozího i následujícího snímku, a opět obsahuje data pohybových vektorů a korekční data. Tento typ obrázku je kódován velmi efektivně a obsahuje zhruba jednu čtvrtinu dat obrázku I. Protože jsou jednotlivé obrázky na sobě závislé, jsou kódovány v rámci tzv. „Group of Pictures – GOP“, neboli skupin obrázků, jejichž struktura a délka není pevně stanovena. Platí však, že každá skupina začíná referenčním obrázkem I, a končí tedy obrázkem, který je před dalším referenčním obrázkem typu I. Pro danou obrazovou kvalitu se evidentně s délkou GOP datový tok snižuje. Pro distribuci se běžně užívá GOP s 12 až 15 obrázky. Jelikož obraz může být dekódován pouze v rámci skupiny obrázků (která samozřejmě nemůže být přerušena), vznikají při dlouhých GOP potíže se střihem, nebo i přepínáním jednotlivých toků. Situace může být dále komplikována tím, že skupina obrázků je neuzavřená, tzn., že před obrázkem I je obrázek B, který byl od tohoto obrázku odvozen. Pokud je MPEG užíván pro záznam s možností střihu a postprodukce, musí být používány pouze obrázky typu I, nebo skupiny velmi krátké se všemi omezeními a problémy z toho vyplývajícími. Jestliže však není využíváno odstranění temporální redundance, přichází MPEG o svou hlavní výhodu a z hlediska principu se stává do určité míry standardizovanou metodou M-JPEG s volitelným konstantním bitovým tokem, který je zajištěn zpětnou vazbou z výstupní vyrovnávací paměti řídící váhové kvantování a dosahuje pro dané bitové toky obdobnou kvalitu s tím, že kritické obrazy jsou postiženy více. Přesto má nad metodou M-JPEG jednoznačnou výhodu v tom, že je v nejdůležitějších parametrech standardizován. MPEG–2 je široce založený flexibilní systém umožňující i kódovaní zvuku a je definovaný pro tzv. „úrovně“ a „profily“.Čtyři úrovně zahrnují systém HDTV – úroveň „High, systém „High 1440“, dále „Main“ a konečně „Low“. Nejnižší úroveň pracuje s televizním snímkem majícím 352x288 obrazových prvků a maximálním bitovým tokem 4 MHz. Mezi parametry, které definuje „úroveň“, patří počet prvků televizního snímku (a tím vlastně vzorovací kmitočet) a maximální bitový tok. Hlavní parametry, které určuje profil, jsou typy použitých obrázků, struktura vzorkování chrominančních signálů, odstupňovatelnost, přesnost koeficientu pro stejnosměrnou složku a struktura skupin makrobloků. Pro distribuci standardního televizního signálu se v současné době nejvíc užívá varianta označovaná MP@ML, tzn. hlavní profil, hlavní úroveň, používající vzorkovací schéma 4:2:0, obrázky typu I,P,B, jasový snímek s počtem 720x586 obrazových bodů a maximální bitový tok 15 Mb/s. MP@ML je hlavním nástrojem pro zdrojové kódování DVB. („Digital Video Broadcasting – digitální televize“)
52
Pro výrobu a použití ve studiu byl systém doplněn o variantu 422P@ML označovanou jako studiový, nebo profesionální profil. Pracuje se vzorkováním 4:2:2, jasový snímek má 720x608 bodů, a zahrnuje tedy i vertikální zatemňovací interval. Maximální bitový tok je 50 Mb/s, kdy je omezen pouze na vnitrosnímkově kódované obrázky typu I, takže může být bez problémů střihán a v nelineárních soustavách je užíván stále více. Na rozdíl od standardů, které popisují zcela přesně strukturu kodéru a dekodéru, MPEG definuje pouze syntaxi bitového toku a vlastnosti dekodéru. Ty nemusí být schopny dekódovat všechny úrovně, od dané úrovně však musí dekódovat úrovně a profily nižší. Vlastnosti kodérů jsou záležitostí výrobců, takže technickými prostředky a zdokonalováním kompresních algoritmů může být kvalita obrazu i zvuku zvyšována. To je na jedné straně velkou výhodou, na straně druhé však při daném bitovém toku a struktuře GOP není zaručena pro daný obraz konstantní kvalita. Vývoj komprese MPEG měl pokračovat standardem MPEG 3, který byl určen pro televizi HDTV. Požadavky na kódování televize s vysokou rozlišovací schopností však byly již zahrnuty do standardu MPEG 2. Zatím co MPEG 1 a MPEG 2 byly určeny pro efektivní záznam a přenos signálu, standard MPEG 4, označený jako ISO/IEC 14496, byl zamýšlen pro interaktivní televizi a velmi nízké bitové toky.Využívá všech nástrojů MPEG 2, a navíc používá vysoce účinné prostředky komprese založené na kódování objektů. Scéna může být složena z přirozených audiovizuálních objektů snímaných kamerami a mikrofony a z objektů syntetických, generovaných elektronicky. Příkladem může být předpověď počasí, kdy scéna obsahuje relativně velmi málo dat – elektronicky generované pozadí s obrázky slunce, mraků atd. a postavu moderátora. Scéna je pak modelována a popisována jako kompozice. MPEG 4 je optimalizován pro bitové toky 5 – 64 kbit/s, pro internet a mobilní aplikace s rozlišovací schopností 352 x 288 pixelů a až 15 snímky za sekundu. Vyšší bitové toky umožňují dosáhnout nejvyšší obrazovou kvalitu standardní televize odpovídající doporučení ITU-R601. Standard MPEG 7 má standardizovat popis multimediálního obsahu. Definuje pojmy jako „deskriptor“, „deskripční schéma“, „deskripční definiční jazyk“, tak aby materiál, který obsahuje data MPEG 7, mohl být snadno a rychle vyhledáván. Mé se stát rovněž standardem pro „metadata“. (Metadata jsou data týkající se obrazu a zvuku určená pro jejich označení a vyhledávání jak v archivu, tak i přenášeném toku obrazových a zvukových dat. Příkladem může být časový kód, stopová čísla filmu – K-kód atd.)
8.4 Kompresní systém DV Systém DV je v současné době pravděpodobně nejkvalitnější televizní kompresní metodou s konstantním bitovým tokem, která odstraňuje psychovizuální redundanci v rámci jednoho televizního snímku, tzn. s vnitrosnímkovým kódováním. Komprese se provádí s obrazem kvantovaným do osmibitového slova a v základní verzi pracuje se stupněm komprese 5:1 a výstupním bitovým tokem 25 Mb/s. Využívá principů, které jsou užity v dříve popsaných metodách a které opět vycházejí z metody JPEG, tzn. diskrétní kosinové transformace, váhového kvantování bloku DCT a entropického kódování. Navíc však používá přeskupení bloků v rámci snímku, odlišný způsob zpracování prvního druhého půlsnímku, jestliže se liší, v obraze je např. tedy pohyb, pevný počet bajtů na snímek, a tím konstantní bitový tok. Ten je 53
místo zpětnou vazbou z výstupní vyrovnávací paměti udržován předběžnou analýzou jednotlivých snímků, jejíž výsledek řídí váhové kvantování bloků DCT. Principiální schéma je na obr. 9
Obr. 9 Princip komprese typu DV Vstupní obrazový signál SDI se vzorkováním 4:2:2 je rastrově kódován na vzorkování 4:2:0, nebo 4:1:1. (V případě varianty DV s bitovým tokem 50 Mb/s je zachováno vzorkovací schéma 4:2:2.) Diskrétní kosinová transformace je opět aplikována na bloky 8x8 obrazových bodů, nebo bloky 2-4x8 bodů v případě, že je v dané oblasti televizního snímku detekován pohyb a jednotlivé půlsnímky se v této oblasti liší. Pohyb v obraze znamená, že se naruší vertikální korelace mezi lichými (první půlsnímek) a sudými (druhý půlsnímek) řadami v bloku 8x8, a je tedy výhodnější zpracovat samostatně bloky z prvního a druhého půlsnímku, tzn. 2-4x8. Snímkové zpracování, tzn. v blocích 8x8 je naopak výhodnější, když jednotlivé půlsnímky nejsou odlišné, protože v tomto případě je v bloku vyšší redundance. (Liché a sudé řádky jsou v tomto případě prakticky stejné, nebo velmi podobné.) Stejným způsobem se však zpracovávají i oblasti, kde je detekován velmi rychlý pohyb, takže detail je rozmazán. Bloky jsou seskupeny do makrobloků, které obsahují čtyři bloky jasového signálu a po jednom bloku Cr a Cb, celkem tedy 6x 64 bajtů. Z různých oblastí snímku je pak vybráno pět makrobloků a seskupeno do tzv. obrazového segmentu. Tento postup se opakuje, a snímek je tímto způsobem rozdělen do 324 obrazových segmentů po 1920 bajtech, které obsahují data z jeho různých částí . Důvodem je skutečnost, že v jedné části obrazu se může vyskytovat velké množství detailů, zatímco jinde mohou být například pouze souvislé plochy obsahující velkou redundanci. Přeskupením makrobloků v rámci snímku dojde k zprůměrování množství redundance v jednotlivých segmentech a komprese je vyrovnanější. Již zmíněná předběžná analýza zajišťující konstantní bitový tok je prováděna pro každý obrazový segment a podle výsledku se pak volí kvantizační tabulka pro váhové kvantování koeficientů, které odstraňuje psychovizuální redundanci. K dispozici je 64 tabulek, ty jsou po 16 rozděleny do 4 skupin. Skupina 1 je určena pro bloky s vysokým spektrálními prostorovými kmitočty, tzn. pro velmi jemné detaily v obraze, a naopak skupina 4 pro nenáročný obraz a hrubý detail. Zbývající dvě tvoří podle náročnosti obrazu přirozené mezistupně. Měřením energie koeficientů jednotlivých spektrálních kmitočtů v bloku DCT je zvolena nejdříve vhodná skupina a v druhém kroku vybrána jedna z tabulek tak, aby hodnota vážených 54
(komprimovaných) dat byla rovna, nebo menší než 385 bajtů, a tato tabulka je použita [11]. Tímto způsobem se při dodržení konstantního bitového toku dosáhne optimální komprese pro každý televizní snímek a relativně malé závislosti na jeho obsahu. Nakolik je tato metoda komprese kvalitní, ilustruje následující obrázek publikovaný EBU [8], kde jsou porovnány histogramy šesti kritických obrazů v sedmé generaci komprimované systémem Digital Betacam (proprietární DCT vnitrosnímková komprese cca 1:2), dále DV (DVCPRO 50) a MPEG-2 422@ML komprimované na bitový tok 50 Mb/s, tzn. stupeň 1:3,3. Obraz procházel kompresí a dekompresí a režijním zpracováním s posuvy o obrazový prvek. Hodnocení bylo provedeno subjektivní metodou, pozorovací vzdálenost byla čtyřnásobkem výšky obrazu tj. 4H.
Obr. 10 Srovnání kvality typů komprese Na první pohled je patrné, že Digitální Betacam, který používá velmi mírnou kompresi, se s jedinou výjimkou pohybuje v oblasti 5 kvalitativní stupnice CCIR, a patří tedy do komprese vizuálně bezeztrátové. V téže oblasti se pohybují i výsledky dosažené metodou DV 50 a velmi málo kvazitransparentní hranici překračuje metoda MPEG-2 422@ML se stejným bitovým tokem, takže výsledky, zvláště pro větší pozorovací vzdálenost, lze prakticky považovat za srovnatelné. Velmi důležitá je však skutečnost, že hodnocení kvality jednotlivých obrazů při metodě DV je podstatně vyrovnanější, což potvrzuje velmi malou závislost na obsahu obrazu. Dosažená kvalita obrazu u tohoto komprimačního systému je natolik vysoká, že se stal nejrozšířenějším nástrojem pro vnitrosnímkovou kompresi televizního signálu s konstantním bitovým tokem a v současné době je užíván jak v páskových záznamových formátech, tak pro záznam do disků.
8.5 Střih komprimovaných televizních signálů Z předchozího vyplývá, že pokud byl signál komprimován pouze v rámci jednoho televizního snímku, tj. vnitrosnímkově, jako je tomu například v případě kompresí M-JPEG a DV, může být zaznamenaný signál vcelku bez problémů stříhán, 55
a to i v komprimované formě, protože jednotlivé snímky jsou na sobě nezávislé. Pro režijní přechody musí být ovšem vždy dekódován do základního pásma. Opakované kódování a dekódování je však vždy, a obzvláště v případě efektů a klíčování, ztrátové a zhoršuje obrazovou kvalitu. Kompresní metoda MPEG byla však vytvořena jako soustava přenosová, nikoli produkční. I při distribuci je však třeba různé příspěvky spojovat, aniž došlo k narušení obrazu. Jestliže je při střihu nahrazen v rámci GOP referenční obrázek, tj. I, nebo některý z obrázků P, nemohou být obrázky od nich odvozené dekódovány. Nastřiženy by mohly být pouze celé skupiny obrázků GOP, a to ještě v pouze v případě, že jsou jednotlivé skupiny uzavřené. Nejběžnějším řešením tohoto problému je provádění střihu dekódovaného signálu. Každý z přepínaných signálů musí mít vlastní dekodér s vyrovnávací pamětí. Dekódování a opětné kódování však v praxi není nikdy bezeztrátové a tato metoda je pro záznamové stroje naprosto nevhodná. Jak již bylo zmíněno, pro magnetický záznam s možností střihu, musí být používány pouze obrázky typu I (formát D10), nebo skupiny velmi krátké, jako např. GOP 2 skládající se s obrázků typu IBIBIB... u formátu D8 - Betacam SX. Je patrné, že situace je zde ještě komplikovaná tím, že oboustranně predikované obrázky B mají vztah jak k předchozímu, tak následujícímu referenčnímu obrázku I. Tento problém byl odstraněn tím, že stroje s přesností střihu na snímek byly řešeny jako hybridní, tzn. vybavené navíc diskovým záznamem, s jehož pomocí mohl být střih překódováním proveden. (Disk ovšem umožňoval řadu dalších provozních funkcí). Jednodušší stroje bez disku umožňovaly pouze nástřih s omezenou přesností. Pro pochopení problému je třeba si uvědomit, že skupina BI je na pásku zaznamenána jako celek, kde obrázek B je zaznamenán jako první, a ke střihu tedy může dojít pouze před tímto obrázkem [2]. Pokud je střih takto požadován, realizován je tak, že první nastřižený obrázek B je překódován a zaznamenán jako jednosměrně predikovaný k následujícímu referenčnímu obrázku I. Pokud by byl střih vyžadován uprostřed skupiny, tj. nastřižen by měl být obrázek I, dojde ke střihu o jeden snímek později, tzn. nastřižen je až obrázek B další skupiny, kódovaný ovšem opět jako jednosměrný k následujícímu obrázku I. Teprve druhá generace strojů umožnila i naprosto přesné vložení signálu, tzn. střih insert bez diskového záznamu. Stroj je vybaven vychylovanou hlavou „preread“ spojenou s dekodérem, jehož výstup je veden na přepínač. Ten volí pro záznamový kodér buď vstupní signál, nebo signál z dekodéru hlavy „preread“, pokud je obrázek B ponechaný na pásku potřeba překódovat na jednosměrný. K fyzickému střihu na pásku tedy dochází vždy před obrázkem B - místo, kde je nový signál nastřižen, nebo odstřižen, je určeno polohou přepínače signálu. Princip objasňují obrázky 11 a 12. Obrázek na pásku označený Bu je na rozdíl od normálního překódován na jednosměrně predikovaný, aby závisel vždy pouze na jednom kotevním obrázku „I“
56
Obr. 11 Princip přesného nástřihu u formátu Betacam SX
57
Obr. 12 Princip přesného odstřihu u formátu Betacam SX
58
9. Nelineární editing Jakkoli byly klasické střihové systémy v konci osmdesátých let technicky i uživatelsky dokonalé, nebyly schopné překročit omezení daná skutečností, že nosným mediem při střihu byl pásek a střih byl prováděn přepisem. Neexistoval tedy skutečný a okamžitý libovolný přístup k požadovanému záběru nebo sekvenci, tvůrčí pracovník – střihač - ztrácel většinu času při převíjení, parkování, souběhu jednotlivých strojů a výměnách cívek, nebo kazet se zpracovávaným materiálem. To platí jak pro přípravu dat, tak i při vlastním „on line“ sestřihu. Výsledek lze pak modifikovat jen ve velmi omezené míře. Záběr, nebo sekvenci lze vyměnit pouze v případě, že je stejně dlouhá jako původní, v opačném případě bylo třeba část pořadu znovu stříhat nebo přepsat, což v případě analogových záznamů vždy přinášelo ztrátu technické kvality. Tyto nedostatky mohl odstranit pouze návrat ke skládání jednotlivých příspěvků, aniž by musely být přepisovány, podobně jako tomu bylo u klasického filmového střihu, nebo u mechanického střihu magnetických pásků. To samozřejmě vyžadovalo typ nosiče s okamžitým, nebo téměř okamžitým přístupem k libovolné části materiálu. Tento požadavek mohl splnit prakticky pouze diskový záznam ve spojení s počítačem vybaveným příslušným programem. Záznam na disk je obecně možný jak v analogové, tak digitální formě, výhody digitálního záznamu jsou naprosto nesrovnatelné. Kapacita diskových pamětí konce osmdesátých a začátku devadesátých let byla ve srovnání s množstvím dat reprezentujících televizní signál však velmi malá a obrazový signál tak musel být v naprosté většině případů silně komprimován, takže běžně obrazová kvalita umožňovala pouze přípravu dat. Výjimkou byly firma Quantel, která pracovala s plnou kvalitou signálu; užívána byly speciální disková pole, pořad musel být zpracováván po částech a systém běžně spolupracoval s digitálním záznamovým strojem D1. „Non linear, dynamic, nebo film style editing“, jak byl tento způsob střihu nazýván, ve své podstatě znamená, že ke kterékoli části zpracovávaného materiálu existuje okamžitý přístup a veškerá kreativní práce střihače je uložena v paměti počítače. Materiál zůstává uložen pouze ve formě jednotlivých příspěvků a výsledkem je střihová soupiska v případě přípravy dat. Přepisován na pásek je většinou pouze výsledek v případě střihu „on line“. Z hlediska ovládání, softwarového vybavení a provozních vlastností nelineární systémy tedy obecně nabízejí: •
vysokou rychlost vyhledávání, značení a ukládání dat určujících místo střihu včetně typu režijního přechodu, (i když u prvních systémů určených pro přípravu dat mohl být typ přechodu pouze označen a teprve u pokročilejších systémů byl skutečně generován, ovšem nikoli v reálném čase;
•
tzv. „intuitivní“ způsob práce pomocí ikonek s piktogramy a systémy, jež jsou k uživateli „přátelské“;
•
možnost, aby střihač pracoval pouze s obrazovou informací, tzn. s jednotlivými snímky, a nemusel pracovat s časovým kódem, i když je každý snímek samozřejmě adresován a kód je, nebo může být zobrazen. Opuštěna jsou tedy tradiční menu a na displeji, obvykle počítačovém monitoru, jsou zobrazeny zmenšené zpracovávané snímky, tlačítka pro typ režijního přechodu a grafické znázornění procesu pomocí časové osy – „time line“;
59
•
možnost měnit stupeň a případně typ komprese, a tím volit kvalitu obrazu (to samozřejmě mění délku zaznamenaného „digitalizovaného“ materiálu);
•
možnost přenosu EDL (střihové soupisky) na jiné střihové systémy;
•
fyzický přenos i digitalizovaného materiálu, pokud jsou užívány výměnné magnetooptické disky;
•
program určený speciálně pro střih filmu;
•
možnost přímého ovládání páskových záznamových strojů pro záznam (digitalizaci) zpracovávaných pořadů a zpětný přepis vybraných, nebo výsledných materiálů.
První nelineární zařízení pro přípravu střihových dat bylo součástí již dříve zmíněného lineárního systému CMX 600, který byl vyvinut již v roce 1972. Ten však příliš předběhl dobu a nelineární soustavy přicházely v širší míře do praxe v druhé polovině osmdesátých let. Jako průkopnický systém, který již převážně splňoval většinu uvedených vlastnosti, bývá označováno zařízení EMC2, to již bylo vyvinuto na standardní architektuře PC v roce 1988, užívalo stykové rozhraní SCSI, což umožňovalo připojit jak pevné, tak i velkokapacitní magnetooptické disky a bylo cenově dostupné. V současné době vyrábějí nelineární systémy jak firmy zabývající se výrobou klasické televizní techniky (SONY, Panasonic, Gras Valley, atd.), tak řada počítačových a specializovaných firem. Za všechny lze jmenovat firmy Lightworks, Avid, FAST, Matrox, Pinnacle a na trhu existuje samozřejmě mnoho dalších. Ve výčtu nelze opomenout firmu Quantel, jejíž výrobky jsou cenově velmi náročné, lze je však zařadit do absolutní špičky. V souvislosti s nástupem akvizičních formátů se začal používat až čtyřnásobně zrychlený přepis dat do disků i z páskových záznamových strojů.
9.1 Obecná struktura pracovní stanice – „workstation“ Velmi zjednodušené principiální schéma je na následujícím obrázku 13. Profesionální stanice obvykle používá dedikovanou klávesnici s víceúčelovým rotačním ovladačem. Používána je rovněž myš pro ovládání kursoru a někdy paralelní standardní počítačová klávesnice. Na počítačovém monitoru - „Video Display Unit“ – jsou jednak zmenšené obrázky stříhaného materiálu získávané ze snímkové paměti, dále menu, obvyklá je časová osa („time line“) a řada dalších grafických zobrazení [15]. Běžně existuje volba několika různých stránek pro požadovaný typ provozu. Diskové pole je tvořeno standardními pevnými disky, použity mohou být disky magnetooptické a v současnosti i přepisovatelné optické. Disky spolupracuji s pamětí s libovolným přístupem typu RAM, která umožňuje okamžitý přístup a při vyhledávání je trvale přepisována. Jestliže je nalezena oblast střihu, přepis je zastaven a čtení je prováděno ze středu paměti. To umožňuje krokování po jednotlivých snímcích v obou směrech a přesné stanovení místa střihu. Pokud se při krokování, nebo zpomalené reprodukci čtení přiblíží k okraji uložené sekvence, je čtení z disku automaticky obnoveno, a snímání z paměti tak může bez omezení pokračovat. Střih může být odzkoušen a jeho adresa uložena. Střihová soupiska může být potom v požadovaném formátu (CMX, SONY) zaznamenána na
60
pružný disk. Běžnou součástí pracovních stanic je možnost ovládání páskových záznamových strojů.
Obr. 13 Blokové schéma pracovní stanice Signál je do disků zaznamenáván podle požadavků a možností zařízení s plným bitovým tokem, nebo v komprimovaném tvaru. V současnosti může být volba typu komprese na stanici volena a běžné jsou již doporučované typy komprese DV a MPEG 422 s vnitrosnímkovou kompresí. Možný je nyní samozřejmě i přepis, nebo zrychlený přepis již komprimovaného materiálu. K tomuto účelu se užívá jednak rozhraní SDTI („Serial Data Transport Interface“), MTS („MPEG Transport Streams“), nebo přenos ve formě datových souborů přes rozhraní IEEE 1394 („Fire Wire, i-Link“) a nejnověji USB 2. Pracovní stanice se někdy podle určení dělí na stanice se zaměřením na „vertikální“, nebo „horizontální“ aspekt procesu. V prvém případě umožňují mnohovrstevné režijní zpracování („multilayering“), případně i zpracování označované jako „compositing“. V tomto případě se jedná o mnohovrstevné zpracování včetně vícenásobného klíčování, digitálních efektů, dokreslování, retušování, oprav obrazu atd. a představuje nejvyšší třídu zařízení, která pracuje převážně s nekomprimovaným, nebo velmi mírně komprimovaným záznamem. V případě horizontálního aspektu se jedná o spíše klasické střihové zpracování s možností zpracovat větší množství materiálu. Moderní nelineární systémy mohou samozřejmě zpracovávat i signály HDTV na stejné, nebo dokonce vyšší úrovni než standardní televizní signál, a vzhledem k existenci více kvalitativních úrovní HDTV mohou umožnit nejen práci v požadovaném standardu, ale mohou signály podle požadavků konvertovat. Na závěr zbývá poznamenat, že to, co dříve umožňovaly stanice se speciálním a velmi drahým hardwarem, zvládnou i současné dobře vybavené osobní počítače, které, jsou-li opatřeny příslušným programem, umožňují střih s výjimkou náročnějších režijních přechodů, které nejsou realizovány v reálném čase, minimálně na základní úrovni.
61
9.2 „Embedded editing“ - střih na videoserveru Obecný počítačový server je počítačem řízený vícekanálový systém zpřístupňující uložené soubory dat více uživatelům a pracující na lokální síti. Termín videoserver se začal objevovat v první polovině devadesátých let, a oproti počítačovému serveru se jedná o systém pracující s mnohem většími soubory dat, reprezentujících multimediální informace, které jsou uloženy většinou v diskových polích. Soubory dat jsou přenášeny většinou na síti „Ethernet“, nebo „Fibre Channel“, což umožňuje spolehlivý přenos dat velmi vysokou rychlostí. Imperativem pro videoserver je, že multimediální informace musí být zpracovávána kontinuálně, reprodukovaný obraz nebo zvuk nesmí být přerušen. Ačkoli paměťovým médiem nemusí být nutně disky, (vysílací servery běžně pracovaly a pracují s páskovou záznamovou technikou), moderní videoservery diskové paměti používají takřka výhradně. Obecná specifikace videoserveru neexistuje a jednotlivé typy se liší již zaměřením ( tj. zda se jedná o server odbavovací, produkční, archivní, nebo servery pro televizní žurnalistiku), vnitřní strukturou i typem sítě, na které pracují. Stejně tak není specifikován typ komprese a kompresní poměr, i když tato situace se v poslední době unifikuje a užívány jsou převážně mezinárodně doporučované kompresní standardy DV a MPEG 422. Velkou aktivitu z hlediska určité standardizace datových souborů vyvíjí v poslední době EBU i SMPTE, přičemž v úvahu přichází již existující soubor GFX pro odbavování a soubor MXF, který nese střihovou soupisku EDL a další data týkající se střihu. Velikost paměti se pohybuje od stovek GB u serverů velmi malých, pracujících v rámci větších systémů, až po desítky TB pro servery, které mohou zajistit kompletní provoz celého televizního centra. Střihem na videoserveru ve smyslu „embedded editing“ se rozumí stav, kdy na libovolný port serveru s okamžitým a libovolným přístupem je možno připojit pracovní stanici, pracovat s materiálem uloženým v centrální paměti, tj. signál reprodukovat, stříhat, a případně zaznamenat, i když záznam samozřejmě není nutný. Ke stejnému materiálu má tedy přístup kterákoli připojená stanice (aniž se samozřejmě vzájemně ovlivňují). Tento způsob střihu je obzvlášť výhodný v případě serverů pro televizní žurnalistiku, kde je tato technologie nejrozšířenější a přináší zvláště z hlediska rychlosti zcela novou kvalitu. 9.2.1 Disková pole RAID Pro zajištění dostatečné rychlosti datových toků, jejich většího počtu, korekce chyb a zabezpečení proti poruchám jednotlivých disků, kdy selhání jediného z nich by mohlo způsobit kolaps celého systému a nenapravitelnou ztrátu dat, jsou disková pole pevných disků organizována do sestav označovaných podle kategorie akronymem RAID („Redundant Array of Independent (Inexpensive) Discs“) v úrovních 0 – 5. Úroveň 0 Tato úroveň nenabízí žádnou redundanci, a tím žádné zabezpečeni. Zajišťuje pouze rychlost a kapacitu danou větším počtem spolupracujících disků.8 Úroveň 1
8
Diskem je zde míněna disková mechanika.
62
Zdvojuje počet disků a zajišťuje paralelní (zrcadlový) provoz každé dvojice. V případě selhání disku je provoz zálohován. Úroveň 2 Sestava devíti disků, z nichž osm zaznamenává vždy jeden bit bajtu a devátý zapisuje bit paritní, který umožňuje zjistit chybu. Toto uspořádání se prakticky neužívá. Úroveň 3 Sestava n+1 disků, z nichž na daný počet je vždy jeden určen pro záznam paritních bitů. Je vhodný pro menší systémy, kde selhání dvou disků, což by způsobilo ztrátu dat, je nepravděpodobné. Tato úroveň je optimalizována pro velmi velké soubory, a je tedy vhodná pro video. Úroveň 4 Podobná jako úroveň 3, umožňuje však přenos i malých bloků dat. Úroveň 5 Paritní data jsou rozložena na všech discích a některá pole této úrovně mohou být konstruována jako „hot swop“, což znamená, že vadný disk je možno vyměnit za provozu. Řada moderních videoserverů používá kombinaci jednotlivých úrovní. Na příklad pro dosažení požadované rychlosti úroveň 3, nebo 5 pro zajištění ochrany dat.
9.3 Střih filmu Snahy provádět přípravu filmového střihu pomocí pracovní kopie na magnetickém pásku se objevily, jakmile se k pomocným účelům začal používat formát U-matic, tzn. počátkem sedmdesátých let. Běžně se k tomuto účelu užíval záznam časového kódu vloženého do obrazu ve viditelné formě. Jednalo se však spíše o předběžný výběr materiálu a záběrů, které by měly být použity, protože na filmu neexistovala odpovídající informace. Pro přípravu skutečně přesných střihových dat bylo v prvé řadě nutné opatřit film určitým typem strojově čitelného kódu, který by konvenoval s časovým kódem magnetického záznamu, a vyvinout potřebné technologické řetězy. Počátky vývoje na tomto poli lze datovat přibližně do téže doby, jednalo se však víceméně o proprietární řešení. V roce 1975 byla upravena kamera ARRI SR 16 pro záznam kódu IRT/EBU ve formě čtyřbitového čárového kódu BCD, který byl zaznamenáván mezi perforační otvory oboustranně perforovaného filmu. Kód neoznačoval jednoznačně každé filmové políčko, údajně však byl některými německými společnostmi ještě v prvé polovině devadesátých let [4]. Koncem osmdesátých let byla upravena kamera ARRI 16 SR II pro kód ARRI SR II. V tomto případě se jednalo o 112bitový kód, který byl v bitech 15 – 104 kompatibilní s osmdesátibitovým kódem SMPTE. Pro 16mm výrobu byl vyvinut kamerový modul TC 300 pro záznam osmdesátibitového časového kódu. Protože oba zmíněné kódy kolidovaly s formátem Super – 16, bylo vyvinuto příslušenství pro záznam kódu SR III, které zaznamenává časový kód na úzký okraj neperforované strany filmu. Čtecí hlava FIS („Film Ident Sync“) umožňovala čtení jak obou variant, tak i Key – kódu [4]. I když kódy SR II a SR III se používaly již v širší 63
míře, od druhé poloviny devadesátých let jednoznačně převážilo užívání Key - kódu a Aaton kódu. Koncepce Aaton kódu pochází již z roku 1968. Jedná se o 91bitový datový/časový a identifikační kód zaznamenávaný kamerou pomocí matice 7 x 13 světelných bodů. Matice kromě strojově čitelného kódu Aaton umožňuje i vkládání „klasického“ osmdesátibitového kódu a záznam periodicky vkládaných alfanumerických, tedy čitelných znaků. Tak například časové údaje mohou být zaznamenávány s periodou 1 sekundy a s periodou 3 sekundy jsou vkládána identifikační čísla. Střídavé vkládání digitálních a čitelných alfanumerických informací má samozřejmě řadu výhod a v případě, že je digitální informace z nějakého důvodu nečitelná, alfanumerické znaky čitelné být mohou. Aaton kód nekoliduje s Key – kódem ani čitelnými stopovými čísly a je použitelný pro jak pro oba 16mm, tak i 35milimetrový formát. V září roku 1998 byla presentována zlepšená verze, označená jako AATONCODE II, která je přesnější a odolnější vůči případným chybám nastavení. Firma Aaton vyvinula rovněž rozsáhlé příslušenství pro snímání, převody a redakci dat získaných nejen z Aaton kódu, ale i Key -kódu. Key – kód jsou strojově čitelná stopová (perforační) čísla ve formě čárového kódu, kterými od let 1989/90 vybavuje filmový materiál firma KODAK a která převzali i další výrobci. Umísťována jsou periodicky mezi perforací a okrajem filmu. Kromě čárového kódu jsou exponována, nebo tištěna i v čitelné formě, nesou všechny důležité informace týkající se filmu umožňující identifikaci jednotlivých filmových políček a pomocí referenčních značek („zero frame reference mark“) vytvářející jednoznačnou vazbu mezi filmem a jeho okódovaným přepisem na magnetický záznam. Střih filmu pomocí nelineárních systémů se začal široce užívat v průběhu devadesátých let, kdy pro tyto systémy byly vybaveny příslušnými softwary a realizovány kompletní technologické řetězce spojující filmová data s časovým kódem magnetických záznamů. Tak například počítačový systém „Keylink“ firmy Aaton spolupracující s filmovým snímačem čte oba uvedené kódy, generuje odpovídající kód VITC. Umožňuje vkládání těchto kódů do obrazu ve viditelné formě a zajišťuje synchronní závěs zvukových strojů (v současnosti je nejběžněji užíván digitální magnetofon R – DAT). Protože Aaton kód je běžně užíván pro kódování zvukových nosičů, je někdy označován jako zvukový kód. Pokud na filmu není Aaton kód zaznamenán, používá se pro zvuk tzv. elektronická klapka. Jedná se vlastně o displej se stojícím časovým kódem, který je snímán kamerou a dálkově spouští generátor kódující magnetofon snímající zvuk. Dále tento systém vytváří potřebnou databázi a generuje filmové soupisky v různých formátech – běžný je formát SMPTE FLEX na disketě a ve formě tištěného protokolu. Navíc umožňuje vložit do vertikálního intervalu televizního obrazu tzv. třířádkový kód, který byl navržen společně s firmami Avid, Evertz a Lightworks. Tento kód může v jednom řádku nést klasický kód VITC, v druhém Keykód a v třetím Aaton kód. Vložen může být na místo standardně užívaného VITC, například do řádek 19 – 21, nebo do jiných zvolených řádek vertikálního intervalu. Takto okódovaný obraz je obvykle zaznamenán na pásek a odtud je přepisován se všemi daty do nelineárních střihových systémů. Výsledkem je pak střihová soupiska EDL pro magnetický záznam a filmová střihová soupiska pro příslušně vybavenou filmovou laboratoř a filmové střižny. Zde je často používán střihový software „Excalibur“ firmy Filmlab System s obdobnými možnostmi jako Keylink. Stávající technologické řetězce umožňují řadu variabilních produkčních
64
postupů, kdy výsledkem může být jak magnetický pás, tak film, případně v různých verzích. Skutečnost, že klasický film pracoval se dvaceti čtyřmi obrázky za vteřinu, nevytváří v Evropě obzvláštní problém. Běžná, zvláště v televizních studiích, je výroba filmu s dvaceti pěti políčky za sekundu, takže plně konvenuje s evropským televizním standardem. Pokud je vyráběn film s klasickou rychlostí, je do televizního signálu převáděn zrychlený o cca 4 % a nelineární střihové systémy tuto skutečnost respektují. Respektována a zajištěna musí být však rychlost výsledného zvuku při převodu na film. Komplikovanější je situace v zemích, kde je užíván televizní standard NTSC s 30 (respektive 29,7) obrázky za sekundu. Film se do tohoto televizního standardu převádí tzv. strhem 3:2. To znamená, že jedno filmové pole je snímáno třikrát, další dvakrát. Označíme-li jednotlivá filmová políčka A, B, C, D, pak jsou jednotlivé televizní půlsnímky snímány v následujícím sledu: A1 A 2 A1B2 B1C2 C1C2 D1D2. Jak je patrné, ze čtyř filmových polí je vytvořeno pět televizních snímků, při dodržení jmenovité rychlosti filmu, a vzniká tak tzv. pětisnímková sekvence, při jejímž dodržení lze bez problémů signál stříhat. Pokud je nutný střih uvnitř sekvence, musí být její struktura respektována, což nelineární systémy vesměs pomocí příslušných algoritmů zajišťují. Progresivní a stále více užívanou metodou je užití televizní soustavy se 24 snímky, která je v soustavě ATSC9 standardizována v různých rozlišovacích úrovních. Ve své nejvyšší kvalitě označované jako 1920 x 1080 / 24p (tj. 1920 prvků na aktivní řádek, 1080 aktivních řádků a 24 progresivně – neprokládaně snímaných snímků za sekundu) je tato soustava určena jednak jako soustava produkční, a soustava pro tzv. elektronický film, kdy je celý výrobní řetěz televizní, respektive počítačový a na film je převáděno až výsledné zpracování.
9
Advanced Television System Comittee – koordinační a standardizační komise založená roku 1982 ve Spojených
státech.
65
10. Přehled záznamových formátů. Magnetický pásek, který byl téměř půl století základním nosným mediem pro výrobu a distribuci televizních pořadů, je v současné době za svým zenitem. Přes své nesporné přednosti, co se týče kapacity a cenové dostupnosti, má z hlediska současných požadavků jeden základní, a možno říci fatální, nedostatek. Jedná se o medium lineární, tj. s velmi zdlouhavým přístupem. I když se podobná prohlášení objevovala již v prvé polovině devadesátých let, je v současné době toto konstatování neoddiskutovatelnou skutečností. To samozřejmě neznamená, že pásek v dohledné době z televizních středisek zmizí, jejich stávající vybavení a velmi rozsáhlé archivy to prostě nedovolí; těžko však lze předpokládat, že by se objevil nový televizní záznamový formát, zvláště pro standardní televizi. Jinou otázkou jsou samozřejmě stávající záznamové formáty pro HDTV, kde není vyloučeno užití kvalitnějších kompresních systémů a dále zařízení zaznamenávající televizní signál již skutečně pouze jako data a neumožňující střih buď vůbec, nebo jen v omezené míře. Logicky vzato by se takový záznam mohl stát vhodným médiem pro zálohování archivů, případně pro primární záznam HDTV a elektronický film. Skutečný vývoj na tomto poli lze však velmi těžko předjímat. Za této situace je podrobnější charakteristika a základní parametry nejznámějších záznamových formátů, které se celosvětově v televizních provozech užívaly a užívají, jakýmsi ohlédnutím za zcela neopominutelnou etapou vývoje televizní techniky. Kursivou jsou popsány formáty, které se v praxi neprosadily nebo zanikly.
10.1 Analogové kompozitní profesionální záznamové formáty Formát Quadruplex – příčný záznam. První standardizovaný a až do první poloviny osmdesátých let celosvětově užívaný systém zaznamenávající černobílý, nebo kompozitní barevný signál v plné šíři pásma (přímý záznam), užívající pásek na otevřené cívce o šíři dva palce. Bubínek se čtyřmi hlavami měl pro evropský televizní systém 25010 otáček za sekundu, a jeden půlsnímek byl tak segmentován do 20 příčných stop, záznamová rychlost byla 41,27 m/s, standardní posuvná rychlost pásku 397 mm/s. V podélných stopách byl zaznamenán jeden kvalitní zvukový kanál a jeden kanál pomocný tzv.„CUE“ určený pro režijní pokyny a později užívaný pro záznam časového kódu. Hlavními výrobci byly firmy AMPEX a RCA, na licenčním základě i další firmy. Běžně byly užívány studiové stacionární stroje, ve spektru zařízení však nechyběla ani přenosná verze a multikazetové systémy určené především pro vysílání reklam. V druhé polovině sedmdesátých let firma AMPEX uvedla na trh stroje s možností záznamu v SHBP, tj. s vyššími modulačními kmitočty a pomocným kmitočtem pilotním, který umožňoval značně kvalitnější vyrovnání reprodukovaného signálu. Hlavní zvuková stopa byla rozdělena, takže bylo možno zaznamenat dva programové zvukové kanály. Tento systém se však již příliš nerozšířil. V současné
10
Číselné údaje, není li uvedeno jinak, platí pro evropský televizní standard.
66
době se jedná o formát historický, který by se snad mohl užívat pouze k dokončení přepisu archivních materiálů. Formát IVC 9000 Tento formát je zde uveden pouze jako příklad slepé uličky vývoje. Vznikl již na samém začátku sedmdesátých let jako pološikmý segmentovaný záznam (rozložením stop podobný jako dále uvedený formát B) na dvoupalcovém pásku. Jednalo o formát, který měl v kategorii „přímý záznam“ historicky vůbec nejlepší signálové parametry, dva velmi kvalitní zvuky, pomocnou zvukovou stopu a datovou stopu. Vynikající byla i konstrukce strojů, pořizovací i provozní náklady; prakticky se však vůbec neuplatnil. Důvodem bylo zřejmě tehdejší vybavení televizních studií kvadruplexní technikou a skutečnost, že se jednalo o dvoupalcový formát, se všemi důsledky z toho vyplývajícími. Formát EBU – B Jednopalcový, pološikmý, („segmented helical“) segmentovaný záznamový standard vyvinutý firmou Bosch/BTS, který koncem sedmdesátých let, zvláště v německy mluvících zemích a Skandinávii začal nahrazovat příčný záznam. Buben s dvěma hlavami byl opásán v úhlu cca 180°, měl 150 ot/s, záznamová rychlost byla 24 m/s a posuv pásku 243 mm/s. V podélných stopách mohly být zaznamenány až tři kvalitní zvukové kanály; třetí zvuková stopa byla běžně užívána pro časový kód. Způsob opásání a nižší segmentace zjednodušovaly vyrovnání reprodukovaného signálu, počet generací s přijatelnou kvalitou byl minimálně o jednu generaci vyšší. Téměř čtvrtinová hmotnost cívek s páskem umožnila konstrukci skutečně kvalitního přenosného stroje s hmotností kolem 20 kg (později cca 10 kg) což zjednodušilo veškerá exteriérová natáčení. Mimo cívkové stroje byly vyráběny i multikazetové systémy. Formát B byl užíván do začátku devadesátých let. Formát EBU – C Jednopalcový nesegmentovaný přímý záznam s opásáním ve tvaru písmene Ω, který v prvé polovině osmdesátých let celosvětově nahradil kvadruplex. Vyvinut byl na základě formátu A firmy AMPEX a D firmy SONY jako formát společný. Konfigurace ve vztahu hlava versus pásek a možnost použít dynamicky vychylované reprodukční hlavy umožnily monitorovat signál při záznamu a reprodukci obrazového signálu v plné kvalitě při nestandardním posuvu pásku, tzn. zpomalenou, nebo zrychlenou reprodukci v rozsahu mínus jedna až plus trojnásobku rychlosti nominální. Formát měl tři varianty, které byly plně kompatibilní. V jedné z nich mohly být zaznamenány až čtyři zvukové kanály. Záznamová rychlost byla 21,39 m/s, posuvná rychlost pásku 239,8 mm. Hustota záznamu tedy byla obdobná jako u formátu B. Vyráběny byly studiové a přenosné stroje v širokém spektru, typ opásání však neumožnil kazetovou variantu. Hlavními výrobci byly firmy AMPEX a SONY, později byl vyráběn i firmami dalšími. Tento formát začal být v průběhu devadesátých let vytlačován složkovými záznamy. V současnosti se již prakticky neužívá pro výrobu, někde se však ještě užívá pro odbavování. V široké míře je využíván jako výchozí formát pro výrobu programových kazet VHS. Formát U – matic Záznamový standard vyvinutý společně firmami SONY a JVC, představený v roce 1971, užívající pásek o šíři 3/4 palce uložený v kazetě. Pásek je obtočen v úhlu 180° kolem bubínku s dvěma kombinovanými hlavami, z nichž každá zaznamenává jeden televizní půlsnímek, záznamová rychlost je 8,54 m/s, posuvná 67
9,5 cm/s. Barevný kompozitní signál je zaznamenáván metodou „Color under“; chrominanční signál je převeden do pásma 685 ± 500 kHz. Rozlišovací schopnost je udávána kolem 200 řádek. Zvukové signály v pásmu cca 50 – 12 000 Hz jsou zaznamenány do dvou podélných stop. Standardní kapacita kazety byla jedna hodina. Pro svoji spolehlivost, přijatelnou kvalitu obrazu, a hlavně relativně malé rozměry začal být v druhé polovině sedmdesátých let v USA užíván pro reportáže a elektronickou žurnalistiku. Pro evropský televizní systém však byla kvalita obrazu nedostatečná a byla vyvinuta zlepšená verze U–matic H („High Band“). Zlepšení kvality bylo dosaženo rozšířením obrazových stop cca o 30 % a zvýšením charakteristických kmitočtů frekvenčně modulovaného signálu o cca 1 MHz, což umožnilo přesunout barvonosný kmitočet na 924 kHz a rozšířit jeho pásmo. Navíc bylo možno zaznamenat časový kód v další podélné stopě. Zatímco původní formát byl v Evropě užíván pouze pro pomocné účely, verze H byla velmi úspěšně užívána pro žurnalistiku, komerci a upoutávky. Navíc vznikla další modifikace označená jako SP („Superior Performance“) užívající zlepšený typ pásku, což umožnilo další zvýšení kmitočtů FM signálu, a tím zkvalitnění reprodukovaného signálu. Protože záznamová rychlost a posuv pásku zůstaly ve všech případech zachovány, byly jednotlivé formáty na všech strojích s omezenou kvalitou černobíle reprodukovatelné. Formát U – matic byl v profesionální televizi běžně užíván až do devadesátých let a byl, stejně jako formáty B a C, vytlačen složkovými záznamy, jmenovitě formátem Betacam. Systém VCR – Philips Jednalo se o dvouhlavý nesegmentovaný záznamový formát s obrazovou transformací „Color under“ s heterodynní stabilizací chrominančního signálu pro standard PAL., presentovaný v roce 1972. Pásek o šíři půl palce byl uložen v kazetě, cívky však byly uloženy nad sebou. Dosahoval prakticky shodné kvality obrazu jako systém U-matic. Jeho hlavní nevýhodou byla nepříliš šťastná konstrukce kazety, která obsahovala vodící kladky pásku a prává tvořila zároveň vstupní vodítko, což bylo velmi náročné na přesnost. Odtud pramenily potíže se správným sledováním stop a kompatibilitou. V průběhu sedmdesátých let byl několikrát modifikován a s nástupem formátů pro domácí použití zanikl.
10.2 Záznamové formáty pro domácí použití Vývoj záznamových formátů tohoto typu umožnil prudký vývoj v oblasti elektroniky a záznamové techniky v druhé polovině sedmdesátých let. Všechny typy užívaly pásek uložený v kazetě, obrazový systém „Color under“a nesegmentovaný záznam bez ochranného pásma mezi stopami, čímž se zvýšila záznamová kapacita. K zamezení přeslechu mezi jednotlivými stopami byl užit azimutový záznam a v případě záznamu kompozitních signálů PAL a NTSC speciální protipřeslechové techniky. Použit byl pásek o šíři 1/2 palce, u pozdějších formátů firmy SONY pouze 8 mm. Vzhledem k rozměrům kazet bylo u všech typů možné realizovat kameru spojenou se záznamem – kamkordér. Formáty označené později jako Betamax a VHS byly původně vyvíjeny japonskými firmami SONY a Mathushita jako projekt společný. Systém Betamax
68
První standardizovaný záznam této kategorie prezentovaný firmou SONY. Záznamový formát byl realizován na kazetě s půlpalcovým páskem. Charakteristický kmitočet FM signálu pro temeno synchronizačního impulsu 3,8 MHz, pro úroveň bílé 5,2 MHz, chrominanční signál konvertován na cca 688 kHz. Rozlišovací schopnost pro jasový signál dosahovala až 250 řádek. Posuvná rychlost pásku 18,7 mm/s umožňovala ve srovnání s konkurenčním systémem VHS pro danou délku pásku větší kapacitu záznamu. Při prakticky shodných, nebo i lepších technických parametrech soutěžil tento formát zpočátku úspěšně s formátem VHS; vzhledem k neobratné licenční strategii však byl z trhu vytlačen a v roce 1987 firma SONY zastavila jeho výrobu. Systém VHS Vyvinut firmami koncernu Matsushita a uveden na trh v roce 1978. Stejně jako v předchozím případě se jedná záznam používající kazetu s půlpalcovým páskem, s velmi obdobnými technickými parametry. Záznamová rychlost je 4,85 m/s, posuv pásku 23,39 mm/s, kmitočet odpovídající temeni synchronizačního impulsu 3,8 Mhz, bílé 4,8MHz. Zvuk byl nahráván do podélné stopy, která byla později rozdělena, a umožnila tak záznam dvou zvukových kanálů. Vzhledem k relativně slušné kvalitě (rozlišovací schopnost až 250 řádek) nedávala malá posuvná rychlost pásku možnost zaznamenat skutečně kvalitní zvuk. Proto byl na trh uveden systém Hi-Fi, kdy je frekvenčně modulovaný stereofonní zvuk nahráván zvláštními rotačními hlavami do šikmých stop „pod“ obrazový signál. Kvalita reprodukovaného obrazu se průběžně zvyšovala, objevily se stroje s označením HQ – „High Quality“ a režimy s poloviční a později i třetinovou rychlostí posuvu pásku (samozřejmě s odpovídajícím poklesem kvality). Všechny verze však byly podle vybavení strojů navzájem kompatibilní. Systém VHS se stal dík masové produkci, a tím dostupné ceně nejrozšířenějším konzumním systémem, který je stále živý a stává se nejdéle provozovaným záznamovým formátem vůbec. Systém S – VHS Jedná se o zlepšenou verzi formátu VHS užívající kvalitnější pásek, který umožnil zvýšení charakteristických kmitočtů jasového signálu až na 5,4 MHz pro temeno synchronizačního impulsu a 7,0 MHz pro bílou. To umožnilo dosáhnout rozlišovací schopnosti větší než 400 řádek. Kmitočet konvertovaného barvonosného signálu se naproti tomu nezměnil, stejně jako záznamová rychlost a posuv pásku. Uvedené rozlišovací schopnosti bylo možno dosáhnout zvláště v případě, že zaznamenávaný signál byl přiveden jako tzv. S-video, (někdy označováno jako Y/C), kdy jasový a chrominanční signál byl přiváděn odděleně. Tento typ vstupu a výstupu se stal v dané kategorii zařízení standardem a začal být používán obecně. Stejně tak je pro tento formát standardem stereofonní podélný a frekvenčně modulovaný zvuk. Stroje S – VHS jsou s předchozím typem plně kompatibilní, rozlišení formátů je prováděno automaticky podle typu založeného pásku. Počátkem devadesátých let bylo pro tento záznamový standard postaveno celé spektrum profesionálního zařízení, takže se začal užívat i v profesionální sféře. Systém VCC – Video 2000 Philips Ze skupiny „domácího videa“ s půlpalcovou kazetou byl tento systém technicky nejpokročilejší. Šířka stopy byla snížena až na 22,6 mikrometru, takže pro správné sledování šikmých stop bylo třeba použít pilotní signály a vychylované magnetické hlavy. Pásek byl navíc kolem bubínku obtočen tak, že k záznamu docházelo pouze na polovině jeho šířky. Kazeta pak mohla být otočena a signál 69
zaznamenán na druhé polovině. Kapacita kazety byla tak až 8 hodin. Tento systém pracoval na mezi tehdejších technických možností a první typy zařízení trpěly četnými problémy. Když tyto nedostatky byly později vyřešeny, byl trh již obsazen, systém se neprosadil a zanikl. Systém Video 8 Vyvíjen byl jako společný projekt japonských a některých amerických firem, hlavně jako alternativa k půlpalcovým domácím formátům. Hlavním protagonistou byla později firma SONY, standardizován byl v první polovině osmdesátých let. Používá kazetu s páskem jak s kovovými částicemi - typu MP (Metal Partica), tak i pásek napařovaný – ME (Metal Evaporated) s šířkou pásku 8 mm. Charakteristický FM kmitočet je pro temeno synchronizačního impulsu 4,2 MHz pro bílou 5,2 MHz. Konvertovaný chrominanční signál je na kmitočtu cca 732 kHz. Pod obrazový signál je zaznamenán FM stereofonní signál. Záznamová rychlost je 3,12 m/s, posuvná 20,05 mm/s. Pásek je kolem bubínku obtočen v úhlu 221°, takže po dokončení záznamu televizního půlsnímku mohou být zaznamenány dva digitální zvukové kanály a signály pilotní zajišťující správné sledování stop, takže není potřebná podélná řídicí stopa. Na horní a spodní okraj pásku mohly být zaznamenány dvě podélné stopy pro záznam pomocného zvuku a dat. Výrazně se rozšířila až následující verse tohoto formátu označená Video 8 – Hi. Systém Video 8 – Hi Tento formát lze označit jako „High band“ verzi formátu předchozího. To znamená, že charakteristické kmitočty FM jasového signálu byly posunuty na kmitočet 5,7 MHz pro temeno synchronizačního impulsu a 7,7 MHz pro bílou. Posunutí kmitočtově modulovaného signálu a téměř dvojnásobný frekvenční zdvih v porovnání s Video 8 zajistily podstatně vyšší rozlišovací schopnost jasového signálu a snížily přeslech se signálem barvonosným. Ostatní parametry zůstaly shodné s formátem předchozím, nejsou však zaznamenávány žádné podélné stopy a časový kód může být zaznamenán do šikmých stop. Zvukové signály jsou zaznamenány opět jako FM pod obrazovým signálem a v digitálních sektorech šikmých stop. Dík velmi dobré kvalitě obrazu i zvuku se formát stal velmi populárním a široce jsou užívány zvláště kamkordéry, z nichž je signál často přepisován na některý z formátů VHS.
10.3 Analogové složkové profesionální formáty Elektronická žurnalistika, která se na rozhraní sedmdesátých a osmdesátých let prudce rozvíjela, postrádala reportážní kameru spojenou s magnetickým záznamem - kamkordér. Kvalita zařízení pro „domácí video“, jejichž kazety výrobu kamkordérů umožňovaly, zůstávala nedostatečná a zvýšení záznamové rychlosti, které by umožnilo přímý záznam kompozitních signálů, by přineslo těžko zvládnutelné technické komplikace. Řešení tohoto problému bylo nalezeno v záznamu nezakódovaného barevného signálu a vyšlo ze skutečnosti, že na kameře jsou barevné rozdílové složky k dispozici, a signál tedy nebude jejich oddělením ze signálu kompozitního degradován. Nabízela se tak možnost použít dvojice paralelních hlav, z nichž jedna bude zaznamenávat kmitočtově omezený jasový signál a druhá chrominanční složky. Skutečnost, že barevné složky mohou být zaznamenány s podstatně nižším pásmem, ve srovnání s jasovým signálem téměř 70
čtvrtinovým, umožňovala jejich multiplex, takže obě mohly být zaznamenány společnou hlavou. Takřka současně se objevily tři systémy. Systém Lineplex S velmi originálním řešením, s obchodním názvem „Quartercam“ nebo „Lineplex“ , přišla firma Bosch Fernseh. Použila čtvrtpalcový pásek v kazetě CVC a jasový signál a barevné složky byly časově multiplexovány a v daném pořadí zaznamenávány do dvojice paralelních stop reprezentujících jeden půlsnímek. Jasový signál byl expandován na jeden a půlnásobek doby trvání televizního řádku a barevné složky komprimovány na jednu polovinu, čímž se dosáhlo prakticky shodného spektra. Tento formát byl standardizován jako formát „K“, v praxi se však neuplatnil a zanikl. Systém Chromatrack Systém označovaný jako „Chromatrack“, „RECAM“ nebo M formát byl vyvinut společně firmami RCA a Panasonic. Použity byly kazeta a pásek pro systém VHS, jednalo se o záznam nesegmentovaný, jasový signál se zaznamenával jednou hlavou a paralelní hlava zaznamenávala frekvenčně modulovaný kmitočtový multiplex složkových signálů „I“ a „Q“. Tento formát měl určitý úspěch v USA, byl podporován i firmou AMPEX pod názvem „Hawk Eye“, avšak poté, co zanikla elektronická divize RCA, rychle skončil. Další vývoj převzal koncern Matsushita, respektive firma Panasonic. Systém Betacam Jednoznačným vítězem této „války formátů“ se stal systém Betacam, standardizovaný jako formát „L“. Použita byla kazeta a pásek pro formát Betamax (i když v praxi s jednalo o pásek kvalitnější). Nesegmentovaný záznam byl opět prováděn dvojicí paralelních hlav, přičemž jedna zaznamenávala jasový signál Y a druhá složky R-Y a B-Y, které byly časově komprimovány a multiplexovány. Pro časový multiplex se původně užívaly analogové posuvné registry CCD; demultiplex a časové vyrovnání u studiových strojů se provádělo digitálně. Protože tento formát vstupoval do kompozitního prostředí, bylo zařízení vybaveno vstupním dekodérem a výstupním kodérem pro kompozitní barevné signály. Záznamová rychlost byla 5,75 m/s, posuvná 101,51 mm. Frekvenční modulace pro jasový signál měla charakteristické kmitočty 4,4 MHz pro temeno synchronizačního impulsu a 6,4 MHz pro bílou. Barevné složkové signály měly frekvenční zdvih od 4 MHz do 5,7 MHz, přičemž vyšším amplitudám, tj sytějším barvám je přiřazován nižší kmitočet, čímž se logicky zlepšoval pro syté barvy poměr signál šum. Dva zvukové kanály byly zaznamenávány do dvou podélných stop, časový kód do podélné stopy další. I když u jasového signálu bylo pásmo reprodukovaného signálu oproti evropskému standardu o cca 1 MHz nižší, kvalita signálu tohoto systému byla natolik dobrá, že kromě žurnalistiky se začal užívat i pro exteriérové dotáčky. Postupně se změnila i technologická koncepce, která předpokládala další zpracování reprodukovaného signálu v kompozitním tvaru. Pro systém byla vytvořena velká kazeta s kapacitou 90 minut, na trhu se objevily složkové režijní jednotky a začala se ve velké míře stavět i složková studia. Systém M II V roce 1986 prezentovala firma Panasonic úplně nový záznamový standard M II s kazetou VHS a novou velkou kazetou. Použit byl však pásek typu MP, který dovolil zvýšit charakteristické kmitočty FM signálu, takže již umožnil zaznamenat 71
jasový signál i chrominanční signály v plné šíři pásma. Záznamová rychlost byla 5,9 m/s, posuvná 66,295 mm. Kromě podélného záznamu dvou zvukových kanálů mohly být zaznamenány dva zvukové FM kanály a některá zařízení umožňovala místo jedné podélné zvukové stopy i záznam zvuku v digitální formě. Rozdílové složkové signály byly komprimovány a časově multiplexovány, podobně jako u systému Betacam. Systém používal malou a velkou kazetu, z nichž obě byly pro danou kapacitu záznamu menší než kazety konkurenčního formátu Betacam. Technické parametry byly velmi dobré, plně srovnatelné s formátem Betacam SP. Systém Betacam SP Ve stejné době firma SONY prezentovala vyšší („Superior Performance - High Band“) verzi toho standardu označenou jako Betacam SP, která užívala pásek s kovovými částicemi - typ MP. Charakteristické FM kmitočty pro jasový signál byly oproti původnímu standardu zvýšeny o 2,4 MHz, chrominanční o 1,6 MHz, což již rovněž umožnilo zaznamenávat signál v plné šíři pásma. Navíc byl tento formát doplněn záznamem dvou velmi kvalitních FM zvukových signálů na kmitočtech 310 kHz a 540 kHz, které jsou kmitočtově multiplexovány s chrominančními signály. Mechanické parametry byly shodné s verzí Betacam a nová zařízení byla konstruována jako dvounormová, plně kompatibilní, s automatickým rozlišením podle typu pásku (přesněji podle kazety), tj. oxidový, nebo MP. Navíc firma uvolnila licenci, takže nová zařízení, úplně shodná s produkcí SONY, vyráběly firmy AMPEX, BTS a Thomson. Výsledkem bylo, že formát Betacam se stal naprosto dominantním (podíl formátu MII byl menší než 10 % a stále se snižuje) a nejúspěšnějším formátem všech dob. Tak zvaná studiová řada strojů BVW byla v průběhu devadesátých let doplněna o lacinější řady s označením PVW a UVW a v současné době se počet provozovaných jednotek blíží půl milionu. I když formát Betacam SP je již nahrazován akvizičními digitálním formáty a původní řada strojů BVW se již nevyrábí, nezdá se, že by jeho popularita klesala. Systém Betacam je téměř jistě posledním představitelem analogového záznamu televizního signálu, který plně využil všech možností, jež mu užitý princip poskytuje, a analogovou etapu záznamu televizního signálu ukončil. Zásadním způsobem ovlivnil vývoj studiové televizní techniky, vytlačil kompozitní záznamovou techniku (ačkoli k tomu nebyl původně určen), v oblasti zpravodajství dokončil přechod na elektronickou žurnalistiku a v oblasti televizní výroby urychlil přechod na složkové a posléze digitální složkové signály.
10.4 Digitální záznamové formáty Záznamový formát D1 Jako první digitální záznamový formát na trhu byl realizován firmou SONY v roce 1986. Jednalo se o složkový digitální záznam s plným bitovým tokem pracujícím podle doporučení ITU-R 601 s kvantováním do osmi bitů. Čtyři zvukové kanály se vzorkováním 48 kHz a kvantováním 16 bitů byly zaznamenávány ve středu pásku mezi sektory obrazovými, jeden půlsnímek byl segmentován do dvanácti (v NTSC do deseti) šikmých stop a jako jediný digitální formát používal mezi segmenty (šikmými stopami) ochranné pásmo. Realizován je na oxidovém pásku o šíři 3/4 palce a užívá tři typy kazet - S, M, L, tj. malou, střední a velkou, s maximální kapacitou 94 minut. Existuje pouze studiové provedení. Protože zařízení bylo velmi drahé a první modely 72
měly ve srovnání s používaným analogovým zařízením omezené některé provozní vlastnosti (např. omezené možnosti reprodukce nestandardními rychlostmi) a v době jeho vzniku existovalo velmi málo složkových studií, příliš se nerozšířil a užíval se u produkčních společností pro grafiku a mnohastupňové režijní zpracování. Stal se však určitým etalonem kvality televizního signálu digitalizovaného podle uvedeného doporučení a nejvyšší kvalita obrazu standardní televize je často označována jako D1. V současné době je užíván také pro výměnu obrazových materiálů produkčních a filmových společností. Záznamový formát D2 Byl vyvinut firmou AMPEX a prezentován společně s firmou SONY v roce 1988. Jednalo se o kompozitní digitální záznam s plným bitovým tokem se vzorkováním 4fsc a kvantováním do osmi bitů, který měl nahradit stávající analogové kompozitní formáty. Čtyři zvukové kanály se vzorkováním 48 kHz a kvantováním do 16 bitů byly zaznamenávány na obou okrajích pásku za sektory obrazovými, jeden půlsnímek byl segmentován do osmi, respektive šesti (NTSC) šikmých stop a nepoužíval již mezi segmenty ochranné pásmo, zabezpečení proti přeslechu dat ze sousedních stop se provádělo změnou azimutu štěrbin magnetických hlav. Realizován byl na obdobné kazetě jako formát D -1, avšak s páskem typu MP. Díky vyšší záznamové hustotě měl oproti formátu D -1 dvojnásobnou kapacitu záznamu a díky výhodnějšímu rozložení stop a možnosti použít vychylovaných hlav byly i provozní vlastnosti již shodné s analogovými stroji. Navíc umožnil nový typ střihu „preread". Zařízení existovalo jak ve studiovém, tak i přenosném provedení. Rozšířil se hlavně ve Spojených státech a Japonsku. Záznamový formát D3 Byl vyvinut firmou Panasonic a prezentován v roce 1991. Jednalo se opět o kompozitní digitální záznam, ten však byl realizován na pásku o šíři půl palce. Z hlediska rozložení stop byl takřka identický s formátem D2, produkční a kanálový kód byl však pokročilejší a zcela odlišný a šířka stopy byla pouze 18 mikrometrů. Používal malou a velkou kazetu s maximální kapacitou až 245 minut. Půlpalcová kazeta umožnila výrobu celého spektra zařízení, tj. studiový stroj, přenosný stroj i kamkordér. Byl užíván k archivaci a stejně jako formát D2 byl určen k náhradě kompozitních analogových strojů, přičemž přinášel širší spektrum zařízení, takřka neomezený počet přepisů a lepší provozní vlastnosti (funkce „preread"). Jeho rozšíření a užívání bylo omezeno hlavně velmi rychlým přechodem na digitální složkové signály. Záznamový standard DCTd Standard „Digital Component Technology“ byl předveden jako prvý ze strojů tak zvané nové generace. Jednalo se o digitální záznam složkových televizních signálů podle doporučení ITU-R BT.601 používající však proprietární redukci bitového toku v poměru cca 2:1 založenou na diskrétní kosinové transformaci, a může být tedy řazen mezi tzv. vizuálně bezeztrátové formáty. Postaven byl na vynikajícím transportu stroje AMPEX pro formát D2, užíval stejnou segmentací a prakticky shodné kazety ve třech velikostech s maximální kapacitou záznamu 187 minut. Z provozního hlediska měl tento transport dosud bezkonkurenční vlastnosti, co se týče rychlosti vyhledáváni a zacházení s páskem. Z tohoto důvodu a z důvodu vynikající robustnosti formátu byl velmi oblíben u řady produkčních společností. Jeho hlavní nevýhodu byla velikost kazety prakticky neumožňující postavit přenosové verze zařízení, dále cena a skutečnost, že u prvních modelů bylo třeba užívat 73
externích rozhraní pro jednotlivé typy vstupních a výstupních televizních signálů. V současné době je vyráběna pouze jeho verze pro záznam dat DST (Digital Storage Technology). Záznamový formát D-5 Jedná se opět o formát „z nové generace“ digitálních formátů a je jediným plně transparentním, a tím z hlediska kvality nejlepším formátem, neužívajícím redukci bitového toku. Jedná se tedy o složkový záznam podle doporučení ITU-R 601 s kvantováním do deseti, nebo volitelně do osmi bitů. Postaven je na transportu stroje D3, užívá stejný typ produkčního a kanálového kódování a dvojnásobný počet rotačních paralelních hlav, a tím dvojnásobnou rychlost posuvu pásku. Segmentace je oproti D3 tedy dvojnásobná, rozložení stop se však změnilo tak, že zvukové sektory byly umístěny do středu pásku, čímž se výrazně zlepšila ochrana proti chybám čtení. Toto schéma je ostatně s výjimkou formátu DV a jeho variant užito u všech dalších digitálních formátů. Používá prakticky shodné kazety jako formát D3, kapacita záznamu je poloviční. Příslušně vybavené stroje jsou s formátem D3 z hlediska reprodukce kompatibilní. Vyráběn je pouze ve studiové verzi, což kromě ceny jistě mělo vliv na jeho relativně malé rozšíření. Široce jsou však užívány varianty HD, tzn. stroje upravené, nebo vyráběné pro záznam televizních signálů s vysokou rozlišovací schopností. V tomto případě je užívána proprietární redukce bitového toku v poměru 1:4 až 1:5. Záznamový formát Digital Betacam Byl představen v roce 1993 a je z „nové generace“ digitálních záznamových strojů jednoznačně nejúspěšnější. Jeho strategie, která vycházela z možnosti jednostranné kompatibility na analogové formáty Betacam, z možnosti výroby celého spektra zařízení - studiový záznamový stroj a přehrávač, přenosný stroj a kamkordér, byla velmi úspěšná. Jedná se o digitální složkový, vizuálně bezeztrátový záznam s proprietární redukcí bitového toku v poměru cca 2:1. Komprese je opět založena na diskrétní kosinové transformaci. (Při srovnání kvality obrazu s formátem DCT byl obecně hodnocen jako nepatrně lepší.) Použit je půlpalcový pásek MP, jeden půlsnímek je segmentován do šesti stop, a přestože průměr bubnu je oproti analogovému stroji větší, může být kompatibilita s analogovým formátem zachována. Přesné sledování segmentů zvukových stop ve středu pásku zajišťují pilotní kmitočty, čímž se značně zvýšila odolnost proti chybám i při opakovaném střihu zvuku mezi jednotlivými kanály. Kazety ve dvou velikostech jsou podobné analogovým, maximální kapacita záznamu studiového stroje činí 124 minut. Velmi dobrý transportní mechanismus je využíván i u dalších záznamových formátů firmy SONY. Podobně jako u formátu D-5 existují i varianty HDCam (označován jako D11) pro záznam HD signálů, opět při použití proprietární redukce bitového toku. Ze současného hlediska je hlavním nedostatkem Digital Betacam nestandardní způsob komprese, nemožnost přepisu komprimovaných dat a chybějící prostor pro záznam metadat.11
11
Metadata jsou doprovodná data nesoucí informace o programu, tj obrazu a zvuku.
74
10.4 Akviziční digitální formáty Jak již bylo zmíněno, byly tyto formáty určeny v prvé řadě pro žurnalistiku a publicistiku, kde nebylo předpokládáno mnohastupňové režijní zpracování, a mohl tedy být užit vyšší stupeň, do určité míry standardizovaného typu komprese. Oproti předchozím mají tyto formáty vstupní a výstupní rozhraní SDTI („Serial Data Transport Interface“) nebo rozhraní IEEE 1394 („Fire Wire, i-Link“), jež přenáší signál ve formě datových souborů. Tato rozhraní přinášejí možnost záznamu a reprodukce komprimovaných signálů, v případech kdy to umožňuje zařízení, i vyšší rychlostí. Padesátimegabitové formáty se však ukázaly jako prakticky vizuálně bezeztrátové, a navíc byly od nich odvozeny i formáty pro záznam komprimovaných signálů HDTV. V současné době je tedy toto označení poněkud sporné, přesto se však dále používá. Formáty DV, DVC PRO - D7 a DVCAM Formát DV byl vyvíjen konsorciem, jehož členy byly v prvé fázi firmy např. Sony, Philips, Thomson, Mathushita, Hitachi, JVC a později na tomto projektu participovalo více než padesát světových výrobců elektroniky. Cílem bylo vyvinout konzumní digitální záznamový formát, který by na zcela nové kvalitativní úrovni nahradil systém VHS. Výsledkem práce je digitální komprimovaný formát používající kazetu s páskem o šíři 6,25 mm s napařovanou magnetickou vrstvou – typ ME. Stávající provedení užívá bubínek o průměru 21,7 mm se dvěma protilehlými hlavami který při 150 ot/s segmentuje jeden snímek do 12 (10 pro NTSC) šikmých stop o šíři 10 mikrometru. Data na stopě jsou rozdělena do čtyř oddělených sektorů. První od spodní hrany pásku je označen jako ITI („Insert Tracking Information“) a zajišťuje sledování stop, protože není použita podélná řídicí stopa. Dalším je sektor se zvukovými daty, následují obrazová data a konečně sektor subkódu, který např. umožňuje záznam časového kódu. Obrazový signál je komprimován cca 1:5 metodou DV se vzorkováním 4:1:1 pro NTSC a 4:2:0 pro Evropu, datový tok je cca 25 Mb/s. (Celkový včetně zabezpečení cca 42 Mb/s.) Zvuk je nekomprimovaný a při vzorkování 32 Mb/s a kvantování do 12 bitů zaznamenává 4 kanály, nebo dva kanály při vzorkování 44,1, nebo 48 kHz a kvantování do 16 bitů. Kvalita a spolehlivost zařízení užívající tento formát způsobily, že je velmi často využíván i profesionální sféře. DVC PRO - D7 je plně profesionální extenzí konzumního formátu DV a jako takový je teprve řazen do kategorie akvizičních formátů. Vyvinut byl firmou Panasonic. Pracuje s kazetou o šířce pásku 6,25 mm. Na rozdíl od konzumního formátu DV však namísto typu pásku ME používá typ MP s technologií označenou akronymem „ATOMM-II“ („Advanced super Thin layer high Output Metal Media“) a vzorkování 4:1:1 místo 4:2:0. Šířka stopy byla rozšířena na 18 mikrometrů, což výrazně zvýšilo jeho „robustnost“. Zaznamenává dva zvukové kanály se vzorkováním 48 kHz a kvantováním do 16 bitů. Na pásek je navíc zaznamenávána řídicí stopa CTL a pomocná stopa CUE. Pro tento formát byly vyrobeny kazety o kapacitě 123 min – typ L a 63 min – typ M. Současná zařízení DVC PRO jsou však s formátem DV a jeho další profesionální verzí DVCAM z hlediska reprodukce většinou plně kompatibilní; minikazeta DV je reprodukována pomocí adaptoru. Obrazová kvalita formátu DVC PRO plně dostačuje v žurnalistice, pro vyšší a mnohastupňové režijní zpracování však dostatečná není.
75
Původní formát s bitovým tokem 25 Mb/s byl dále rozšířen o variantu DVC PRO 50, která má dvojnásobný bitový tok, vzorkování 4:2:2 a čtyři zvukové kanály. Použitý typ komprese je shodný s formátem Digital-S. Formát DVC PRO disponuje v současné době bohatým, a hlavně úplným sortimentem vyráběných a nabízených zařízení: od několika typů kamkordérů (i s formátem obrazu 16:9), přes studiové stroje a přehrávače a hybridní stroje s integrovaným záznamem na pevný disk, či stroje se zrychleným přepisem, až po stolní a laptop editory a videoserver. Výhodou tohoto formátu je velmi malá kazeta, a tím i transportní mechanismus a již zmíněná návaznost tohoto formátu na spotřební výrobky formátu DV, které mohou vhodně doplnit sortiment kamer o nejnižší modely třídy „handycam“. Velmi důležitá je i návaznost na vyšší záznamový formát DVC PRO 50, jenž poskytuje kvalitu záznamu srovnatelnou s formátem Digital Betacam. Poprvé tak byl vytvořen záznamový standard, kde studiové zařízení vysoké třídy může být jednosměrně kompatibilní se zařízením spotřebním. Pro záznam signálů s vysokou rozlišovací schopností je vyráběna varianta DVC PRO 100 nebo DVC PRO HD označena D12 komprimující bitové toky HDTV signálů na 100 Mb/s. Varianta DVCAM, vyráběná firmou SONY, původně řazená do kategorie „Professional“ byla později přesunuta do kategorie „Broadcast". Od formátu DV se liší pouze šířkou stopy, která je 15 mikrometrů, a tím i větší robustností a širokým rozsahem velmi kvalitního, plně profesionálního zařízení, jež je kompatibilní s formátem DV a některé typy i s formátem DVC PRO. Z hlediska počtu užívaného zařízení je tento standard v kategorii s bitovým tokem 25 Mb/s nejrozšířenější. Formát D8 - Betacam SX Byl koncipován jako součást tzv. úplného řešení zahrnujícího akvizici, zpracování, přenos a odbavení, s vysokou robustností a s možností reprodukovat formáty Betacam a Betacam SP. Mechanické parametry transportního systému záznamových strojů ukazují, že jsou odvozeny od systému Digital Betacam. Komprimační mechanismus je sice obdobný jako u standardu MPEG-2 422P@ML, avšak transportní tok je formátován odlišně, aby bylo dosaženo jednodušší implementace funkcí JOG (krokování) a SHUTTLE (řízené převíjení s pozorovatelným obrazem). Převod do standardního formátu MPEG-2 je však relativně jednoduchý. Užívány mohou být klasické kazety Betacam SP, výrobce udává, že vyhoví i laciná řada UVW; vyráběn je však i nový typ s označením SX. Kapacita oproti analogovému formátu je dvojnásobná. Čtyři zvukové kanály jsou nekomprimované se vzorkováním a kvantováním 48 kHz a 16 bitů. Na trhu v současné době existuje kompletní sortiment zařízení, obdobně jako u formátu DVC PRO. Protože byla užita komprese typu MPEG-2 s obrázky I, B, tzn. GOP = 2, byly první studiové stroje formátu Betacam SX konstruovány jako hybridní systém s pevným diskem a s omezenými možnostmi přímého střihu na pásek. V současné době jsou však k disposici i „klasické“ studiové a přenosné stroje bez omezení střihových možností. Formát D9 – Digital S Jedná se o plně profesionální formát kategorie „Broadcast“ vyvinutý firmou JVC pracující s kompresí DV s bitovým tokem 50 Mb/s. Užívá vzorkovací schéma 4:2:2 a zaznamenává dva, respektive čtyři zvukové kanály. Z tohoto hlediska je tedy kompatibilní s DVC PRO 50. Využívá velmi kvalitní transportní systém a servosystém profesionální řady strojů JVC formátu S-VHS. Pracuje tedy s páskem širokým půl palce a jeden půlsnímek je segmentován do šesti stop. Zobrazovací jednotka 76
„scanner“ je oproti klasické jednotce VHS odlišná a využívá střední disk s rotujícími hlavami. Průměr se však shoduje. Cílem výrobce bylo uvést na trh cenově dostupný digitální formát s nízkou redukcí dat, cca 1:3,3. Původně byl zřejmě zamýšlen jako digitální náhrada pro menší televizní stanice, které používaly pro žurnalistiku formát S - VHS. Některé stroje proto mohou být vybaveny možností přehrávat analogové záznamy formátu VHS/Super VHS. Systém užívá pásek typu MP, kazeta zhruba odpovídá systému W-VHS, avšak má lepší provedení. Kapacita záznamu byla původně 105 min, v současné době činí až 120 minut. Určitou nevýhodou tohoto formátu jako akvizičního se stává opět velikost kazety. Z hlediska kvality obrazu však může být řazen mezi vizuálně bezeztrátové. Podobně jako u formátu DVC PRO byl od řady strojů pro tento formát firmou JVC odvozen stroj zaznamenávající 100 Mb/s určený pro komprimovaný záznam HDTV. Formát D10 Tento formát výrobcem označovaný jako MPEG IMX, používá pásek s šířkou půl palce, využívá opět transportního mechanizmu odvozeného od strojů Digital Betacam. Televizní snímek je segmentován do osmi stop s šířkou 21,7 mikrometru a na pásek je zaznamenávána podélná stopa s časovým kódem a stopa řídicí. Signál je komprimován standardem MPEG 2 se vzorkováním 4:2.2 a se skupinou obrázků GOP 1, tedy pouze s obrázky typu „I“, datový tok je cca 50 Mb/s. Způsob komprese odstraňuje problémy se střihem a více než dvojnásobný bitový tok oproti systému Betacam SX výrazně zvyšuje obrazovou kvalitu, která se blíží kvalitě formátu Digital Betacam, (viz obr. 10), tedy vizuálně bezeztrátové. Nekomprimované zvukové signály jsou zaznamenány do středu pásku a existuje možnost volby mezi záznamem osmi kanálů s kvantováním do 16 bitů, nebo čtyř s kvantováním do dvaceti čtyř bitů. Formát používá velkou a malou kazetu, přičemž maximální kapacita záznamu velké kazety při záznamu evropského standardu je 220 minut. Pozoruhodné je, že pro tento standard byly postaveny studiové stroje, které jsou plně kompatibilní se všemi formáty Betacam analogovými i digitálními, tzn. s formáty Betacam standard, SP, Digital a SX. Na závěr tohoto přehledu a pro úplnost lze ještě krátce zmínit formát D-6 a formáty Digital 8 a Digital VHS, i když samozřejmě do kategorie akvizičních formátů nespadají.V případě formátu D6 se jedná o zařízení vyvinuté firmou Toshiba a BTS určené pro záznam signálů s vysokou rozlišovací schopností, které jako jediné nepoužívá komprimace a zaznamenává celkový bitový tok cca 1200 Mb/s. Užívá velkou – L, střední M a malou S kazetu typu D-2 a pásek o šíři tři čtvrtiny palce MP. Na bubnu je proti sobě umístěno vždy osm paralelních hlav, z nichž každá zaznamenává 150 Mb/s., buben má 150 ot/s. Vzorkovací kmitočet pro signál Y je 74,25 MHz, pro barevné složky poloviční. Zaznamenáno může být až 12 zvukových kanálů s kvantováním do 20, nebo 24 bitů. Zařízení je vyráběno jako multistandardní. Formát Digital 8 je často chybně označován jako D-8. Jedná se o digitální záznam s kompresí DV využívající transportní systém analogového formátu SONY Hi-8. Otáčky bubínku jsou zvýšeny na 75 ot/s, což při jeho průměru zajišťuje záznamovou rychlost prakticky shodnou s formátem DV a na pásku o šíři 8 mm jsou vlastně dva segmenty formátu DV nad sebou. Vyráběná zařízení jsou kompatibilní s formáty Video 8 a Hi-8. Z hlediska kvality zařízení zůstává v konzumní oblasti. V případě formátu D-VHS vyvinutého firmou JVC se nejedná již o televizní záznam v pravém slova smyslu, ale o záznam datový, určený především pro záznam signálů MPEG ze satelitních, nebo terestrických přijímačů. V současné době jsou
77
však stroje konstruovány s řadou běžných signálových rozhraní. Postaven je na konvenčním transportním mechanizmu S-VHS a vyráběná zařízení jsou s tímto formátem plně kompatibilní. Pro záznam dat používá obdobnou kazetu a pásek, vstupní datový tok pro standardní režim je 14,1 Mb/s.
78
Závěr Závěrem nezbývá, než naznačit vývojové trendy a pokusit se predikovat nejbližší budoucnost. Zdá se naprosto nepochybné, že klasická televizní studia a komplexy budou stále více užívat technická zařízení pro IT s využitím videoserverů a že se stále více bude užívat „embedded“ (sdílený?) střih s využitím velkých centrálních pamětí. Očekávat lze rovněž šíření určité varianty tohoto střihu s označením „Proxy“, kdy je automaticky se záznamem ve vysílací kvalitě pořizován materiál v signálové kvalitě s nízkým bitovým tokem, tzn. v kvalitě „off line“. Stříhán pak může být v této úrovni a odbaven, nebo realizován v kvalitě vysílací. V oblasti televizní záznamové techniky se o přechodu z pásku na disk mluví velmi dlouho, několik firem již řadu let experimentuje s kamkordéry, které používají namísto pásku disk, široce však tato technologie v žádném případě užívána nebyla. Tato situace se může velmi brzo změnit, protože firma SONY prezentovala na výstavě NAB 2003 kamkordéry („diskordéry“) a studiové stroje užívající 120mm optický disk s kapacitou 23 GB, což stáčí pro záznam 45 minut signálu MPEG IMX 50 Mb/s, nebo 90 minut záznamu DVCAM s tokem 25 Mb/s, v obou případech včetně signálu „Proxy“. Podle předběžných údajů mohou systémy s dvěma optickými hlavami číst signál IMX 2,5krát vyšší rychlostí (5x DV) a zaznamenávat dvojnásobnou, respektive čtyřnásobnou rychlostí. Signál „Proxy“ může být přenášen až třicetkrát rychleji. Tento signál pak může být velmi rychle přepsán pro střih do počítače laptop, případně přenesen přes pojítko do studia a sestříhán ještě před dodáním disku. Zařízení by mělo být dodáváno před koncem roku 2003. Firma Panasonic se rozhodla postoupit ještě o krok dále a ohlásila vývoj a předvedla prototyp záznamu s formátem DVC PRO na pevnou paměťovou kartu SD („Solid-State Professional”), která by do roku 2005 měla dosáhnout kapacity 16 GB a později až 64 GB. Rychlost přenosu dat by v tomto případě byla ve srovnání s mechanickými systémy, tj. páskem nebo diskem, nesrovnatelně vyšší. Uvedené informace snad nejlépe ilustrují skutečnost, že i velmi optimistické premisy mohou být realitou značně překonány.
79
Literatura: [1]
A Guide to MPEG Fundamentals. USA, materiál firmy Tektronix Inc., 1998.
[2]
Avis, R.: Insert Editing on Betacam SX Tape. Technical paper.
[3]
Flaherty, J.: Development of Television Recording. Journal of SMPTE, roč.79, č 7, str. 579 – 584.
[4]
Jedlička, M. – Stránský, V. : Časový kód a film. In Televize (sborník), roč.94, č. 2. Praha, ČT Praha. 1994, s. 89 – 93.
[5]
Líška, D.: Nejbližší budoucnost digitálního televizního vysílání v Evropě. Publikace ČT, Praha 1994.
[6]
Lowman, C. E. : Magnetic Recording. 1972 McGraw-Hill, Inc. Library of Congress Cataloging in Publication Data, Maple Press Company, USA. ISBN 007-038845-8.
[7]
Magnetic Recording History – electronic information.URL:
[2001]
[8]
Picture Qality for Different Bit Rates and Compression Methodes. Ženeva, Švýcarsko, EBU Task Force Report, 1998.
[9]
Robinson, J., F. : Videotape Recording. Third Edition, 1981. Focal Press Limited, London, UK. ISBN 0 240 51083 6.
[10] Rubin, M.: Nonlinear – a guide to electronic film and video editing. Second edition, 1992. Triad Publishing Company, Gainesville Florida. ISBN 0-93740483-7. [11] Šafář, J.: Kompresní systém DVCPRO. Přednáška pořádaná firmou SECURITON, Praha, listopad 1998. [12] The Digital Fact Book – A reference manual for the broadcast TV and post production industries, editor: Bob Pank. England UK, Quantel Ltd, 2000. [13] Video Compression Technology. UK, materiál Sony Training Centre, Sony Broadcast and Professional Europe 1995. Picture Qality for Different Bit Rates and Compression Methodes. Ženeva, Švýcarsko, EBU Task Force Report, 1998. [14] Videotape Recording. USA, sborník fimy Ampex Corporation, A Subsidiary of Allied-Signal Inc., 1986. [15] Watkinson, J.: The Art of Digital Video. Second Edition, 1994. Focal Press, Oxford, UK. ISBN 0 240 51369 X.
80