Bankovní institut vysoká škola Praha
Formát PDF a jeho využití
Bakalářská práce
Jiří Novák
04/2014
Katedra informatiky a kvantitativních metod
Formát PDF a jeho využití
Bakalářská práce
Autor:
Jiří Novák
Informační technologie
Vedoucí práce:
Ing. Bohuslav Růžička, CSc.
Praha
04/2014
Bakalářská práce
Prohlášení Prohlašuji, že jsem bakalářskou práci zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu.
Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Neratovicích dne 29. 4. 2014
Formát PDF a jeho využití
Jiří Novák
2
Bakalářská práce
Poděkování Rád bych poděkoval panu Ing. Bohuslavu Růžičkovi, CSc., vedoucímu mé bakalářské práce, za odborné vedení, podnětné návrhy, věcné připomínky a vstřícnost při vypracování této bakalářské práce.
Formát PDF a jeho využití
3
Bakalářská práce
Anotace Cílem bakalářské práce je popsat možnosti standardizovaného formátu PDF s ohledem na jednotlivé oblasti využití. Úvodní část představuje historický vznik společnosti Adobe souběžně s vývojem jazyka PostScript. Dále navazuje vývoj a přehled jednotlivých verzí PDF, přičemž zároveň je představena i vnitřní architektura obou formátů. Následuje popis důležitých standardů formátu PDF, možnosti jeho zabezpečení a popis zefektivnění podnikových procesů pomocí inteligentních PDF dokumentů a formulářů. Závěr patří popisu koncepce práce s PDF dokumentem v Adobe Readeru.
Klíčová slova: formát PDF – inteligentní dokument/formulář – vnitřní architektura – zabezpečení.
Abstract Aim of bachelor thesis is to describe possibilities of a standardized PDF format with respect to individual area of its use. Introductory part presents the historical evolution of Adobe in parallel with the development of PostScript language. Further is development and review of all PDF versions and there is also presented internal architecture of both formats. Following part is a description of the important standards of PDF format, its security options and a description of efficient business processes using intelligent PDF documents and forms. The conclusion includes a description of the concept, how to work with PDF document in Adobe Reader.
Key words: PDF format – intelligent document/form – internal architecture – security.
Formát PDF a jeho využití
4
Bakalářská práce
Obsah 1 Úvod................................................................................................................................... 6 2 Vývoj jazyka PostScript..................................................................................................... 7 3 PostScript – vnitřní architektura...................................................................................... 15 4 Vývoj formátu PDF.......................................................................................................... 17 5 Kód formátu PDF............................................................................................................. 19 6 PDF – vnitřní architektura............................................................................................... 21 7 Standardy a normy formátu PDF..................................................................................... 25
7.1 PDF/X – mezinárodní standard pro předávání tiskových dat............................................................................................................ 25
7.2 PDF/X-1a............................................................................................................................................................................................... 26
7.3 PDF/X-3................................................................................................................................................................................................ 27
7.4 PDF/X-4 a PDF/X-5.............................................................................................................................................................................. 28
7.5 Další standardy PDF............................................................................................................................................................................ 28
7.6 PDF/A – dlouhodobá archivace dokumentů PDF............................................................................................................................... 28
7.7 PDF/E – PDF pro inženýrství.............................................................................................................................................................. 30
8 Zabezpečení PDF dokumentů.......................................................................................... 31
8.1 Kontejner (obálka).................................................................................................................................................................................31
8.2 Heslo......................................................................................................................................................................................................31
8.3 Vodoznak............................................................................................................................................................................................... 32
8.4 Elektronický (digitální) podpis............................................................................................................................................................ 32
8.5 Rights Management (správa práv dokumentu).................................................................................................................................... 32
9 Inteligentní PDF dokumenty............................................................................................ 34
9.1 Propojení lidí, procesů a aplikací pomocí inteligentních dokumentů................................................................................................ 34
9.2 Zefektivnění obchodních procesů........................................................................................................................................................ 35
9.3 Architektura inteligentních dokumentů............................................................................................................................................... 36
9.4 Nasazení inteligentních dokumentů..................................................................................................................................................... 38
10 Inteligentní PDF formuláře.............................................................................................. 39 11 Rozšíření práv a funkcí pro Adobe Reader (Reader Extensions).................................... 43 12 Závěr................................................................................................................................ 44
12.1 Role PDF formátu v životních cyklech obsahu – pojetí obsahu budoucnosti����������������������������������������������������������������������������������� 44
A Seznam obrázků.............................................................................................................. 46 B Seznam tabulek................................................................................................................ 47 C Seznam zkratek................................................................................................................ 48 D Literatura......................................................................................................................... 49
Formát PDF a jeho využití
5
Bakalářská práce
1 Úvod Dokumentový formát PDF se postupem času v určitých kruzích stal naprostým fenoménem, avšak je stále mnoho uživatelů, kteří tento formát využívají pouze pro načtení obsahu na obrazovku a případně pro jeho tisk. Z pohledu dnešních možností jsou to ale v podstatě pasivní uživatelé. Většina současných tvůrců, kteří PDF dokumenty generují, využívá buď minimálně nebo nevyužívá takřka vůbec potenciál tohoto formátu a tím právě nutí své čtenáře zůstat pasivními. V současné době se velice rychle mění trend, kdy klasické tiskoviny jsou postupně stále více nahrazovány nejrůznějšími typy elektronických dokumentů a publikací, které se mnohdy objevují i ve vzájemně nekompatibilních formátech. To však neplatí pro PDF. Tato zkratka vznikla z anglického „Portable Document Format“, což znamená přenosný, resp. přenositelný formát dokumentů. Jedná se o souborový formát vyvinutý společností Adobe Systems, který zajišťuje ukládání a zobrazení dokumentů nezávisle na softwaru i hardwaru, na kterém či pro který byly pořízeny. Cílem práce je podívat se na formát PDF hlouběji a představit si některé možnosti tohoto jediného multiplatformního formátu pro přenos prakticky všech typů dokumentů pro nejrůznější účely použití.
Obr. 1 Na konci roku 2012 úplně přestal v tištěné podobě vycházet jeden z prestižních amerických týdeníků Newsweek a od začátku roku 2013 je k dispozici pouze v elektronické formě. [1] Svou roli tu v tehdejší krizové době určitě sehrály i ekonomické důvody, ale to nic nemění na faktu, že čím dál víc tištěných médií se již orientuje i na jiné způsoby distribuce svého obsahu, a tak lze poměrně s jistotou očekávat, že tento krok Newsweeku budou následovat i další vydavatelství. V tuto chvíli je zřejmé, že elektronických formátů distribuce bude několik. Zcela určitě to budou formáty pro mobilní zařízení či e-book čtečky, což určitě podpoří i jejich další prodej. Tyto formáty ale nemají žádný pevný layout stránky, neboť jejich zobrazení se kvůli čitelnosti mění podle velikosti displeje na čtecím zařízení. Avšak tam, kde naopak bude žádoucí zachovat požadovaný původní vzhled stránky a přitom zachovat nezávislost na čtecím či výstupním zařízení, v podstatě jiná volba než formát PDF v současnosti není.
PDF formát je možné načíst v aplikacích pro Windows (včetně Windows Mobile), Mac OS, Linux, Solaris, Android, Symbian, Java aj.
Formát PDF a jeho využití
6
Bakalářská práce
2 Vývoj jazyka PostScript Dva američtí vědečtí pracovníci, John Warnock a Chuck Geschke, v roce 1982 společně pracovali v jednom z nejlepších výzkumných ústavů na světě, Xerox PARC (Palo Alto Research Center). Oba měli velmi mnoho společného, dokonce sdíleli i podobné životní zkušenosti a stejné hodnoty, tudíž si v práci velice rozuměli. Přestože oba v té době pracovali s těmi nejlepšími počítačovými mozky a s nejmodernějším vybavením, byli frustrováni z toho, že žádný ze svých nápadů nemohli využít ve výrobcích výpočetní techniky. V prosinci 1982 se proto rozhodli vydat se na vlastní dráhu a založili svou společnost, v níž byli zprvu i jedinými zaměstnanci. Společnost pojmenovali Adobe Systems, její jméno vzniklo podle názvu potoka protékajícího za domem Johna Warnocka v kalifornském Los Altos. Pro zajímavost, v tomtéž roce např. Intel přichází s procesorem 286 a Hewlett-Packard jako první zavádí standard 3,5ʺ disketovou mechaniku. Oba pánové zpočátku vůbec netušili, že svět už je na jejich vynálezy a nápady připraven, nepodléhali ani žádným ohromným očekáváním, ale věřili si, že budou úspěšní. Absolutně nejvíc však věřili v úspěch technologie, kterou se chystali nabídnout. Historicky nejdůležitějším milníkem jejich práce byl programovací jazyk, který dostal název PostScript. Byli si tehdy jisti, že tento produkt najde přirozené uplatnění především v kancelářském prostředí a vyřeší hned několik problémů. [2]
Obr. 2 V kalifornském Los Altos, za domem jednoho ze zakladatelů, Johna Warnocka, protéká potok Adobe, po kterém v roce 1982 pojmenoval svoji společnost Adobe Systems Inc. Její název tedy nemá nic společného s vepřovicemi – nepálenými cihlami, jak lze tento název rovněž přeložit. [zdroj: maps.google.com]
Formát PDF a jeho využití
7
Bakalářská práce
Naprosto nejdůležitější a klíčovou myšlenkou pro další vývoj bylo to, že jazyk PostScript měl dokázat popsat vzhled celé stránky (text, grafika, fotografie), čímž by se dalo zcela eliminovat do té doby používané vystřihování a lepení jednotlivých prvků na papír, resp. osvitovou fólii. Za další se tento programovací jazyk měl využít i ke komunikaci mezi počítačem a tiskárnou (v té době dominovaly ještě neinteligentní a hlučné jehličkové tiskárny). Doposud se pro každé zařízení musely používat specializované ovladače a aplikační protokoly. PostScriptem by toto šlo nahradit. A za poslední se tento jazyk měl začít začleňovat do nových a tišších laserových tiskáren, které měly zbavit uživatele např. i nepříjemného rachotu jehličkových tiskáren. Revoluční součástí plánu nasazení PostScriptu byla jeho naprostá nezávislost na výstupním zařízení ve smyslu, že stránky vytištěné na laserové tiskárně (300 dpi) nebo na osvitové jednotce (1200 dpi) budou vždy vypadat úplně stejně, pochopitelně pouze s rozdílem kvality tisku. I když nová společnost Adobe Systems vznikla v podstatě „jen“ na myšlence popisu tiskové strany, dokázali její zakladatelé svými plány oslovovat bývalé kolegy z Xerox PARCu a na jaře 1983 měli vybudovaný první tým nadšených spolupracovníků. Celý tým se dal do práce a o pár měsíců později byl PostScript na světě. Testování svých nových ovladačů si v Adobe ověřovali na laserové tiskárně Xerox, vypůjčené od spřáteleného Xerox PARCu. V tu chvíli začali zároveň řešit, jak tuto svoji geniální myšlenku dostat na trh. Všem zúčastněným bylo již jasné, že celý nápad, jak popsat tiskovou stránku způsobem nezávislým na konkrétním zařízení, byl opravdovým průlomem. Metody, jakými k tomuto problému přistupovali, byly úplně odlišné od všech ostatních. Vyvinuli jazyk pro výstupní zařízení a jeho interpreter, takže pokud bude využíván tento modul, nezáleží na tom, co do něj odešlete. To bylo přesně to, co bylo potřeba. Rozhodujícím klíčem k úspěchu PostScriptu byl však způsob, kterým řešil problém s fonty. Namísto nutnosti vytvářet ručně dolaďované bitmapy pro každý styl a velikost písma umožňoval jazyk PostScript automaticky generovat fonty jakékoliv velikosti a tvaru na základě matematického popisu jejich křivek, čímž značně eliminoval nutnost intenzivní lidské práce. Vyvinutí písem nezávislých na zařízení je považováno za největší úspěch této technologie. Společnost Adobe tímto položila základ oboru, který dnes nazýváme DTP (Desktop Publishing). Další události nabraly správné obrátky, když do Adobe zavolal Steve Jobs, zakladatel společnosti Apple Computer. [2]
Formát PDF a jeho využití
8
Bakalářská práce
V ten moment společnost Apple Computer zažívala úspěchy s řadou počítačů Apple II, kterou vřele přivítali především pedagogové, ale John Warnock a Chuck Geschke ještě nevěděli, že Steve Jobs již pracuje na své další inovaci, počítači Macintosh, který zobrazoval grafiku a ne jenom řádky ASCII textu. Vizionář Steve Jobs, jedna z nejvýraznějších osobností počítačového průmyslu posledních čtyřiceti let, byl o tomto přesvědčen, že to je budoucnost nejen výpočetní techniky, ale také publikování. Psal se stále ještě rok 1983, když John Warnock a Chuck Geschke pozvali Steva Jobse na návštěvu. Tehdy měl Apple vlastní jehličkovou tiskárnu s rozlišením 72 dpi nazvanou ImageWriter, ale spolupracoval také zároveň i se společností Canon na vývoji levné laserové tiskárny produkující ostrý výstup, ale v ceně o několik tisíc dolarů nižší, než bylo cokoli jiného na trhu. Co však Steve Jobs neměl, byl způsob, jak spolu propojit laserovou tiskárnu a Macintosh. Všichni tři (Warnock, Geschke, Jobs) tehdy věděli, že klíčovou záležitostí v podnikové sféře je zlepšení kancelářského tisku. Steve Jobs nechtěl promarnit příležitost, protože kvalitní tisk by mohl vynést Apple do výšin. Při snídani Steve Jobs navrhl, aby Adobe licencovalo svou technologii Applu pro začlenění do Macintoshem řízené laserové tiskárny s rozlišením 300 dpi vybavené součástkami Canon. V té době ještě u Adobe uvažovali stát se zároveň i výrobcem hardwaru (počítače, tiskárny aj.), ale při této návštěvě je v podstatě Steve Jobs přesvědčil, aby od svých plánů upustili a aby se namísto toho zabývali pouze vývojem softwaru. John Warnock a Chuck Geschke si uvědomili, že rozhodnutí licencovat svou technologii je zbaví břemene výroby a umožní jim slušně profitovat z jejich softwaru. Steve Jobs jim za licenční poplatky za PostScript nabídl 1,5 miliónu dolarů a zrealizoval investici 2,5 miliónu dolarů výměnou za 20% podíl ve společnosti. Úspěch partnerství Adobe a Apple byl založen na něčem vyšším, než jen na dobrých osobních vztazích. Obě společnosti totiž sdílely víru, že technologie může přesahovat běžnou výpočetní techniku a dosahovat tak vyšších estetických cílů. Proto během několika dalších jednání (koncem roku 1983) nabídl Steve Jobs za odkoupení celé společnosti Adobe částku 5 miliónů dolarů. Protože však John Warnock a Chuck Geschke krátce předtím unikli ze stínu velkých společností, tuto jeho nabídku odmítli. Oba zakladatelé Adobe však v následujících měsících zaměřili pozornost na vizi Apple a začali vylaďovat PostScript nejen pro zařízení s vysokým rozlišením, ale soustředili se právě na kancelářské laserové tiskárny s rozlišením 300 dpi, což bylo vcelku náročné zadání. [2]
Formát PDF a jeho využití
9
Bakalářská práce
Problémem byla především reprodukce písma tiskárnou, protože PostScriptem vygenerované písmo mělo tendenci se jevit tučnější, než ve skutečnosti bylo. V Adobe se tedy pustili do práce na vylepšování vzhledu písma, což se jim podařilo vyřešit až tím, když se při tisku v jakémkoli rozlišení příslušně měnilo měřítko šířky dříků písmen. To skutečně znamenalo, že písmena stejné velikosti a stylu vypadala dobře, ať byla vytištěna na laserové tiskárně s rozlišením 300 dpi, nebo osvitovou jednotkou s rozlišením 1200 dpi. Tato schopnost byla dalším hlavním průlomem pro PostScript i pro Adobe. Následný vývoj počátkem roku 1984 byl v Adobe zaměřen na portování PostScriptu do čipu Motorola, který se používal v laserových tiskárnách Apple. Původně Apple plánoval vývoj vlastní řídicí jednotky, ale poté, co vývojáři Adobe sdělili vývojářům Applu své nápady ohledně řešení jednotky, vznikla jako výsledek spolupráce řídicí jednotka pro laserovou tiskárnu Apple LaserWriter. Tato společná strategie nakonec vyústila v „Macintosh Office“, což byla sestava počítače Apple Macintosh a laserové tiskárny Apple LaserWriter, která by kancelářským zaměstnancům ulevila při produkci dokumentů tím, že by jim umožnila vytvářet dokumenty s textem a grafikou přímo na monitoru počítače a pak je přesně ve stejné podobě vytisknout na tiskárně. Jednou z klíčových věcí úspěchu sestavy „Macintosh Office“ byla písma. S navrhováním a produkcí písmen však neměli zkušenosti ani v Adobe, ani v Apple, ačkoli lidé z vedení obou společností si velmi cenili kvalitní typografie. Zde se naskýtala příležitost k oslovení dalšího partnera dodávajícího nejen písma, ale i komplexní výstupní platformu s vysokým rozlišením pro PostScript, jejímž základem by byla osvitová jednotka. Jednou z oslovených společností byla 100 let stará tiskařská firma Allied Linotype, jejíž majitelé zprvu vůbec nevěřili úspěchu spolupráce, ale nakonec se přece jen nechali přesvědčit a společnostem Adobe a Apple licencovali své drahocenné rodiny písem Helvetica a Times. Dokonce se s Adobe dohodli na spolupráci na vývoji první postscriptové osvitové jednotky. Ačkoli Linotype nebyl největším výrobcem osvitových jednotek, byl tím nejzavedenějším a nejrespektovanějším, takže získání Linotypu na svou stranu posunulo PostScript k dalšímu úspěchu. Vývojáři v Adobe se tedy pustili do konverze písem Helvetica a Times, u každého do čtyř řezů (regular, bold, italic a italic bold). Současně k nim ještě přidali stejné čtyři řezy písma Courier, které v tu dobu díky psacím strojům bylo doslova všudypřítomné, a jeden řez písma Symbol, což byla kolekce speciálních a matematických znaků. Těchto 13 řezů zabudovaných do první postscriptové laserové tiskárny Apple LaserWriter se stalo základním kamenem moderního digitálního písma. [2]
Formát PDF a jeho využití
10
Bakalářská práce
V měsících, které vyvrcholily uvedením tiskárny Apple LaserWriter na trh, budovala společnost Adobe další základy pro svoji budoucnost, neboť zde věděli, že aby se PostScript mohl stát standardem, bude potřeba více písem. Proto Adobe oslovilo i společnost International Typeface Corporation (ITC), která byla nejvýznamějším zdrojem písem pro reklamní a mediální komunitu v New Yorku. Krátce nato Adobe podepsalo i s ITC dohodu o začlenění jejich písem v dalších iteracích PostScriptu. V létě roku 1984 John Warnock (Adobe) a Steve Jobs (Apple) předvedli sestavu Apple Macintosh a laserovou tiskárnu Apple LaserWriter. Pro mnohé to byl vskutku magický moment. Šťastný Steve Jobs o této události pronesl: „Když z tiskárny LaserWriter vylezla první stránka, byl jsem z toho úplně pryč.“ Nikdo nic takového předtím neviděl. „Držel jsem tu stránku před sebou a říkal jsem, kdo by tohle nechtěl?“ Všichni tehdy správně tušili, že tato přelomová událost bude mít dalekosáhlý pozitivní dopad a publikování se tímto posune do zcela jiné dimenze. Na konci roku 1984 bylo vše připraveno pro představení laserové tiskárny Apple LaserWriter veřejnosti. Cena této tiskárny činila 6 995 dolarů, což je sice v poměru k dnešním standardům hodně, ale konkurenční tiskárny Xerox či IBM byly tehdy až desetkrát dražší. Adobe a PostScriptem vybavená laserová tiskárna Apple LaserWriter se brzy staly středem zájmu, ale počítače Apple Macintosh začaly být pod palbou kritiky pro svůj nedostatečný výpočetní výkon a malou rozšiřitelnost. To, co bylo v tu chvíli zapotřebí, byla „super aplikace“, která by naplno ukázala grafické uživatelské rozhraní počítače Apple Macintosh a tiskové schopnosti PostScriptu. To splňovala v tu dobu jen jediná, PageMaker, kterou vyvinula společnost Aldus Corporation. Aldus PageMaker byl novým typem programu, zčásti textový editor, zčásti grafický program. Byl vyvinut po vzoru systémů používaných v novinové produkci a umožňoval uživatelům elektronickou sazbu stránek, na kterých bylo možné kombinovat text a grafiku, začleňovat písma různých velikostí, použít více sloupců atd. namísto v té době běžného používání rýsovacího prkna a nože k ručnímu pospojování slov a obrázků. Proto se v roce 1985 sešly tři společnosti na vzestupu (Adobe Systems, Apple Computer a Aldus Corporation), aby spojily své síly a přivedly na svět „Desktop Publishing“ (DTP), což v přeneseném významu znamená „publikování na stolním počítači“. Kombinace počítače Apple Macintosh, programu Aldus PageMaker a tiskárny Apple LaserWriter vybavené Adobe PostScriptem vnesla pořádný rozruch do světa publikování, neboť to tak bylo osvobozeno od specifických osvitových jednotek a tiskových systémů, čímž v podstatě byla odstartována DTP revoluce. [2]
Formát PDF a jeho využití
11
Bakalářská práce
Aplikace Aldus PageMaker byla uvolněna na trh v červenci 1985 a okamžitě se stala naprosto ideální k předvedení potenciálu počítače Apple Macintosh jako publikačního nástroje a Adobe PostScriptu coby nového tiskového objevu. Pomocí PageMakeru mohl grafik na stránku umístit text i grafiku, přičemž výsledek okamžitě viděl na obrazovce Macintoshe a při stisku tlačítka „Print“ vylezl stejný dokument z tiskárny LaserWriter jako ucelená stránka s veškerým textem a grafikou na svém místě. To bylo v té době skutečně revoluční a nadmíru působivé. Trvalo pouze dva roky, než se z nového odvětví zvaného DTP stal mnohamiliónový business (v USD). Způsob editace dokumentů v počítači, při kterém je verze zobrazená na obrazovce vzhledově totožná s výslednou vytištěnou verzí dokumentu na papíře, se později začal nazývat WYSIWYG (z anglického „What You See Is What You Get“ neboli česky „co vidíš, to dostaneš“). Před nástupem PostScriptu byly tiskárny jen pasivními stroji, které kvůli omezenému výpočetnímu výkonu hostitelského počítače dokázaly tisknout pouze řádky textu. PostScript tedy jednoznačně učinil tiskárny inteligentnějšími stroji. Tisková kvalita výstupu laserových tiskáren sice nebyla tak dobrá, aby mohla konkurovat stále ještě v té době klasické fotosazbě, ale i to se velmi brzy změnilo díky již započatému partnerství společností Adobe a LinoType, která jako jediná rychle pochopila budoucí možnosti nové technologie. Toto partnerství přineslo své ovoce již na jaře roku 1985, kdy byly na trh uvedeny první postscriptové osvitové jednotky LinoTronic 100 a 300 s rozlišením 1270 dpi, resp. 2540 dpi. Schopnost konkurovat běžné fotosazbě byl dalším klíčem úspěchu Adobe. Tisk s vysokým rozlišením však byl jen jednou z cest, kterou společnost Adobe s PostScriptem prorazila. V Adobe zároveň také začali vytvářet knihovnu písem, která se zanedlouho měla stát rivalem pro všechny písmolijny světa, neboť nedostatek písem byl na začátku brzdou fenoménu DTP. Nejprve Adobe licencovalo písma od cizích písmolijen, ale později začalo navrhovat písma vlastní, aby po čase mělo rozsáhlou vlastní knihovnu písem, která se dokonce stala největší svého druhu na světě. Následoval další růst počtu vestavěných postscriptových písem, a jak se ve vydavatelském průmyslu stále více usídloval PostScript, rozhodly se i další velké písmolijny (Agfa, Berthold, ITC, Monotype aj.) konvertovat svá písma do PostScriptu. Dokonce se začaly objevovat i nové menší firmičky, které nabízely svá vlastní nová písma. Celosvětový úspěch PostScriptu jako průmyslového standardu byl ale dán teprve expandováním PostScriptu do Japonska v roce 1987. Vzápětí po něm se na japonském trhu objevil Apple Macintosh s japonským operačním systémem a také lokalizovaná verze PageMakeru, čímž DTP revoluce definitivně vtrhla také do Japonska. [2]
Formát PDF a jeho využití
12
Bakalářská práce
Jak postupně PostScript plnil svoji historickou úlohu, přemýšleli v Adobe nad jeho výhodnější náhradou pro přenos tiskových dat. Zásadní nevýhoda PostScriptu totiž byla v jeho univerzální textové struktuře programovacího jazyka, kdy pro každé zobrazení či tisk postscriptových dat byl nutný nějaký překladač celého souboru, a to i když bylo potřeba vytisknout pouze jednu stránku celého souboru. To činilo kontrolu PostScriptu nesmírně náročnou na výpočetní výkon i čas. Nastal tedy moment vhodný k přechodu od programovacího jazyka k datovému typu dokumentu, ale přitom se zachováním všech možností kvalitního a přesného popisu tiskové stránky. Nový typ dokumentu, který vyšel z jazyka PostScript, měl zprvu pouze nahradit tištěné dokumenty v kanceláři. Aby ale byl schopen nést v sobě grafické informace stejně tak dobře, jako to uměl PostScript, a navíc se zachováním stejné nezávislosti dokumentu na softwaru i hardwaru, na kterém či pro který byl pořízen, musel být postupně rozšiřován o celou řadu dalších vlastností. V roce 1996 proběhlo uvolnění první verze nového souborového formátu, který se stal dalším významným mezníkem společnosti Adobe. Nový typ dokumentu, který je s jistou mírou nadsázky považován za druhou revoluci po Gutenbergově vynálezu knihtisku, dostal příznačný název Adobe PDF (z anglického „Portable Document Format“, což česky znamená „přenosný, resp. přenositelný formát dokumentů“. Pro prohlížení, vytváření, úpravu a další práci se soubory formátu PDF byla vyvinuta rodina produktů s názvem Adobe Acrobat, přičemž ten nejjednodušší, Acrobat Reader (nyní Adobe Reader), je prakticky od samého počátku k dispozici zcela zdarma. [2]
Obr. 3 Když člověk kráčí v kalifornském San Jose po Park Avenue, kde má dnes, kromě celé řady dalších technologických firem, hlavní sídlo i společnost Adobe Systems, upoutá jeho pohled architektonicky zajímavý a sebevědomý komplex budov, na němž se skví logo Adobe symbolizující úspěch největšího světového výrobce grafického softwaru. Avšak začátky této proslulé společnosti, jak je zřejmé z její historie, rozhodně nebyly nijak snadné. [3]
Formát PDF a jeho využití
13
Bakalářská práce
Obr. 4 První historické logo Adobe Systems Incorporated navrhla grafička Marva Warnock, manželka jednoho ze zakladatelů, Johna Warnocka. [2]
Obr. 5 John Warnock (vlevo) a Chuck Geschke, zakladatelé společnosti Adobe. [2]
Obr. 6 První zkušební testovací obrazce, které prokázaly univerzálnost jazyka PostScript. Obsahovaly všechny tehdy slíbené prvky (text, grafika, obrázky). [2]
Obr. 7 Piktogram jazyka PostScript. [2]
Obr. 8 První logo Apple Computer. [2] Obr. 9 Steve Jobs, zakladatel společnosti Apple Computer, již tehdy správně tušil, že první list z postscriptové laserové tiskárny bude z té „jeho“. [2]
Obr. 12 Pohled do tehdejší kanceláře týmu Acrobat. [2]
Obr. 10 Sestava počítače Apple Macintosh a laserové tiskárny Apple LaserWriter s PostScriptem (Macintosh Office) se stala základním kamenem publikační práce. [2]
Obr. 11 Program Aldus PageMaker provozovaný na počítačích Apple Macintosh položil základ oboru zvaného DTP (Desktop Publishing). [2]
Obr. 13 Tato ilustrace se na dlouhou dobu stala ústředním motivem Adobe Acrobatu. [2]
Obr. 14 Aktuální logo společnosti Adobe Systems, současný piktogram formátu PDF a grafický motiv produktu Adobe Acrobat. [zdroj: www.adobe.com]
Formát PDF a jeho využití
14
Bakalářská práce
3 PostScript – vnitřní architektura Jak z předešlé historie vyplývá, programovací jazyk PostScript, na jehož základě později vznikl binární datový formát PDF, byl vyvinut jako interpretační jazyk. To znamená, že postscriptový kód byl zpracováván (interpretován) jiným nezávislým programem či zařízením, které se nazývá překladač (interpreter). Obvykle byl takový interpretační překladač umístěn v osvitových jednotkách v modulu RIP (Raster Image Processor), jenž měl za úkol převádět (rasterizovat) tisková data do rastrové podoby. Hlavní úlohou PostScriptu tedy bylo popsat vzhled textu, grafiky a obrázků na tiskovém dokumentu a tento popis pak přenést do rastrového výstupu tiskařského zařízení. Přesněji řečeno, PostScript je textový zápis příkazů, které určují, jak má být určitá stránka rozvržena. Pro určení polohy objektů, jako je text nebo grafické prvky na stránce, je v popisu používán souřadnicový systém. Tyto specifikace obsahují i jiné charakteristiky, jako je hustota řádků, polotónové body, úhly, barvy atd. PostScript pracuje pouze se třemi základními jednoduchými objekty, ze kterých se výsledný layout tiskoviny staví. Jsou to: 1) Bitmapový (rastrový) objekt – jde o takový typ dat, který popisuje každý jednotlivý digitální bod (pixel) konkrétní definovanou barvou. Z pohledu objemu dat jsou sice bitmapy největšími „žrouty“, avšak při zpracování bitmapových dat pro tisk jde o nejjednodušší objekty, protože jednotlivé pixely jsou pouze tranformovány na tiskové body. 2) Vektorový objekt – zde se jedná o matematický zápis trajektorie křivky, která se má reprodukovat. Geometrii tvaru určují např. přímky, pravoúhelníky, kružnice, Bézierovy křivky aj., přičemž k dané trajektorii jsou ještě přiřazovány barevnosti tahu a výplně. Mohou být vzájemně kombinovány i výseče jednotlivých geometrických tvarů. Z pohledu objemu dat jsou vektorové objekty velmi malé, avšak při zpracování těchto dat pro tisk se musí z matematických definic geometrických tvarů vypočítat tiskové body (rasterizace), což je výpočetně náročný úkon. 3) Písma – (jinak také fonty) tvoří samostatný druh postscriptového kódu. Tvary znaků jsou stejně tak jako vektorové objekty popsány matematicky jako křivky a stejným způsobem jako vektory se také zpracovávají. Pro snazší a rychlejší práci s písmem je však každý znak jednotlivého fontu doplněn identifikátorem, což umožní umísťování, resp. sazbu znaků vedle sebe či pod sebou na řádky. Rovněž i u písem dochází před tiskovým zpracováním k jejich rasterizaci na tiskové body. [4]
Formát PDF a jeho využití
15
Bakalářská práce
PostScript byl během své existence, kdy se stal průmyslovou normou ve světě DTP, několikrát modifikován, resp. do něj byly přidány nové vlastnosti. Po původním PostScriptu Level 1 následoval v roce 1994 PostScript Level 2. Ten přinesl řadu zásadních inovací, týkajících se například vylepšení celkového výkonu, separací, rastrování či správy barev. V roce 1998 pak Adobe představilo PostScript 3 (již bez přívlastku Level), který ale neznamenal v rámci samotné technologie tak přelomové změny, jako přechod z Level 1 na Level 2. Jeho posláním bylo spíše reflektovat některé specifické požadavky digitalizované polygrafické výroby (rozšířená podpora písmových technologií, prostor pro separace s použitím přímých barev, optimalizace kódu, přetisky aj.) a nabídl také další podporu moderních publikačních technologií. Jedna z přelomových změn naznačující další vývoj, kterou PostScript 3 přeci jen přinesl byla ta, že kompatibilním rastrovacím modulům RIP (Raster Image Processor) na nových osvitových jednotkách, umožnil PostScript 3 zpracovávat soubory již i v novějším PDF formátu. Pozice PostScriptu v polygrafii podnítila vznik i dalších specifických variací formátu, které vznikaly nejen z aktivity Adobe, ale i od jiných výrobců. Jeden z významných formátů jistě je „zapouzdřená“ varianta PostScriptu EPS (Encapsulated PostScript) pro počítačovou stránkovou montáž grafiky, se kterým jsou dále spojeny např. technologie OPI (Open Prepress Interface) pro náhradu obrázků a DCS (Desktop Color Separation) pro separace. Za nejvýznamnější variantu modifikace PostScriptu však musíme označit formát PDF. [4]
%IPS-Adobe-2.0 %%Title:Nazev v obdelniku /Helvetica-Bold findfont 50 scalefont setfont 200 300 moveto 400 300 lineto 400 500 lineto 200 500 lineto closepath 0.8 setgray fill 0 setgray 225 380 moveto (Scitex)show showpage
Scitex
Obr. 15 Ukázka jednoduchého postscriptového kódu. Ze zápisu kódu vlevo vytiskne jakákoli postscriptová tiskárna šedý obdélník s nápisem Scitex (vpravo). [4]
Formát PDF a jeho využití
16
Bakalářská práce
4 Vývoj formátu PDF Přestože všechny fáze vývoje formátu PDF měly stejnou ikonu a koncovku (*.pdf), v každé nové verzi obvykle přibylo něco podstatného. Základní specifikace souboru PDF 1.0 (Acrobat 1 – r. 1993) obsahovala pouze interpretační vrstvu, která uchovávala layout, písma a barvy v RGB režimu. V následující verzi 1.1 (Acrobat 2 – r. 1994) již přibyly první prvky šifrování a ochrana dokumentu heslem. Teprve až v průlomové verzi 1.2 (Acrobat 3 – r. 1996) mohl předtiskový průmysl (pre-press) začít uvažovat o nasazení, neboť započala podpora barev v režimu CMYK i přímých barev. Kromě toho rovněž odstartovala podpora vyplňování interaktivních PDF formulářů (AcroForm) a současně i podpora kódování Unicode. Další verze 1.3 (Acrobat 4 – r. 2000) přinesla především digitální podpis, podporu JavaScriptu, možnost vnoření jakéhokoli souboru do těla PDF jako přílohy (kontejner) a konverzi WWW stránek do PDF. Pro pre-press segment přibyla podpora duplexů a ICC (International Color Consortium) profilů. Ve verzi 1.4 (Acrobat 5 – r. 2001) se interaktivní formuláře vylepšily o export do XML (eXtensible Markup Language), více se zesílil šifrovací algoritmus ochrany dokumentů a rozšířila se funkce digitálních podpisů o vzdálené ověřování. Pro předtiskový průmysl tato verze přinesla dlouho očekávanou podporu průhledností objektů, čímž se pro tuto oblast použití v podstatě mohl ukončit vývoj, neboť vše potřebné pro pre-press v tu chvíli již bylo implementováno. Následující verze 1.5 (Acrobat 6 – r. 2003) „přinesla schopnost“ do PDF souborů vkládat a přehrávat multimédia, byla znovu ještě více zesílena ochrana dokumentů šifrováním, přibyla i možnost zašifrování dokumentu veřejným klíčem a také byla dále vylepšena podpora exportu dat z interaktivních formulářů do XML. Zatím předposlední verze 1.6 (Acrobat 7 – r. 2003) se zasloužila především o import 3D grafiky, vnoření OpenType fontů (OTF) a dále se rozšířila funkce, kdy na jakýkoli vložený soubor v těle PDF mohl být umístěn odkaz (hyperlink) v textu PDF dokumentu. Aktuální verze 1.7 (Acrobat 8 – r. 2006) přinesla vylepšenou funkčnost vkládání 3D objektů a možnost vícenásobného vložení jiných souborů, které se tak dají sestavit do digitálního šanonu (portfolio). Verze 1.7 se dále člení na tzv. Extension Level. Za zmínku ještě stojí, že verze PDF 1.7 Extension Level 3 (Acrobat 9 – r. 2008) s sebou přinesla možnost vkládání prvků Flash vč. videa (H.264). Posledním funkčním rozšířením verze PDF 1.7 je Extension Level 8 (Acrobat X – r. 2011). [5, 6]
Formát PDF a jeho využití
17
Bakalářská práce
Nová verze standardu PDF 2.0 je zatím ve vývoji. Výborem ISO (International Organization for Standardization) pro normalizaci standardů, jejímž členem je i Adobe, byla tato verze jako nový návrh přijata již v roce 2009 pod názvem ISO/NP 32000-2. Adobe v tomto návrhu předložilo i původně odmítnuté specifikace, které ve verzích PDF 1.7 Extension Level 3 a 5 ještě nebyly ISO výborem přijaty. Posláním ISO výboru, rozvíjejícího standard PDF, je evoluční vylepšení a zdokonalení tohoto formátu, ale současně výbor také zamítá ty funkce, které jsou používány v dřívějších verzích PDF. [6]
verze PDF
verze Acrobat
spuštěno souhrn nových vlastností v roce
1.0
1.0
1993
první základní verze, pouze interpretační vrstva (layout a písma), barvy v RGB režimu
1.1
2.0
1996
první prvky šifrování a ochrana dokumentu heslem (40 bitů), hyperlinky
1.2
3.0
1996
podpora barev CMYK a přímých barev, interaktivní formuláře (AcroForm), podpora kódování Unicode, vnoření multimédií (video a zvuk), navýšení počtu kompresních metod
1.3
4.0
2000
digitální podpis, podpora JavaScriptu, vnoření souborů jako přílohy (kontejner), konverze www stránek do PDF, podpora duplexů a ICC profilů, vkládání poznámek
2001
přidání průhledností, zesílené šifrování algoritmem RC4 (ARCFOUR) na 128 bitů, rozšíření podpory formulářů FDF (Forms Data Format), vylepšení architektury dokumentů o PDF tagy a XML (eXtensible Markup Language) metadata, přidání komprese JBIG2
1.4
5.0
1.5
6.0
2003
zesílení ochrany dokumentů šifrováním veřejným klíčem algoritmem RSA (Rivest-Shamir-Adleman) – až 4096 bitů, podpora interaktivních formulářů založená na XFA (XML Forms Architecture), rozšíření podpory vnoření a přehrávání multimédií (video a zvuk), přidání komprese JPEG 2000
1.6
7.0
2004
vnoření OpenType fontů (OTF), import 3D grafiky, umístění odkazu (hyperlinku) na soubory vložené v těle PDF, rozšíření kódování o algoritmus AES (Advanced Encryption Standard)
1.7 (ISO 32000-1:2008)
8.0
2006
vícenásobné vložení jiných souborů a sestavení do digitálního šanonu (portfolio), vylepšení importu 3D objektů, vylepšení podpory formulářů založené na XFA (XML Forms Architecture)
1.7 Extension Level 3 9.0
2008
možnost vkládání Flash prvků včetně Flash videa formátu H.264, zesílení kódování algoritmu AES (Advanced Encryption Standard) na 256 bitů, přizpůsobení formulářů XFA (XML Forms Architecture) v souladu se standardem PDF/A
1.7 Extension Level 5 9.1
2009
další vylepšení podpory formulářů založené na XFA (XML Forms Architecture)
1.7 Extension Level 8 X
2011
kvůli slabosti byla vylepšena podpora pro ověření hesel algoritmu AES (256 bitů)
2.0
–
ve vývoji
–
Tab. 1 Vývoj funkcionalit jednotlivých PDF verzí. [5]
Formát PDF a jeho využití
18
Bakalářská práce
5 Kód formátu PDF Formát PDF je textový dokument, jehož znakové řetězce slouží k definování různých entit, ze kterých se skládá celý dokument. Entity v sobě nesou datový obsah v textové či binární podobě. Každý PDF dokument obsahuje čtyři základní sekce: hlavičku, tělo, tabulku křížových odkazů a patičku. • Hlavička nese na prvním řádku jednořádkovou informaci specifikující verzi PDF formátu daného dokumentu. • Tělo obsahuje posloupnost objektů, což jsou entity nesoucí datový obsah dokumentu v různých formátech (text, grafika, video, zvuk aj.). • Tabulka křížových odkazů je sekce, která umožnuje náhodně přistupovat k libovolnému objektu v těle dokumentu, aniž by bylo nutné číst celý dokument od začátku. Tato tabulka je členěna na bloky (např. dokument, který nebyl nikdy upravován, má jediný blok). Jeden řádek každého bloku obsahuje křížový odkaz na jeden z objektů v těle dokumentu. Křížový odkaz obsahuje tři položky – desetimístnou pozici udávající umístění odkazovaného objektu, pětimístné číslo představující generační číslo (udává počet modifikací, které proběhly nad daným objektem) a nakonec jednoznakovou hodnotu udávající, zda je daný řádek využitý (n), nebo volný (f). • Patička je poslední sekcí dokumentu, která slouží ke snadnému nalezení výše popsané tabulky křížových odkazů. Obsahuje pozici, na které se nachází tabulka křížových odkazů a slovník (množina dvojic klíč–hodnota) s informacemi o této tabulce (počet záznamů ad.). Při zpracovávání PDF dokumentu se postupuje od konce. Čtením informací uložených v patičce je nejdříve lokalizována pozice, na které se nachází tabulka křížových odkazů a slovník popisující tuto tabulku. Poté teprve dochází ke zpracování jednotlivých objektů v těle dokumentu. [8]
Obr. 16 Základní členění PDF dokumentu. [8]
Formát PDF a jeho využití
19
Bakalářská práce
%PDF-1.1 ← zde začíná hlavička %âãÏÓ 1 0 obj ← zde začíná tělo « /Kids [2 0 R) /Count 1 /Type /Pages » endobj 2 0 obj « /Rotate 0 /Parent 1 0 R /Resources 3 0 R /MediaBox [0 0 612 792] /Contents [4 0 R] /Type /Page » endobj 3 0 obj « /Font « /F0 « /BaseFont /Times-Italic /Subtype /Type1 /Type /Font » » » endobj 4 0 obj « /Length 65 » stream 1. 0. 0. 1. 50. 700. cm BT /FO 36. Tf (TEXT) Tj ET endstream endobj 5 0 obj « /Pages 1 0 R /Type /Catalog » endobj xref ← zde začíná tabulka křížových odkazů 0 6 0000000000 65535 f 0000000015 00000 n 0000000074 00000 n 0000000192 00000 n 0000000291 00000 n 0000000409 00000 n trailer ← zde začíná patička « /Root 5 0 R /Size 6 » startxref 459 %%EOF Obr. 17 Ukázka kódu PDF dokumentu (uvedeny začátky každé ze čtyř základních sekcí). [5]
Formát PDF a jeho využití
20
Bakalářská práce
6 PDF – vnitřní architektura PDF je souborový formát, který společnost Adobe představila v roce 1993 po PostScriptu jako následný standard pro přenos tiskových souborů. Formát PDF sice vychází ze stejných grafických principů jako PostScript (dokáže velmi dokonale po grafické stránce popsat všechny typy objektů, je univerzální, multiplatformní, a navíc stránkově orientovaný), ale některé jeho prvky jsou implementovány mírně odlišně a jiné nejsou použity vůbec. Návaznost na PostScript však zvyšuje spolehlivost použití PDF v předtiskové přípravě, protože PostScript a PDF sdílejí některé vlastnosti, např. přenášet důležité informace pro správu barev, přímé barvy a přetisky, umí rovněž pracovat i s vysokým rozlišením bitmapových objektů. Největší výhodou PDF oproti PostScriptu je právě jeho stránková orientace, protože jednotlivé stránky se mohou zpracovávat samostatně, editovat, slučovat či rozdělovat, a to bez ohledu na objekty na sousedních stranách. Všechny zdroje jsou vždy vztaženy k dané stránce, a nikoli k celému dokumentu, jako tomu je u PostScriptu. Viditelný rozdíl je i ve velikosti souborů, protože soubory PDF automaticky používají komprimaci a jsou typicky výrazně menší než odpovídající dokumenty ve formátu PostScript. Univerzálnost PDF, na rozdíl od PostScriptu, spočívá především v různorodosti druhů podporovaných objektů. Zatímco PostScript si vystačil se třemi základními objekty, PDF dále přidává např. objekty typu hypertextový odkaz, interaktivní formulář, 3D grafika, video, zvuk a další typy anotací. Zejména uložení omezené sady znaků fontu přímo v dokumentu PDF významným způsobem vylepšilo i meziplatformní kompatibilitu, neboť vložené znakové sady se s dokumentem přenášejí a tím je umožněn jejich tisk i na nepostscriptových zařízeních. Základní princip, jak je grafika prezentována v PDF, je velmi podobný tomu v PostScriptu, s výjimkou použití průhlednosti, která byla přidána do PDF až později. K popisu stránky používá PDF grafika kartézský souřadnicový systém nezávislý na použitém zařízení. Popis stránky PDF může používat matice pro rotaci, změnu měřítka nebo zkosení grafických prvků. Klíčovým konceptem ve formátu PDF je stav grafiky a stavové proměnné, což je kolekce grafických parametrů, které mohou být měněny, ukládány a obnovovány popisem stránky. PDF má 24 grafických stavových vlastností, z nichž 16 je nezávislých na použitém zařízení a zbylých 8 je na zařízení závislých. [5, 7]
Formát PDF a jeho využití
21
Bakalářská práce
Některé grafické stavové proměnné jsou nastavovány pomocí konkrétních operátorů, některé pomocí příslušného záznamu ve slovníku grafických stavových proměnných a některé mohou být nastaveny pomocí obou. Například aktuální tloušťka čáry může být nastavena oběma uvedenými způsoby, ale např. aktuální barva je nastavována pouze pomocí konkrétního operátoru. Bitmapové (rastrové) objekty mohou být 1–16bitové obrázky v několika barevných prostorech. V PDF jsou reprezentovány pomocí slovníků s asociovanými streamy. Slovník popisuje vlastnosti obrázku a stream obsahuje obrazová data. Někdy může být rastrový obrázek přímo součástí popisu stránky jako vložený obrázek. Obrázky jsou obvykle komprimovány různými bezztrátovými či ztrátovými komprimačními mechanismy. Vektorová grafika je ve formátu PDF rovněž konstruována pomocí cest. Cesty jsou obvykle složeny z přímek, kubických (Bézierových) křivek nebo mohou být vytvořeny z obrysů textu. Čáry a výplně mohou mít různou tloušťku a barvu v jakémkoli barevném prostoru. Výplně navíc mohou být i jako hladké přechody mezi dvěma barvami nebo na ně mohou být použity předem definované vzory. Objekty mohou obsahovat i průhlednost v několika různých režimech prolnutí. Barevné prostory se v PDF definují v souvislosti s využitím dokumentu. Lze použít všechny dnes používané barevné prostory týkající se konkrétních elektronických nebo tiskových zařízení (stupně šedi, duplex, RGB, CMYK, přímé barvy aj.). Průhlednost byla do specifikace PDF přidána až později (původní zobrazovací model PDF byl neprůhledný), avšak s ohledem na zpětnou kompatibilitu, aby mohla být případně ignorována ve starších verzích prohlížečů. Je-li průhlednost použita, nové objekty vzájemně působí na objekty dříve zobrazené, čímž se vytvoří efekt prolínání. Text je v PDF prezentován pomocí textových prvků, které definují, že znaky jsou vykresleny na určitých pozicích, přičemž jsou specifikovány pomocí kódování vybraného zdroje písma (fontu). Font jako objekt v PDF je popis digitálního typu písma. Soubory fontů jsou zakotveny v dokumentu, čímž se docílí, že text vypadá stejně na jakémkoli počítači, nehledě na to, jestli je zobrazený font instalován v jeho systému. Font je do dokumentu vložen buď jen jako množina použitých znaků (unembedded), nebo je vložena celá znaková sada (embedded). Vestavěné fonty vycházejí z široce používaných formátů písem (TrueType, Type 1, OTF). Stejně jako u vektorových objektů může mít i font různou tloušťku tahu a být vyplněn jakoukoli barvou, vzorem nebo průhledností. [5, 7]
Formát PDF a jeho využití
22
Bakalářská práce
Kódování charakterizuje způsob zobrazení znaků v textovém řetězci. Každý znak je mapován na konkrétní glyf vloženého fontu. V současné době se převážně používá kódování Unicode, což je tabulka znaků všech existujících abeced, obsahující více než 110 000 znaků. Metadata jsou v PDF definována mimo grafický obsah a nemají tak žádný vliv na vzhled dokumentu. Kromě standardních metadat (název, autor, copyright, použitá písma, zabezpečení, aj. – některé z těchto informací se generují automaticky a některé si může nastavit sám autor) obsahují PDF dokumenty i celou řadu dalších identifikátorů umožňujících zpracování a vzájemnou výměnu dokumentů v rámci pracovních postupů publikování. Od verze PDF 1.4 (Acrobat 5) mohou být metadata uložena v XML (eXtensible Markup Language), což je jazyk, který popisuje strukturu z hlediska věcného obsahu (nezabývá se vzhledem dokumentu). Zdrojový kód XML metadat lze importovat ve formátu XMP (Extensible Metadata Platform), který následně usnadňuje výměnu dat mezi aplikacemi či jejich sdílení mezi různými dokumenty. Interaktivní formuláře se v PDF tvoří dvěma navzájem neslučitelnými formami architektury. Za prvé to jsou prvky otevřeného standardu AcroForm (od verze PDF 1.2) založeného na objektech typu textové pole, zaškrtávací pole, přepínač atd. Druhým typem jsou interaktivní PDF formuláře založené na architektuře XML Forms Architecture (od verze PDF 1.5), kde se chování formulářových polí definuje objektově orientovaným skriptovacím jazykem JavaScript. Logická struktura dokumentu jsou informace o strukturálním obsahu (kapitoly, podkapitoly, obrázky, tabulky, poznámky atd.), který má být zahrnut vedle grafického obsahu. Tagované PDF má logickou strukturu prvků definovanou tak, že stejný text se přeformátuje a zobrazí i v jiné velikosti textu nebo stránky, např. v mobilním zařízení (čtečka apod.). Zabezpečení PDF dokumentů heslem se provádí např. pomocí algoritmu RC4 (ARCFOUR) nebo šifrovacích metod AES (Advanced Encryption Standard). Další ochranou dokumentu je autentický elektronický podpis. Pomocí přenosu důvěry lze ověřit totožnost tvůrce podpisu, což samozřejmě zajistí i důvěryhodnost obsahu dokumentu. Elektronický podpis se provádí pomocí asymetrické kryptografie (kryptografie s veřejným klíčem), např. algoritmem RSA (Rivest-Shamir-Adleman) nebo DSA (Digital Signature Algorithm). Komprimace obrázků a dalších dat může být v PDF dokumentu realizována pomocí ztrátových i bezztrátových algoritmů různých výrobců. Namísto celého PDF dokumentu lze však různě kombinovat komprimace jednotlivých objektů, přičemž struktura celého PDF dokumentu
Formát PDF a jeho využití
23
Bakalářská práce
zůstane vždy dostupná bez nutnosti dekomprimovat celý soubor a komprimované sekce se zpracují, až když je to potřeba. Používá se několik ztrátových i bezztrátových komprimačních algoritmů, např. JBIG2, JPEG, JPEG2000, LZW aj. Formát PDF má mnoho tváří a rozhodně není správné vnímat ho jen jako formát pro přenos tiskových dat, pro což byl původně určen. Možnosti formátu PDF jsou velmi rozmanité a s každou novou verzí se objevují nová využití v nejrůznějších profesích. [5, 7]
Vrstva bezpečnosti • elektronický podpis • zabezpečení • šifrování • integrita • certifikáty
Prezentační vrstva
XML Transport
plnohodnotná interpretace dokumentu tak, jak vypadá v papírové formě
možnost nést XML data pro integraci s dalšími systémy Strukturovaná data
Nestrukturovaná data
Business logika Vrstva příloh
• programový kód Java Script
• PDF soubory
• logika nad XML v dokumentu
• jakékoli jiné binární soubory (kontejner)
• konektory na externí datové zdroje
Vrstva pokynů pro Adobe Reader • komentování • ukládání formulářů • podepisování • vkládání příloh
Obr. 18 Obsah jednotlivých logických vrstev PDF. [zpracoval autor]
Formát PDF a jeho využití
24
Bakalářská práce
7 Standardy a normy formátu PDF 7.1 PDF/X – mezinárodní standard pro předávání tiskových dat Důvody pro mezinárodní standardizaci jakékoliv činnosti či výrobku jsou celkem zřejmé. U standardních věcí jsou předem známy jejich parametry, takže lze na sebe dobře navazovat různé technologické etapy. Standardy přicházejí i do grafického průmyslu, přestože se jim to daří velmi pomalu a nejsou vždy přijímány s nadšením. Je to dáno obrovským konzervatismem zejména v tiskárnách, které si již dlouhé roky rozhodují o kvalitě samy, obvykle metodou „pokus-omyl“. Přijmout jakoukoli tiskovou normu jim dělá problémy. Stejně tak pomalu se prosazují standardy v oblasti výměny tiskových dat ve formátu PDF. Tyto standardy musejí reflektovat různá východiska a pracovní postupy v předtiskové přípravě, proto se jich kodifikovalo několik podle toho, jak např. pracují s barevnými prostory. Protože existují rozdílná workflow (pracovní postupy), je i standardů PDF/X více. PDF/X je podmnožinou Adobe PDF a souhrnně označuje rodinu mezinárodních standardů zaměřených na spolehlivou výměnu tiskových dat, přičemž jednotlivé standardy jsou publikovány jako části mezinárodní normy ISO 15930. Nejde tedy o žádný nový formát, standardy PDF/X pouze omezují či zakazují některé prvky formátu PDF, aby zajistily, že soubor neobsahuje prvky nepotřebné pro tiskovou produkci, které by mohly ohrozit jeho korektní zpracování na modulu RIP. PDF/X se také muselo vypořádat s nejčastějšími problémy při výměně tiskových dat, a proto jiné vlastnosti PDF naopak vyžaduje (například vkládání písem).
Mezi hlavní cíle PDF/X patří: • Snížení počtu chyb v předtiskové přípravě a při nátiscích (doporučení korektních postupů a vyloučení těch špatných). • Zlepšení barevné shody mezi nátisky a tisky (automatická komunikace o barevnosti pomocí identifikátorů výstupních podmínek a zlepšení predikovatelnosti konverzí barev). • Rychlé, efektivní a automatizované zpracování dat v momentě obdržení dat (pokud dokonale známe typ zdrojových dat, lépe se připravíme na jejich následné zpracování). • Vzdělávání tvůrců tiskových dat (definice správného typu tiskových dat je hotova, existují i návody, normy a doporučení k těmto standardům). [7]
Formát PDF a jeho využití
25
Bakalářská práce
Obr. 19 Přehled standardizovaných prvků formátu PDF/X, určeného pro přenos dat v tiskové produkci. (Pozn.: Trapping nemá ekvivalentní český překlad. Tímto termínem se označuje přeplňování (nasilování) velikostí grafických objektů aplikované mezi dvěma přilehlými barvami.)
7.2 PDF/X-1a Norma definující PDF/X-1a:2001 je základním stavebním kamenem předtiskové přípravy. Je vyzkoušená, funkční a dobře pokrývá různé potřeby přípravy tiskové produkce.
Přehled nejvýznamnějších požadavků PDF/X-1a:2001 • Všechna písma musí být vložena v souboru a příjemce je má při interpretaci souboru použít. • Tiskové prvky souboru PDF/X-1a:2001 musí připraveny pro jedny tiskové podmínky CMYK určené v souboru jako tzv. záměr výstupu. Povoleny jsou i přímé barvy. Zakázána jsou předseparovaná PDF, kde jsou jednotlivé výtažky na samostatných stránkách. Prostřednictvím odpovídající vlastnosti souboru PDF musí být určeno, zda byl, nebo nebyl proveden trapping. • Každá stránka musí obsahovat rámeček média (MediaBox) a vymezovací rámeček čistého formátu (TrimBox) nebo oblast grafiky (ArtBox) – ne však Trim Box a ArtBox současně. Pokud dokument obsahuje spadávku, má být určena rámečkem spadávky (BleedBox). Norma se nezabývá velikostí či odstupy těchto rámečků, tomu se dále věnují specifikace PDF/X Plus. • Soubor PDF/X musí být označen jako PDF/X. Jakékoliv zabezpečení je v PDF/X-1a zakázáno. Zakázány jsou také fragmenty postscriptového kódu, Java-Script a akce. [7]
Formát PDF a jeho využití
26
Bakalářská práce
• Anotace, tedy i interaktivní prvky (formuláře) pak mohou být pouze vně vymezovacích rámečků grafiky, čistého formátu či spadávky. To znamená, že PDF/X prakticky nemůže obsahovat například audiovizuální snímky. • Soubor PDF/X-1a:2001 musí být kompatibilní s verzí PDF 1.3. Celý standard je postaven na PDF 1.3 a všechno, co standard nijak blíže neurčuje nebo nevylučuje, má být zpracováno tak, jak je v této verzi definováno. • Je vyžadován identifikátor výstupních podmínek, tedy informace, pro jaký tiskový proces s jakou barevností byl dokument zhotoven. Soubor PDF/X-1a:2001 musí obsahovat ICC profil. Pokud jsou ale tiskové podmínky uvedeny v registru ICC, přítomnost ICC profilu není vyžadována. • Standard PDF/X-1a:2001 (ISO 15930-1:2001) byl revidován v roce 2003 a vydán jako ISO 15930-4:2003 (PDF/X-1 a:2003). Tato revize se však příliš neprosadila, proto je nadále doporučeno užívání standardu z roku 2001. [7]
7.3 PDF/X-3 Navazujícím standardem je PDF/X-3, který se od PDF/X-1a odlišuje jedinou věcí, a sice tím, že povoluje obrazy i v dalších barevných prostorech než jen CMYK (CIE Lab, RGB aj.), avšak za předpokladu, že jsou kolorimetricky definovány (typicky ICC based – barevný prostor objektu tagovaný daným ICC profilem). Používá se proto ve workflow plně řízeným správou barev. Předpokládá výměnu souboru, který obsahuje vše potřebné (písma, obrazy), bez předchozí domluvy mezi odesílatelem a příjemcem souboru, stejně jako u PDF/X-1a. I tento soubor musí mít definovány určité výstupní podmínky, a to CMYK, RGB nebo odstíny šedé. To je další z rozdílů proti PDF/X-1a, jehož výstupní podmínky jsou vždy pouze CMYK, a to i v případě, že jde o jednobarevný tisk. Každý objekt v PDF/X-3 musí být připraven pro určené výstupní podmínky nebo mít barevnost přesně definovanou kolorimetricky. Ve výsledku tak můžete mít texty v černé (K), ale fotografie třeba v režimu CIE Lab. Zatímco PDF/X-1a:2001 předpokládá, že při předávání dat jsou v dokumentu obsaženy pouze výtažky barev, které se skutečně mají tisknout, PDF/X-3:2002 přímo uvádí, že veškeré výtažky definované v souboru jsou na výstupu samostatné. Proto si tvůrci tiskových souborů musí dávat velký pozor na „zapomenuté“ přímé barvy. [7]
Formát PDF a jeho využití
27
Bakalářská práce
7.4 PDF/X-4 a PDF/X-5 Novými výzvami pro zpracovatele digitálních dokumentů PDF se staly standardy PDF/X-4 a PDF/X-5, které dovolují použití „živé“ průhlednosti a vrstev. Standardy PDF/X-1a a PDF/X-3 dnes stále dominují a předpokládá se, že velký význam budou mít ještě dlouhou dobu. Tvůrci standardů se proto rozhodli, že nové PDF/X, zavádějící významné změny v předávání tiskových dat, nebudou představeny jako revize původních verzí PDF/X-1a a PDF/X-3, ale ponesou zcela jiné označení, což navíc zabrání různým nedorozuměním. PDF/X-4 a PDF/X-5 jsou standardy, které oba vycházejí z PDF verze 1.6 a povolují průhlednost při předávání tiskových dat a vrstvy v PDF. Zpracování průhlednosti by již nemělo znamenat žádná překvapení, protože výsledky slučování průhledností při exportu tiskových dat do PDF se ukázaly být již dostatečně kvalitní. [7]
7.5 Další standardy PDF Unikátní vlastnosti formátu Adobe PDF zapříčinily, že se o něj zajímají různorodé skupiny uživatelů i z jiných oborů, kteří, podobně jako tiskový průmysl s PDF/X, dospěli k potřebě standardizace vytváření, distribuce a uchovávání dat ve formátu PDF. Některé standardy mohou být zajímavé pouze pro uživatele, jiné zase jen pro tvůrce publikací. Každopádně, nejen v tiskovém průmyslu, ale i mnoha dalších oborech se standardy PDF již používají nebo brzy začnou používat. [7]
7.6 PDF/A – dlouhodobá archivace dokumentů PDF Soubory PDF byly v obchodní praxi a ve státní správě používány pro výměnu a dlouhodobou archivaci dokumentů již dříve. Mezinárodní standard PDF/A-1 je založen na PDF verze 1.4 a má stanovit jasná pravidla, která zaručí pohodlné používání archivovaných dokumentů i v budoucnosti, včetně schopnosti zobrazit je správně i za několik let v programech podporujících PDF/A-1. Dokument PDF/A musí být naprosto nezávislý na okolí, jinak by jeho využitelnost pro archivaci byla velmi nízká. Proto musí obsahovat veškerý obsah potřebný pro jeho zobrazení – především vložená písma a barvy (nezávislé na zařízení). Zakázány jsou veškeré odkazy na externí obsah PDF (dílčí objekty, které by měly být načteny z dat mimo soubor PDF, ale zobrazeny při jeho prohlížení).
Formát PDF a jeho využití
28
Bakalářská práce
Hypertextové odkazy směřující z textu mimo dokument PDF/A však umístěny být mohou. Není rovněž povoleno vkládání příloh, audio-video souborů nebo použití JavaScriptu. Dokument nesmí být zabezpečený a nesmí obsahovat průhlednost. Za předpokladu, že jsou splněny definované požadavky PDF/A, může dokonce dokument obsahovat i digitální podpis. Standard PDF/A-1 obsahuje dvě úrovně shody se standardem, které se liší především přístupem k textu. Úroveň PDF/A-1a vyžaduje, aby dokument obsahoval strukturu a další data, které zajistí schopnost vyhledávat v dokumentu PDF a dovolí jeho obsah použít znovu. PDF/A-1a je tedy tagované PDF, které si zachovává informaci o obsahu, struktuře textu a přirozeném pořadí čtení, takže obsah může být snadno vyhledáván, procházen nebo třeba i čten nahlas. Úroveň PDF/A-1b má zajistit schopnost dlouhodobé reprodukce vizuální podoby dokumentu. Další verze standardu (PDF/A-2) by měla v PDF/A zpřístupnit i některé náročnější prvky PDF. Dne 1. července 2008 byl formát PDF/A (vycházející z PDF 1.7) publikován jako standard ISO 32000-1:2008. [7]
Obr. 20 Pro standardizovaný archivační formát PDF/A se ujal slogan „Jako vytesané do kamene zůstanou vaše dokumenty ve standardu PDF/A“.
Formát PDF a jeho využití
29
Bakalářská práce
7.7 PDF/E – PDF pro inženýrství PDF/E vychází z PDF verze 1.6 a jeho cílem je vytvořit vhodný standard pro vývoj a výměnu projektové CAD dokumentace. Mezi očekávané efekty patří finanční úspory a zrychlení procesů v inženýrských oborech. PDF/E definuje podmínky pro přesnou výměnu a tisk technické dokumentace, komentování i zahrnutí komplexního 2D i 3D obsahu do dokumentů PDF, včetně metadat k jednotlivým objektům. Vrstvy 2D technických výkresů lze převést do vrstev v PDF dokumentu, které lze skrývat nebo zobrazovat stejně jako v původním CAD programu. Do PDF dokumentu lze také integrovat 3D objekty tak, že je v něm umožněna manipulace s objektem, zobrazení jeho perspektivy či případně rozklad objektu na jednotlivé součásti. Zajištěno je i zabezpečení PDF/E dokumentů, které je v inženýrství velmi důležité. [7]
2
150 70
B
8
60
R3
88
2 R1
2 R1
7
35 48
R3
R12
6
5
A
25
R6
A
R6
4
3
10
1
B
A 50
A 32
90 126
C
C
12
25
10 R6 10
10
R2 5
D
66
D
20
38 E
16
64
16
28
SECTION A-A
UNLESS OTHERWISE SPECIFIED: DIMENSIONS ARE IN MILLIMETERS SURFACE FINISH: TOLERANCES: LINEAR: ANGULAR: NAME
DEBUR AND BREAK SHARP EDGES
FINISH:
SIGNATURE
DATE
REVISION
TITLE:
Bevel Gear Support
DRAWN CHK'D APPV'D
F
DO NOT SCALE DRAWING
MFG Q.A
MATERIAL:
6061 Alloy 1
2
3
4
53 Bevel Gear Support
DWG NO.
WEIGHT: 666.75
SCALE:1:1.5
A3
SHEET 1 OF 1
Obr. 21 Ukázka 2D/3D strojírenského CAD výkresu. [9]
Formát PDF a jeho využití
30
Bakalářská práce
8 Zabezpečení PDF dokumentů Ochrana počítačů, sítí a dat se v dnešní době soustředí zejména na ochranu proti „vnějšímu nepříteli“. Jde tedy o ochranu proti neoprávněnému přístupu do interní počítačové sítě, ochranu proti virům, proti spamu nebo proti odchycení komunikace s vnějším subjektem. Zcela určitě se jedná o velmi důležité prvky zabezpečení, bez kterých by rozvoj informačních technologií prakticky nebyl možný, neboť únik či jiné zneužití některých informací je velmi nežádoucí. Avšak co je to platné, když všechny výzkumy ukazují, že největší nepřítel je ten vnitřní. Jakmile má totiž někdo do systému nebo aplikace přístup, tak může informace získat, nakopírovat a odnést. Takové informace poté v podstatě již nic nechrání. Jejich ochrana je vcelku složitá, počínaje různými hesly a konče organizačními opatřeními typu prohlížení pouze na konkrétním počítači uvnitř kanceláře, který má znemožněno cokoliv kopírovat. Tyto metody mají svá úskalí, a hlavně jsou vždy vhodné jen pro některé typy informací. Řešení založené na PDF formátu nabízí několik typů zabezpečení.
8.1 Kontejner (obálka) Formát PDF lze kromě přesného popisu stránky využít zároveň i jako kontejner (obálku), v němž může být jako příloha vložen jakýkoli binární soubor z libovolné aplikace. Celá PDF obálka se navenek tváří jako běžný PDF soubor, který samozřejmě může být zabezpečen stejnými způsoby jako jiné PDF dokumenty, jejichž zabezpečení je všeobecně postaveno na uznávaných standardech pro elektronický podpis, šifrování a integritu. Zásadní výhodou takové PDF obálky je způsob zacházení s vloženými přílohami. Ty není možné z obálky vyjmout, oprávněná osoba však s nimi může pracovat. Zabezpečení PDF dokumentů lze dle potřeby řešit různými způsoby.
8.2 Heslo Heslo je bezesporu nejpoužívanější způsob zašifrování obsahu PDF dokumentu. Používá se v případech, kdy je záměrem, aby dokument nemohl číst či pozměnit nikdo jiný, než komu je sděleno heslo. Heslem se dá v dokumentu zamezit např. kopírování, editaci a tisku. Nevýhodou je ale nutná správa hesel a také fakt, že spoustě uživatelů nedělá žádný problém sdělit heslo někomu cizímu. [10]
Formát PDF a jeho využití
31
Bakalářská práce
8.3 Vodoznak Poněkud odlišnou ochranu PDF dokumentu poskytuje ochrana vodoznakem. Využívá se především tam, kde je žádoucí „znehodnotit“ dokument nějakým podkladovým textem nebo grafickým znakem tak, aby z dokumentu po vytištění bylo zřejmé, kdo je např. jeho autorem či jaká je klasifikace dokumentu (Tajné, Schváleno, Zamítnuto, Důvěrné, Návrh, Vzor atd.). Tuto ochranu je výhodné kombinovat zároveň s ochranou heslem.
8.4 Elektronický (digitální) podpis Elektronický podpis je náhrada klasického vlastnoručního podpisu. Elektronickým podpisem lze zabezpečit PDF dokument tak, že na základě veřejných klíčů ověřených osob jsou poté zodpovědné osoby schopny k dokumentu přistupovat pomocí svého privátního klíče. Součástí elektronického podpisu je identifikace toho, kdo podpis vytvořil, což zároveň slouží k ověření, zda je podpis platný. Podporovány jsou různé standardy elektronického podpisu včetně tzv. zaručeného elektronického podpisu. U každé osoby lze rovněž určit, jakým způsobem může s dokumentem nakládat. Zabezpečení je podstatně silnější, než u zabezpečení heslem a tím pádem tedy i možnost úniku informace je nižší, neboť dát někomu svůj privátní klíč elektronického podpisu je již méně obvyklé, než poslat heslo.
8.5 Rights Management (správa práv dokumentu) Rights Management je způsob zabezpečení založený na unikátní serverové technologii společnosti Adobe, nazvané LiveCycle ES (Enterprise Suite). Vlastnosti tohoto systému nabízejí jeho rychlé a efektivní nasazení jako integračního nástroje do stávající podnikové IT infrastruktury. Adobe LiveCycle ES je modulární systém řešení určených pro automatizaci procesů, který umožňuje plně automatické vytváření PDF dokumentů a zároveň nad nimi poskytuje dynamickou kontrolu.
Mezi základní automatizované funkce patří např.: • generování PDF souborů z jiných aplikací a formátů (MS Office, bmp, jpg, png, tiff aj.) • optimalizace vytvořeného PDF souboru • automatické rozpoznání skenovaného textu (OCR – Optical Character Recognition) • spojování a rozdělování PDF dokumentů • vkládání příloh a vodoznaků do PDF dokumentů [10]
Formát PDF a jeho využití
32
Bakalářská práce
Součástí technologie Adobe LiveCycle ES je serverová služba s názvem „Policy Server“, která se obvykle nachází ve vnitřní síti organizace. Může ale být i mimo organizaci a zabezpečeným způsobem je dosažitelná z internetu. Je napojena na stávající správu uživatelů v organizaci nebo může pracovat nad vlastní vytvořenou správou uživatelů. Pro chráněné dokumenty jsou na serveru uloženy zásady zabezpečení (avšak nejsou zde uloženy vlastní PDF soubory), která mohou být na třech úrovních: • uživatelé – zde je definováno, kdo může k dokumentu přistoupit a co může s dokumentem dělat; • časová platnost – slouží k definici období, ve kterém dokument platí; • off-line režim a monitorování dokumentu – zde se nastavuje, jak se bude dokument chovat v off-line režimu a zda se bude monitorovat práce s ním. Princip činnosti je takový, že pokud někdo chce otevřít dokument (např. v Adobe Readeru), na který jsou aplikovány bezpečnostní zásady, je vyzván k autorizaci na serveru (Rights Manager). Musí tedy v tu chvíli být připojen k internetu. Adobe Reader si sám zkontroluje, zda je uživatel připojen k síti a provede buď autorizaci vůči serveru nebo v rámci nastavených pravidel otevře dokument v off-line režimu. V případě, že práva k dokumentu nejsou platná, uživatel je na tuto skutečnost upozorněn a jeho přístup je zamítnut. Velmi důležité také může být sledování dokumentu. Pokud je tato vlastnost nastavena, server vede podrobný protokol o přístupech k dokumentu a co s ním bylo prováděno. Současně se kontroluje i časová platnost dokumentu, což je informace, která určuje, jak dlouho může oprávněný uživatel po autorizaci na konkrétním počítači otevřít dokument v režimu off-line. Existuje mnoho způsobů využití tohoto způsobu ochrany citlivých informací, přičemž vždy se autor může dozvědět, kde se takto zabezpečený dokument právě nachází, v kolika kopiích byl pořízen atd. Využitím Rights Managementu lze chránit elektronické dokumenty velmi efektivním způsobem.Všechny takto automaticky vzniklé PDF dokumenty jsou pro koncového uživatele samozřejmě vždy dostupné prostřednictvím bezplatně šířeného Adobe Readeru a navíc, je-li použita funkcionalita „Rozšíření funkcí v Adobe Readeru“ (Reader Extensions), lze PDF dokumenty v Adobe Readeru např. opatřovat poznámkami, vyplňovat formulářová pole, elektronicky podepisovat atd. [10]
Formát PDF a jeho využití
33
Bakalářská práce
9 Inteligentní PDF dokumenty Inteligentní PDF dokumenty jsou určeny pro korporátní účely a zakládají se na výše zmíněné technologii Adobe LiveCycle ES (Enterprise Suite). Dnešní IT manažeři jsou postaveni před mnoho problémů. Lidé z vedení společností, v očekávání snížení rozpočtů, investovali do drahých podnikových aplikací určených pro automatizaci klíčových podnikových procesů. IT týmy se snaží tyto klíčové systémy udržovat a přizpůsobovat obchodním manažerům, kteří neustále mění priority. Provádění jakýchkoli změn primárních systémů vyžaduje čas a peníze, proto se organizace často uchylují k neefektivním manuálním zástupným řešením pro procesy, kde určití pracovníci, podílející se na procesu, nemají do některé z klíčových podnikových aplikací přístup. To platí i pro lidi, nacházející se mimo podnikovou intranet síť, jako např. partneři, zákazníci či dodavatelé. Kromě toho, že se týmy snaží umožnit manažerům efektivně vytvářet a upravovat automatické dokumenty, jako jsou např. faktury, výpisy aj., musí zároveň umožnit jednotlivcům uvnitř i vně organizace sdílet klíčové dokumenty, aniž by tito museli mít stejný software a hardwarové systémy. Pro splnění svých strategických obchodních cílů podniky potřebují nalézt způsob, jak optimálně využít značné investice vložené do podnikových aplikací, které musí být flexibilní, aby se dokázaly přizpůsobit měnícím se potřebám obchodních manažerů.
9.1 Propojení lidí, procesů a aplikací pomocí inteligentních dokumentů Dokumenty jsou důležitou součástí obchodních procesů a primární způsob komunikace s lidmi. Dokumenty také poskytují zjednodušené rozhraní pro ty uživatele, kteří sice v klíčových podnikových systémech nemají účet, avšak jsou přímo napojeni do některého z procesů a i potřeby těchto uživatelů je nutné snadno měnit či přizpůsobovat potřebám firmy. Dokumentový formát PDF umožňuje organizacím využívat bezpečné a spolehlivé inteligentní dokumenty jako preferovaný formát pro zaměstnance, zákazníky a partnery v interakci s podnikovými aplikacemi při každém kroku obchodního procesu. S inteligentními dokumenty mohou podniky snadno prezentovat personalizovaný obsah umožňující komplexní interní i externí spolupráci. S jejich pomocí lze rovněž zajistit výměnu dat a transakcí mezi základními aplikacemi či mezi osobami nebo skupinami osob a dále také archivovat informace v tomto standardizovaném formátu. [11]
Formát PDF a jeho využití
34
Bakalářská práce
9.2 Zefektivnění obchodních procesů Díky využití výkonu a pružnosti inteligentních dokumentů, mohou podniky překonat problémy spojené s přizpůsobením základní aplikace pro obchodní potřeby. Platforma PDF pro inteligentní dokumenty řeší čtyři typy dokumentů zaměřené na podnikové procesy: • Vytváření kvalitních dokumentů z podnikových aplikací. Podniky potřebují vytvářet komplexní dokumenty, jejichž obsah se snadno sdělí zainteresovaným jednotlivcům. Bohužel, většina klíčových podnikových systémů byla záměrně vytvořena tak, aby produkovala pouze základní dokumenty. Tyto systémy tak postrádají nástroje, kterými lze vytvářet vlastní kvalitní dokumenty. Potíže se navíc umocní, pokud data v souhrnném dokumentu pochází z více zdrojů. Doprogramovat do systému vhodné nástroje je nejen velice nákladné, ale i obtížné a tím pádem neefektivní. Automatizované řešení na platformě PDF dokáže v dokumentu sloučit obsah z podnikových aplikací do předem definovaných šablon pro vygenerování personalizovaných dokumentů, které jsou následně použitelné na jakémkoli zařízení. • Zefektivnění spolupráce mezi procesy. Dosažení požadované úrovně spolupráce několika podniků může být obtížný úkol, protože podnikové dokumenty musí zároveň proudit jak uvnitř, tak i mezi organizacemi. Všichni zainteresovaní účastníci však nemusí mít stejné aplikace nebo stejně zkonfigurovaný systém pro podporu specializovaných formátů souborů. Naopak inteligentní dokumenty mohou být vytvořeny téměř z jakéhokoli zdroje, od standardních kancelářských aplikací (např. MS Office), přes standardní grafické aplikace až třeba po specializované CAD nástroje. I takovéto dokumenty lze vždy, spolehlivě zobrazit na libovolném počítači nebo zařízení většiny uživatelů. Ti pak mohou v dokumentu např. provést revize, připomínkovat jej či schvalovat. Toto řešení prokazatelně zefektivní spolupráci mezi procesy napříč různými skupinami uživatelů. • Sběr dat efektivněji uvnitř i vně organizace. Pro aktivní komunikaci s jednotlivci v rámci celého podniku, včetně partnerů a zákazníků, musí organizace nabídnout způsob, kterým lze informace, které pochází z různých kanálů a zařízení, automaticky ověřit a archivovat. Řešení společnosti Adobe nabízí řadu možností pro sběr dat on-line nebo off-line z různých systémů a klientských zařízení. Vložením obchodní logiky do dokumentu (např. různé výpočty a validace) umožní získat přesnější či úplné údaje, které tak vzápětí mohou být snadno integrovány do podnikových aplikací. [11]
Formát PDF a jeho využití
35
Bakalářská práce
• Automatizace obchodních procesů, které neřídí základní systémy. Podniky dnes bojují s tím, jak zvýšit efektivitu příslušných interních i externích uživatelů v každém kroku obchodního procesu. Řešením je automatizovat procesy dokumentů na základě interakce mezi zaměstnanci, zákazníky a partnery a zároveň integrovat získaná data zpět do základních systémů. Řešení společnosti Adobe má schopnost navázat na obchodní pravidla založené na rolích, takže podniky mohou automatizovat, sledovat a efektivněji spravovat procesy, které potřebují sdílet s osobami nacházejícími se uvnitř i vně organizace. [11]
Obr. 22 Schéma oběhu inteligentních dokumentů na platformě Adobe PDF. [11] Dokumenty zůstanou zásadní metodou komunikace, spolupráce a provádění transakcí se zákazníky, partnery a zaměstnanci. Nicméně, aktuální procesy jsou často na bázi nestrukturovaných dokumentů, které nejsou integrovány do podnikových aplikací, což má za následek neefektivnost, zpoždění a zvýšení nákladů.
9.3 Architektura inteligentních dokumentů Platforma Adobe PDF pro inteligentní dokumenty zahrnuje tři klíčové prvky: vlastní inteligentní dokumenty, univerzální klienty a sadu služeb dokumentu, což jsou související technologie, které vytváří inteligentní dokumenty a integrují je do obchodního procesu podniku. Inteligentní dokumenty kombinují vlastnosti běžných „statických“ dokumentů s obchodní logikou schopnou dopravit data do jiných systémů. Dokument může být zpřístupněn pomocí univerzálních klientů, jako je například bezplatný Adobe Reader nebo webové prohlížeče. [11]
Formát PDF a jeho využití
36
Bakalářská práce
Univerzální klient je přístupový bod pro inteligentní dokumenty, který umožňuje, aby každá osoba, která používá Adobe Reader nebo webový prohlížeč mohla být v interakci s inteligentními dokumenty. Např. bezplatně šířený Adobe Reader s přibližně miliardou stažených kopií po celém světě poskytuje uživatelům vysoký komfort pro prohlížení inteligentních dokumentů a to jak on-line, tak i off-line na všech hlavních počítačových platformách a zařízeních – např. systémy Windows, Mac OS, Linux, UNIX a různé mobilní platformy (Android, Symbian, Java aj.). Sada služeb dokumentu umožňuje tvorbu a správu inteligentních dokumentů a integraci dat z/do podnikových aplikací (např. CRM, ERP, DCM atd.). [11]
Obr. 23 Vrstvy vnitřní architektury inteligentních PDF dokumentů. [11] •
Prezentační. Inteligentní dokumenty jsou kvalitní a díky vizuální věrnosti odrážejí záměr autora, včetně veškerého původního rozvržení, designu a typografických prvků, takže dokumenty vypadají úplně stejně jak v elektronické podobě, tak i při tisku.
•
Obchodní logika. Inteligentní dokumenty obsahují také obchodní logiku (výpočty a validace), čímž se snižuje potřeba získávat proměnné informace jinde. Tímto procesem se zkracuje doba zpracování a eliminují případné chyby.
•
XML data. Díky podpoře standardních XML dat, včetně uživatelem definovaných schémat, mohou inteligentní dokumenty snadno přenášet data z/do podnikových aplikací.
Platforma Adobe pro inteligentní PDF dokumenty poskytuje firmám finančně zajímavé řešení, neboť je již dále nenutí navyšovat investice do svých stávajících klíčových aplikací. Díky inteligentním PDF dokumentům mají podniky možnost rychle se přizpůsobit měnícím se potřebám různých obchodních manažerů, čímž tak mohou účinněji a efektivněji plnit své obchodní potřeby. [11]
Formát PDF a jeho využití
37
Bakalářská práce
9.4 Nasazení inteligentních dokumentů Informační technologie výrazně změnily v posledních několika letech náš každodenní život a to jak soukromý, tak i profesní. Komunikujeme rychleji a efektivněji, tok informací se zrychlil a zautomatizoval. Avšak navzdory rozmachu elektronických procesů, převážná část obchodních transakcí stále probíhá klasickou formou, tedy prostřednictvím papírových dokumentů a formulářů. Zdá se, že papír zůstane našim věrným společníkem i přes ambiciózní odhady analytiků, kteří v minulosti předpověděli éru digitálních dokumentů a bezpapírové kanceláře. Je tomu tak např. z těchto důvodů: vlastnoruční podpis, dodatečné papírové podklady, schválení dokumentu třetí stranou atd. Stále také převládá větší důvěra lidí k dokumentům, které jsou řádně vytištěné a podepsané. Nasazení inteligentních PDF dokumentů odpovídá klasickému „papírovému“ procesu a směřuje k jedinému cíli, který je stejný jak pro autora, tak i pro uživatele, a sice jednoduchost a přívětivost. Nemusí se při jejich nasazení ani nijak zvlášť zasahovat do stávající IT infrastruktury, přičemž úspory, oproti původním (papírovým) procesům, jsou v řádu desítek procent. Inteligentní PDF dokumenty jsou snadno dostupným řešením, neboť jsou jednoduché na vytvoření, používání i archivování, a dokážou vyřešit většinu slabých míst podnikových dokumentačních procesů. Největší, avšak neopodstatněnou, překážkou jejich zavedení je ve většině případů obava z přílišné složitosti a nedůvěra k moderním technologiím, které u zaměstnanců přetrvávají více než v jiných oborech. Inteligentní PDF dokumenty přitom splňují veškeré podmínky, které jsou pro zaměstnance nezbytné, jako je bezpečnost, soulad s legislativou, zacházení s citlivými daty aj. Navíc, díky tomu, že jde o elektronické dokumenty, mohou být obohaceny o funkce, které papír mít nemůže. Doposud většinou platí, že pokud má mít informace nějakou váhu, nějaký dlouhodobě, nezměnitelně a bezpečně uložený význam, tak ji svěříme papíru. Papír např. podepíšeme, někam pošleme nebo uložíme. A totéž přeci chceme i od elektronických dokumentů! Chceme, aby měly stejné parametry jako papír! S inteligentními PDF dokumenty a jejich nástroji lze získat komplexní přehled a kontrolu nad podnikovými dokumenty. Nezáleží přitom na tom, v jakém informačním systému jsou uložena zdrojová data, základním nástrojem se stanou inteligentní PDF dokumenty. [10]
Formát PDF a jeho využití
38
Bakalářská práce
10 Inteligentní PDF formuláře Jedna z důležitých součástí inteligentních PDF dokumentů jsou inteligentní PDF formuláře, jejichž základ je rovněž postaven na technologii Adobe LiveCycle ES (Enterprise Suite). Inteligentní formuláře PDF jsou klíčem k dosažení vyšší úrovně zpracování procesů, neboť dokumenty jsou pak pro všechny procesy jednotné a srozumitelné. V oblasti lidských zdrojů neustále platí, že: „co je psáno, to je dáno“. Většina procesů probíhá stále stejnou, tj. papírovou cestou. Výsledkem jsou vysoké náklady, zbytečné zatěžování zaměstnanců, dlouhá doba zpracování, chyby během procesů, zanedbávání dalšího vzdělávání a rozšiřování kompetencí. Podnikové procesy se týkají každého zaměstnance podniku, ať má nebo nemá přístup k IT systémům. Kromě toho existuje celá řada dalších osob a externích partnerů, kteří jsou do mnoha procesů začleněni. Mezi těmito účastníky stále ještě v mnoha případech probíhá komunikace v papírové formě. Avšak papírová forma formulářů bývá v každém pohledu slabé místo ve všech procesech. Vytvoření předloh, formulářů, potvrzení a dalších dokumentů představuje náročné programování v informačních systémech. Každá změna pak vyžaduje nutný kontakt s oddělením IT a zbytečně zdlouhavé úpravy. Ještě slabším místem je, že vyplňování papírových formulářů je značně chybovou součástí v celém procesu oběhu dokumentů a vyžaduje opakované zadávání stejných dat, což navozuje zbytečné chyby z nepozornosti. Externí účastníci procesů obvykle nemají přístup do interního systému, ale i u nich je nutné vzájemné přeposílání různých dokumentů, jejich vyplňování, potvrzování a zpětné zasílání. Pokud úprava nebo aktualizace personálního dotazníku trvá několik hodin až dní, potom se doplnění nebo rozšíření personálního procesu protahuje na několik dní až týdnů. Inteligentní PDF formuláře nabízejí nové možnosti, které se dají využít komplexně nebo o ně pouze rozšířit stávající systémy. Takové formuláře si pak automaticky načtou ze systému potřebné informace a následně již vše probíhá v elektronické formě. Případné změny v dokumentech se provádějí přímo a není nutná žádná zdlouhavá úprava hluboko v informačním systému nebo, co je snad ještě horší, vytištění formuláře, jeho vyplnění, potvrzení a zaslání zpět v papírové formě. Elektronická korespondence a možnost digitálního podpisu částečně odstranily nedostatky papírových procesů, ale to je pouze částečné řešení, protože převážná většina obchodních transakcí nebo úředních úkonů vyžaduje identifikaci v podobě ručního nebo elektronického podpisu. [10]
Formát PDF a jeho využití
39
Bakalářská práce
Dochází tak k situacím, kdy např. banky, pojišťovny, úřady a další instituce sice na svých internetových stránkách nabízí elektronické dokumenty a formuláře ke komunikaci se zákazníkem, ale kvůli tomu, že většina lidí nevlastní identifikační technologie k digitálnímu podpisu, veškerá snaha institucí končí tím, že si klient formulář vytiskne, ručně vyplní, podepíše a poštou odešle adresátovi. Ten pak sice má podepsaný originál od klienta, ale všechny získané údaje musí ručně přepisovat do počítače, čímž se vlastně znehodnotí smysl elektronické komunikace. Pro společnosti, které denně zpracovávají velké množství údajů z formulářů, jako jsou např. úřady státní správy, papírové procesy doslova brzdí efektivitu, protože se musí zaměstnávat personál pouze kvůli manuálnímu přepisování údajů z formulářů do počítačů a následné kontrole, jestli se někde nevyskytla chyba. Řešení tohoto problému se paradoxně neskrývá v úplném odbourání vytištěných papírových dokumentů, ale v jejich inteligentním rozšíření tak, aby i z vytištěné stránky bylo možné jednoduše převést údaje do digitální podoby. To vše samozřejmě za předpokladu, že vyplněný elektronický formulář a následně vytištěný papírový dokument se obsahově i vizuálně naprosto shodují. Tedy situace, kdy si uživatel stáhne elektronický formulář, vyplní ho v počítači, vytiskne, podepíše a odešle tvůrci formuláře, který si ho během chvíle převede zpátky do původního elektronického formátu s tím, že dokument již bude obsahovat aktualizované údaje vyplněné klientem. Tuto možnost nabízí právě inteligentní PDF formuláře využívající šifrování údajů v čárových kódech různých norem (2D Bar Code). Takové formuláře při vyplňování políček automaticky převádějí zapsané informace do čárového kódu, který je vizuální součástí PDF dokumentu. Proměnné informace jsou tedy zaznamenány v podstatě třikrát, jednou v čitelné formě v políčkách formuláře jako text, podruhé zakódované v čárovém kódu a potřetí jako XML data, což následně zajistí větší kompatibilitu s různými systémy nebo dalšími formáty, které vlastník formuláře interně využívá. V praxi to tedy vypadá tak, že uživatel si otevře inteligentní PDF formulář ve zdarma dostupném Adobe Readeru a vyplní požadované údaje, které se automaticky převedou do čárového kódu. Tyto úpravy může udělat, aniž by byl připojen k internetu. Pak stačí vyplněný a uložený formulář buď poslat elektronicky nebo jej vytisknout a odeslat poštou. Příjemce následně buď z elektronického formuláře načte XML data, anebo z papírového dokumentu standardním skenerem naskenuje čárový kód, z nějž se zašifrovaná data dekódují zpět do elektronické podoby
Formát PDF a jeho využití
40
Bakalářská práce
původního formuláře. Při úspěšném načítání čárového kódu se zachycená data 100% shodují s informacemi, které vyplnil uživatel. Odpadá tak potřeba pracně kontrolovat shodu vytištěného dokumentu s elektronickým. Tuto technologii ocení organizace, které často sbírají data od svých klientů, dále je zpracovávají v elektronické formě a zároveň mají povinnost uchovávat ručně podepsané originály např. z archivačních důvodů. Úřady tak mohou zefektivnit zpracování různých podání a zrychlit dobu vyřízení požadavku občana, firmy mohou rychleji, přesněji a s nižšími náklady zpracovávat požadavky klientů a opět rychleji zpětně reagovat. Uvedená technologie tak přináší spokojenost oběma stranám. Přestože inteligentní PDF formuláře již jsou plnohodnotnou alternativou svých papírových protějšků a mají i legislativní podporu, stále je většina organizací z mnoha důvodů vůbec nevyužívá. [10]
DATA
FORMULÁŘ
DATA Prezentační vrstva souboru PDF
VSTUP
Zobrazení koncového uživatele shromažďuje data . zadaná uživatelem.
Vrstva s obchodní logikou Tvůrce formuláře určí vstupy koncového uživatele, pravidla toku dat a typ prohlíženého obsahu včetně bohatého multimediálního obsahu.
XML
VSTUP
Vrstva s daty jazyka XML
(PLM/ERP)
XML
VÝSTUP
K datům od koncového uživatele má přístup tvůrce nebo systém, dle definice pravidel toku dat, včetně podpory schémat jazyka XML ve formuláři formátu PDF.
(PLM/ERP)
Obr. 24 Vzájemná spolupráce PDF a XML v inteligentním PDF formuláři [12]
Formát PDF a jeho využití
Standard formátu pro budoucnost
41
Bakalářská práce
Obr. 25 Nejznámější formulář v ČR samozřejmě také existuje v elektronické verzi jako inteligentní PDF formulář. V pravém dolním rohu je umístěn čárový kód, který slouží pro sběr proměnných dat z papírové (vytištěné) verze formuláře. [13]
Formát PDF a jeho využití
42
Bakalářská práce
11 Rozšíření práv a funkcí pro Adobe Reader (Reader Extensions) Zde se v podstatě dostáváme zpět do Úvodu, kde je mj. řečeno: „Většina současných tvůrců, kteří PDF dokumenty generují, využívá buď minimálně nebo nevyužívá takřka vůbec potenciál tohoto formátu a tím právě nutí své čtenáře zůstat pasivními“. Právě díky povolení rozšíření práv a funkcí v Adobe Readeru dochází k naplnění podstaty, že placený Adobe Acrobat dokument vytvoří a zdarma šířený Adobe Reader s dokumentem pracuje. PDF generátory třetích stran se zaměřují na prostou tvorbu PDF, ale již ne na práci s PDF v jednotlivých fázích celého procesu. Autor obsahu je tedy ten, kdo určuje, co půjde v Adobe Readeru s dokumentem dělat, přičemž se vůbec nemusí starat o to, jaký počítač nebo operační systém mají ti, kdo budou s dokumentem pracovat a už vůbec je nenutí k tomu, že si musí koupit nějaký program, aby vůbec mohli s PDF dokumentem pracovat. Povolením práv a funkcí pro Adobe Reader je dovoleno všem uživatelům do PDF dokumentu vkládat poznámky, provádět sdílené revize (korektury), vyplnit formulář (dokonce ho lze následně i vyplněný uložit) a dokument digitálně podepsat či schválit. S touto koncepcí se Adobe Reader stal komplexním nástrojem pro práci s elektronickým dokumentem zajišťující úkony v souladu s legislativou.
Obr. 26 Adobe Acrobat Professional – ukládání PDF dokumentu s rozšířenými právy v Adobe Readeru. [printscreen autor]
Formát PDF a jeho využití
43
Bakalářská práce
12 Závěr 12.1 Role PDF formátu v životních cyklech obsahu – pojetí obsahu budoucnosti Nároky na obsah 21. století vyžadují po organizacích přehodnocení jejich pojetí obsahu z předchozího století. Elektronický papír, elektronické formuláře, soulad s legislativou, spolupráce více subjektů a nové formáty mediálního obsahu kladou na životní cykly obsahu nové požadavky. V současné době jsou životní cykly obsahu mnohem komplexnější a zahrnují více cyklů revizí i mezi více organizacemi. Dokumenty musí být schopny prezentovat různorodý obsah velkému množství cílových uživatelů s různými potřebami a cíli, a zároveň s tím, jak se vyvíjí technologie, musí být možné dokumenty dlouhodobě uchovávat (archivovat). Díky zachování zpětné kompatibility s předchozími verzemi dokumentů se formát PDF stal publikačním a distribučním standardem ve veřejném i soukromém sektoru. Jeho schopnost přesné a věrné reprodukce originálního dokumentu, s možností plnohodnotného vyhledávání v textu, umožnila společnostem rychlé přijetí formátu PDF jako preferovaného formátu elektronických dokumentů pro zákazníky, dodavatele, partnery a zaměstnance. Orgány státní správy v podstatě na celém světě PDF formát standardizovaly jako upřednostňovaný formát pro dokumenty a formuláře určené veřejnosti. Standardy založené na formátu PDF jsou formáty souborů, které mohou v průběhu životního cyklu sloužit mnoha různým rolím ve fázích revizí, publikování a archivace. Použití formátu PDF se stalo všudypřítomným, s miliardami existujících souborů. Standardizace formátu PDF pomáhá zajistit, aby zůstal důležitým formátem souborů až do vzdálené budoucnosti. Mezi jeho hlavní výhody patří věrnost zobrazení obsahu, podpora systémů na více platformách, technologie tvorby formulářů, podpora multimediálního obsahu a bezpečnostní funkce včetně digitálního podpisu. Elektronické záznamy obvykle vyžadují přiměřenou jistotu životnosti formátu. PDF formát již svou zkouškou časem úspěšně prošel. První soubory PDF vytvořené před více než 15 lety jsou i dnes stále životaschopnými elektronickými záznamy. Právě tak dlouho společnost Adobe Systems udává směr ve vývoji standardu PDF. V dnešní době je PDF formát otevřeným standardem a díky tomu je umožněn jeho další vývoj, což napomáhá globální revoluci pro práci s obsahem. Nyní, kdy je formát PDF pod dohledem standardizačních organizací i různých výrobců softwaru, mohou organizace ze soukromého i veřejného sektoru formátu PDF důvěřovat. [12]
Formát PDF a jeho využití
44
ho cyklu obsahu a podívejme se, kde formát PDF v průběhu tohoto životního cyklu zajišťuje přidanou hodnotu. Bakalářská práce
1. Vytvoření
CAD ODF
LESSON
XML DOC
Začátek životního cyklu obsahu, kdy uživatelé vkládají své nápady do libovolného typu média.
5. Archivace
2. Revize
PDF/A
ARCHIVE
PDF
Připomínky jsou shromažďovány elektronicky, aby usnadnily efektivnější provádění revizí a aby bylo možné vytvářet protokoly auditu.
Data nebo obsah jsou uloženy pro dlouhodobé uchovávání.
4. Využití
3. Publikování
PDF
PDF
www.
PDF FORM
FORM
@
PAPER
PDF
PDF
Určení koncoví uživatelé pracují s obsahem nebo v něm provádějí transakce.
Konečný obsah je distribuován příslušným stranám v papírové nebo elektronické formě.
Obr. 27 Životní cyklus obsahu s typickými formáty dokumentů. [12]
Vytváření Jednotlivé součásti obsahu vznikají tak, že lidé ukládají své myšlenky do médií, kdy informace proudí z kreativní mysli na obrazovku počítače. Nezáleží na tom, co bude následovat, vždy se musí začít tím, že někdo vytvoří obsah. V tom nejjednodušším příkladu je použit textový procesor pro vytvoření tradičního obchodního dokumentu. S tím, jak rostla složitost obchodních dokumentů, byly přidávány nové objekty s obsahem, jako jsou obrázky, technické výkresy, tabulky, pole formulářů a grafy. Výrobci textových procesorů se snažili své produkty vylepšit přidáváním vestavěných nástrojů pro úpravu objektů, které obsahovaly více než jen pouhý text. V současnosti jsou moderní obchodní dokumenty vytvářeny pomocí různých nástrojů, z nichž každý se specializuje na konkrétní typy obsahu. Poté, kdy se do obliby dostala elektronická distribuce dokumentů, začalo do nich být přidáváno ještě více typů objektů s obsahem. Moderní interaktivní elektronické dokumenty obsahují následující obsah: audio, video, animace, interaktivní formuláře, technické výkresy a přímou integraci s mnoha obchodními procesy a typy dat. Formát PDF a jeho využití
45
Bakalářská práce
A Seznam obrázků Obr. 1 Týdeník Newsweek (přechod na digitální distribuci)........................................................6 Obr. 2 Google mapa Los Altos (potok Adobe)..............................................................................7 Obr. 3 San Jose (současné sídlo Adobe Systems)........................................................................ 13 Obr. 4 První historické logo Adobe Systems.............................................................................. 14 Obr. 5 John Warnock a Chuck Geschke (zakladatelé společnosti Adobe Systems)................... 14 Obr. 6 První zkušební testovací obrazce jazyka PostScript........................................................ 14 Obr. 7 Piktogram jazyka PostScript............................................................................................ 14 Obr. 8 První logo Apple Computer.............................................................................................. 14 Obr. 9 Steve Jobs (zakladatel společnosti Apple Computer)....................................................... 14 Obr. 10 Sestava Apple Macintosh a Apple LaserWriter (Macintosh Office)................................ 14 Obr. 11 Program Aldus PageMaker (základ oboru DTP)............................................................. 14 Obr. 12 Pohled do tehdejší kanceláře týmu Acrobat..................................................................... 14 Obr. 13 Ilustrace prvního ústředního motivu Adobe Acrobatu.................................................... 14 Obr. 14 Aktuální logo společnosti Adobe Systems, piktogram PDF a motiv Adobe Acrobat.... 14 Obr. 15 Ukázka jednoduchého postscriptového kódu................................................................... 16 Obr. 16 Základní členění PDF dokumentu................................................................................... 19 Obr. 17 Ukázka kódu PDF dokumentu.........................................................................................20 Obr. 18 Obsah jednotlivých logických vrstev PDF.......................................................................24 Obr. 19 Přehled standardizovaných prvků formátu PDF/X..........................................................26 Obr. 20 Jako vytesané do kamene zůstanou vaše dokumenty ve standardu PDF/A.................... 29 Obr. 21 Ukázka 2D/3D strojírenského CAD výkresu (PDF/E)....................................................30 Obr. 22 Schéma oběhu inteligentních dokumentů na platformě Adobe PDF............................... 36 Obr. 23 Vrstvy vnitřní architektury inteligentních PDF dokumentů........................................... 37 Obr. 24 Vzájemná spolupráce PDF a XML v inteligentním PDF formuláři................................ 41 Obr. 25 Nejznámější inteligentní formulář v ČR (elektronická verze)......................................... 42 Obr. 26 Adobe Acrobat Pro (printscreen ukládání PDF s rozšířením pro Adobe Reader).......... 43 Obr. 27 Životní cyklus obsahu s typickými formáty dokumentů................................................. 45
Formát PDF a jeho využití
46
Bakalářská práce
B Seznam tabulek Tab. 1 Vývoj funkcionalit jednotlivých PDF verzí..................................................................... 18
Formát PDF a jeho využití
47
Bakalářská práce
C Seznam zkratek CAD
(Computer Aided Design) je počítačem podporované projektování pomocí pokročilých grafických programů.
CMYK je barevný model založený na subtraktivním míchání barev, který se používá především u reprodukčních zařízení, např. tiskárny. Model obsahuje čtyři základní barvy: azurovou (Cyan), purpurovou (Magenta), žlutou (Yellow) a černou (Key). DTP
(DeskTop Publishing) znamená tvorbu tištěného dokumentu za pomoci počítače a sázecího programu, který obvykle obsluhuje DTP operátor nebo grafik.
ICC
(International Color Consortium) je barevný profil, který charakterizuje barvový gamut a vlastnosti reprodukčního zařízení či média. Tyto informace jsou využívány zejména v DTP aplikacích, kde slouží k převodu mezi barvovými režimy RGB a CMYK pro přesnou reprodukci či zobrazení barev na daném zařízení (tiskárna, monitor, skener aj.).
ISO
(International Organization for Standardization) je mezinárodní organizace pro normalizaci, která se zabývá tvorbou mezinárodních ISO norem a jiných druhů dokumentů ve všech oblastech normalizace.
OTF
(OpenType Font) je standard pro popis vektorových počítačových písem (fontů), jako nástupce dřívějšího standardu TrueType.
PDF
(Portable Document Format) je standardizovaný ISO formát pro ukládání dokumentů nezávisle na softwaru i hardwaru, na kterém, či pro který byly pořízeny.
PS/EPS (PostScript/Encapsulated PostScript) je programovací jazyk určený ke grafickému popisu tisknutelných dokumentů nezávislých na zařízení, na kterém se má dokument tisknout. RGB
je barevný model založený na aditivním míchání barev, který se používá především u zobrazovacích zařízení, např. monitory. Model obsahuje tři základní barvy: červenou (Red), zelenou (Green) a modrou (Blue).
RIP
(Raster Image Processor) je komponenta tiskových systémů, která má za úkol převádět (rasterizovat) tisková data do rastrové podoby (bitmapy) jako výstup pro tiskové zařízení.
XFA
(XML Forms Architecture) je proprietární specifikace architektury XML. Byla navržena především ke zlepšení zpracování webových formulářů, ale používá se i s PDF formuláři. Není ISO standardem.
XML (eXtensible Markup Language) je jazyk, který se používá pro znázornění libovolných datových struktur v dokumentu. Cílem jeho návrhu byla jednoduchost, obecnost a použitelnost přes internet. Jedná se o textový formát dat s podporou kódování Unicode pro většinu světových jazyků. XMP (eXtensible Metadata Platform) je ISO standard, vyvinutý pro vytváření, zpracování a výměnu dokumentů s vlastními (uvnitř dokumentu uloženými) metadaty z různých druhů zdrojů. Odstranil se tím problém, když byla metadata ukládána odděleně.
Formát PDF a jeho využití
48
Bakalářská práce
D Literatura [1]
http://www.rozhlas.cz/zpravy/technika/_zprava/americky-tydenik-newsweek-v-tistenepodobe-konci-presouva-se-na-internet--1125310
[2]
PFIFFNER, Pamela. Inside the Publishing Revolution: The Adobe Story. Adobe Press 2002. ISBN-13: 978-0-321-11564-5. (Zveřejněné ukázky na: http://www.adobe.com/aboutadobe/pressroom/20thanniversary.html)
[3]
http://www.santamonicapropertyblog.com/wp-content/uploads/2010/05/almaden-tower.jpg
[4]
AMATO, Lindy. Postscript, pre-press a barva: ilustrovaný průvodce. Computer Press 1996.
[5]
WHITINGTON, John. PDF Explained. O‘Reilly 2012. ISBN-13: 978-1-449-31002-8.
[6]
http://en.wikipedia.org/wiki/Portable_Document_Format
[7] LOZAN, Petr; SMÉKAL, Jan; TŘEŠŇÁK, Kamil. PDF pro tisk. Grafie CZ 2007. ISBN 978-80-239-9672-2 [8]
http://wwwimages.adobe.com/www.adobe.com/content/dam/Adobe/en/devnet/pdf/pdfs/ pdf _reference_1-7.pdf
[9]
http://www.iadesigns.com.au/_ private/53%20Bevel%20Gear%20Support%20draw.PDF
[10] http://www.jaknapdf.cz [11] http://www.adobe.com/enterprise/pdfs/intelligent_doc_ platform.pdf [12] http://www.amsoft.cz/Produkty/Adobe/acrobat/tips/pdf/Role_PDF.pdf [13] http://www.financnisprava.cz/assets/tiskopisy/IF_5405-_20.pdf
Formát PDF a jeho využití
49
Vysoká škola:
BANKOVNÍ INSTITUT VYSOKÁ ŠKOLA, a. s.
Oborová katedra:
Informatiky a kvantitativních metod Akademický rok: 2013/2014
,
,
,
v
,
,
ZADANIBAKALARSKEPRACE
Jméno a příjmení:
Jiří
Studijní obor:
Informační
Název tématu:
Formát PDF a jeho využití
Název tématu v
Cíl práce:
angličtině:
Novák technologie
PDF Format and Its Use
Popis funkcí standardizovaného formátu PDF s ohledem na jednotlivé oblasti využití.
Osnova práce:
Vývoj jazyka Postscript a formátu PDF Vnitřní architektura PDF Formáty PDF Rozšířené funkce pro Adobe Reader Zabezpečení PDF
Zásada pro vypracování:
Zásady pro vypracování bakalářské práce jsou dále specifikovány v "Metodických pokynech pro vypracování bakalářské práce na Bankovním institutu vysoké škole v Praze ".
Rozsah grafických prací:
min. 40 stran
Seznam odborné literatury:
viz
Vedoucí
bakalářské
práce:
bakalářské
práce:
Termín odevzdání bakalářské práce:
Vedoucí oborové katedry
V Praze dne:
práce
Ing. Bohuslav Růžička, CSc.
· - ~- ·- ~ -
Podpis vedouciho práce:
Datum zadání
bakalářská
31. 1. 2014
31. 10. 2013 30. 4. 2014
Rektor