Bankovní institut vysoká škola Praha Katedra matematiky, statistiky a informačních technologií
Využití formátu PDF při distribuci a archivaci dokumentů Bakalářská práce
Autor:
Andrej Pak Informační technologie, Auditor informačních systémů
Vedoucí práce:
Praha
Ing. Bohuslav Růžička, CSc.
Červen, 2013
Prohlášení: Prohlašuji, ţe jsem bakalářskou práci zpracoval samostatně a v seznamu uvedl veškerou pouţitou literaturu. Svým podpisem stvrzuji, ţe odevzdaná elektronická podoba práce je identická s její tištěnou verzí a jsem seznámen se skutečností, ţe se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Praze dne 28. 6. 2013
Andrej Pak
2
Poděkování Rád bych poděkoval vedoucímu práce panu Ing. Bohuslavu Růţičkovi, CSc. za všechny věcné připomínky, rady, metodické vedení celé práce a odbornou pomoc.
3
Anotace Práce se zabývá vyuţitím formátu PDF, a to s důrazem na jeho pouţití při distribuci a archivaci dokumentů. Popisuje vznik, vývoj a jednotlivé verze formátu PDF. Nedílnou součásti práce je popis vlastností a nástrojů pro vytváření formátu PDF. Klíčová slova: Acrobat, Adobe, PDF, PDF/A, PDF/X, PostScript.
Annotation The work deals with the use of the PDF format, with an emphasis on its application in the distribution and archiving of documents. It describes the origin, development, and individual PDF versions. An integral part of the work is the description of features and tools for creating PDF format. Key words: Acrobat, Adobe, PDF, PDF/A, PDF/X, PostScript.
4
Obsah Úvod ...................................................................................................................... 9 1
2
Historie vzniku PDF ..................................................................................... 10 1.1
Počátky PDF .............................................................................................................. 10
1.2
Vztah mezi PDF a PostScriptem ................................................................................ 13
1.3
PostScript ................................................................................................................... 13
1.3.1
Historie jazyka PostScript .................................................................................. 13
1.3.2
Podstata PostScript ............................................................................................. 14
1.4
Historie verzí PDF ..................................................................................................... 14
1.5
PDF jako ISO standard .............................................................................................. 17
1.6
PDF/X, PDF/A, PDF/E, PDF/UA a další typy PDF .................................................. 19
1.6.1
PDF/X pro výměnu dokumentů.......................................................................... 20
1.6.2
PDF/A pro archivaci ........................................................................................... 20
1.6.2.1
PDF/A úroveň A (PDF/A–1a) ..................................................................... 21
1.6.2.2
PDF/A úroveň B (PDF/A–1b) ..................................................................... 21
1.6.3
PDF/E pro inţenýrství ........................................................................................ 21
1.6.4
PDF/UA pro maximální dostupnost ................................................................... 22
1.6.5
Jiné typy PDF ..................................................................................................... 22
Vlastnosti formátu PDF ................................................................................ 24 2.1
Vyuţití PDF ............................................................................................................... 24
2.1.1
Polygrafický průmysl ......................................................................................... 24
2.1.2
E-knihy a publikování ........................................................................................ 24
2.1.3
PDF formuláře .................................................................................................... 24
2.1.4
Archivace dokumentů ......................................................................................... 25
2.1.5
PDF jako formát souboru ................................................................................... 25
2.2
Struktura souboru ....................................................................................................... 25
2.2.1
2.3
Rozvrţení souboru .............................................................................................. 25
2.2.1.1
Hlavička ...................................................................................................... 26
2.2.1.2
Tělo ............................................................................................................. 26
2.2.1.3
Tabulka kříţových odkazů .......................................................................... 26
2.2.1.4
Trailer .......................................................................................................... 27
Struktura dokumentu.................................................................................................. 28 5
2.3.1
Slovník traileru ................................................................................................... 28
2.3.2
Dokumentový katalog ........................................................................................ 29
2.3.3
Stránky a stromové modely stránek ................................................................... 29
2.3.3.1 2.4
Rotace a velikost stránek ............................................................................. 31
Vlastnosti souboru ..................................................................................................... 31
2.4.1
Text a písma ....................................................................................................... 31
2.4.2
Vektorové obrázky ............................................................................................. 32
2.4.3
Rastrové obrázky ................................................................................................ 32
2.4.4
Barevné modely .................................................................................................. 32
2.4.5
Metadata ............................................................................................................. 33
2.4.6
Navigace ............................................................................................................. 33
2.4.7
Volitelný obsah ................................................................................................... 33
2.4.8
Multimédia ......................................................................................................... 34
2.4.9
Interaktivní formuláře ......................................................................................... 34
2.4.10 Logická struktura a přeformátování ................................................................... 34 2.4.11 Zabezpečení ........................................................................................................ 34 2.4.12 Komprese ............................................................................................................ 35
3
Nástroje pro vytváření formátu PDF ............................................................ 36 3.1
Adobe Acrobat ........................................................................................................... 36
3.1.1
Způsoby vytváření PDF ...................................................................................... 36
3.1.2
Adobe PDF tiskárna ........................................................................................... 37
3.1.3
Tvorba PDF ze souborů ...................................................................................... 37
3.1.3.1
Podporované formáty souboru .................................................................... 38
3.1.4
Konverze více souborů do PDF .......................................................................... 39
3.1.5
Konverze obrazů ze schránky ............................................................................. 39
3.1.6
Skenování do PDF .............................................................................................. 40
3.1.7
Konverze webových stránek do PDF ................................................................. 40
3.1.7.1 3.1.8 3.2
Zachycení webových stránek ...................................................................... 41
Vytváření PDF ze šablon .................................................................................... 42
Aplikace Microsoft Office ......................................................................................... 43
3.2.1
Microsoft Word .................................................................................................. 43
3.2.2
Microsoft Excel .................................................................................................. 44
3.2.3
Microsoft PowerPoint ......................................................................................... 44 6
3.2.4 3.3
4
Microsoft Outlook .............................................................................................. 45
Print2PDF X .............................................................................................................. 46
3.3.1
Novinky v Print2PDF X ..................................................................................... 46
3.3.2
Vlastnosti nástroje Print2PDF X ........................................................................ 47
Vyuţití formátu PDF pro distribuci dokumentů .......................................... 49 4.1
Optimalizace PDF dokumentů pro distribuci ............................................................ 49
4.2
Vytváření PDF dokumentů pro interní distribuci ...................................................... 49
4.3
Zabezpečení Acrobatu z hlediska distribuce.............................................................. 50
4.3.1
Ochrana dokumentu heslem ............................................................................... 51
4.3.2
Ochrana dokumentu certifikátem zabezpečení ................................................... 51
4.3.2.1 4.4
Optimalizace PDF dokumentů pro konkrétní účely................................................... 52
4.4.1
Vytváření PDF dokumentů pro internet ............................................................. 52
4.4.2
Vytváření PDF dokumentů pro tisk .................................................................... 52
4.5
5
Tvorba seznamu důvěryhodných osob ........................................................ 51
Distribuce formulářů PDF ......................................................................................... 52
4.5.1
Tvorba formulářů PDF ....................................................................................... 53
4.5.2
Druhy polí formuláře PDF.................................................................................. 54
Vyuţití formátu PDF pro archivaci dokumentů ........................................... 56 5.1
Vyuţití formátu PDF/A ............................................................................................. 56
5.1.1
Ukládání e-mailů jako PDF/A ............................................................................ 56
5.1.2
Ukládání broţur, příruček a informačních listin jako PDF/A ............................ 56
5.1.3
Plány, mapy a konstrukční výkresy v PDF/A .................................................... 56
5.1.4
Digitálně podepsané smlouvy v PDF/A ............................................................. 56
5.1.5
Věrné barvy v dokumentu PDF/A ...................................................................... 56
5.1.6
Uchovávání dokumentů pro tisk jako PDF/A .................................................... 57
5.2
Konverze dokumentů PDF do archivních PDF ......................................................... 57
5.2.1
5.3
5.2.1.1
Konverze do PDF/A–1b .............................................................................. 58
5.2.1.2
Konverze do PDF/A–1a .............................................................................. 59
PDF/A validace .......................................................................................................... 59
5.3.1 5.4
Konverze do PDF/A pomocí Preflight ............................................................... 57
Preflight validace ................................................................................................ 60
Vlastnosti archivních PDF souborů ........................................................................... 61
5.4.1
Obrázky .............................................................................................................. 61 7
5.4.2
Barvy .................................................................................................................. 61
5.4.3
Písma .................................................................................................................. 61
5.4.4
Interaktivní PDF soubory ................................................................................... 62
5.4.5
PDF/A pro konstrukční výkresy ......................................................................... 62
Závěr .................................................................................................................... 64 Seznam pouţité literatury .................................................................................... 66 Seznam obrázků .................................................................................................. 69 Seznam tabulek ................................................................................................... 69 Seznam zkratek ................................................................................................... 70
8
Úvod Cílem předkládané bakalářské práce je popsat vznik, vývoj a verze formátu PDF a jeho pouţití pro distribuci a archivaci souborů. Poţadavky na dokumenty jedenadvacátého století vyţadují, aby organizace a trhy přehodnotily vnímání dokumentů z dvacátého století. Elektronický papír, elektronické formuláře, dodrţování právních předpisů, spolupráce a nový mediální obsah kladou nové potřeby na organizace a ţivotní cykly jejich dokumentů. Dokumenty musí být schopny prezentovat různorodý obsah uţivatelům s různými potřebami a cíli, a také musí být schopny zachovat obsah po dlouhou dobu navzdory tomu, jak rychle se vyvíjí technologie. Neexistuje jediný formát souboru, který je vhodný pro všechny účely nebo fáze ţivotního cyklu dokumentu. Jednotlivé fáze ţivotních cyklů dokumentů vyţadují různé formáty souborů, přičemţ kaţdý z nich je optimalizován pro určitou fázi ţivotního cyklu. Standard PDF (ISO 32000) a další standardy zaloţené na formátu PDF jsou formáty souborů, které mohou poslouţit v celém ţivotním cyklu dokumentu, zejména při revizích, publikování a archivaci. Pouţití formátu PDF se stalo všudypřítomným, v současné době existují miliardy souborů ve formátu PDF, které kolují po celém světě. Standardizace formátu PDF pomáhá zajistit, ţe PDF bude i nadále důleţitým standardním formátem souborů. Mezi jeho hlavní přednosti patří vysoká věrnost zobrazení obsahu, podpora systémů na různých platformách, robustní technologie tvorby formulářů, podpora multimediálního obsahu, silné bezpečnostní funkce a moţnost opatřit ho elektronickým podpisem. První soubory formátu PDF, vytvořené před 20 lety, jsou stále ţivotaschopné elektronické dokumenty. Nyní je formát PDF pod kontrolou standardizačních organizací a nezávislých dodavatelů softwaru. Proto podniky ze soukromého a veřejného sektoru mohou s důvěrou investovat do technologií zaloţených na formátu PDF. Specifikace formátu PDF byla poprvé zveřejněná v roce 1993 spolu s představením aplikace Acrobat společnosti Adobe. Formát PDF byl rychle přijat jako publikační a distribuční standard ve veřejném a soukromém sektoru. Mnoho zemí pro své orgány státní správy standardizovalo formát PDF jako upřednostňovaný formát pro dokumenty a formuláře určené veřejnosti. V důsledku toho, jak s kaţdým rokem rostl význam internetu a rozšiřoval se jeho multimediální obsah, začaly vznikat nové typy dokumentů. Společnost Adobe úspěšně pokračuje ve své činnosti dodnes a poskytuje stále lepší produkty, které reflektují vývoj v oblasti formátů dokumentů. 9
1 Historie vzniku PDF 1.1 Počátky PDF Společnost Adobe byla zaloţena v roce 1982 Johnem Warnockem a Chuckem Geschkem. Její první produkty byly digitální fonty, nicméně v dnešní době Adobe nabízí širokou škálu produktů a technologií. V roce 1985 společnost Adobe představila jazyk PostScript (PS). PostScript patří mezi mnoţinu jazyků s označením Page Description Language (PDL). PostScript je interpretační programovací jazyk. Jeho hlavním úkolem je popsat vzhled textu, grafické tvary a vloţené obrazy. PostScript také umoţňuje ovládat tisková zařízení, můţe například zadat počet kopií, které budou vytištěny a tak dále. Ve stejném roce, kdy byl představen PostScript, Adobe vyvinula pro Apple Macintosh aplikaci s názvem Adobe Illustrator (AI). Šlo o program pro vektorovou grafiku se svým vlastním formátem. Formát Adobe Illustratoru byl odvozen z PostScriptu. Adobe Illustrator byl upraven pro OS Windows v roce 1989, coţ umoţnilo jeho větší rozšíření v oblasti grafického průmyslu. Vytvářet profesionální grafiku bylo po dlouhou dobu výsadou specialistů, ale s příchodem PostScriptu a Illustratoru, mohl kdokoliv, vybavený počítačem, publikovat kvalitní dokumenty. Zavedením těchto dvou technologií, odstartovala společnost Adobe revoluci v tzv. Desktop Publishing (DTP). Přesto se zakladatelé společnosti Adobe domnívali, ţe stále něco chybí. V roce 1991, John Warnock publikoval šestistránkový dokument „Camelot paper―, ve kterém říkal: „The specific problem is that most programs print to a wide range of printers, but there is no universal way to communicate and view this printed information electronically ... What industries badly need is a universal way to communicate documents across a wide variety of machine configurations, operating systems, and communication networks.―
10
„Specifickým problémem je, že většina programů tiskne na širokou škálu tiskáren, ale není tam žádný univerzální způsob, jak komunikovat a zobrazit tuto tištěnou informaci elektronicky… Co průmysl nutně potřebuje, je univerzální způsob, jak zveřejňovat dokumenty na zařízeních s různými hardwarovými konfiguracemi, operačními systémy a komunikačními sítěmi.― —The Camelot Project, John Warnock1 Na základě této publikace byl zahájen nový projekt a inţenýři ze společnosti Adobe vylepšili technologie PostScript a Illustrator. Byla vytvořena sada aplikací, se kterými se vytvářely a zobrazovaly dokumenty tohoto formátu. Původní název aplikace byl Carousel, později byl změněn na Acrobat. Nový formát dokumentu byl původně nazýván Interchange PostScript (IPS), ale brzy byl znám jako Portable Document Format (PDF). V únoru 1993 Jim King, šéf vývoje společnosti Adobe, mluvil o „osvobozování― informací uzamčených v počítačových systémech. Do té doby bylo nutné pouţít stejnou počítačovou aplikaci, ve které byl dokument vytvořen, aby ho bylo moţno přečíst na obrazovce nebo jej vytisknout. „This is analogous to requiring the reader of a newspaper to own a photo-typesetting machine. Or the reader of a book to own a printing press. Acrobat frees the computer industry from this ridiculous model, establishing a standard for electronic final-form documents and providing simple viewing and printing tools that are widely and generally usable. Acrobat is an information liberation system!― „Toto je podobné, jako vyžadovat po čtenáři novin mít svůj vlastní fotosazební stroj. Nebo po čtenáři knih vlastnit tiskárnu. Acrobat zbavuje počítačový průmysl tohoto směšného modelu. Stanoví standard pro finální formu elektronických dokumentů a poskytuje jednoduché nástroje pro jejich prohlížení a tisk, které jsou široce a obecně použitelné. Acrobat je systém, který osvobozuje informace!― —Jim King, šéf vývoje, Adobe2 PDF je zkratka pro Portable Document Format, název vychází z faktu, ţe PDF dokument lze zobrazit a vytisknout na libovolné platformě: Windows, Mac, Linux a podobně. PDF dokument vypadá prakticky stejně na kaţdé z těchto platforem. Jak bylo uvedeno výše, v červnu 1993 společnost Adobe představila svůj nový produkt Acrobat. První dokumentace o PDF se nazývala Portable Document Format 1
LOWAGIE, Bruno. iText in Action Second Edition. Str. 414. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610 2 LOWAGIE, Bruno. iText in Action Second Edition. Str. 415. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610
11
Reference Manual a publikoval ji Addison–Wesley. Následovalo pět dalších vydání, i kdyţ ne všechny z nich byly vytištěny na papír. Šesté vydání pro verzi PDF 1.7 je k dispozici pouze jako PDF dokument. Obrázek 1 ukazuje obal první referenční příručky PDF, dále je na obrázku reklama pro Acrobat Starter Kit a také vyobrazení disket, na kterých byl Acrobat distribuován.
Obrázek 1 – Obal PDF příručky, reklama na Acrobat Starter Kit a Acrobat diskety (převzato z [2.])
V září 1993 byl na trh uveden Acrobat Exchange, coţ byl software, který umoţňoval uţivatelům vzájemnou výměnu elektronických dokumentů aplikace Adobe Acrobat. Umoţňoval vytvářet, prohlíţet, třídit, navigovat, vkládat poznámky a tisknout dokumenty, a to za cenu 195 dolarů. Pro převod PostScriptu do PDF byl určen Acrobat Distiller, který tehdy stál 695 dolarů; Network Distiller byl pro více uţivatelů a stál 2495 dolarů. Společnost Adobe také nabízela produkt Acrobat Reader. Marketingové materiály ho charakterizovaly jako „zvláštní nástroj pro podnikové a komerční vydavatele, kteří potřebují distribuovat dokumenty ve velkém (pro 50 i více osob), a to maximálně efektivně s co nejniţšími náklady. Tenkrát Reader nebyl distribuován zdarma, byl prodáván za 2500 dolarů za 50 kopií. Od
12
verze 2.0, která byla vydána v roce 1994, byl Reader k dispozici jiţ zdarma a Distiller byl zahrnut do verze Acrobat Pro.
1.2 Vztah mezi PDF a PostScriptem Ačkoli PostScript a PDF jsou příbuzní, jedná se o různé formáty. PDF vyuţívá schopnost jazyka PostScript pro vykreslení kompletního textu a grafiky jak na obrazovce, tak i na tiskárně. U PDF byla sníţená flexibilita vyměněna za lepší účinnost a předvídatelnost. Na rozdíl od PostScriptu můţe PDF obsahovat mnoho struktur dokumentu, odkazů a další související informace, ale PDF nemůţe přikázat tiskárně pouţít určitý vstupní zásobník, změnit rozlišení nebo pouţít jakékoliv další hardwarově specifické vlastnosti. PDF není programovací jazyk jako PostScript. PDF soubor se skládá z řady objektů. Jim King se ve svých prezentacích o formátu PDF často odkazuje na PDF jako na „objektově orientovaný PostScript―, protoţe toto objektové strukturování je něco, co neexistuje v PostScriptu. Jednou z klíčových výhod PDF je stránková nezávislost. U formátu PostScript můţe nastat to, ţe něco v popisu stránky 1 můţe ovlivňovat stránku 1000, takţe aby bylo moţno prohlédnout stránku 1000, bude nutno interpretovat všechny stránky před ní. Ve formátu PDF je kaţdá stránka soběstačná a lze ji zobrazit samostatně, protoţe kaţdá stránka má přístup k textu, specifikacím písma, okrajům, nákresu, grafickým prvkům a barvám pozadí a textu.
1.3 PostScript 1.3.1
Historie jazyka PostScript První verze jazyka PostScript a první PostScript tiskárna se objevily v roce 1985. V té
době v polygrafii ještě neexistovaly ţádné standardní popisy tištěných obrazů, mnoho pouţívaných aplikací bylo omezeno na konkrétní pouţití v uzavřených systémech. Vytváření profesionálních grafických materiálů byl úkol pouze pro specialisty. Náklady na tiskovou technologii a zařízení byly velmi vysoké. Příchod nového formátu změnil během relativně krátké doby celé odvětví. Všichni největší výrobci počítačů, tiskáren, zařízení pro fotosazbu, rastrových plotrů začali podporovat jazyk PostScript jako standard. Náklady na výrobu tištěných produktů tím podstatně klesly. PostScript se stal součástí výroby v tiskařském, vydavatelském a výpočetním průmyslu.
13
Jazyk PostScript se stále vyvíjí a jeho pouţití se rozšiřuje do různých dříve nepředpokládaných směrů. Významným důvodem pro popularitu jazyka PostScript je jeho otevřená specifikace a velké mnoţství metodických materiálů pro vývoj PostScriptových generátorů. 1.3.2
Podstata PostScript PostScript – to je jazyk pro popis stránek, určený pro vytváření obrazů libovolné
sloţitosti a jejich převod pro tisk. Pro tento účel existuje v jazyce PostScript definována sada grafických objektů. Grafické objekty, které tvoří obraz, lze rozdělit do tří skupin: vektorová grafika – umoţňuje kreslit rovné čáry, oblouky; křivky o libovolné velikosti, orientaci a šířce; vybarvovat plochy jakékoliv velikosti, tvaru a barvy; barva čar nebo výplně můţe být vybrána z barevného modelu jazyka. práce s textem – slouţí pro zobrazení textu všech velikostí, text lze umístit s libovolnou orientací v kterémkoli místě na stránce, text je plně integrován s grafikou – všechny textové znaky jsou vytvářeny jako vektorové tvary. rastrové obrazy – umoţňují zobrazit na stránce naskenované obrázky nebo fotografie s různým měřítkem a různou orientací. Rastrová grafika můţe pocházet z bitmapového grafického editoru nebo pocházet z fotoaparátu nebo skeneru. Jednotlivé vrstvy obrazu mohou být sloučeny do jedné nebo mohou být vloţeny jako oddělené. Obraz, který se popisuje pomocí jazyka PostScript, ţádným způsobem nezávisí na rozlišovací schopnosti výstupního zařízení a na jeho barevné hloubce (počet barev). Přizpůsobování se k specifickým rozlišovacím moţnostem výstupního zařízení je proces, který není vázán na popis obrazu v jazyce PostScript a provádí se pro kaţdé výstupní zařízení zvlášť. V tomto spočívá nezávislost jazyka PostScript na zařízení. Kvalita obrazu je stanovena konkrétním výstupním zařízením a jeho fyzickým omezením. Vytváření obrazu na výstupním zařízení je dvoustupňový proces: 1. Aplikace vytváří nezávislý obraz v jazyce PostScript. 2. Systém
zpracování
obrazu
interpretuje
obraz
a
přizpůsobuje
ho
charakteristikám daného výstupního zařízení.
1.4 Historie verzí PDF V tabulce 1 je uveden seznam nových vlastností, které byly postupně přidávány do jednotlivých verzí.
14
Aţ do verze PDF 1.7 vlastnila autorská práva týkající se specifikace PDF společnost Adobe. Aby tato společnost podpořila pouţívání formátu PDF, dala svolení pouţívat autorská práva komukoliv pro následující činnosti: Připravit soubory, jejichţ obsah je v souladu se specifikací. Napsat ovladače a aplikace, které produkují výstup reprezentovaný ve formátu PDF. Vytvořit software, který akceptuje vstup ve formátu PDF a zobrazuje, tiskne nebo jinak interpretuje obsahy. Kopírovat seznam datových struktur a operátorů společnosti Adobe, stejně jako příklad kódu a PostScript jazykové funkční definice v rozsahu nezbytném k pouţití PDF pro účely výše uvedené. Toto byly podmínky, které se vztahovaly na svolení pouţívat autorská práva: Autoři softwaru, který akceptuje vstup v podobě PDF, musí vynaloţit přiměřené úsilí, aby zajistili, ţe software, který vytváří, respektuje přístupová oprávnění a oprávnění kontrol. Kaţdý, kdo pouţívá seznam datových struktur a operátorů, jak jiţ bylo uvedeno výše, musí zahrnout vhodnou autorskou doloţku.
15
PDF verze Rok Verze PDF – 1.0 1993 Acrobat 1 PDF – 1.1
1994 Acrobat 2
PDF – 1.2
1996 Acrobat 3
PDF – 1.3
1999 Acrobat 4
PDF – 1.4
2001 Acrobat 5
PDF – 1.5
2003 Acrobat 6
PDF – 1.6
2004 Acrobat 7
PDF – 1.7
2006 Acrobat 8
PDF – 1.7 Extension Level 3
2008 Acrobat 9.0
PDF – 1.7 Extension Level 5 PDF – 2.0
2009 Acrobat 9.1
PDF – 2.1
2012 Acrobat XI
2011 Acrobat X
Nové vlastnosti Poskytnout komplexní text a grafiku na obrazovku a tiskárnu. Heslem chráněné PDF Externí odkazy Barva nezávislá na zařízení Flate komprese Interaktivní vyplňování formulářů Podpora čínštiny, japonštiny a korejštiny Přílohy souboru Digitální podpisy Logické číslování stránek 128 – bitové šifrování Průhlednost Tagované PDF Dodatečná komprese a moţností šifrování Skupiny volitelného obsahu Vylepšená podpora pro vkládání a přehrávání multimédií Přizpůsobitelná hodnota uţivatelské jednotky Podpora pro Advanced Encryption Standard (AES) Moţnost nastavení měřítka stránky pro tisk Přenosné kolekce Rozšířené ovládání tiskárny Významná vylepšení 3D Specifikace PDF 1.7 pouţita jako základ pro ISO 32000–1; číslo verze zůstává 1.7, ale společností mohou přidávat svá vlastní rozšíření, taková jako je Adobe Level 3 Extensions, zahrnuje podporu pro multimédia, geoprostorová data atd. Adobe Level 5 Extensions, zahrnuje vylepšení pro průhlednost, přenosné kolekce a Rich Text řetězce OCR kontrola a oprava chyb Rychlé prohledávání a filtrování komentářů Sjednocený nástrojový panel pro práci s poznámkami Optimalizace pro web a mobilní zařízení Aplikace Adobe FormsCentral pro tvorbu PDF formulářů Vytvářet a ověřovat dokumenty odpovídající standardu ISO PDF/VT pro variabilní a transakční tisk
Tabulka 1 – Nové vlastnosti v různých PDF verzích (převzato z [2.], přeložil autor)
16
1.5 PDF jako ISO standard Přestoţe společnost Adobe zveřejnila specifikaci, řada uţivatelů nepovaţovala formát za dostatečně otevřený. Společnost Adobe stále měla výsadní práva k vlastnictví a kontrole specifikace PDF. Trendy nového tisíciletí poţadovaly co největší otevřenost. V určitém okamţiku se společnost Adobe musela rozhodnout, zda uvolní plnou specifikaci: „SAN JOSE, Calif.—Jan. 29, 2007—Adobe Systems Incorporated (Nasdaq:ADBE) today announced that it intends to release the full Portable Document Format (PDF) 1.7 specification to AIIM, the Enterprise Content Management Association, for the purpose of publication by the International Organization for Standardization (ISO).― „SAN JOSE, Kalifornie, 29. leden 2007, Adobe Systems Incorporated (Nasdaq: ADBE) dnes oznámila, že hodlá uvolnit plnou specifikaci Portable Document Format (PDF) 1.7 pro AIIM (Association for Information and Image Management – Asociace pro informační a obrazovou správu), Enterprise Content Management Association (ECM – Asociace pro správu podnikového obsahu), za účelem uveřejnění podle Mezinárodní organizace pro normalizaci (ISO).― –Adobe tisková zpráva3 Jim King vysvětluje, proč bylo takto rozhodnuto: „It was not a simple or easy decision for Adobe to make, but it has come up nearly every year since we first announced PDF and each time we’ve decided not to do it. I view it as a balance scale for weighing things. We put positive things on the right side and negative things on the left. Negative and positive for all of Adobe, our customers, our competitors, etc. It always has come out not to do it. Things do change and this year it came out (to my surprise) that the scale tipped the other way for the first time. There were just too many good reasons to do it and not many not so good. We believe that it will benefit everyone. I have been asked if this was in response to the pressure from government for open specifications or because of something Microsoft has done or might do, or because we think the language is becoming mature. Well my answer is yes, of course, but not because of any single one of those kinds of things. Just the accumulated long list of benefits and the scale tipped.― „Přijmout takové rozhodnutí nebylo pro Adobe jednoduché. Problém vznikal téměř každý rok od okamžiku, kdy jsme zveřejnili formát PDF a pokaždé jsme se rozhodli neudělat to. Vnímám to jako bilanční váhu. Dali jsme pozitivní věci na pravou misku vah a negativní 3
LOWAGIE, Bruno. iText in Action Second Edition. Str. 418. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610
17
věci na levou misku vah. Pozitiva a negativa pro celé Adobe, naše zákazníky, naše konkurenty atd. Vždy z toho vycházelo nedělat to. Všechno se mění, a v tomto roce (k mému překvapení) se stalo, že váha se poprvé naklonila na druhou stranu. Existovalo příliš mnoho důvodů udělat to, a méně důvodů to neudělat. Věříme, že to bude přínosem pro všechny. Byl jsem tázán, jestli to bylo výsledkem tlaku ze strany vlády kvůli otevření specifikace nebo kvůli něčemu, co udělal Microsoft nebo by mohl udělat, nebo proto, že si myslíme, že jazyk se stává vyspělejším. Moje odpověď je samozřejmě ano, ale ne kvůli některému z výše uvedených důvodů. Jen jsme shromáždili dlouhý seznam výhod a váhy napověděly toto.― —Budoucnost PDF a Flash, Jim King4 Standard byl publikován organizací ISO 1. července 2008. Jim King řekl o faktu, ţe společnost Adobe přenesla specifikaci PDF do ISO standardu:
„From what I have been able to figure out there are over a billion PDF files being stored on computers in this world—could be a lot bigger number. What we want to do is to help ISO get an accurate specification under their control that documents the rules all those PDF files obey. We think they all, well nearly all, obey Adobe’s current PDF 1.7 specification so a clean clear ISO version of that is what we’re after. Please note that this is not tied in any significant way to Adobe products like Acrobat. It is your billion PDF files we’re interested in documenting, not Acrobat. Once the ISO standard has been established, Adobe will be just one other (key we hope) company working together with other companies to make any changes to ISO PDF that are needed.―
Podle mých předpokladů je v počítačích na celém světě uložena více než miliarda PDF souborů, možná i více. Našim přáním je pomoci společnosti ISO vytvořit přesnou specifikaci (která by byla pod její kontrolou) obsahující pravidla, kterým jsou podřízeny všechny soubory PDF. Myslíme si, že všechno, téměř všechno, vychází ze současné specifikace PDF 1.7 společnosti Adobe, proto je naším cílem jasná a srozumitelná verze ISO normy. Je nutné poznamenat, že toto není žádným způsobem svázáno s produktem společnosti Adobe, kterým je Acrobat. Jsou to vaše miliardy PDF souborů, které je třeba zdokumentovat, 4
LOWAGIE, Bruno. iText in Action Second Edition. Str. 418. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610
18
nikoliv Acrobat. Jakmile bude vytvořen ISO standard, společnost Adobe se stane jednou ze společností (doufám klíčovou) spolupracující s dalšími společnostmi na zavádění změn v ISO PDF, které se ukážou potřebné. —Budoucnost PDF a Flash, Jim King5 Od této chvíle můţe kaţdá společnost napsat svá vlastní rozšíření pro Portable Document Format a předloţit je ISO organizaci jako navrhované změny ve specifikaci PDF. Organizace ISO tato rozšíření můţe nebo nemusí přijmout; například Adobe předloţila řadu návrhů na zařazení do ISO 32000–2, který byl vydán v roce 2011 a objevil se v PDF verzi 2.0. Nová úmluva umoţňuje společnostem a dalším subjektům identifikovat svá vlastní rozšíření ve vztahu k základní verzi PDF. Záměr úmluvy o rozšíření je dvojí: Umoţnit vývojářům aplikací pro tvorbu PDF definovat rozšíření specifikace pouţívané v jejich společnosti v dokumentech PDF a dovolit tato rozšíření přidat k obecným specifikacím. Umoţnit vývojářům aplikací pro tvorbu PDF určit, která rozšíření jsou pouţívaná v PDF dokumentu a doplnit popis těchto rozšíření do specifikací. Rozšíření pouţívají mechanismus definovaný v ISO 32000–1. Navíc úmluva označuje úrovně rozšíření ve vztahu k této základní verzi. V tabulce 1 jsou uvedeny úrovně rozšíření 3 a 5. Jedná se o dvě rozšíření zveřejněné společností Adobe pro Acrobat 9.0 a 9.1. Aby se zabránilo kolizím nad názvy společností a názvy rozšíření specifických pro podnik, zavedla společnost ISO předponu názvu. Předpona je tvořena čtyřmi znaky z velkých písmen abecedy a identifikuje konkrétní společnost (subjekt). Předpona je typická pro podnikové verze. Například ADBE je předpona registrovaná společností Adobe, ITXT je předpona pouţívaná společností iText. Podrobnosti o pouţití předpon jsou uvedeny v dodatku E ISO 32000–1.
1.6 PDF/X, PDF/A, PDF/E, PDF/UA a další typy PDF Existuje mnoho různých způsobů, jak vytvořit korektní PDF soubor. Tato svoboda tvorby je výhodou, ale zároveň můţe být také zásadní nevýhodou. Jednotlivé varianty PDF souborů lze přizpůsobit konkrétnímu účelu. Neexistuje jedna univerzální PDF specifikace, která by vyhověla všem moţným účelům pouţití. Proto byly vytvořeny různé ISO normy, první z roku 2001: PDF/X.
5
LOWAGIE, Bruno. iText in Action Second Edition. Str. 419. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610
19
1.6.1
PDF/X pro výměnu dokumentů V oblasti předtiskové přípravy se digitální dokumenty, které jsou určeny k tisku na
tiskařském stroji, ukládají ve formátu PDF. Kvalitní tiskové podklady umoţňují vytvoření tiskových plátů s vysokým rozlišením například aţ 5000 bodů na palec. Takovéto vysoké rozlišení pak musí mít i obrázky a ostatní grafické prvky vloţené v PDF v odpovídajícím rozlišení. Pro tento účel bylo třeba upravit definici PDF. Společnosti, které pracují v oblasti předtiskové přípravy, zaloţily proto konsorcium a vydaly specifikaci nazvanou PDF/X. Jedná se o soubor ISO norem (ISO 15930–1 aţ ISO 15930–8) popisující podmnoţinu PDF specifikací, které zajistí jednoznačný, předvídatelný a konzistentní výstup pro tisk. Vzhledem k tomu, ţe tyto normy jsou podmnoţinami formátu PDF, soubory splňující tyto normy, zároveň odpovídají obecným souborům PDF. Kaţdá z PDF/X specifikací má svoje vlastní poţadavky a omezení. Dva nejpouţívanější standardy PDF/X jsou: PDF/X–1a:2001 a PDF/X–3:2002. Formát PDF/X–1a je určen pro podporu tzv. slepé výměny dokumentů ve formátu PDF. Slepá výměna znamená, ţe můţete dodávat PDF dokumenty poskytovateli tiskových sluţeb, aniţ byste se museli zajímat o jeho technické vybavení. PDF/X–3 je rozšířením PDF/X–1a. Hlavní rozdíl je, ţe soubor PDF/X–3 můţe také obsahovat i data o správě barev. 1.6.2
PDF/A pro archivaci PDF/A specifikace je také známa jako ISO 19005–1:2005: Document Management–
Electronic Document File Format for Long–Term Preservation – Part 1: Use of PDF 1.4 (PDF/A–1). Tento standard byl schválen v září 2005. Iniciativa pro PDF/A byla vyvíjena ve sdruţeních Association for Information and Image Management (AIIM) – Asociace pro informační a obrazovou správu a Association for Suppliers of Printing, Publishing, and Converting Technology (NPES) – Asociace dodavatelů technologií pro tištění, vydavatelství a konverzi. Ve světě v současnosti existuje mnoho elektronických formátů a technologií, které mohou slouţit pro archivaci elektronických dat. Největší nevýhodou je, ţe mnoho z těchto formátů je soukromým majetkem. Neexistuje tudíţ ţádná záruka, ţe dokument aplikace Word vytvořený pomoci nejnovější verze Microsoft Word, bude moţné otevřít v jeho nejnovější verzi za dalších deset, dvacet let. A i kdyby se podařilo ho otevřít, nemůţete očekávat, ţe dokument bude vypadat stejně jako v původní verzi Wordu, pouţité k jeho vytvoření.
20
Na rozdíl od většiny formátů textových procesorů, PDF zaznamenává nejen údaje obsaţené v dokumentu, ale také jeho přesnou formu. Soubor můţe být zobrazen, aniţ bychom měli k dispozici aplikaci, ve které byl vytvořen. Společnost Adobe také ujistila, ţe všechny revize PDF specifikací jsou a zůstanou zpětně kompatibilní. To znamená, ţe bez ohledu na verzi formátu PDF bude dokument vţdy vypadat stejně, a to i v novějších prohlíţečích PDF. Ještě předtím, neţ byl PDF zveřejněn jako ISO standard, byla specifikace PDF k dispozici zdarma. Kaţdý můţe vytvářet programy pro tvorbu a zobrazení PDF dokumentů. To činí z PDF (ISO 32000) velmi zajímavý formát pouţitelný pro archivaci. 1.6.2.1 PDF/A úroveň A (PDF/A–1a) Formát PDF/A musí mít všechna písma vloţena do dokumentu, obsah nesmí být šifrován, je zakázáno vkládat audio a video obsah, stejně tak není povolen JavaScript ani vkládání spustitelného souboru. Dále se poţaduje, aby PDF byl tagován. Tagovaný PDF je varianta PDF, která definuje sadu standardních strukturních typů a atributů dovolujících kopírovat obsah stránky a pouţívat ho pro jiné účely. Obsah stránky je definován tak, ţe znaky, slova a pořadí textu mohou být spolehlivě určeny. Kaţdý PDF/A dokument musí obsahovat metadata ve formátu XMP. 1.6.2.2 PDF/A úroveň B (PDF/A–1b) Tato verze je zjednodušená varianta předchozí definice. Základní rozdíly jsou uvedeny v tabulce 2. Shoda se standardem Cíl
Logická struktura
Fonty
ISO 19005–1:2005: PDF/A–1a Úplná shoda s PDF/A standardem
ISO 19005–1:2005: PDF/A–1b Omezená shoda s PDF/A standardem Vytvářet archivní PDF soubory pro úplný Vytvářet archivní PDF soubory, přístup k celému obsahu které zaručují pouze vizuální reprodukovatelnost Struktura a přístup mohou být uskutečněny Nejsou zde ţádné přesně prostřednictvím tagů a popisem stanovené poţadavky na jednotlivých obrazů a také pomocí logickou strukturu nastavení pouţitého jazyka. Kaţdé písmeno musí mít Unicode – ekvivalent
Tabulka 2 – Základní rozdíly mezi úrovní A a B standardu PDF/A (převzato z [1.], přeložil autor)
1.6.3
PDF/E pro inženýrství PDF/E neboli ISO 24517–1:2008 byl schválen organizací ISO jako otevřený standard
v červnu 2007. Vychází z PDF 1.6 a je určen pro pouţití v inţenýrských pracovních 21
postupech. Byl navrţen jako otevřený a neutrální výměnný formát pro inţenýrskou a technickou dokumentaci. PDF/E poskytuje bezpečnou distribuci duševního vlastnictví a spolehlivé řízení výměny a změny. To také sniţuje náklady spojené s tištěnou dokumentací (včetně nákladů na skladování a archivaci papíru). Zahrnuje tři hlavní oblasti: Přesný tisk technických výkresů. Podpora pro výměnu a správu anotace a připomínkových dat. Začlenění komplexních dat do formátu PDF (3D, CAD data a tak dále) 1.6.4
PDF/UA pro maximální dostupnost Chceme-li, aby byl dokument přístupný pro zrakově postiţené, měl by PDF soubor
obsahovat logické pořadí čtení, obrázky by měly být opatřeny alternativními popisy a tak dále. Všechny tyto poţadavky budou v dohledné době dodány jako ISO/AWI 14289. Posláním PDF/UA je rozvíjet specifikace formátu PDF k zajištění jeho dostupnosti pro lidi, kteří pouţívají pomocné technologie, jako jsou čtečky obrazovky. „This is not meant to be a techniques (how to) specification, but rather a set of guidelines for creating accessible PDF. The components and their structure are highly dependent upon which objects (graphics, text, multimedia, form fields) are to be present in the PDF file. The specification will describe such components and the conditions governing their inclusion in a PDF file in order to be considered accessible for a particular document type.― „Toto (PDF/UA) není myšleno jako přesný popis metodiky, ale jako sada návodů pro tvorbu přístupného PDF. Komponenty a jejich struktura jsou velmi závislé na tom, které objekty (grafika, text, multimediální nástroje, pole formulářů) mají být zobrazeny v souboru PDF. Specifikace popíše takové komponenty a podmínky definující jejich zařazení do souboru PDF, aby mohly být považovány za přístupné pro určitý typ dokumentu.― —AIIM, PDF/UA, Výbor pro oblast působnosti maximální dostupnosti6 Mechanismus tagovaného PDF nabízí řadu technik pro různé varianty dostupnosti (čitelnosti) PDF. Například lze přidávat tagy usnadňující porozumění textu, který je čten nahlas umělou řečí, která je integrována do aplikace Adobe Reader. 1.6.5
Jiné typy PDF Dále je uveden neúplný výčet ostatních typů PDF, se kterými se lze setkat:
6
LOWAGIE, Bruno. iText in Action Second Edition. Str. 423. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610
22
Tagované PDF – jak jiţ bylo vysvětleno, kdyţ jsme definovali PDF/A a PDF/UA, lze přidávat další struktury do souboru PDF, které umoţňují uţivateli PDF lépe vyhledávat informace a pochopit obsah. Linearizovaný PDF – je soubor, který je organizován zvláštním způsobem tak, aby umoţnil efektivní přístup do dokumentu. Jeho hlavním cílem je zobrazení první stránky tak rychle, jak je to jen moţné, aniţ byste museli nahrát do prohlíţeče všechny zbývající části souboru nebo načíst tabulku kříţových odkazů, která je zpravidla na konci souboru. Toto zlepšuje moţnosti při prohlíţení souboru ve formátu PDF, který stahujeme přes streamingový komunikační kanál, jako je internet. Linearizovaný PDF se někdy označuje jako PDF pro „rychlé webové prohlíţení.― Se základní tabulkou kříţových odkazů na konci souboru, není to moţné, pokud soubor není linearizován. Linearizace můţe být provedena pouze tehdy, pokud je PDF soubor kompletní a pokud jsou k dispozici všechny zdroje. PDF/H – PDF pro poskytovatelé zdravotní péče a jejich spotřebitelů. PDF/H je popsán v „Příručce osvědčených postupů―. Jeho cílem je poskytnout bezpečnější elektronický kontejner pro ukládání a přenášení zdravotnických informací, včetně dokumentů, XML dat, DICOM snímků a dat, klinických poznámek, laboratorních zpráv, elektronických formulářů, naskenovaných obrázků, fotografií, digitálních rentgenů a EKG. Existují i další typy PDF, jako je PDF/VT (pro variabilní a transakční polygrafický průmysl). Některé specifikace se objevily a pak zmizely, například Adobe Mars byl alternativou XML pro PDF společnosti Adobe.
23
2 Vlastnosti formátu PDF 2.1 Využití PDF PDF se pouţívá v celé řadě různých průmyslových odvětví a profesí. Dále je uveden výčet některých pouţití v praxi. 2.1.1
Polygrafický průmysl PDF podporuje barevné modely, informace o rozměru stránky (např. MediaBox,
CropBox, ArtBox a BleedBox), překrývání barev a nezávislost rozlišení vyţadované pro komerční tisk. Rozšiřitelnost metadat v PDF umoţňuje vkládat různá schémata a barevné profily a další potřebné informace pro vytvoření tiskových plátů na CTP (Computer To Plate) zařízení a dovoluje ukládat schémata s dokumentem během procesu vytváření. 2.1.2
E-knihy a publikování E-knihy se vytváří pomocí systému DocBook, který otevře strukturovaný dokument ve
formátu XML, provede sazbu a vyrobí kompletní PDF s hypertextovými odkazy a záloţkami (jako PDF vhodné pro tisk). PDF je jedním z konkurenčních formátů e-knih. Chcete-li podporovat zobrazení na široké škále obrazovek, PDF dokumenty mohou být tagovány informací o moţnosti přeformátovaní, coţ umoţní, aby řádky textu byly zobrazeny v různých šířkách na jednotlivých zařízeních. Toto je zásadní odlišnost od obvyklého pouţití formátu PDF, kde je fixní rozvrţení textu poţadavek. 2.1.3
PDF formuláře PDF formulář (vyplněný online, pak vytisknut na papír) vypadá stejně jako ten, který
byl vyplněn ručně na papír a mohou být stejně zpracovány ručně nebo počítačovými systémy. PDF formuláře se otevírají přímo v PDF prohlíţeči a systém dovolí vyplnit jen příslušné kolonky. Vyuţití JavaScriptu přidává do PDF formulářů uţitečné funkce, jako je kontrola, zda vyplněný údaj odpovídá poţadavkům nebo sčítání číselných údajů v daňovém formuláři. Moţnost digitálního podpisu PDF formuláře, předurčuje tento formát k pouţití v elektronickém styku s úřady a státní správou.
24
2.1.4
Archivace dokumentů PDF/A je ideální varianta formátu PDF pro dlouhodobou archivaci dokumentů
spojující přesné zobrazení naskenovaného a elektronického obsahu s jazykovou podporou Unicode a mechanismy komprese pro všechny druhy dat, včetně důleţitých CCITT Fax a JBIG2 metod pro jednobarevné obrazy. Vzhledem k tomu, ţe PDF/A je ISO standardem (a díky tomu prakticky všudypřítomným), PDF/A zaručuje, ţe tyto dokumenty budou přečteny i v daleké budoucnosti. PDF můţe být pouţit pro optické rozpoznávání znaků (OCR). Tato funkce je součástí např. Adobe Acrobatu a umoţňuje číst text vloţený v PDF formátu jako naskenovaný obrázek. Přesné vizuální zobrazení originálu zůstává zachováno spolu s rozpoznaným textem, který tvoří jakoby další vrstvu. 2.1.5
PDF jako formát souboru Na první pohled PDF není formátem vhodným k pouţití jako editovatelný formát
vektorové grafiky. Například kruh nezůstane po úpravě kruhem, z toho okamţiku, kdy kruh bude převeden na určitý počet křivek (v PDF neexistuje kruh jako prvek). Nicméně kdyţ dokáţeme odpovídajícím způsobem vyuţívat rozšiřitelnost PDF pro ukládání doplňujících dat, lze PDF pouţít i jako zdrojový soubor. Například Adobe Illustrator nyní vyuţívá rozšířenou formu PDF jako svůj formát souboru. Soubor lze prohlíţet v libovolném PDF prohlíţeči a Illustrator můţe vyuţívat rozšířená data. Takové PDF lze uloţit jako editovatelné s doplňkovými daty nebo jako klasické PDF (tedy needitovatelné).
2.2 Struktura souboru Soubor PDF se skládá ze čtyř částí – hlavička, tělo, tabulka kříţových odkazů a trailer. 2.2.1
Rozvržení souboru
1. Hlavička, která označuje číslo verze PDF. 2. Tělo, které obsahuje stránky, grafický obsah a mnoho vedlejších informací, vše zakódováno jako série objektů. 3. Tabulka kříţových odkazů, která zahrnuje pozici kaţdého objektu v souboru, aby usnadnila přímý přístup. 4. Trailer obsahuje slovník, který pomáhá lokalizovat kaţdou část souboru a zahrnuje různé části metadat, které lze číst bez zpracování celého souboru.
25
2.2.1.1 Hlavička V souboru PDF je číslo verze dokumentu uvedeno v hlavičce. Formát PDF je zpětně kompatibilní, to znamená, ţe dokument ve verzi PDF 1.3 musí být čitelný programem, který zná verzi PDF 1.5. To samé se stává i v opačném směru, takţe většina PDF programů se pokusí přečíst libovolný soubor nezávisle na číslech verzí PDF. Příklad hlavičky: %PDF–1.0 %âăĎÓ První řádek souboru PDF označuje číslo verze dokumentu. V tomto příkladu se jedná o soubor PDF verze 1.0. Znak procenta naznačuje další řádek hlavičky, dalších několik bytů představují libovolné znakové kódy přesahující hodnotu 127. Vzhledem k tomu, ţe PDF soubory téměř vţdy obsahují binární data, mohou být poškozeny, pokud konce řádků se pozmění (například v případě, ţe soubor bude přenesen přes FTP v textovém reţimu). 2.2.1.2 Tělo Tělo souboru se skládá z posloupností objektů. Číslo objektu, číslo generace a klíčové slovo obj na jednom řádku předchází kaţdý objekt a následně se po objektu vyskytuje klíčové slovo endobj na dalším řádku. Například: 1 0 obj << /Kids [2 0 R] /Count 1 /Type /Pages >> endobj V tomto příkladu je číslo objektu 1 a číslo generace je 0 (platí to téměř vţdy). Obsah objektu 1 je mezi dvěma řádky 1 0 obj a endobj. V tomto případě je to slovník: << / Kids [2 0 R] /Count 1
/ Type
/Pages >>
2.2.1.3 Tabulka křížových odkazů Tabulka kříţových odkazů zahrnuje posun souřadnic kaţdého objektu v těle souboru. Toto umoţňuje přímý přístup k objektům, takţe se objekty nemusí číst v patřičném pořadí a objekt, který se nikdy nevyuţívá, se nikdy nečte. To znamená, ţe jednoduché operace, jako je počítání stránek v dokumentu PDF, mohou být rychle vykonány, dokonce i ve velkých souborech.
26
Kaţdý objekt v PDF souboru má číslo objektu a číslo generace. Čísla generací se pouţívají v případě, kdyţ záznam tabulky kříţových odkazů se pouţije opakovaně (čísla generací tady nerozebíráme – budou vţdycky nulami). V dále uvedeném příkladu můţeme rozebrat tabulku kříţových odkazů, která se bude skládat z: 1. řádku hlavičky udávající počet záznamů 2. speciálního záznamu 3. jednoho řádku pro kaţdý objekt v těle souboru. Příklad: 0 6 Šest záznamů v tabulce, začíná se od 0 0000000000 65535 f Speciální záznam 0000000015 00000 n Objekt 1 je při posunu souřadnic v bytech 15 0000000074 00000 n Objekt 2 je při posunu souřadnic v bytech 74 0000000192 00000 n atd. 0000000291 00000 n 0000000409 00000 n Objekt 5 je při posunu souřadnic v bytech 409 Všimněte si, ţe souřadnice objektů v bytech jsou uchovávány s úvodními nulami k tomu, aby zajistily stejnou délku pro kaţdý záznam. Proto také můţeme přečíst tabulku kříţových odkazů přímým přístupem. 2.2.1.4 Trailer Na prvním řádku traileru je jen klíčové slovo trailer. Poté následuje slovník traileru, který obsahuje alespoň /Size záznam (určuje počet záznamů v tabulce kříţových odkazů) a /Root záznam (přisuzuje objektu číslo z dokumentového katalogu, coţ je základním prvkem grafu objektů v těle souboru). Na dalším řádku stojí klíčové slovo startxref, dále následuje řádek s jedním číslem (jedná se o posun souřadnic začátku tabulky kříţových odkazů uvnitř souboru) a potom je uveden řádek %%EOF, který signalizuje konec souboru PDF. Příklad: trailer Klíčové slovo trailer << Slovník traileru /Root 5 0 R /Size 6 >> startxref Klíčové slovo startxref 459 Posun souřadnic začátku tabulky kříţových odkazů %%EOF Značka konce souboru Trailer je čten od konce souboru; nejdřív se najde značka konce souboru, zvýrazní se souřadnice začátku tabulky kříţových odkazů a pak se provádí analýza slovníku traileru. Klíčové slovo Trailer označuje horní rozsah traileru.
27
2.3 Struktura dokumentu V této kapitole bude popsána logická struktura dokumentu PDF. Zejména se zaměříme na pojmy, jako jsou slovník traileru, dokumentový katalog a stromový model stránek.
Obrázek 2 – Typická struktura dokumentu pro dvoustránkový PDF dokument (převzato z [8.], přeložil autor)
2.3.1
Slovník traileru Tento slovník obsaţený v traileru souboru a nikoliv v těle souboru, je první věc, která
má být zpracována, kdyţ program potřebuje přečíst PDF dokument. Slovník obsahuje záznamy umoţňující přečíst tabulku kříţových odkazů, a také objekty souboru. Jeho důleţité záznamy jsou shrnuty v tabulce 3. Klíč Typ hodnoty /Size Integer /Root Nepřímý odkaz na slovník /Info Nepřímý odkaz na slovník /ID Pole dvou řádků
Hodnota Celkový počet záznamů v tabulce kříţových odkazů souboru (obvykle se rovná počtu objektů v souboru plus jeden). Dokumentový katalog. Dokumentový informační slovník. Jednoznačně identifikuje soubor v rámci workflow. První řádek se projevuje při prvotním vytvoření souboru, druhý řádek se mění systémy workflow, kdyţ se provádí modifikace souboru.
Tabulka 3 – Záznamy ve slovníku traileru (převzato z [8.], přeložil autor)
28
Příklad slovníku traileru: << /Size 421 /Root 377 0 R /Info 375 0 R /ID[<75ff22189ceac848dfa2afec93deee03><057928614d9711db835e000d937095a2>] >>
Jakmile byl slovník traileru zpracován, můţeme pokračovat ve čtení dokumentového informačního slovníku a dokumentového katalogu. 2.3.2
Dokumentový katalog Dokumentový katalog je základním objektem grafu, s pomocí dokumentového
katalogu je moţné mít přístup ke všem ostatním objektům prostřednictvím nepřímého odkazu. V tabulce 4 uvádíme slovník důleţitých záznamů dokumentového katalogu. Jednak jsou uvedeny záznamy, které jsou vyţadovány, a také některé, které jsou volitelné. Klíč
Typ hodnoty /Type Název /Pages Nepřímý odkaz na slovník /PageLabels Model čísel
/Names
Slovník
Hodnota Musí být /Catalog. Kořenový uzel stromového modelu stránek. Model čísel, který přidává pořadí stránek pro dokument. Tento mechanismus umoţňuje mít sloţitější číslování stránek v dokumentu neţ jen 1, 2, 3 … Například předmluva knihy můţe být očíslována I, II, III …, zatímco hlavní obsah začíná opět od 1, 2, 3 … Toto pořadí stránek je zobrazeno v PDF prohlíţečích a nevyskytuje se v tištěné verzi dokumentu. Slovník pojmenování. Obsahuje různá schémata pojmenování, které zobrazují shodu pojmenování a objektů.
Tabulka 4 – Dokumentový katalog (převzato z [8.], přeložil autor)
2.3.3
Stránky a stromové modely stránek Stránkový slovník v PDF dokumentu sdruţuje instrukce pro kreslení grafického
a textového obsahu se zdroji (písma, obrázky a další externí data), které tyto instrukce vyuţívají. Stránkový slovník téţ obsahuje velikost stránky, spolu s několika jinými boxy určujících oříznutí a tak dále. Záznamy ve stránkovém slovníku jsou shrnuty v tabulce 5. 29
Klíč /Type /Parent
Typ hodnoty Název Nepřímý odkaz na slovník /Resources Slovník
/Contents
Hodnota Musí být /Page. Nadřazený uzel daného uzlu ve stromovém modelu stránek. Stránkové zdroje (písma, obrázky atd.). Pokud je tento záznam zcela vynechán, zdroje budou zděděny z nadřazeného uzlu ve stromovém modelu stránek. Pokud nejsou opravdu ţádné zdroje, zařaďte tento záznam, ale přitom pouţijte prázdný slovník. Nepřímý odkaz Grafický obsah stránky v jednom nebo více oddílech. na proud nebo Pokud tento záznam chybí, znamená to, ţe stránka je pole takových prázdná. odkazů
Tabulka 5 – Záznamy ve stránkovém slovníku (převzato z [8.], přeložil autor)
Dále je uveden obrázek 3, na kterém je zobrazen příklad stromového modelu stránek. Konstrukce kaţdého tvaru stromu záleţí na tom, jak jednotlivé aplikace PDF interpretují jeho pojetí.
Obrázek 3 – Stromový model pro sedm stránek (převzato z [8.], přeložil autor)
V následující tabulce 6 jsou shrnuty záznamy stromového modelu stránek pro prostřední nebo kořenový uzel. Klíč /Type /Kids
Typ hodnoty Název Pole nepřímých odkazů
Hodnota Musí být /Pages. Bezprostřední podřízené uzly daného uzlu ve stromovém modelu stránek. /Count Integer Počet uzlů stránky, které jsou eventuálně podřízeny danému uzlu. /Parent Nepřímý odkaz na uzel ve Odkaz na nadřazený uzel daného uzlu. Musí být stromovém modelu stránek přítomen, jestli není kořenovým uzlem stromového modelu stránek. Tabulka 6 – Záznamy stromového modelu stránek pro prostřední nebo kořenový uzel (převzato z [8.], přeložil autor)
30
2.3.3.1 Rotace a velikost stránek Klíč /Rotate
Typ hodnoty Integer
/MediaBox Obdélník
/CropBox
Obdélník
Hodnota Rotace zobrazení stránky ve stupních, po směru hodinových ručiček od severu. Hodnota musí být násobkem 90 stupňů. Výchozí hodnota: 0. To se vztahuje jak na prohlíţení, tak i na tisk. Pokud tento záznam chybí, jeho význam bude zděděn z jeho nadřazeného uzlu ve stromovém modelu stránek. MediaBox stránky (velikost prostředí, tj. papír). Pro většinu účelů se myslí velikost stránky. Pokud tento záznam chybí, jeho význam bude zděděn z jeho nadřazeného uzlu ve stromovém modelu stránek. CropBox stránky. Definuje část stránky viditelnou při výchozím nastavení, kdyţ se stránka zobrazuje nebo tiskne. Pokud chybí, jeho hodnota se definuje stejně jako pro MediaBox.
Tabulka 7 – Záznamy ve stránkovém slovníku pro rotaci a velikost stránek (převzato z [8.], přeložil autor)
Obdélníková struktura dat pro MediaBox a další boxy je pole skládající se ze čtyř čísel. Tato čísla definují úhlopříčně protilehlé rohy obdélníka – první dva prvky pole jsou x a y souřadnice jednoho rohu, zbývající dva prvky pole jsou souřadnice druhého rohu. Obvykle se uvádí levý dolní a pravý horní roh. Například: /MediaBox [0 0 500 800] /CropBox [100 100 400 700] V tomto příkladu MediaBox definuje stránku o velikosti 500 na 800 bodů, přičemţ CropBox ořízne stránku o 100 bodů na kaţdé straně. Stránky jsou vzájemně propojeny pomocí stromového modelu stránek, ale nikoliv jednoduchým polem. Tato stromová struktura umoţňuje rychleji najít určitou stránku v dokumentu se stovkami nebo tisíci stránek. Dobré PDF aplikace vytvářejí vyváţený model stromu (jeden model stromu s minimální výškou vzhledem k počtu uzlů). Tím je zajištěno, ţe konkrétní stránka můţe být rychle lokalizována. Uzly bez podřízených uzlů jsou samy o sobě stránkami.
2.4 Vlastnosti souboru Typický PDF soubor obsahuje mnoho tisíc objektů, několik kompresních mechanismů, různé písmové formáty a směs vektorové a rastrové grafiky společně s širokou paletou metadat a vedlejšího obsahu. 2.4.1
Text a písma Soubor PDF můţe zobrazit text pomocí fontů ve všech běţných formátech (Type1,
TrueType, OpenType atd.). Fonty jsou vloţeny do dokumentu, takţe tvary písmen jsou vţdy 31
k dispozici, coţ znamená, ţe soubor by se měl zobrazit stejně na jakémkoli počítači. Jsou podporovány různá kódování písma, včetně Unicode. Text můţe být vyplněn libovolnou barvou, vzorem nebo průhledností. Část textu můţe být pouţita jako tvar pro připojení jiného obsahu, který umoţňuje sloţité grafické efekty, zatímco text zůstává volitelným a editovatelným. Obvykle je v PDF dokumentu zakódován dostatek informací pro extrakci textu, ačkoli tento proces není vţdy přímočarý. 2.4.2
Vektorové obrázky Grafický obsah ve formátu PDF je zaloţen na modelu, který byl poprvé pouţit
v jazyce PostScript společnosti Adobe. Je sloţen z objektů tvořených rovnými linkami a křivkami. Kaţdý objekt ohraničený křivkami můţe být vyplněn nebo vytaţen (zvýrazněná ohraničující linka) nebo můţe nastat obojí. Linky mohou mít různou tloušťku, mohou mít různé styly (čárky, tečky, sloţitější tvary nebo vzorky). Objekty mohou být vyplněny jakoukoliv barvou, ať jednolitou nebo s opakujícím se vzorem definovaným jinými objekty nebo s plynulým přechodem mezi dvěma barvami. Pro výplň lze vyuţít téţ bitmapový obrázek (např. fotografie). Výplň objektů můţe být poloprůhledná nebo s hladkým přechodem průhlednosti do barvy. Je definováno několik různých reţimů, určujících vzájemné působení poloprůhledných objektů. Objekty mohou být seskupeny pro účel průhlednosti s tím, ţe určená průhlednost je aplikována na celou skupinu objektů najednou. 2.4.3
Rastrové obrázky PDF dokumenty mohou obsahovat rastrové obrázky mezi 1 a 16 bity na barvu,
v několika barevných modelech (např. tří-komponentový RGB nebo čtyř-komponentový CMYK). Obrázky mohou být komprimovány pomocí různých bezztrátových i ztrátových mechanismů. Obrázky mohou být v libovolném měřítku a mohou být vloţeny přes sebe, mohou být pouţity pro vytvoření vzoru výplně, mohou mít předlohu, která definuje, jak obrázky pouţívají průhlednost, např. aby splynuly s pozadím, na kterém jsou umístěny. 2.4.4
Barevné modely PDF můţe pracovat s barevnými modely, které vyuţívají konkrétní elektronická nebo
tisková zařízení (ve stupních šedi, RGB, CMYK), a také ty, které souvisí s lidským vnímáním barvy. Navíc PDF je schopno pracovat i s přímými barvami, coţ vyuţívá např. polygrafický 32
průmysl. Existuje moţnost, ţe některé aplikace nepodporují rozšíření barevných modelů. V tom případě se tyto barevné modely převedou na základní. 2.4.5
Metadata PDF dokumenty mají sadu standardních metadat, jako je název, autor, klíčová slova
a tak dále. Metadata jsou definována mimo grafický obsah a nemají ţádný vliv na dokument při zobrazení. Tvůrce (program, který vytvořil obsah) a producent (program, který napsal PDF soubor) se také evidují. Kaţdý dokument má také sadu jedinečných identifikátorů, které lze sledovat během procesu workflow. Od okamţiku vytvoření verze PDF 1.4 metadata mohou být uchovávány v XML (eXtensible Markup language) dokumentu vloţeném do PDF s pomocí Adobe Extensible Metadata Platform (XMP). Tím je definován způsob, jak uchovávat metadata pro objekty v PDF, které mohou být rozšířeny třetími stranami za účelem drţení informace, která má vztah ke konkrétním produktům nebo workflows. 2.4.6
Navigace PDF dokumenty mají dvě metody navigace při prohlíţení na obrazovce: Dokumentový přehled, běţně známý jako záloţky dokumentu, je to strukturovaný seznam destinací v rámci dokumentu, zobrazený vedle něho. Kliknutím na jednu destinaci je moţné přesunout pohled na konkrétní stránku nebo pozici. Hypertextové odkazy v textu nebo grafice dokumentu umoţňují uţivateli kliknutím se přesunout jinam v rámci dokumentu nebo otevřít externí URL.
2.4.7
Volitelný obsah Skupiny volitelného obsahu v PDF umoţňují seskupovat a ukazovat (nebo
neukazovat) části obsahu stránky v závislosti na některých jiných faktorech (volba uţivatele, sledování dokumentu na obrazovce nebo vytisknutí, vyuţití měřítka). Vztahy mezi skupinami mohou být definovány tak, ţe jsou závislé na sobě navzájem. Jedinečným (konkrétním) pouţitím tohoto můţe být kopírování (emulace) "vrstev" nalezených v balíkách grafických programů. Například vrstvy Adobe Illustratora jsou zachovány, kdyţ vytvářející se dokument je moţné číst s pomocí PDF prohlíţeče.
33
2.4.8
Multimédia PDF dokumenty mohou obsahovat různé druhy multimediálních prvků. Jejich
mnoţství omezuje přenositelnost vlastní PDF a často není podporováno patřičným způsobem mimo Adobe produkty. Od PDF 1.2 Od PDF 1.4 Od PDF 1.5 Od PDF 1.6
Mohou být vloţeny zvuky a filmy. Mohou být definovány prezentace, kdy lze automaticky přecházet mezi stránkami s přechodnými efekty. Byl představen obecnější systém pro zahrnutí libovolných multimediálních prvků. Mohou být vloţena 3D umělecká díla. Tabulka 8 – Vývoj multimédií v PDF (převzato z [8.], přeložil autor)
2.4.9
Interaktivní formuláře K dispozici jsou dvě nekompatibilní formy architektur ve formátu PDF: AcroForms,
který je otevřený standard, a Adobe XML Forms Architecture (XFA), který je zdokumentován, ale vyţaduje komerční software od společnosti Adobe. Formuláře umoţňují uţivatelům vyplnit textová pole a vyuţívat zaškrtávací políčka a přepínací tlačítka. Pokud jsou data kompletní, mohou být uloţena do dokumentu (pokud je to dovoleno) nebo se předávají URL pro další zpracování. Vloţený JavaScript je často vyuţíván ve spojení s formuláři kvůli tomu, aby bylo moţné ověřovat hodnoty polí nebo podobné úkoly. 2.4.10 Logická struktura a přeformátování Nástroje logické struktury umoţňují spojovat informaci strukturálního obsahu (kapitoly, oddíly, číselné údaje, tabulky a poznámky pod čarou) s grafickým obsahem. Jednotlivé prvky mohou být laděny prostřednictvím třetí (zúčastněné) strany. Tagované PDF je jedno z těch, které má logickou strukturu zaloţenou na souboru prvků definovaných společnosti Adobe. Soubory odpovídající těmto konvencím mohou být přeformátovány pomocí programu čtečky knih za účelem zobrazení stejného textu na stránce jiné velikosti nebo textu jiné velikosti, například v čtečce e-knih. 2.4.11 Zabezpečení PDF dokumenty mohou být zašifrovány pro bezpečnost pomocí RC4 nebo AES šifrovacích metod. Existují dvě hesla – heslo majitele a heslo uţivatele. Heslo majitele odemkne soubor pro provedení všech změn, heslo uţivatele dovolí jen řadu operací zvolenou vlastníkem, kdyţ byl soubor původně zašifrován (například povolení nebo znemoţnění tisku
34
nebo extrakci textu). Často se stává, ţe uţivatelské heslo se nevyplňuje (zůstává prázdné), a proto otevření souboru se můţe jevit jako běţné, ale funkčnost souboru je omezena. Počínaje PDF 1.3, mohou být digitální podpisy vyuţívány k ověření identity uţivatele nebo obsahů dokumentu. 2.4.12 Komprese Obrázky a další datové proudy ve formátu PDF mohou být komprimovány pomocí různých bezztrátových a ztrátových metod definovanými třetími stranami. Při kompresi pouze těchto datových proudů (ne celého souboru), struktura PDF objektů je vţdy k dispozici bez dekomprese celého souboru a komprimované oddíly mohou být zpracovány pouze v případě potřeby. Existuje několik skupin kompresních metod: Bezeztrátová komprese pro dvou úrovňové (např. černá a bílá) obrázky. PDF podporuje standardní metody přesného kódování pro dvou úrovňové obrázky a od verze PDF 1.4 standard JBIG2, který poskytuje lepší kompresi obrázků stejné třídy. Ztrátové obrázkové filtry, jako je JPEG a od verze PDF 1.5 JPEG2000. Bezeztrátové
mechanismy
komprese
vhodné
pro
kompresi
videodat
a obecných dat, jako je Flate (zip algoritmus), Lempel–Ziv–Welch (LZW) a Run Length Encoding (algoritmus RLE).
35
3 Nástroje pro vytváření formátu PDF 3.1 Adobe Acrobat Acrobat nebyl nikdy navrţen pro podporu vytváření nových souborů a editaci stránek za účelem přidávání obsahu. Uţ od počátku byl Acrobat určen pro konverzi souborů do PDF formátu. Uţivatelé vţdy začali tím, ţe vytvořili dokument v jiném programu a výsledný dokument je následně konvertován do PDF buď pomocí nástrojů v rámci Acrobatu, nebo nástrojů a příkazů v rámci programů, které podporují převod nativních dokumentů do formátu PDF. 3.1.1
Způsoby vytváření PDF Acrobat nabízí několik voleb pro konverzi dokumentů do formátu PDF. Můţete
okamţitě zjistit, jaké volby pro PDF konverzi lze vyuţít v Adobe Acrobatu tím, ţe otevřete v nabídce Soubor Vytvořit. V podnabídce jsou seřazeny jednotlivé volby: Ze souboru. Tento příkaz se pouţívá pro konverzi některých formátů souborů do formátu PDF. Například konverze MS Word dokumentu, RTF souboru, souboru naformátovaného obrázku a mnoho dalších formátů. V nabídce zvolíte Soubor Vytvořit Ze souboru. Otevře se dialogové okno, kde vyhledáte na disku soubor, který chcete konvertovat do PDF, označíte ho a kliknete na tlačítko Otevřít. Ze skeneru. Tato volba umoţňuje skenovat dokument na plochém skeneru a konvertovat ho do formátu PDF jednoduchým kliknutím tlačítka. Z webových stránek. Slouţí pro konverzi webových stránek do formátu PDF. Ze schránky. Veškerá data, která jsou kopírována do systémové schránky, mohou být konvertována do formátu PDF. Sestavit PDF Portfolio. Existují moţnosti, jak přidat mnoho různých nativních formátů souborů do PDF Portfolia. Při vkládání souborů do PDF Portfolia máte na výběr buď konvertovat dokumenty do PDF, nebo zachovat původní formáty souborů. PDF Portfolio lze sestavit v nabídce pod odkazem Soubor Vytvořit Sestavit PDF Portfolio. Spojit soubory do jednoho PDF. Tuto moţnost lze vyuţít, jestliţe chcete konvertovat více souborů různých formátů do jednoho PDF dokumentu.
36
Příkaz Tisk. Pro konverzi nativních dokumentů do formátu PDF můţeme vyuţít příkaz Tisk. Prakticky kaţdý dokument vytvořený v autorském programu, který umoţňuje tisk, můţe být převeden do formátu PDF pomocí tiskárny Adobe PDF. 3.1.2
Adobe PDF tiskárna Chcete-li převést libovolný aplikační dokument do formátu PDF, zvolte Soubor
Tisk nebo přejděte na dialogové okno Tisk ve vašem autorském programu. Některé specializované programy, jako jsou účetní a další kancelářské programy, mohou mít příkaz pro tisk umístěný v jiné nabídce neţ v nabídce Soubor. Kdyţ otevřete dialogové okno Tisk, zobrazí se vám různé ovladače tiskáren, které jsou nainstalované na vašem počítači. V dialogovém okně Tisk stačí zvolit tiskárnu Adobe PDF a potvrdit operaci tlačítkem Tisk.
Obrázek 4 – Dialogové okno Tisk (převzato z [4.])
Jednoduché textové editory dokumentů, specializované aplikační programy, jako jsou účetní programy, shareware programy a další typy dokumentů aplikací, které nejsou běţně vyuţívány pro profesionální účely návrhu, jsou vhodnými kandidáty pro pouţití ovladače Adobe PDF tiskárny. 3.1.3
Tvorba PDF ze souborů Adobe Acrobat nabízí řadu moţností pro převod dokumentů aplikací do formátu PDF.
37
Obrázek 5 – Možností pro vytváření PDF souborů v rámci Acrobatu (převzato z [4.])
Tlačítko Vytvořit (vlevo na obrázku 5) nabízí několik moţností pro vytváření souborů PDF. Pokud zvolíte Soubor Vytvořit PDF (vpravo na obrázku 5), tak v nabídce najdete mnohem více moţností pro vytváření souborů PDF v rámci Acrobatu. K tomu, abyste mohli konvertovat nějaký formát souboru do PDF dokumentu, můţete vyuţít příkaz Vytvořit PDF Ze souboru. 3.1.3.1 Podporované formáty souboru Pokud je formát souboru podporován, dokument se převede do formátu PDF a lze ho otevírat v aplikaci Acrobat. Pokud formát souboru není podporován, zobrazí se dialogové okno informující, ţe formát není podporován.
Obrázek 6 – Dialogové okno Předvoleb pro konverzi do PDF (převzato z [4.])
Autodesk AutoCAD (pouze Windows) – Soubory Autodesk AutoCAD mohou být otevírány přímo v Acrobatu.
38
BMP – Bitmap je formát souboru, se kterým pracuje mnoho programů pro úpravu obrazů. CompuServe GIF – CompuServe Graphic Interchange Format byl vyvinut před mnoha lety. Tento formát je určen pro rastrovou grafiku. Je populární především pro webovou grafiku. HTML – Hypertext Markup Language slouţí pro psaní webových stránek. HTML soubor je moţné konvertovat do formátu PDF. InDesign – Soubory Adobe InDesign jsou podporovány Acrobatem. JPEG – Joint Photographic Experts Group obrázky jsou vyuţívány pro webovou grafiku a výměnu souborů na internetu. Microsoft Office (pouze Windows) – Aplikace Microsoft Office lze konvertovat do formátu PDF. Jedná se o tyto aplikace: Excel, PowerPoint, Project, Visio, Word, Outlook a Publisher. PNG – Portable Network Graphics (PNG se vyslovuje jako ping). Je to formát, který umoţňuje uloţit 24-bitové barevné obrázky bez komprese. Formát byl navrţen pro webové pouţití a stává se populárnějším mezi webovými návrháři. PostScript/EPS – PostScript a EPS soubory byly kdysi převáděny pouze v Acrobat Distilleru. Jiţ v Acrobatu 8 můţete otevírat tyto soubory pomocí Acrobatu pouţitím nástroje Vytvořit PDF, zatímco Distiller pracuje na pozadí a zároveň zpracovává konverzi dat do formátu PDF. TIFF – Tagged Image File Format je bezesporu nejpopulárnějším formátem mezi lidmi pracujícími v tisku bez ohledu na platformu. TIFF soubory pocházejí z programů obrázkových editorů a skenování. 3.1.4
Konverze více souborů do PDF V Acrobatu 9 můţete konvertovat více souborů do formátu PDF nebo sloučit více
PDF dokumentů, a to buď do jednoho souboru PDF, nebo do PDF Portfolia. Acrobat 8 podporoval PDF balíčky, které později v Acrobatu 9 byly odstraněny ve prospěch nové funkce PDF Portfolií. Existuje mnoho voleb, jak konvertovat soubory, jestliţe pracujete s tlačítkem Combine a příkazy nabídky. 3.1.5
Konverze obrazů ze schránky Jsou situace, kdy máte například mapu s nalezeným cílem, která je součástí aplikace
a vy ji chcete vyříznout a poslat známému jako orientační pomůcku. Nebo potřebujete 39
někomu poslat instrukce pro přihlášení do sítě pomocí klienta FTP, pak je nejjednodušší vytvořit screenshot přihlašovacího okna a ten odeslat dotyčné osobě. Tyto příklady a mnoho dalších jsou ukázkami vyuţití zachycení obrazovek. Chcete-li zachytit screenshot celé obrazovky monitoru v operačním systému Windows, stiskněte Shift + PrtScrn (PrintScreen) nebo PrtSc klávesu. Stisknutím těchto kláves zkopírujete aktuální pohled na vašem monitoru do schránky. Máte moţnost spustit Acrobat nebo ho maximalizovat a zvolit Ze schránky v rozbalovacím menu tlačítka Vytvořit úkol. Data ze schránky se otevírají jako PDF dokument v podokně Acrobatu. Pokud máte otevřené okno menu nebo dialogové okno, můţete pomocí zachycení obrazovky vytvořit z těchto oken screenshoty. Pokud chcete zachytit dialogové okno bez pozadí v systému Windows, pouţijte Alt + PrtScrn (nebo PrtSc). Obrazovky zachycené na operačním systému Windows s pomocí těchto metod vytvářejí 96-ppi (pixelů na palec) obrázky; a obrazovky zachycené na operačním systému Mac jsou v rozlišení 72-ppi. 3.1.6
Skenování do PDF Skenování do PDF je dostupné, pokud klikneme na tlačítko Vytvořit a v nabídce
zvolíme PDF ze skeneru. Tato volba umoţňuje naskenovat dokument pomocí stolního skeneru a konvertovat ho do formátu PDF. Acrobat nabízí několik uţitečných funkcí pro skenování souborů do Acrobatu. Jsou dvě moţnosti, jak otevřít dialogové okno pro konverzi naskenovaného dokumentu do formátu PDF. Vyberte Dokument Skenování do PDF anebo Vytvořit PDF ze skeneru. 3.1.7
Konverze webových stránek do PDF Pro převod webových stránek do PDF pouţijte příkaz Vytvořit PDF z nabídky webové
stránky. Můţete také pouţít tlačítko Vytvořit PDF a zvolit PDF z webové stránky pro konverzi webových stránek nebo souborů HTML uloţených na určeném místě ve vašem počítači nebo na síťových serverech. Web Capture obsahuje řadu nástrojů pro různé typy konverzí webových stránek, webových odkazů, polí formuláře HTML, animací nebo více stránek do formátu PDF. Web Capture převádí textové soubory, obrázky a soubory HTML do PDF a kaţdá webová stránka se přidává k převedenému dokumentu. Formát PDF zajistí archivaci informací, analýzu dat, vytváření indexů pro vyhledávání a mnoho dalších funkcí.
40
Webové stránky, které obsahují animace, jako je Flash animace, mohou být převedeny do formátu PDF s uţitím aplikace Acrobat 6 a následujícími verzemi. Kdyţ se zachycují animované stránky, animační efekty lze prohlíţet v souboru PDF prostřednictvím libovolného Acrobat prohlíţeče.
Obrázek 7 – Webová stránka převedena do PDF (převzato z [4.])
3.1.7.1 Zachycení webových stránek K tomu, abychom zachytili webové stránky, pouţíváme dialogové okno Vytvořit PDF z webové stránky, které lze otevřít v nabídce Soubor Vytvořit PDF Z webové stránky.
41
Obrázek 8 – Dialogové okno Vytvořit PDF z webové stránky (převzato z [4.])
V dialogovém okně Vytvořit PDF z webové stránky najdeme nastavení, která určují mnoho různých atributů pro konverzi webové stránky do formátu PDF a také pro to, jak se webová stránka ve formátu PDF zobrazí v Acrobatu. První úroveň ovládacích prvků se zpracovává v dialogovém okně Vytvořit PDF z webové stránky. Dodatečná tlačítka v tomto dialogovém okně otevírají další dialogová okna, v nichţ nalezneme detailnější moţnosti nastavení. Výchozí zobrazení dialogového okna Vytvořit PDF z webové stránky ukazuje zkrácený seznam moţností, jak je uvedeno v horní části obrázku 8. Pokud kliknete na tlačítko Zachytit více úrovní v dialogovém okně, můţete rozšířit seznam moţností, jak je uvedeno ve spodní části obrázku 8. V rozšířeném seznamu moţností můţeme zadat počet úrovní pro staţení. 3.1.8
Vytváření PDF ze šablon Mnoho různých autorských aplikací, včetně Adobe Acrobatu, podporuje vytváření
nových souborů ze šablon. Je moţné, ţe budete někdy potřebovat vyplnit objednávkový formulář, formulář faktury, slip za pobyt v hotelu nebo nějaký jiný podobný doklad. Uţitečná věc na pouţití šablon je, ţe zabraňuje nechtěnému přepsání originálu. Při otevření šablony vţdy máte k dispozici nový originál dokumentu a po kliknutí na nástroj Uložit budete vyzváni k zadání nového názvu. Tato funkce pomáhá hlavně šetřit čas. Mimo jiné je výhodné ukládat všechny šablony do jedné sloţky, tím se dá také ušetřit čas.
42
3.2 Aplikace Microsoft Office V rámci Acrobatu jsou k dispozici volby pro vytváření PDF přímo z některých autorských programů. Adobe věnovala mnoho času k tomu, aby vytvořila nástroje, které snadno převedou většinu aplikací Microsoftu do formátu PDF. Jediným stisknutím tlačítka v téměř kaţdé aplikaci Microsoftu můţete konvertovat vaše dokumenty do formátu PDF. Společný nástroj pouţívaný v těchto programech je Acrobat PDFMaker vytvořený společnosti Adobe Systems, který je automaticky nainstalován do kaţdého programu nebo aplikace podporující tento nástroj. Acrobat PDFMaker je instalován do počítače během instalace Adobe Acrobatu. 3.2.1
Microsoft Word Ze všech aplikací Microsoft Office, Microsoft Word nabízí nejlepší podporu pro
vytváření souborů PDF. Microsoft Word je jediná aplikace pro zpracování textu, která poskytuje přístup ke strukturálním datům dokumentu. Strukturální data dokumentu Word, jako jsou nadpisy, záhlaví, tabulky, odstavce a tak dále, mohou být převedeny na tagované záloţky. Tagované záloţky poskytují mnohem větší kontrolu nad PDF obsahem. Můţete se pohybovat směrem k prvkům struktury a přemísťovat, kopírovat, vyčleňovat a odstraňovat stránky prostřednictvím nabídky příkazů v panelu Záloţky. Ze všech nástrojů, které máte k dispozici pro konverzi dokumentů do formátu PDF v rámci Acrobatu, je pouţití PDFMakeru nejlepší volba. Protoţe PDFMaker vám zajišťuje větší mnoţství variant nastavení pro ovládání atributů v převedeném souboru. Například, pokud chcete nastavit pořadí hierarchie objevení záloţek v převedeném PDF, je nezbytné pouţít PDFMaker. Pokud chcete převést PowerPoint soubory s přechody a efekty médií, je nezbytné pouţít PDFMaker. Pokud chcete vytvořit vrstvené soubory PDF z aplikace Microsoft Visio, je nezbytné znovu pouţít PDFMaker. PDFMaker nabízí několik nástrojů pro řízení procesu vytváření PDF souborů v rámci aplikace Microsoft Word a všech ostatních programů společnosti Microsoft, které vyuţívají nástroj PDFMaker. Pokud byl Adobe Acrobat předem nainstalován do operačního systému, zobrazí programy ze sady Microsoft Office 2007 kartu Acrobat v pásu karet. Klepnutím na kartu Acrobat se objeví několik nástrojů, které se pouţívají pro práci s Adobe PDF soubory. Na obrázku 9 jsou zobrazeny nástroje karty Acrobat v rámci aplikace Microsoft Word.
43
Obrázek 9 – Nástroje karty Acrobat v MS Word (převzato z [4.])
3.2.2
Microsoft Excel
Obrázek 10 – Nástroje karty Acrobat v MS Excel (převzato z [4.])
Při konverzi souborů Microsoft Excel do formátu PDF se postupuje podobně jako u aplikace MS Word. Vyuţívá se nástroj Acrobat PDFMaker. Na obrázku 10 je zobrazena karta Acrobatu v aplikaci Microsoft Excel. Na první pohled je zřejmé, ţe nástroj Acrobat PDFMaker poskytuje odlišné funkce pro aplikaci MS Excel neţ funkce pro aplikaci MS Word. Všimněte si, ţe nástroje Hromadná korespondence a Acrobat komentáře jsou jedinečné pouze pro aplikaci Word a neobjevují se v Excel nabídce. Zbývající nástroje jsou stejné jako v aplikaci Word. Nicméně při konverzi do formátu PDF máte k dispozici některé jiné volby na výběr pro vytváření PDF souborů z aplikace Excel. 3.2.3
Microsoft PowerPoint Nastavení konverze v aplikaci PowerPoint nabízí několik dalších moţností, které
nenajdeme v aplikacích Word a Excel. Chcete-li otevřít dialogové okno Acrobat PDFMakeru, klepněte na kartu Acrobat v pásu karet a dále klepněte na poloţku Předvolby. Kdyţ se otevře dialogové okno Acrobat PDFMakeru, zobrazí se čtyři nové poloţky v aplikačním nastavení, které se neobjevují v aplikacích Word a Excel. PowerPoint při konverzi souborů do formátu PDF nabízí mimo jiné následující volby: 1. Konvertovat multimédia. Importovaná média, jako jsou zvuk a video v souborech aplikace PowerPoint, mohou být konvertována do PDF média. 2. Zachovat přechody snímků. Přechody snímků lze uloţit do souboru PDF a prohlíţet v celoobrazovkovém reţimu v prohlíţeči Acrobat. 44
3. Konvertovat skryté snímky do stránek PDF. Jestliţe máte skryté snímky ve vaší prezentaci PowerPoint a přejete si, aby se skryté snímky objevily jako stránky ve výsledném PDF. 4. Konvertovat poznámky. Poznámky mohou být konvertovány do dokumentu ve formátu PDF. 3.2.4
Microsoft Outlook Acrobat PDFMaker je také instalován do aplikace Microsoft Outlook. Po spuštění
aplikace Outlook se zobrazí dva nástroje v nástrojové liště, které nainstaloval Acrobat. První nástroj je určen pro vytváření Adobe PDF souborů z vybraných zpráv a druhý nástroj slouţí pro vytváření Adobe PDF souborů ze sloţek. Chcete-li konvertovat e-mailové zprávy obsaţené ve sloţce Doručená pošta nebo z jiné sloţky, vyberte zprávy, které chcete převést do formátu PDF. Mohli byste mít řadu zpráv souvisejících s konkrétním tématem, ve kterém chcete archivovat veškerou poštu vztahující se k danému tématu. Pomocí klávesy Shift nebo klávesy Control vyberte zprávy ze schránky, které chcete archivovat. Poté co vyberete zprávy, klepněte na nástroj Vytvořit Adobe PDF z vybraných zpráv. Otevře se dialogové okno Uložit Adobe PDF soubor jako.
Obrázek 11 – Dialogové okno Uložit Adobe PDF soubor jako (převzato z [4.])
Po určení cílové sloţky, ve které bude soubor uloţen, klepněte na tlačítko Uložit a PDFMaker konvertuje vaše vybrané zprávy do formátu PDF. Výsledkem bude PDF Portfolio. V PDF Portfoliu lze najít kaţdou zprávu konvertovanou do PDF souboru. Můţete hledat obsah Portfolia a najít výsledky zaloţené na textovém vyhledávání. PDF Portfolio poskytuje mnoho moţností pro prohlíţení, úpravu a správu vašich konvertovaných zpráv. Druhé tlačítko, které najdete v aplikaci Outlook, je nástroj Vytvořit PDF ze složky. Klepnutím na tento nástroj lze konvertovat celou sloţku zpráv do PDF (znázorněno na obrázku 11).
45
3.3 Print2PDF X Print2PDF X poskytuje konverzi dokumentů do formátu PDF a PDF/A podle mezinárodních norem ISO a nabízí řadu moţných nastavení. Print2PDF X je produktem společnosti Software602. Print2PDF X je serverové řešení pro centrální zpracování dokumentů ve formátu PDF, PDF/A a PAdES (PDF Advanced Electronic Signatures). Reflektuje nové praktické poţadavky z oblasti digitalizace, autorizace a dlouhodobé archivace. Print2PDF X je řešení určené především pro větší a střední organizace. 3.3.1
Novinky v Print2PDF X
Dlouhodobá ověřitelnost dokumentů (LTV – long term validation) „Aplikace
podporuje
funkce
a
specifikace
PAdES
(ETSI
–
European
Telecommunications Standards Institute) pro ověření stavu dokumentů a jejich formátů s ověřením certifikátů elektronických podpisů, značek a časových razítek, jejich kontrolu vůči CRL listu, kontrolu neporušenosti binárního otisku dokumentu. Dále zprostředkovává uložení metadat na registračním AdES Serveru, díky kterým je možné rychle ověřit, který dokument je třeba k danému datu občerstvit, či v jakém stavu se nachází.―7 Dlouhodobá archivace dokumentů (LTA – long term archiving) Aplikace Print2PDF X nově podporuje dlouhodobou archivaci dokumentů. Pro tento účel je potřeba konvertovat poţadované soubory do formátu PDF/A. (PDF/A byl schválen Mezinárodní organizaci pro normalizaci (ISO) jako ISO standard pro archivaci). Převod běžných PDF do PDF/A pro jejich dlouhodobou archivaci Aplikace nabízí moţnost převodu běţných PDF souborů do formátu PDF/A, který můţe zajistit dlouhodobou archivaci těchto souborů. Silnější šifrování PDF dokumentů V případě, ţe potřebujete ochránit vaše dokumenty například před neoprávněným přístupem, můţete vyuţít nově podporovanou funkci šifrování PDF souborů pomocí standardu AES (Advanced Encryption Standard). Šifrování probíhá na úrovní 128 bitů. Jedná se o průmyslově vyuţívaný šifrovací mechanismus, který slouţí k zabezpečení PDF dokumentů.
7
Software602. Novinky Software602 Print2PDF X. 602.cz [online]. © 2013. [cit. 2013-02-17]. Dostupné z:http://www.602.cz/produkty/print2pdf/novinky
46
3.3.2
Vlastnosti nástroje Print2PDF X
Soulad se standardy Adobe PDF Print2PDF X umí vytvářet Adobe PDF kompatibilní dokumenty. Je zaručeno, ţe tyto dokumenty budou čitelné kaţdému, bez ohledu na operační systém. Vytvořený dokument ve formátu PDF bude vţdy vypadat stejně. Automatizace převodu Rozhraní webových sluţeb poskytuje funkce pro automatickou konverzi dokumentů všech podporovaných formátů. Nástrojem, pro bliţší specifikaci automatické konverze, slouţí konverzní profily. Webová online konverze dokumentů do PDF Lze snadno vytvořit webovou aplikaci, která umoţní vytváření PDF dokumentů prostřednictvím webového prohlíţeče. Tato funkce je určena zejména pro ty uţivatele, kteří nemohou instalovat tiskový ovladač. Sledované složky a e-maily s automatickým převodem do PDF Uţivatel můţe zvolit určitý počet souborových sloţek a POP3 e-mailových účtů a předem nastavit pravidla pro jejich automatickou centrální konverzi. Kaţdý nově vloţený nebo přijatý dokument bude automaticky převeden do formátu PDF. Podepisování PDF dokumentů elektronickými certifikáty PDF dokumenty je moţné opatřit elektronickým podpisem. V rámci organizace je podepisování PDF dokumentů důleţité z hlediska zajištění důvěryhodnosti předávaných dokumentů a zachování jejich integrit. Opatřování PDF dokumentů kvalifikovanými časovými razítky Print2PDF X poskytuje moţnost opatřit PDF dokumenty kvalifikovanými časovými razítky. Časová razítka od uznávané autority spolehlivě stanoví, kdy byl soubor podepsán, přijat nebo byl pozměněn. Zabezpečení dokumentů PDF šifrováním Aplikace umoţňuje vyuţít 40 nebo 128-bitové RC4 šifrování pro zabezpečení citlivých dat. Úkolem RC4 šifrování je ochránit vaše PDF dokumenty. Komprese obrázků K dispozici je funkce komprese obrázků ve formátu JPEG 2000, JPEG nebo ZIP s jednoduchým nastavením úrovně výsledné kvality. 47
Zabezpečení PDF dokumentů Print2PDF X nabízí dvě úrovně ochrany PDF souborů heslem. První úroveň ochrany zabraňuje otevření dokumentu neoprávněným uţivatelem a druhá úroveň ochrany nedovolí provádět změny v dokumentu. Nastavení oprávnění pro manipulaci se souborem Můţete nastavit oprávnění pro manipulaci se souborem ve formátu PDF. Jedná se hlavně o oprávnění k tisku PDF dokumentu, změnám a kopírování jeho obsahu nebo pro vkládání komentářů. Vlastní SMTP klient pro odesílání souborů Nespornou výhodou aplikace Print2PDF X je, ţe má vestavěný SMTP klient pro odesílání PDF dokumentů e-mailem. Do zprávy se vloţí PDF dokument jako příloha a následně se zpráva odešle pomocí SMTP serveru. Není třeba instalovat vlastního klienta pro odesílání e-mailů. Grafická razítka či vodoznaky na stránkách Aplikace podporuje grafická razítka a vodoznaky na stránkách. Díky této funkce je moţné označovat dokumenty obrázkem (například logo firmy) nebo vkládat vodotisk na stránky dokumentu (například TAJNÉ). Podpora pro metadata PDF dokumentu Print2PDF X umoţňuje vkládat do PDF dokumentu metadata. Metadata usnadňují vyhledávání v rámci určitého systému (například DMS – Document Management System). Mezi nejběţnější metadata dokumentu patří údaje o názvu, předmětu, údaje o autorovi a klíčová slova. Je podporován XMP standard pro metadata.
48
4 Využití formátu PDF pro distribuci dokumentů 4.1 Optimalizace PDF dokumentů pro distribuci Acrobat také umoţňuje optimalizovat PDF dokument pro konkrétní účel, můţe to být prezentace, kontrola dokumentu autorem (korektury v procesu zpracování broţury nebo webové stránky), dokument pro zveřejnění na webových stránkách nebo dokument, který bude vytištěn běţnou kancelářskou tiskárnou nebo polygrafickou sluţbou. PDF dokument optimalizovaný pro webové stránky je vhodná varianta pro šíření informací přes internet. Soubor PDF umístěný na vašich webových stránkách můţe kaţdý návštěvník stáhnout nebo prohlíţet online. Pro tento účel můţe běţný uţivatel pouţít svůj webový prohlíţeč.
4.2 Vytváření PDF dokumentů pro interní distribuci Mnoho moderních společností si uvědomuje, ţe pouţívat papír pro distribuci informací je neefektivní. Papír je ve větším mnoţství objemný, zabírá hodně prostoru a navíc je to drahý způsob, jak distribuovat písemnou informaci s krátkou ţivotností. Jestliţe podnik provozuje více poboček, vznikají také náklady na přepravu vydávaných dokumentů mezi jednotlivými pobočkami. PDF dokument je mnohem lepší řešení pro efektivní šíření informací přes firemní intranet, prostřednictvím e-mailu nebo pro distribuci PDF dokumentů na optickém disku. Příručka pro zaměstnance v tištěné podobě můţe obsahovat aţ stovky stran, a navíc bude zabírat velkou část pracovního prostoru zaměstnance. Tato stejná příručka můţe být vytvořena ve formátu PDF a distribuována zaměstnancům například na CD–ROMu. Příručka pro zaměstnance ve formátu PDF vyuţívá méně zdrojů, nabízí jednodušší řešení pro účel distribuce a běţného pouţití. Můţete také vyuţít PDF dokumenty pro distribuci interních sdělení. Pokud jste autor důvěrného interního sdělení, můţete dokument chránit heslem a přidat další bezpečnostní opatření Acrobatu k zabránění provedení změny nebo prohlíţení dokumentu nepovolanou osobou. Pokud potřebujete upravovat důvěrný dokument, můţete vţdy změnit nastavení zabezpečení a po provedení změn tato nastavení zabezpečení zablokovat. Kdyţ vytvoříte dokument pro interní distribuci, příjemci budou mít moţnost se podepsat na dokument pomocí funkce digitálního podpisu. Formát PDF dovoluje v dokumentu vyhledávat konkrétní informaci. K tomu slouţí moţnosti Pokročilého vyhledávání, která je přístupná v dialogovém okně Hledat (viz obr. 12) 49
Obrázek 12 – Můžete najít podstatnou informaci prostřednictvím příkazu Hledat (převzato z [7.])
4.3 Zabezpečení Acrobatu z hlediska distribuce Podniky často mívají pobočky v různých regionech, krajích a zemích. Příchod e–mailu zjednodušil posílání dokumentů pro pobočky. Jednotlivé dokumenty jsou odesílány jako e– mailové přílohy. Existuje nebezpečí, ţe vaší korespondenci můţe přečíst neoprávněná osoba (útočník), který záměrně pouţívá nelegální postupy k tomu, aby získal přístup k obsahu e– mailových zpráv ostatních uţivatelů. PDF dokumenty dovolují zapnout zabezpečení, kterým můţete adresátovi (uţivateli) omezit přístup k dokumentu. Například lze zakázat tisk dokumentu, případně kopírování dokumentu nebo jeho částí. K dispozici máte tři druhy zabezpečení Acrobatu: ochrana dokumentu heslem, ochrana dokumentu certifikátem zabezpečení a Adobe LiveCycle Policy Server. Kdyţ pouţíváte ochranu dokumentu heslem, je stejná úroveň oprávnění udělena všem příjemcům dokumentu. Pokud potřebujete přidělit různé úrovně oprávnění pro různé příjemce vašeho dokumentu, pouţijte ochranu dokumentu certifikátem zabezpečení. Kdyţ zabezpečíte dokument certifikátem zabezpečení, uţivatel můţe otevřít tento dokument, pouze pokud jste vybrali tohoto uţivatele ze svého seznamu důvěryhodných certifikátů a oni jsou přihlášeni
50
s odpovídajícím digitálním podpisem. Můţete přidělit různé úrovně oprávnění pro kaţdého uţivatele ve vašem seznamu důvěryhodných osob. Pokud se vaše organizace rozhodla přihlásit ke sluţbě Adobe LiveCycle Policy Server, můţete přizpůsobit strategii zabezpečení dokumentů, které vytváříte. Můţete například zakázat otevření dokumentu po uplynutí určitého data. Kdyţ zvolíte sluţbu Adobe LiveCycle Policy Server, budete vyzváni k přihlášení do systému prostřednictvím mandátu přiděleného vašim správcem systému. Poté můţete definovat zabezpečení on-line, které je po dokončení uloţeno on-line na Adobe LiveCycle Policy Serveru. 4.3.1
Ochrana dokumentu heslem Pokud pouţíváte zabezpečení heslem, můţete přidělit dokumentu heslo, které je nutno
zadat pro otevření dokumentu. Tento dokument můţe být otevřen pouze pomocí správného hesla. Kdyţ chráníte dokument heslem, můţete přidělit práva uţivateli v rozsahu, jaký je třeba, např. povolení úprav dokumentu. Zabezpečení se vyuţívá i v případě utajené komunikace, kdy e-mailem je zaslán zašifrovaný soubor a heslo k jeho otevření je zasláno např. pomocí SMS. 4.3.2
Ochrana dokumentu certifikátem zabezpečení Pokud pouţíváte ochranu dokumentu certifikátem zabezpečení, máte plnou kontrolu
nad tím, komu je povoleno otevřít dokument a kdo smí upravovat dokument. Můţete rovněţ přidělit různé stupně oprávnění, coţ je uţitečné u dokumentů, které budete rozesílat většímu počtu uţivatelů (např. v korporaci). Můţete poskytnout některým členům týmu úplný přístup k dokumentu, a přitom ostatní budou mít různé stupně přístupu k danému dokumentu. Pokud například nově přijatý zaměstnanec potřebuje nějaký dokument, můţete ho omezit tím, ţe nebude mít moţnost upravovat, tisknout a vyjímat některé částí z dokumentu. Pokud pouţíváte ochranu dokumentu certifikátem zabezpečení, vybíráte uţivatele, kteří mohou mít přístup k dokumentu z vašeho seznamu důvěryhodných osob. 4.3.2.1 Tvorba seznamu důvěryhodných osob Při ochraně dokumentu certifikátem zabezpečení, potřebujete vytvořit seznam důvěryhodných osob. Takovými osobami mohou být uţivatelé Acrobatu, kteří vám poslali své certifikáty. Kdyţ uţivatelé vytváří digitální ID, mají moţnost exportovat do souboru certifikát shodující se s jejich digitálním ID.
51
4.4 Optimalizace PDF dokumentů pro konkrétní účely Pokud jste někdy vytvářeli obrázky a dokumenty pro konkrétní účely, víte, ţe soubor musí být správně zformátován pro daný účel. Soubor vytvořený pro konkrétní účel má pochopitelně specifické vlastnosti. Například soubor, který byl vytvořen pro multimediální prezentaci, a soubor, který byl vytvořen pro webovou stránku, mají málo společného a liší se od sebe. Kdyţ vytváříte soubory pro tisk, musíte je optimalizovat pro výstupní zařízení uţivatele, to znamená sladit soubor co nejblíţe rozlišení tiskárny (DPI) a barevnému modelu (RGB vs. CMYK). Pokud je soubor určen pro sluţby komerčního tisku, pouţijte moţností Předtiskové přípravy aplikace Acrobat X Pro a uloţte dokument jako PDF/X soubor. Na druhou stranu, kdyţ vytváříte PDF soubor pro multimediální pouţití CD–ROMu, přizpůsobíte PDF rozlišení obrazovky. Kdyţ vytváříte dokument pro webovou stránku, potřebujete dosáhnout zlatou střední cestu mezi kvalitou obrazu a dobou stahování dokumentu. 4.4.1
Vytváření PDF dokumentů pro internet Pokud navrhujete webové stránky, můţete vyuţít PDF dokumenty různými způsoby.
Například můţete vytvořit katalog výrobků, interaktivní prostředky výuky, PDF formuláře, a také publikovat příručku, to vše ve formátu PDF. Návštěvník webových stránek si můţe vybrat, buď můţe prohlíţet dokument ve webovém prohlíţeči, anebo stáhnout kompletní soubor pro následující prohlíţení. Nejpopulárnější webové prohlíţeče podporují Adobe Acrobat a Adobe Reader X jako plug–in nebo pomocné aplikace. 4.4.2
Vytváření PDF dokumentů pro tisk Po optimalizaci souboru pro tisk, Acrobat X Pro nabízí moţností pro odeslání souboru
na výstupní zařízení. Dialogové okno Tisk v aplikaci Acrobat X Pro má tlačítko pro pokročilé nastavení. Kdyţ kliknete na toto tlačítko, otevře se samostatné dialogové okno, které vám umoţní zadat tiskové rozlišení a moţností výstupních dat. Můţete také stanovit další moţností, jako jsou ořezové značky, úrovně průhlednosti a schopnost vynechání obrázků během tištění kontrolního souboru PDF. Prohlíţení a tisk – to jsou dvě z mnoha moţností při vytváření PDF, které mohou být pouţity při tisku. Můţete najít další moţností vytváření PDF pro tisk v souladu s oddílem Předtiskové přípravy v panelu Nástrojů.
4.5 Distribuce formulářů PDF Pokud vytvoříte PDF formulář za účelem shromaţďování dat, můţete zjednodušit proces distribuce PDF formulářů a sběru údajů z vrácených formulářů. Můţete spravovat 52
formuláře díky novým funkcím Adobe Acrobatu X a také exportovat data z vyplněných formulářů jako tabulku. Pokud máte formulář, který musí být distribuován prostřednictvím e-mailu více příjemcům, můţete takto snadno učinit v Acrobatu. Máte moţnost odeslat formulář okamţitě nebo uloţit formulář pro následující distribuci. Formulář PDF se skládá z polí, které pouţíváte k akumulaci údajů od lidí, kterým distribuujete formuláře. Pole mohou být pouţity pro sběr textu a číselných údajů. Můţete stanovit formátování polí, a tím určit typ a vzhled zadávaných dat. Můţete také vytvářet formuláře pro objednávky, dotazníky a pro získání zpětné vazby od návštěvníka dané webové stránky. Můţete vytvářet formuláře, které spočítají výsledky on– line nákupu a poté předávají příkazy internetovému prodejci. 4.5.1
Tvorba formulářů PDF Kdyţ vytváříte formulář ve formátu PDF, můţete naskenovat existující papírový
formulář do Acrobatu, následně pouţijte nástroje z oddílu Formuláře v panelu Nástrojů pro tvorbu formuláře a v dalším kroku přidejte pole interaktivního formuláře ve stejné pozici, jako jsou pole v naskenovaném dokumentu. Můţete také vytvořit formulář v Acrobatu, tím ţe otevřete dokument obsahující prvky, které vypadají jako pole formuláře a pak spuštěním příkazu Vytvořit v oddílu Formuláře v panelu Nástrojů. Pole formuláře jsou automaticky odhaleny při vytváření formuláře. Obrázek 13 ukazuje dokument Word, který byl otevřen v Acrobatu. Průvodce formulářem byl pouţit k odhalení objektů, které vypadaly jako pole formuláře. Pokud jste například vytvořili v dokumentu Word tabulku, Acrobat bude detekovat buňky jako textová pole.
53
Obrázek 13 – Využití dokumentu Word jako základ pro PDF formulář (převzato z [7.])
4.5.2
Druhy polí formuláře PDF Chcete–li
vytvořit
pole
ve
vašem
formuláři
PDF,
klikněte
na
tlačítko
NástrojeFormulářeVytvořit. Tím se spustí proces rozpoznávání polí formuláře v dokumentu, který byl vytvořen v jiné aplikaci, jako je například Microsoft Word. Můţete také přidat formuláře do aktuálně otevřeného dokumentu kliknutím na tlačítko NástrojeFormulářeUpravit. Po spuštění tohoto příkazu se Acrobat pokusí najít pole v daném dokumentu. Pokud se nic nepodobá poli, pak můţete přidat svá vlastní pole do dokumentu. V Acrobatu můţete vytvořit různé druhy polí formuláře: Tlačítko. Můţete vytvořit tlačítko v textovém tvaru, tlačítko v podobě obrázku nebo tlačítko kombinující text a obrázek. Můţete vytvořit neviditelné tlačítko a umístit ho nad existující grafikou na formuláři, který jste naskenovali a převedli do formátu PDF, coţ vytváří dojem, ţe grafika provádí činnost namísto pole formuláře. Zaškrtávací políčko. Můţete vytvořit skupinu zaškrtávacích políček, pokud chcete, aby uţivatel vybíral z mnoţiny moţností. Pokud například vytvoříte PDF dotazník, můţete vytvořit mnoho skupin zaškrtávacích políček pro
54
uţivatele, který si vybere jednu nebo více poloţek ze všech moţností, například jaké publikace nejčastěji čte. Combo box. Kdyţ vytváříte Combo box, dáváte uţivateli na výběr z moţností. Combo box je identifikován přítomností šipky. Pokud klikneme na šipku, nabídka se rozbalí a ukáţe seznam dostupných moţností, z nichţ lze vybrat pouze jednu. List box. Můţete vytvořit List box pro zobrazení seznamu dostupných moţností volby pro uţivatele. Můţete nastavit parametry, které umoţní uţivateli provést více výběrů z List boxu (toto není moţné u Combo boxu). V případě, ţe počet poloţek v List boxu přesahuje rozměry okna, Acrobat zajistí posuvnou lištu. Přepínací tlačítko. Můţete vytvořit skupinu přepínacích tlačítek za účelem omezení volby uţivatele na jednu poloţku ze skupiny přepínacích tlačítek. Například pokud zpracováváte on-line formulář objednávky, můţete vytvořit skupinu přepínacích tlačítek s moţnostmi výběru typu platební karty. Uţivatel zvolí moţnost, kterou posléze pouţije. Textové pole. Můţete vytvořit textové pole pro zápis vstupních dat od uţivatele nebo pro zobrazení dat, jako je například aktuální datum. Pole pro digitální podpis. Můţete vytvořit pole pro digitální podpis, aby se oprávnění uţivatelé mohli digitálně podepsat na formulář. Pole pro čárový kód. Můţete vytvořit pole pro čárový kód, pokud chcete přenášet data z formuláře, který byl vytištěn nebo poslán faxem. Pole pro čárový kód eliminuje potřebu číst a ručně zapisovat data z formuláře, který nebyl předloţen elektronicky. Musíte zakoupit software Adobe Barcoded Paper Forms pro zpracování vytištěných formulářů s polem pro čárový kód.
55
5 Využití formátu PDF pro archivaci dokumentů 5.1 Využití formátu PDF/A Mnoho odvětví a profesí čekaly na standard PDF pro archivaci. Tento standard je vhodný nejen pro archivy, správní orgány, průmysl a obchod, ale také pro výzkum a vzdělávání. Obsah různého druhu můţe být uloţen jako PDF/A soubory. Dále je uvedeno několik vybraných příkladů z různých oblastí. 5.1.1
Ukládání e-mailů jako PDF/A V současné době stále více korespondence probíhá elektronicky prostřednictvím e-
mailu. Kaţdý, kdo přešel z jednoho e-mailového programu na jiný, ví, ţe nastávají potíţe spojené s přenosem staré pošty do nového systému. Protoţe PDF/A je bezpečný formát, dává moţnost ukládat e-mailové archivy v podobě formátu PDF/A a poté je ukládat na zálohovací média. Formát PDF uchová všechny zprávy včetně jejich příloh, které zůstanou k dispozici a lze je kdykoli z PDF/A formátu otevřít. 5.1.2
Ukládání brožur, příruček a informačních listin jako PDF/A Mnoho podniků a orgánů veřejné moci jiţ zpřístupnilo velké mnoţství informací ve
formě PDF dokumentů, které lze stáhnout. Standard PDF/A je vhodný jak pro ukládání těchto informací, tak i pro jejich okamţitou distribuci. 5.1.3
Plány, mapy a konstrukční výkresy v PDF/A Digitální mapy, architektonické kresby a stavební plány mohou být také pouţity
budoucími generacemi, pokud jejich tvůrce pouţije formát PDF/A. Zákon stanoví, ţe určité inţenýrské plány, jako jsou stavební plány pro mosty, musí být uchovávány po několik desetiletí. 5.1.4
Digitálně podepsané smlouvy v PDF/A Mnoţství obchodní korespondence se kaţdým rokem zvyšuje. Převáţná většina
z celkového mnoţství je zasílána elektronicky. PDF/A dokumenty lze podepisovat pomocí digitálního podpisu za účelem legitimizace smluv. 5.1.5
Věrné barvy v dokumentu PDF/A PDF/A také umoţňuje přesné zobrazení barev, coţ je významnou výhodou při práci
s daty, která obsahují digitální obrazy. Pokud například muzeum nebo galerie uţ má digitální 56
obrazy svých exponátů, mohou být převedeny do PDF/A souborů a lze je archivovat a zároveň těţit z výhod archivního formátu. Procedury digitálního formování obrazů se stávají stále důleţitějšími v lékařské diagnostice, coţ znamená, ţe PDF/A můţe být uţitečné také v této oblasti. 5.1.6
Uchovávání dokumentů pro tisk jako PDF/A Tiskaři a společnosti zabývající se přípravou tisku vyuţívají skutečnost, ţe standard
PDF/X, který je velmi rozšířený v jejich oboru působností, je plně kompatibilní s PDF/A standardem. PDF dokument můţe být současně PDF/X a PDF/A kompatibilní.
5.2 Konverze dokumentů PDF do archivních PDF Mnoho uţivatelů jiţ pouţívá PDF k ukládání dokumentů do digitálních archivů v podnicích, orgánech veřejné moci nebo soukromí. Kdyţ byl přijat standard PDF/A, uţivatelé dostali moţnost vytvářet archivní dokumenty z jejich stávajících souborů, čímţ se zajišťuje moţnost jejich dlouhodobého pouţití. Kromě toho příjemci tradičních PDF souborů, které je třeba zachovat, ale zatím nejsou k dispozici ve formátu PDF/A, nyní mohou převést tyto soubory do archivních dokumentů PDF. V další části bude uveden postup pro konverzi dokumentů PDF do archivních PDF pomocí Preflight plug–inu. 5.2.1
Konverze do PDF/A pomocí Preflight U verze Acrobat Professional (verze 8 nebo vyšší) se pro převod PDF souborů do
PDF/A pouţívá integrovaný Preflight plug–in. Preflight modul se otevírá v Acrobat nabídce v kartě Advanced nebo stiskem Shift + Ctrl + X. (znázorněno na obrázku 14):
57
Obrázek 14 – Preflight plug–in v aplikaci Acrobat Professional (převzato z [1.])
Konverzi lze provést také kliknutím na volbu Uložit jako. I v tomto případě provádí konverzi Preflight modul. Spodní část hlavního dialogového okna Preflight okamţitě poskytne informace o stavu otevřeného souboru PDF. Pokud soubor PDF nebyl vytvořen ve formátu PDF/A, uţivatel obdrţí zprávu, která mu řekne, ţe soubor „není ve formátu PDF/A―. V případě, ţe uţivatel bude chtít ihned spustit konverzi do PDF/A, můţe jednoduše kliknout na PDF ikonu. (obr. 15)
Obrázek 15 – PDF ikona, která spouští konverzi do PDF/A (převzato z [1.])
Nástroj Preflight pouţívá dialogové okno k tomu, aby se zeptal uţivatele, zda stávající PDF soubor by měl být převeden do PDF/A–1a (úroveň A) nebo omezené PDF/A–1b (úroveň B) verze. 5.2.1.1 Konverze do PDF/A–1b Při převodu si uţivatel vybírá standard „PDF/A–1b― a nastavuje podmínku výstupních dat na „sRGB― v dialogovém okně. To znamená, ţe PDF, o kterém se jedná, je určen pro zobrazení na monitoru. Vzhledem k tomu, ţe PDF soubor pravděpodobně jiţ obsahuje nastavení výstupních parametrů, nástroj Preflight poskytuje zaškrtávací políčko, které specifikuje, ţe má být pouţito připravené nastavení. Kromě toho další zaškrtávací políčko zabraňuje vkládání ICC barevného profilu, pokud není vyţadován. Tím se zmenší výsledná velikost souboru.
58
Kdyţ uţivatel klikne na tlačítko OK, nástroj Preflight prohledá stávající PDF dokument, aby se ujistil, zda splňuje podmínky pro úspěšnou konverzi do PDF/A. Pokud jsou podmínky splněny, konverze proběhne. Podrobnosti o skončeném procesu konverze se zobrazí v dialogovém okně Výsledky v podobě seznamu. Seznam mimo jiné obsahuje informaci podobnou tomu, ţe nástroj přidal příponu"_A1b" k názvu dokumentu.
Obrázek 16 – Nastavení Preflight konverze (převzato z [1.])
5.2.1.2 Konverze do PDF/A–1a Druhá varianta popisuje konverzi souboru PDF do PDF/A–1a. Postup je stejný jako pro variantu 1 s výjimkou, ţe je zvolena úroveň kompatibility „1a― spolu s podmínkou výstupních dat, vhodnou pro čtyř-barevný tisk (například ISO Coated). Opět platí, ţe nástroj Preflight zkontroluje, zda příslušný dokument splňuje podmínky pro konverzi.
5.3 PDF/A validace PDF/A dokument vytvořený v aplikaci Adobe Acrobat můţe být snadno rozpoznán pomocí přípony názvu souboru „_A1a― nebo „_A1b―. Ostatní PDF/A generátory pouţívají podobné postupy. Tak proč je potřeba dodatečná kontrola neboli validace, kdyţ obdrţíte PDF/A soubor prostřednictvím e-mailu nebo otevřete dokument z archivu? Odpověď je jednoduchá: Protoţe PDF/A soubory nemohou být chráněny před dalšími úpravami s pomocí opatření včetně šifrování nebo hesel, coţ by odporovalo PDF/A předpisům, poněvadţ obsah PDF/A v plném rozsahu musí být přístupný bez jakýchkoli bezpečnostních opatření. To znamená, ţe PDF/A soubor, který byl kdysi kompatibilní se standardem, můţe ztratit tuto kompatibilitu v důsledku neúmyslných nebo záměrné provedených změn, aniţ by bylo zřejmé, ţe jiţ neodpovídá standardu. Samozřejmě, ţe můţe jít o podvod – je docela moţné, ţe uţivatel ručně přidal příponu do názvu souboru jako např. „_A1b― před odesláním, dokonce kdyţ daný soubor nikdy nebyl převeden do formátu PDF/A. To je důvod, proč kontroly jsou nutné pro úspěšné vyuţití 59
PDF/A. Data ve formátu PDF/A by měla být ověřována z hlediska kompatibility se standardem na dvou místech v procesu vývoje: Kdyţ PDF/A soubory jsou přijímány a před tím, neţ PDF/A dokumenty jsou převedeny do digitálního archivu (úloţiště dat, CD–ROM nebo DVD–ROM). 5.3.1
Preflight validace Preflight, nástroj aplikace Acrobat Professional, není určen pouze pro vytváření
PDF/A souborů – můţe být také pouţit k testování a ověřování PDF/A dokumentů pro jejich skutečnou kompatibilitu se standardem. PDF/A ikona vlevo dole v dialogovém okně Preflight nástroje poskytuje rychlý přehled o tom, zda je otevřený dokument kompatibilní s PDF/A. Pokud uţivatel otevře PDF/A soubor, který ještě nebyl ověřen, zobrazí se ikona v podobě ţlutého otazníku spolu se zprávou, ţe soubor nebyl ověřen (obrázek 17).
Obrázek 17 – Preflight dialogové okno (převzato z [1.])
Kliknutím na tuto ikonu se spustí proces validace. Nástroj pracuje s pomocí seznamu podmínek, které dokument PDF musí splňovat, aby byl v souladu s PDF/A standardem. Aby dokument mohl být povaţován za kompatibilní se standardem, je nutné dodrţet více neţ sto specifikací. Pokud proces validace nenalezne ţádné odchylky od standardu, software označí PDF/A soubor za kompatibilní se standardem (pomocí zeleného zaškrtávátka). PDF/A validace se nepodaří, pokud dokument nesplňuje všechny specifikace stanovené standardem. V takovém případě systém oznámí uţivateli, ţe došlo k problému prostřednictvím červeného X. Dialogové okno Preflight s výsledky obsahuje seznam 60
problémů, na které jsme narazili v průběhu validace. Uţivatelé mohou kliknout v tomto seznamu na určitou poloţku pro více informací o různých zprávách o chybách. Preflight můţe také označit místa, kde tyto problémy byly nalezeny. Preflight poskytuje tipy, jak opravit chyby, které se vyskytly, nebo jak se jim vyhnout.
5.4 Vlastnosti archivních PDF souborů Technické poţadavky PDF/A se mohou měnit v souladu s podmínkami pouţívání PDF/A souborů. Jeden z uţivatelů můţe vytvářet PDF/A soubory, které budou obsahovat pouze text bez ţádných obrázků, další můţe vyţadovat podpisy a třetí moţná bude potřebovat vytvářet PDF dokumenty, které mohou být archivovány a rovněţ odpovídají poţadavkům na přístupnost. 5.4.1
Obrázky Všechny obrázky obsaţené v PDF/A souborů musí být reprodukovatelné. Toto můţe
být zajištěno pouze jejich začleněním do souboru. Nemohou „mizet― v průběhu času, jak se to stává se soubory jiných formátů, ve kterých se obrázky ukládají do externích úloţišť a nikoliv do souborů. Obrázek na stránce PDF/A souboru je také reprodukovatelný, protoţe existuje pouze jednou. Ve vzácných případech a jen v oblasti předtiskové přípravy se pouţívají alternativní obrázky. Tyto obrázky obsahují variantu niţšího rozlišení pro obrazovku a variantu vysokého rozlišení pro tisk. PDF/A nepovoluje alternativní obrázky, protoţe nemůţe být zaručeno, ţe obě varianty mají přesně ten samý obsah. 5.4.2
Barvy Barvy ilustrací a grafiky v PDF/A by se měly vţdy zobrazovat stejně. PDF/A odstranil
problémy se zkreslením barev. PDF/A standard zaručuje spolehlivou reprodukci barev pro text, obrázky a grafické prvky, protoţe vyuţívá správu barev pro jejich spolehlivé zobrazení. Správa barev je zaloţena na pouţití barevných profilů, které jsou přidávány do obrazových souborů, grafických dokumentů a PDF souborů, aby slouţily jako technologický návod. 5.4.3
Písma Všechny pouţité fonty musí být vloţeny do souboru PDF/A. Pokud by tomu tak
nebylo, text zobrazený na počítači, který neobsahuje pouţité písmo, se nemusí zobrazit v celém rozsahu. To je neslučitelné s poţadovanou vizuální reprodukovatelnosti PDF/A dokumentu. Celý font nemusí být vloţen, postačí vloţit pouze znaky, které se pouţívají v tomto dokumentu. Toto je známo pod pojmem „Vloţené podmnoţiny―. S ohledem na 61
mezinárodní výměnu dokumentů je vyuţití vloţených písem významnou výhodou. Moderní operační systémy poskytují azbuku, asijská a východoevropská písma s cílem umoţnit správné zobrazení mezinárodních internetových stránek. Stále ovšem není zaručeno, ţe dodané fonty, jsou stejné jako ty, které pouţil tvůrce konkrétního PDF dokumentu. 5.4.4
Interaktivní PDF soubory Interaktivní prvky výrazně zvyšují funkční rozsah a moţností vyuţití PDF dokumentů.
PDF/A standard stanovuje, ţe soubory mohou obsahovat pouze v budoucnu osvědčené prvky, které nebrání srozumitelnosti. PDF/A si klade za cíl, aby veškerý obsah v PDF souborech byl reprodukovatelný a trvale přístupný. Komentáře nemusí být skryty nebo nastaveny jako „netisknout―. Pokud uţivatel chce přidat do PDF souboru trvalé komentáře – znamená to, ţe si přeje zachovat komentáře i v PDF/A souboru. V PDF/A je toto technicky moţné, komentář se definuje jako poznámka v Acrobatu a můţeme vygenerovat platný PDF/A soubor z dokumentu. Z technického hlediska jsou hypertextové odkazy také komentáře. Nesmějí být ponechány ve své původní podobě, pokud je chceme zachovat v PDF/A souboru. Všechny hypertextové odkazy musí být zjednodušeny. Pokud se uţivatel pokusí převést soubor PDF, který obsahuje odkazy, do PDF/A souboru, systém vydá dvě chybové zprávy pro kaţdý hypertextový odkaz. Preflight nabízí dvě funkce pro korekci tohoto stavu. Jakmile jsou odkazy vyřazeny, lze převést soubor PDF do PDF/A bez obtíţí. PDF/A standard povoluje ukládat formuláře, ale existují určité typy polí formuláře, které pracují s operacemi a operace mohou bránit PDF souborům být vhodnými pro dlouhodobou archivaci. Problémy se dají očekávat v následujících případech: Operace typu „Odeslat formulář―, „Import dat― a „Obnovit formulář― jsou zakázány. Je to pochopitelné, protoţe tyto operace mění obsah dokumentu. Dodatečné operace nejsou povoleny, protoţe mohou měnit obsah. JavaScript operace jsou zakázány, protoţe ohroţují reprodukovatelnost aktuálního stavu souboru. 5.4.5
PDF/A pro konstrukční výkresy Kresby jako plány CAD a mapy jsou ideálními kandidáty pro dlouhodobou archivaci
ve formě PDF/A souborů. Kresby z oborů architektury a statiky často musí být uchovávány po dlouhou dobu. Technické plány také často vyţadují dlouhodobé skladování. PDF 1.4
62
zvládne velké formáty stránek s délkou několik metrů, které se často vyskytují v technických výkresech. PDF 1.4 je specifikace formátu PDF, na které jsou zaloţeny PDF/A–1a a PDF/A–1b, podporuje maximální velikost stránky 200 x 200 palců, coţ odpovídá 5,08 x 5,08 m. Specifikace PDF 1.7 dovoluje virtuální velikost stránky aţ do 381 kilometrů na délku, ale PDF/A standard povoluje pouze maximální velikost stránky definovanou pro PDF 1.4. Konstrukční výkresy mohou být výstupem do PDF nebo dokonce do PDF/A přímo z běţných CAD programů. Starší plány jsou často naskenovány jako kresby a uloţeny například ve formátu TIFF G4. Takové plány mohou být převedeny do PDF a pak do PDF/A pomocí Acrobat Professional (nebo jiného softwaru pro převod). Návrhy vytvořené v 2D mohou být archivovány jako PDF/A soubory bez problémů. To neplatí v případě 3D modelů. Trojrozměrné návrhy jsou podporovány aţ od Acrobatu 7 (PDF 1.6). Proto nejsou povoleny ve formátu PDF/A.
63
Závěr Nástupem moderních elektronických formátů se zjednodušil a zefektivnil proces šíření a zpracování dokumentů. Formát PDF je jeden z řady formátů pro práci s dokumenty různého obsahu. Mezi jeho konkurenty patří například XPS, jednobarevný TIFF–G4, DOC (Word), RTF, JPEG atd. Kaţdý z těchto formátů má své výhody a nevýhody. Záleţí jen na uţivateli, který formát si zvolí pro naplnění konkrétního cíle. Pro různé účely se hodí určitý formát lépe neţ jiný, proto je důleţité se přesvědčit, zda zvolený formát vyhovuje naším potřebám a poţadavkům. Formát PDF, který představila společnost Adobe, splňuje řadu předpokladů pro bezpečnou manipulaci s dokumenty a umoţňuje rychlejší výměnu informací. Především se jedná o jeho široké uplatnění v různých oblastech lidské činnosti. PDF formát je komplexní řešení pro distribuci i archivaci dokumentů. Je zcela nezávislý na zařízení a zaručuje stejný výstup bez ohledu na konkrétní vybavení pracoviště. PDF umoţňuje z jednoho zdrojového souboru vytvořit sadu dokumentů přizpůsobených různému účelu. Z podkladů pro komerční tisk lze připravit dokument pro předtiskovou přípravu a zároveň dokument pro distribuci pomocí internetu s odpovídající kvalitou a optimalizovaným objemem dat. Formát PDF poskytuje zaručené postupy pro prakticky všechny účely související s nakládáním se soubory. Zaručenými postupy je míněno to, ţe PDF formát byl převzat organizací ISO jako standard v oblasti elektronického styku. Cílem práce bylo popsat vznik, vývoj a verze formátu PDF a jeho pouţití pro distribuci a archivaci souborů. Práce v úvodu seznamuje čtenáře s PDF formátem. V první kapitole je popsána historie vzniku PDF. Jedná se o formát, který vznikl vylepšením technologie PostScript. Dále je uveden stručný přehled verzí PDF, tak jak za sebou vznikaly. Významnou vlastnosti PDF formátu je jeho rozdělení na ISO standardy. Ve druhé kapitole práce popisuje vlastnosti PDF formátu z hlediska příkladů vyuţití PDF. Dále je čtenář obeznámen se strukturou PDF souboru a strukturou PDF dokumentu. Tedy z jakých částí se skládá PDF soubor a dokument uvnitř. Ve třetí kapitole jsou uvedeny nástroje pro vytváření PDF souborů. Jako hlavní nástroj je popsán Adobe Acrobat, který poskytuje bohatou funkční základnu pro vytváření různých typů PDF dokumentů. Pro aplikace ze sady Microsoft Office byl společnosti Adobe Systems vyvinut nástroj Acrobat PDFMaker. Jako příklad komerčního nástroje pro vytváření PDF dokumentů je uveden Print2PDF X české společnosti Software602.
64
Ve čtvrté a páté kapitole jsou shrnuty poznatky, které se týkají vyuţití formátu PDF pro distribuci a archivaci dokumentů. Distribuce dokumentů je zaměřena především na proces optimalizace PDF dokumentů pro konkrétní účely. Do distribuce dokumentů lze téţ zahrnout i PDF formuláře, které jsou známy jako interaktivní PDF dokumenty. Další významnou oblastí vyuţití formátu PDF je archivace dokumentů. Standard pro archivaci dokumentů PDF/A byl koncipován s ohledem na dlouhodobé uchovávání informace a moţnost jejich přečtení i po velmi dlouhé době. PDF formát vyuţívá velké mnoţství uţivatelů. Na celém světě je ve formátu PDF uloţeno obrovské mnoţství informace, proto formát PDF bude i nadále patřit k předním formátům pro práci s dokumenty díky svým spolehlivým vlastnostem a podporou pro další vývoj formátu.
65
Seznam použité literatury 1. DRÜMMER, O., A. OETTLER a D. VON SEGGERN. PDF/A in a Nutshell Long Term Archiving with PDF. Cover design: Anja Godolt. Berlin: Association for Digital Document Standards ADDS – PDF/A Competence Center, © 2007. ISBN 978-39811648-1-7. 2. LOWAGIE, Bruno. iText in Action Second Edition. Cover design by Marija Tudor. Stamford: Manning Publications Co., ©2011. ISBN 9781935182610. 3. NÁDBĚLA, Josef. Velký počítačový slovník. Computer Media s.r.o., © 2004. ISBN 80–86686–21–3. 4. PADOVA, Ted. Adobe Acrobat 9 PDF Bible. Indianapolis: Wiley Publishing, Inc., © 2009. ISBN 978-0-470-37919-6. 5. PADOVA, Ted. Adobe Acrobat X PDF Bible. Indianapolis: Wiley Publishing, Inc., © 2011. ISBN 978-0-470-61291-0. 6. PILAŘ, Alexander. Počítačové zkratky. GRADA Publishing s.r.o., © 1999. ISBN 80– 7169–799–0. 7. SAHLIN, Doug. How to Do Everything. Adobe Acrobat X. The McGraw-Hill Companies, © 2011. ISBN 978-0-07-175294-7. 8. WHITINGTON, John. PDF Explained. Cover design by Karen Montgomery. Sebastopol: O’Reilly Media, Inc., © 2012. ISBN 978-1-449-31002-8. 9. WINKLER, Peter. Velký počítačový lexikon. Brno: Computer Press a.s., © 2009. ISBN 978–80–251–2331–7. 10. Adobe Systems Incorporated. Acrobat X Pro/Buying guide: Version comparison. Adobe.com [online]. © 2013. [cit. 2013-02-16] Dostupné z: http://www.adobe.com/products/creativesuite/acrobatpro/buying-guide-versioncomparison.html 11. Appligent document solutions. PDF/UA Now ISO/AWI 14289. Appligent.com [online]. © 2013. [cit. 2013-06-11]. Dostupné z: http://www.appligent.com/pdfuanow-isoawi-14289/ 12. DICOM. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 6. 4. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/DICOM
66
13. DocBook. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 25. 3. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/DocBook 14. Elektrokardiogram. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 23. 3. 2013 [cit. 201306-11]. Dostupné z: http://cs.wikipedia.org/wiki/Elektrokardiogram 15. Enterprise content management. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 14. 6. 2013 [cit. 2013-06-18]. Dostupné z: http://en.wikipedia.org/wiki/Enterprise_content_management 16. Extensible Metadata Platform. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 26. 5. 2013 [cit. 2013-06-11]. Dostupné z: http://en.wikipedia.org/wiki/Extensible_Metadata_Platform 17. iText. About us. Itextpdf.com [online]. © 2010-2013. [cit. 2013-06-11]. Dostupné z: http://itextpdf.com/about.php 18. JPEG 2000. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 17. 3. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/JPEG_2000 19. KAUCKÝ, Richard. Rozhovor: Dlouhodobá ověřitelnost digitálních dokumentů. CIO Business World [online]. 16.03.2012 [cit. 2013-03-02]. ISSN 1803-7321. Dostupné z: http://businessworld.cz/rady-nazory-zkusenosti/rozhovor-dlouhodoba-overitelnostdigitalnich-dokumentu-8766 20. NASDAQ. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 10. 3. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/NASDAQ 21. PAdES. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 30. 5. 2013 [cit. 2013-06-11]. Dostupné z: http://en.wikipedia.org/wiki/PAdES 22. PDF/A. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 13. 5. 2013 [cit. 2013-05-20]. Dostupné z: http://cs.wikipedia.org/wiki/PDF/A
67
23. PPI. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 24. 5. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/PPI 24. RC4. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 26. 5. 2013 [cit. 2013-06-11]. Dostupné z: http://cs.wikipedia.org/wiki/RC4 25. Revokační seznam. In: Wikipedia: the free encyclopedia [online]. St. Petersburg (Florida): Wikipedia Foundation, 11.12.2006, last modified on 4. 4. 2013 [cit. 201306-11]. Dostupné z: http://cs.wikipedia.org/wiki/Revokační_seznam 26. Software602. Novinky Software602 Print2PDF X. 602.cz [online]. © 2013. [cit. 201302-17]. Dostupné z:http://www.602.cz/produkty/print2pdf/novinky 27. Software602. Produkt Software602 Print2PDF X. 602.cz [online]. © 2013. [cit. 201302-17]. Dostupné z: http://www.602.cz/produkty/sw-print2pdf 28. Software602. Vlastnosti Software602 Print2PDF X. 602.cz [online]. © 2013. [cit. 2013-02-17]. Dostupné z: http://www.602.cz/produkty/print2pdf/vlastnosti 29. TeX, LaTeX, MiKTeX. PostScript. Tex.anabar.ru [online]. © 1998. [cit. 2013-02-15]. Dostupné z: http://tex.anabar.ru/PostScript/books/articles/postscript.htm 30. Verypdf. Compressing your PDF files. Verypdf.com [online]. © 2000-2006. [cit. 201306-11]. Dostupné z: http://www.verypdf.com/pdfinfoeditor/compression.htm 31. White Paper. The future content imperative: The role of PDF in content lifecycles. In: Adobe.com [online]. © Aug, 2008. [cit. 2013-02-09]. Dostupné z: http://www.adobe.com/enterprise/standards/pdfs/pdf-content-lifecycle.pdf
68
Seznam obrázků Obrázek 1 – Obal PDF příručky, reklama na Acrobat Starter Kit a Acrobat diskety (převzato z [2.]).................................................................................................................... 12 Obrázek 2 – Typická struktura dokumentu pro dvoustránkový PDF dokument (převzato z [8.], přeloţil autor) .................................................................................................... 28 Obrázek 3 – Stromový model pro sedm stránek (převzato z [8.], přeloţil autor) .................... 30 Obrázek 4 – Dialogové okno Tisk (převzato z [4.]) ................................................................. 37 Obrázek 5 – Moţností pro vytváření PDF souborů v rámci Acrobatu (převzato z [4.]) .......... 38 Obrázek 6 – Dialogové okno Předvoleb pro konverzi do PDF (převzato z [4.]) ..................... 38 Obrázek 7 – Webová stránka převedena do PDF (převzato z [4.]) .......................................... 41 Obrázek 8 – Dialogové okno Vytvořit PDF z webové stránky (převzato z [4.]) ..................... 42 Obrázek 9 – Nástroje karty Acrobat v MS Word (převzato z [4.]) .......................................... 44 Obrázek 10 – Nástroje karty Acrobat v MS Excel (převzato z [4.]) ........................................ 44 Obrázek 11 – Dialogové okno Uloţit Adobe PDF soubor jako (převzato z [4.]) .................... 45 Obrázek 12 – Můţete najít podstatnou informaci prostřednictvím příkazu Hledat (převzato z [7.]).................................................................................................................... 50 Obrázek 13 – Vyuţití dokumentu Word jako základ pro PDF formulář (převzato z [7.]) ....... 54 Obrázek 14 – Preflight plug–in v aplikaci Acrobat Professional (převzato z [1.]) .................. 58 Obrázek 15 – PDF ikona, která spouští konverzi do PDF/A (převzato z [1.]) ......................... 58 Obrázek 16 – Nastavení Preflight konverze (převzato z [1.]) .................................................. 59 Obrázek 17 – Preflight dialogové okno (převzato z [1.]) ......................................................... 60
Seznam tabulek Tabulka 1 – Nové vlastnosti v různých PDF verzích (převzato z [2.], přeloţil autor) ............. 16 Tabulka 2 – Základní rozdíly mezi úrovní A a B standardu PDF/A (převzato z [1.], přeloţil autor) ................................................................................................................. 21 Tabulka 3 – Záznamy ve slovníku traileru (převzato z [8.], přeloţil autor) ............................. 28 Tabulka 4 – Dokumentový katalog (převzato z [8.], přeloţil autor) ........................................ 29 Tabulka 5 – Záznamy ve stránkovém slovníku (převzato z [8.], přeloţil autor) ...................... 30 Tabulka 6 – Záznamy stromového modelu stránek pro prostřední nebo kořenový uzel (převzato z [8.], přeloţil autor) ......................................................................... 30
69
Tabulka 7 – Záznamy ve stránkovém slovníku pro rotaci a velikost stránek (převzato z [8.], přeloţil autor) .................................................................................................... 31 Tabulka 8 – Vývoj multimédií v PDF (převzato z [8.], přeloţil autor) .................................... 34
Seznam zkratek 2D (2 Dimensional) – dvojrozměrné zobrazení dat 3D (3 Dimensional) – trojrozměrný prostor Acrobat Pro (Acrobat Professional) – profesionální placená verze aplikace Acrobat AcroForms – označeni pro interaktivní formuláře, byly představeny v PDF 1.2 ADBE – předpona registrovaná společností Adobe AdES Server (Advanced Electronic Signatures Server) – poskytuje sluţbu pro dlouhodobou ověřitelnost dokumentů podle standardu PAdES LTV AES (Advanced Encryption Standard) – pokročilý šifrovací standard, symetrická bloková šifra AI (Adobe Illustrator) – vektorový grafický editor od společnosti Adobe Systems AIIM (Association for Information and Image Management) – Asociace pro informační a obrazovou správu AutoCAD – program firmy AutoDesk, vyuţívá se pro konstrukční (projektové) práce AWI (Approved Work Item) – status během vývoje ISO standardu BMP (Bit Mapped Picture) – formát bitmapové grafiky, výhodou je obrovská podpora a rozšířenost CAD (Computer Aided Design) – počítačem podporovaný návrh (konstruování) CCITT Fax (Comité Consultatif International Téléphonique et Télégraphique) – standard pro kompresi faksimilních přenosů (fax) a pro komprimaci jednobarevných dokumentů CD–ROM (Compact Disk Read Only Memory) – datová paměť na optickém disku CMYK (Cyan, Magenta, Yellow, BlacK) – čtyř-komponentový barevný model substraktivního skládání barev (azurová, purpurová, ţlutá, černá) CRL (Certificate Revocation List) – seznam revokovaných (zneplatněných) digitálních certifikátů pro oblast kryptografie CTP (Computer To Plate) – technologie pro přímý osvit tiskových desek laserem DICOM (Digital Imaging and Communications in Medicine) – standard pro práci s daty, které jsou pořizovány snímacími metodami (CT, ultrazvuk atd.) ve zdravotnictví 70
DMS (Document Management System) – systém pro správu dokumentů DOC „documentation file“ – označuje příponu souboru, pouţívá se u souborů textových editorů Microsoft Word nebo WordPad DocBook – značkovací jazyk pro psaní dokumentace, vyuţívá se pro psaní knih nebo článků DPI (dots per inch) – jednotka rozlišení tiskárny, obrazovky nebo skeneru, udává se v tiskových bodech na palec DTP (Desktop Publishing) – vytváření publikací pomocí počítače v profesionálním softwaru, např. InDesign, QuarkXPress DVD–ROM (Digital Versatile (Video) Disc) – optický disk s větší hustotou zaznamenaných dat neţ u klasického CD–ROM ECM (Enterprise Content Management) – systém pro správu obsahu (strukturované a nestrukturované informace) v podniku EKG (Elektrokardiogram) – metoda zaznamenávání a vyhodnocování srdeční činnosti EPS (Encapsulated PostScript) – tiskový soubor určený pro výstup na tiskárně, která má implementován interpret pro programovací jazyk PostScript ETSI (European Telecommunications Standards Institute) – Evropský ústav pro telekomunikační normy Flate (ZIP algoritmus) – kompresní metoda, která je zaloţena na veřejně dostupných kompresních datových formátech ZLIB a DEFLATE FTP (File Transfer Protocol) – protokol pro přenos souborů po síti GIF (Graphics Interchange Format) – formát bitmapové grafiky, má omezenou paletu a kompresi HTML (Hypertext Markup Language) – programovací jazyk, který slouţí pro psaní webových stránek ICC profile (International Color Consortium) – barevné profily se vyuţívají v aplikacích pro zajištění převodu mezi barevnými modely RGB a CMYK, a také barevné shody při reprodukci barev (například profil ISO Coated) IPS (Interchange PostScript) – původní název formátu PDF (pro dokumenty) ISO (International Organization for Standardization) – Mezinárodní organizace pro normalizaci se sídlem v Ţenevě iText – americká společnost zabývající se elektronizaci dokumentů všech druhů ITXT – předpona pouţívaná pro iText JBIG2 (Joint Bi-level Imate experts Group) – metoda pro kompresi jednobarevných obrázků, pouţívá se u faxů 71
JPEG (Joint Photographic Experts Group) – formát pro ukládání obrázků např. fotografie, jedná se o ztrátový komprimační algoritmus JPEG2000 (Joint Photographic Experts Group) – novější verze, poskytuje lepší kvalitu neţ JPEG při stejném kompresním poměru LTA (long term archiving) – dlouhodobá archivace dokumentů LTV (long term validation) – dlouhodobá ověřitelnost dokumentů LZW (Lempel-Ziv-Welch) – Bezeztrátová kompresní metoda, kterou vyvinuli Lempel, Ziv, a Welch v roce 1978 Mac OS (Macintosh Operating System) – grafické uţivatelské rozhraní a zároveň operační systém počítačů Apple MS (Microsoft) – americká firma zabývající se vývojem OS Windows NASDAQ (National Association of Securities Dealers Automated Quotations) – největší burzovní trh v USA NPES (Association for Suppliers of Printing, Publishing, and Converting Technologies) – Asociace dodavatelů technologií pro tištění, vydavatelství a konverzi OCR (Optical Character Recognition) – optické rozpoznávání znaků OS (Operating system) – operační systém PAdES (PDF Advanced Electronic Signatures) – sada omezení a rozšíření vztahující se k PDF pro účel vyuţití zaručených elektronických podpisů PDF (Portable Document Format) – výměnný formát dokumentů společnosti Adobe PDF/A (Archiving) – ISO standard pro archivaci PDF/E (Engineering) – ISO standard pro inţenýrství PDF/H (Healthcare) – ISO standard pro zdravotnictví PDF/UA (Universal Accessibility) – ISO standard pro maximální dostupnost PDF/VT (Variable and Transactional printing) – ISO standard pro variabilní a transakční tisk PDF/X (eXchange) – ISO standard pro výměnu PDL (Page Description Language) – jazyk pro popis stránky dokumentu PNG (Portable Network Graphics) – formát bitmapové grafiky, navrţen jako náhrada JPG a GIF pro webové pouţití POP3 (Post Office Protocol 3) – internetový protokol, který řídí přenos e–mailů z poštovního serveru k příjemci PPI (pixels per inch) – pixelů na palec, jednotka pouţívaná k určení rozlišení rastrového obrazu nebo zobrazovacího zařízení (např. monitoru nebo skeneru) 72
Print2PDF X – produkt pro vytváření PDF souborů od společnosti Software602 PS (PostScript) – jazyk pro kompletní popis tiskové stránky RC4 – veřejný šifrovací algoritmus od firmy RSA Data Security z USA, proudová šifra RGB (Red Green Blue) – tří-komponentový barevný model aditivního skládání barev (červená, zelená, modrá) RLE (Run Length Encoding) – komprimační metoda, jejím cílem je redukovat opakující se sekvence znaků a tím sníţit celkový objem dat RTF (Rich Text Format) – formát pro přenos dokumentů z textových procesorů, soubor obsahující text doplněný formátováním SMS (Short Message Service) – posílání krátkých GSM zpráv SMTP (Simple Mail Transfer Protocol) – výměnný protokol elektronické pošty sRGB (standard RGB) – barevný model „standard RGB― TIFF (Tagged Image File Format) – formát bitmapové grafiky, nezávislý na platformě, vyuţíván především pro tiskové účely TIFF–G4 (Tagged Image File Format – Group4) – nejčastěji se pouţívá pro práci s jednobarevnými obrazy (černobílé) URL (Uniform Resource Locator) – jednoznačná adresa zdroje nebo sluţby v síti internet XFA (Adobe XML Forms Architecture) – nový formát pro formuláře od společnosti Adobe, byl představen v PDF 1.5 XML (eXtensible Markup language) – obecný značkovací jazyk vyvinutý konsorciem W3C XMP (Extensible Metadata Platform) – standard ISO, původně vytvořený společností Adobe, slouţí pro vytváření, zpracování a výměnu standardizovaných a zakázkových metadat XPS (XML Paper Specification) – formát dokumentů zaloţený na XML, podobá se formátu PDF ZIP – souborový formát pro komprimaci a archivaci dat
73