CORES vliv komprese JPG a rozliš ení na velikost souborů a jejich použ itelnost při uklá danídigitá lních dat v NKČ R
Stanislav Psohlavec
AiP Beroun s.r.o. prosinec 2001
Obsah: Příprava testů ......................................................................................................... 2 Volba řady rozlišení ........................................................................................................... 2 Zá věry z pří pravy dat......................................................................................................... 2 Statistický rozbor zí skaný ch dat ........................................................................................ 3 Celkový přehled dat....................................................................................................... 3 Vý běr dat dle jednotlivý ch typů dokumentů ................................................................. 4 Pokyny k vlastnízkoušká m ............................................................................................... 4 Dalšívlastnosti programu CORES ................................................................................ 5 Zá věr.................................................................................................................................. 5 Příloha 1 ................................................................................................................. 6 CORES (COmpresion, REsolution, Size) ná vod k použití.............................................. 6 Automatické vygenerová nívariacípomocíPhotoshop 5.0 a vyšší................................... 6 Příloha 2 ................................................................................................................. 8 Disky vliv komprese JPG a rozlišenína velikost souborů ................................................ 8 DISK 1 ........................................................................................................................... 8 DISK 2 ........................................................................................................................... 8 DISK 3 ........................................................................................................................... 8 DISK 5 ........................................................................................................................... 9 Příloha 3: Grafy.................................................................................................... 10
1
Př íprava testů Pro objektivníposouzenívlivu komprese použí vanípři uklá dá níobrazový ch souborů ve formá tu JPG byl vyvinut srovná vacíprogram CORES (viz pří loha 1).Tento program dovoluje subjektivně porovná vat rozdí ly v informační m obsahu obrazu a seřadit řadu obrazů dle vní mané kvality. Program se stal součá stíprostředků pro ří zenídigitalizace v NKČ R. Prvotní m úkolem při hledá nísubjektivní ho vztahu mezi rozlišení m a kompresíbyla pří prava vhodný ch dat. Bylo vybrá no sedm vzorků z rukopisů , tyto vzorky byly komprimová ny a konvertová ny do nižší ch rozlišení . Pro automatizaci zěchto činnostívyly napsá ny akce pro Photoshop 5.0 a 6.0. Všechny zdrojové obrazy majípočá tečnírozlišenívětšínež 320 DPI a pokrý vajícelou oblast typů dosud digitalizovaný ch obrazů . Volba řady kompresíbyla jednoduchá , využily se všechny možnosti, které nabí zí Photoshop 6.0, tedy třiná ct úrovní0- 12.
Volba ř ady rozlišení Cí lem bylo zmapovat celý rozsah od velmi dobré uživatelské kvality přes ná hledovou kvalitu až ke kvalitě dostačují cípro hromadné přehledy (gallery, tumbnails) Kritériem bylo, aby byl znatelný rozdí l mezi zvolený mi kroky. Po zkoušká ch byl zvolen krok cca 10:12, z něhož je odvozena ná sledují cířada rozlišení .: 320,270,220,190,160,135,115,90,80,66,57,48,40,34,28,24,20,17,14,12,10,8,7,6,5. Již při ověřová nívolby tohoto rastru jsme došli k pozná ní , že změna rozlišeníje vní má na ve srovná níse změnou komprese citlivěji než jsme očeká vali. Pokud byl krok rozlišenízvolen menší , byly sice často hodnoceny některé obrazy s vyšší kompresíméně pří znivě než tytéž obrazy obrazy sice s nižší m rozlišení m, ale menší kompresí . Rozsá hlost dat však vedla k brzké únavě hodnotitelů a hlavně k pozná ní , že lze těžko srovná vat a objektivizovat ztrá tu informacídat danou zvolenou kompresi nebo zvolený m rozlišení m., pokud rozdí ly nejsou dostatečně zjevné. Naopak pokud byla zvolena řada rozlišeníhrubší(krok cca 1,5), byly hodnoceny obrazy s vyšší m rozlišení m jako informačně bohatšítéměř nezá visle na zvolené kompresi.
Zá vě ry z př í pravy dat U zvolené řady rozlišenílze konstatovat: 1. Obrazy s kompresív úrovni 0 a 1 vž dy, 2 částo, 3 občas a 4 vyjímečně (kvality ve Photoshopu označené jako ní zké ) jsou vnímány jako větš í ztráta informace než sníž ení rozliš ení v poměru 1:1,2. 2. Obrazy s kompresív kvalitě 5 a vyš š ích (střední , vysoká , maximu) jsou hodnoceny jen na zá kladě rozlišení , pokud je v poměr v rozlišeníalespoň 1: 1,2. Obraz s vyš š ím rozliš ením byl hodnocen jako informačně bohatš í vž dy, nezávisle na použ ité kompresi.
2
Dalšípoznatek je, že nezaškolený uživatel neníschopen rozpoznat vliv komprese obvykle již od stupně 5 vý še. Zaškolený uživatel a znalec je schopen postihnout vliv komprese do komprese 8, vý še již jen s obtí žemi a jen na vybraný ch detailech. Již z fá ze pří pravy testů , které bylo věnová no dosti času, vyplynuly celkem obecně platné zá věry, které dovolily formulovat dostatečně jasná pravidla volby kombinace komprese a rozlišenís ohledem na to, aby uživatel obrazů měl maximá lníinformačníobsah.
Statistický rozbor zí skaný ch dat Protože při pří pravě testů vzniklo množstvízají mavý ch a objektivní ch dat, pokusili jsme se o jejich statistický rozbor. Ú plná data jsou uvedena na CD, které je pří lohou této zprá vy. Jsou vytištěny jen vý sledky konverzíiluminace, aby bylo možno se orientovat v ná sledují cí ch grafech. Všechny vý sledky nejsou vytištěny v vzhledem k jejich značnému rozsahu a neužitečnosti v nezpracované podobě.
Celkový př ehled dat Graf ‚účinnost celkem‘ ukazuje jak se měníúčinnost komprese v zá vislosti na rozlišení obrazu. Na ose X je jen pořadové čí slo měření . Jednotlivé skupiny ‚peaky‘ jsou tedy tvořeny sériívzorků stejného rozlišenís kompresí0..12. Graf ukazuje, že účinnost komprese na testovaný ch dokumentech se velmi podstatně snižuje s rozlišení m. Pro nejmenšírozlišení5 DPI je poměr mezi nejnižšía nejvyšší kompresí1: 3, přesahuje tento poměr pro soubory s vysoký m rozlišení m poměr 1:100. Vysvětlení: Komprese JPG je založena na vypouštěnívariacív obraze, které překračuji zvolenou velikost. Pro vysokou kvalitu neníobraz prakticky měněn a komprese přiná šíefekt jen na velký ch homogenní ch plochá ch. Pro obrazy s velmi ní zký m rozlišení m (zvlá ště vznikli-li přepočtem z kvalitní ch velký ch obrazů ) je komprese JPG velmi má lo účinná , protože obvykle chybíplochy s ní zký mi variacemi. Dalšívliv který jistě přispěl k malé efektivitě JPG komprese pro obrazy s maý m rozlišení m je jejich velikost.Soubor obrazu obsahuje konstantníhlavičku, její ž velikost je konstantnía u malý ch souborů velmi ovlivňuje efektivitu použitívysoké komprese. Tatá ž data jsou zobrazena na ná sledují cí m grafu ‚účinnost komprese normovaně‘. Ú činnost komprese je vztažena ke kompresi 8. Normalizacígrafu je možno detailněji sledovat vliv komprese při vyšší ch rozlišení ch. Zá roveň je zvý razněn efekt v oblast 40..60 DPI, kde se účinnost komprese zřetelně mění . Pří činu tohoto jevu se nepodařilo jednoduše objasnit, detailněji jsme se jí m nezabý vali..
3
Vý běr dat dle jednotlivý ch typů dokumentů Ná sledují cígrafy byly vytvořeny tak, aby postihovaly vlastnosti obrazů srovnatelná velikosti. Skupiny dat jsou zvoleny cca 10 kB, 100kB, 1 MB, 3 MB, 5MB. Vzorky jsou do grafu zařazová ny na zá kladě parametrů uvedený ch na zdrojové tabulce v zá hlavídat, konkrétně pod parametry ‚velikost souboru‘ a ‚tolerance‘. Graf lze interpretovat napří klad takto ( viz graf ‚Iluminace‘): …uví tal bych za daný ch okolností(snaha poskytovat dat data po internetu, zá jem umí stit všechny obrazy celého rukopisu na jediné CD) kdy by soubor měl velikost cca 1MB. Množina odpoví dají cí ch bodů pokrý vá určitou oblast. Dle předchozí ho a dle vlastností konkrétní ho dokumentu chci maximá lnírozlišení , ale kompresi stupně alespoň 5 a lepší . Tomuto požadavku vyhovuje kombinace 160 DPI při kompresi 6 a 7. Preferuji-li rozlišení , mohu volit kombinaci 190 DPI, komprese 5.
Pokyny k vlastnízkoušká m Doporučujeme zá věry zprá vy ověřit vlastní mi zkušenostmi. Proto poskytujeme volně nejen vý sledky našich zkoušek, ale i zdrojová data, program CORES a makra pro použitív programu Photoshopu, slouží cí mu zde ke generaci variacíobrazů . Pro jejich použitíje nutno respektovat specifické vlastnosti Photoshopu. 1. Akce definované v programu Photoshop, pokud obsahuji jména souborů , pracují s konkrétníadresou. Protože modifikovat akce jen s ohledem na použitý disk a adresá ř je velmi ná ročné, doporučuji pracovat pro generaci s adresá řem C:\CORES, pro který jsou akce napsá ny. Nutno počí tat s volný m mí stem cca 1GB na disku, doporučujeme alespoň 256 MB RAM. Zdrojové soubory musíbý t kvalitní , s rozlišení m větší m než 320 DPI. Pokud použijete soubory s nižší m rozlišení , zakažte všechna vyššírozlišenív akcí ch. 2. Provedeníkonverzíje velmi ná ročné na vý kon, paměťa mí sto na disku počí tače. Proto byly konvertované soubory vypá leny na sadu CD. 3. Rovněž import informacía prvnípřečtenítěchto dat programem CORES je ná ročné na vý kon počí tače. Proto jsme umožnili i tento krok překročit. Zá kladnítří dí cí soubory ‚sort‘) jsou umí stěny na disku 5 v adresá ři ‚ná hledy a sort‘. Chcete-li tyto soubory použí t, zkopí rujte je kamkoli na počí tač na povolte jejich editaci, protože po zkopí rová níz CD jsou soubory typu ‚jen pro čtení ‘. Tyto soubory mů žete otevří t programem CORES. Soubory obsahujíkonkrétníadresu, kde majíbý t hledá ny porovná vané obrazy. Pokud je vaše CD-ROM mechanika registrová na jako D:, nenínutno nic měnit, vložte jen sprá vný disk s daty do mechaniky. Jinak opravte cestu k datů m dle skutečnosti v programu NOTEPAD. Obsah disků je uveden v pří loze 2.
4
Dalš ívlastnosti programu CORES Kromě možnosti stanovit pořadíkvality variacíobrazů , dovoluje tento program optimalizovat využitínapří klad CD-R disku. Při zadá nípočtu obrazů a označení vyhovují cí ch kvalit, program prů běžně počí tá očeká vanou velikost celé sestavy obrazů , jichž je testovaný obraz prů měrný m představitelem. To dovoluje zvolit optimá lní kompromis komprese a rozlišeni pro efektivníběžné použitínapř. při publikaci na CDROM nebo na internetu..
Zá vě r Z testů plyne jednoznačně už itečnost a oprávněnost použ ívání komprese JPG. Lze konstatovat, že nenívhodné použí vat komprese ní zké kvality (úrovně 0..3, pří padně i 4) a to ani pro pomocné funkce jako ná hledové obrá zky, galerie, protože jejich informační obsah je nižšínež ve stejně velký ch obrazech s nižší m rozlišení , ale zaznamenaný ch s vyššíkvalitou. Pro běžné použitíje obvykle vyhovují cíjiž zobrazenístředníkvality (5 a vyšší ). Pro zachová nínejkvalitnější ch obrazů zcela vyhovujívšechny kvality označované jako maximum (10..12). Při těchto kvalitá ch jsou již fluktuace dat dané šumem CCD prvků , přesnost kalibrace a jiné vlivy vý razně vý znamnějšínež variace vná šené do obrazu kompresíJPG. Pokud je nutno zvažovat vyššíkompresi, lze vyjí t ze zjednodušené zá sady, že nárů st rozliš ení 1,2x je přínosem vž dy, pokud komprese při použ ití formátu JPG ve Photoshopu je střední kval.ity nebo vyš š í.
5
Př íloha 1 CORES (COmpresion, REsolution, Size) ná vod k použ ití Automatické vygenerovánívariacípomocíPhotoshop 5.0 a vyš š í · · · · · · ·
Založte na disku C: adresá ř C:\CORES . Spusťte Photoshop 5.0 a vyšší(Ph) Otevřete obrá zek, který chcete testovat. Zkontrolujte jeho rozlišení . Má -li rozlišenímenšínebo blí zké 320 DPI, je vhodné v akci vypnout konverze do vyšší ch hladin (viz další ). Otevřete okno Akce, načtěte sadu ‚MoW gener CORES.atn ‘. Pokud je třeba, zakažte v akci generují cívariace zbytečně vysoká rozlišení . Spusťte akci ‚C:\CORES\...variace ‘, která automaticky generuje soubory potřebného jména a vlastnostído adresá ře C:/CORES. Akce mů že trvat i několik minut. Tí m jsou připraveny variace otevřeného soboru pro testová níprogramem CORES.
Př i rutinním používá ní programu je výhodné zaká zat kombinace rozliš enía komprese které se nikdy nepoužijí Jde př edevš ím o kombinace vysoká komprese … 5 u malých souborů, př ípadně nízká komprese 7… u velkých souborů, a obecně komprese 0,1,2. Lze použít i souborů JPG z jiných zdrojů. Tvar jmé na grafických souborů se generuje/ př edpoklá dá : *KK.JPG kde * - libovolný počet znaků KK – komprese, kterou byl soubor uklá dá n v Ph.
První inicializace programu CORES: 1. Program zkopí rujte na Vá š počí tač a spusťte. 2. V menu Soubor zadejte Nový. 3. Zobrazíse dialogové okno. Do vrchní ho pole zadejte cestu a ná zev souboru, do kterého se uloží informace o grafický ch vzorech (stavový soubor xxx.TXT). 4. Do spodní ho pole zadejte cestu ke grafický m vzorků m. 5. Stiskněte OK. Nyníse začnou načí tá vat informace z jednotlivý ch JPG souborů . Tato akce mů že trvat několik minut. 6. Po vytvořenínového souboru s informacemi o vzorcí ch jsou soubory seřazeny podle jména. Načtení rozpracované ho porovnávání v programu CORES: 1. V menu Soubor zadejte Otevří t. 2. Zobrazíse dialogové okno. Vyberte dří ve určený stavový soubor a otevřete jej. Program se nastavído stavu v němž jste jej opustili. Postup hledání rozhraní rozdílu. 1. Seřaďte vzorky podle kvality od nejhorší ch po ty nejlepší . Obrazy jakoby tvořili řadu od nejhorší ch po nejlepší , z ní ž vidí te dva obrazy. Je-li vpravo obraz horší , stiskněte pří slušnou klá vesu. Projděte několikrá t řadu, až budete mí t vpravo vždy obraz, který se vá m jevíjako lepší . 2. Určete rozhraní , počí naje který m obrazy vyhovujípro použitíjako: Galery - malý obrá zek slouží cíjen k zá kladníorientaci v knize. Má bý t viditelné obrysy textu, iniciá ly nadpisy, iluminace. Prewiew - ná hled, na hranici čitelnosti, dovolují cívšak již odhad obsahu strá nky, strukturu textu Normal - obraz zpří stupňují císpolehlivě obsah strá nky, má zajišťovat dobrou čitelnost textu i obrazu, nenívšak určen k reprodukční m účelů m nebo k detailní mu studiu obrazu. Maximá lníkvalita obrazů je na Excellent obrazech, které jsou v maximá lní m rozlišenía nejsou předmětem testů , které tento program prová dí .
6
Ovládání: Listová nív ř adě obrazů Šipka vpravo posun o jeden zá znam vpravo Šipka vlevo posun o jeden zá znam vlevo PageUp posun o pět zá znamů vpravo PageDown posun o pět zá znamů vlevo Home skok na prvnízá znam End skok na poslednízá znam TAB vpravo je horší– přesune pravý zá znam před levý zá znam
Prostř edí F1 Zobrazeníná povědy F2 Zobraz/Skryj hlavnípanel F3 Zobraz/Skryj panel s informacemi F4 Otevři/Zavři ná hledové okno
Vý počty F5 –Vý počet velikosti
Rozhraní Ctrl+F8 smaž e vš echna rozhraní Ctrl+F9 označírozhraníGallery Ctrl+F10 označírozhraníPreview Ctrl+F11 označírozhraníNormal F9 skok na rozhraníGallery F10 skok na rozhraníPreview F11 skok na rozhraníNormal
Lupa PLUS Zvětšenílupy MINUS Zmenšení
F5 – okno vý počtu sloužík odhadu pravděpodobné velikosti prostoru na mediu, kde bude ví ce podobný ch souborů . Obsahuje přehled vlastnostíaktuá lně zvolený ch rozhranía vý počet. Je nutno zadat počet obrazů . Celková velikost se zobrazuje i v ovlá dací m panelu zcela dole.
7
Př íloha 2
Disky vliv komprese JPG a rozlišenína velikost souborů DISK 1
Iluminace vzorky konverzírozlišenía komprese
text O1 vzorky konverzírozlišenía komprese
DISK 2
noty graduál vzorky konverzírozlišenía komprese
rytina vzorky konverzírozlišenía komprese
DISK 3
kresba Kodex Tirsch vzorky konverzírozlišenía komprese
text 02 graduál vzorky konverzírozlišenía komprese
8
DISK 4 náhledy a sort obsahuje ná hledové obrazy použitý ch vzorový ch obrazů z disku 4 a textové soubory popisují císestavu variacíkonverzído rů zný ch rozlišenía kompresí (viz Pokyny k vlastní m zkoušká m, bod 3)
noty graduál zlacení vzorky konverzírozlišenía komprese
PROGRAM CORES Sestava prostředků pro porovná vá nívlivu komprese JPG a rozlišenína velikost souborů při uklá danídigitá lní ch dat v NKČ R
Photoshop konverzníakce pro Photosho 5.0 a 6.0
DISK 5
Vzory pro konverze iluminace graduá l český HK.tif kresba kodex Tirsch.tif noty graduá l MB.tif noty graduá l zlaceníMB.tif rytina. tif text 01.tif text 02 graduá l lati HK.tif
145 MB 16 MB 158 MB 155 MB 12 MB 38 MB 140 MB
9
Př íloha 3: Grafy Soubor VaV 2001 CORES analý za vlivu komprese a rozlišení .xls
10