Berke József
Számítógépes grafika Grafika2000 v1.0 „oktatási segédlet”
Keszthely, 2000. 1 Grafika2000 v1.0 Copyright: Berke József
1 Tartalomjegyzék 1
TARTALOMJEGYZÉK ................................................................................................... 2
2
COPYRIGHT ..................................................................................................................... 4 2.1
3
BEVEZETÉS ................................................................................................................. 5
SZÁMÍTÓGÉPES KÉPFELDOLGOZÁS ALAPJAI ................................................... 6 3.1 DIGITÁLIS KÉP FOGALMA ÉS FAJTÁI ............................................................................ 8 3.1.1 Rasztergrafika ........................................................................................................ 8 3.1.2 Vektorgrafika ......................................................................................................... 9 3.1.3 Ellenőrző kérdések .............................................................................................. 10 3.2 DIGITÁLIS KÉPALKOTÁS ............................................................................................ 11 3.2.1 Leképezés ............................................................................................................ 11 3.2.2 Mintavételezés ..................................................................................................... 12 3.2.3 Kvantálás ............................................................................................................. 12 3.2.4 Folytonos kép helyreállítása ................................................................................ 13 3.2.5 Ellenőrző kérdések .............................................................................................. 14 3.3 ESZKÖZÖK ................................................................................................................ 15 3.3.1 Hardver eszközök ................................................................................................ 15 3.3.1.1 3.3.1.2 3.3.1.3 3.3.1.4 3.3.1.4.1 3.3.1.4.2
Képbeviteli eszközök .............................................................................................. 15 Jelátalakítás eszközei ............................................................................................... 18 Képek tárolása ......................................................................................................... 19 Képmegjelenítő eszközök........................................................................................ 20 Monitorok........................................................................................................... 20 Nyomtatók .......................................................................................................... 21
3.3.2 Szoftver eszközök ................................................................................................ 23 3.3.3 Ellenőrző kérdések .............................................................................................. 26 3.4 ALAPVETŐ GRAFIKAI JELLEMZŐK ............................................................................. 27 3.4.1 Méret ................................................................................................................... 27 3.4.2 Szín és színrendszerek ......................................................................................... 29 3.4.2.1 3.4.2.2 3.4.2.3
3.4.3
Fizikai alapfogalmak ............................................................................................... 29 Az emberi színlátás ................................................................................................. 30 Színrendszerek......................................................................................................... 31
Formátum ............................................................................................................ 33
3.4.3.1 3.4.3.2
A formátum választása ............................................................................................ 33 Formátum és tömörítés ............................................................................................ 34
3.4.4 Ellenőrző kérdések .............................................................................................. 34 3.5 GRAFIKUS SZABVÁNYOK ÉS FORMÁTUMOK .............................................................. 35 3.5.1 Grafikus operációs rendszer ................................................................................ 35 3.5.2 Grafikus szabványok ........................................................................................... 37 3.5.2.1 3.5.2.2 3.5.2.3
3.5.3
SRGP ....................................................................................................................... 37 PHIGS ..................................................................................................................... 37 OpenGL ................................................................................................................... 37
Fontosabb kétdimenziós adatformátumok ........................................................... 38
3.5.3.1 3.5.3.2 3.5.3.3
TIFF ......................................................................................................................... 38 JPEG ........................................................................................................................ 38 BMP......................................................................................................................... 39
2 Grafika2000 v1.0 Copyright: Berke József
3.5.3.4 3.5.3.5 3.5.3.6 3.5.3.7 3.5.3.8 3.5.3.9 3.5.3.10
PCX ......................................................................................................................... 39 GIF........................................................................................................................... 39 PDF .......................................................................................................................... 40 PhotoCD .................................................................................................................. 40 VRML ..................................................................................................................... 42 MPEG ...................................................................................................................... 42 AVI .......................................................................................................................... 43
3.5.4 Ellenőrző kérdések .............................................................................................. 43 3.6 FELHASZNÁLÁSI TERÜLETEK .................................................................................... 45 3.6.1 Nyomdatechnika .................................................................................................. 45 3.6.2 Távérzékelés ........................................................................................................ 45 3.6.3 Orvosi diagnosztika ............................................................................................. 46 3.6.4 Ipari és mezőgazdasági alkalmazások ................................................................. 47 3.6.5 Számítógépes animáció ....................................................................................... 47 3.6.6 Optikai karakterfelismerés................................................................................... 48 3.6.7 Számítógéppel támogatott tervezés ..................................................................... 49 3.6.8 Ellenőrző kérdések .............................................................................................. 50
3 Grafika2000 v1.0 Copyright: Berke József
2 Copyright Minden jog fenntartva! Az oktatási anyag vagy annak részletei a szerző írásbeli hozzájárulása nélkül semmilyen formában nem sokszorosítható, másolható, fordítható, reprodukálható, továbbá nem konvertálható elektronikus vagy mechanikus úton!
Jelen tananyag a szerző által írásban meghatározott oktatási formákban használható!
[email protected]
A tananyag a VE Georgikon Mezőgazdaságtudományi Kar, Keszthely www.georgikon.hu valamint a Kvark Számítástechnikai Betéti Társaság www.kvarkmed.hu támogatásával került kifejlesztésre!
4 Grafika2000 v1.0 Copyright: Berke József
2.1
Bevezetés
A XX. század végén földünk fejlett és fejlődő társadalmai jelentős változáson esnek át, amelyet elsősorban az informatika generál. Hazánk szerencsés helyzetben van, hiszen lépést tarthatunk a legfejlettebb társadalmakban ezen a téren végbemenő változásokkal. A folyamatnak szoros velejárója, hogy a népesség számára hagyományos és nyitott képzési programok valósuljanak meg. Mindez alapvetően új technika, és technológia bevonásával történjen. Az oktatási segédlet a számítógépes képfeldolgozás alapjait foglalja össze. Itt az olvasó áttekintést kap a digitális kép fogalmáról, jellemzőiről, a digitális képalkotás folyamatáról, a képfeldolgozáshoz kapcsolódó hardver és szoftvereszközökről és az alapvető grafikai jellemzőkről. Példákon keresztül bemutatjuk a képfeldolgozás jelentősebb kutatási és alkalmazási területeit, külön hangsúlyt fektetve a hazai példák ismertetésére. Kiegészítő, hasznos a tananyag elsajátítását segítő információk az alábbi helyen találhatók:
http://www.georgikon.hu/grafika.htm
5 Grafika2000 v1.0 Copyright: Berke József
3 Számítógépes képfeldolgozás alapjai A harmadik évezred küszöbén az információ szelektálásában, feldolgozásában különös jelentőséggel bír a számítógépes képfeldolgozás. Ismert tény, hogy az ember és a környezete közötti kapcsolatban a vizuális információ a legfontosabb a tömörsége miatt. Egyes kutatók szerint az összes információ, több mint kétharmada vizuális formában ér bennünket. Ez a részarány tovább emelkedhet az Internet és Intranet alapú hálózatok mindennapi életünkbe való betörésével, a multimédia alapú anyagok térhódításával – általában az informatikai alapú társadalmak kifejlődésével. Tekintsük át röviden a képfeldolgozás lényegét az 1. Ábra alapján.
1. ábra A képfeldolgozás filozófiája A számítógépes képfeldolgozás egyik célja, hogy a környezetünkből származó vizuális információt digitálisan (olyan formában, amelyet a számítógép közvetlenül kezelni tud) előállítsuk, majd számítógép segítségével feldolgozzuk és kiértékeljük. Ezt a folyamatot analízisnek nevezzük. Ilyen feladatot oldunk meg, amikor légi- és/vagy űrfelvételek alapján három dimenziós digitális terepi 6 Grafika2000 v1.0 Copyright: Berke József
adatokat nyerünk vagy környezetünk állapotáról szerzünk információkat. Ugyanezt a folyamat hajtjuk végre akkor is, ha egy kísérlet vagy kísérlet sorozat folyamán kapott, digitális formában előállított, vizuális információt értékeljük ki (mezőgazdasági kísérletek vizuális értékelése, látórobotok irányítása a környezet vizuális információi alapján, röntgen és ultrahang felvételek analízise, fizikai mérések, stb.). Bár környezetünk tárgyai háromdimenziós objektumok, azonban az esetek jelentős részében elegendő az objektumok kétdimenziós leképezésének feldolgozása. Ha csupán kétdimenziós felvételekkel dolgozunk akkor digitális képfeldolgozásról beszélünk. Erre példa az előzőekben említett légi- és/vagy űrfelvételek kiértékelése folyamán szerzett egyszerű területi és távolsági adatok vagy egy mikroszkópi metszeten található sejtmagok méretének, darabszámának és egyéb morfológiai jellemzőinek a mérése. A 3D képfeldolgozáson olyan információk kinyerését értjük, amelyek a háromdimenziós világra jellemző információkat tartalmazza. Ilyen folyamatot hajt végre egy Computer Tomográf (CT) amikor az emberi test háromdimenziós modelljét létrehozza, vagy amikor egy háromdimenziós szkenner számítógép segítségével rekonstruál egy tárgyat. Gyakran van szükség arra, hogy ötleteinket, elképzelésünket vizuális formában jelenítsük meg. Vagyis adatok, információk állnak rendelkezésünkre, melyekből képeket kívánunk létrehozni. Jó példa erre, hogy egy építészmérnök számítógéppel segített tervező rendszert használ az építési tervek elkészítéséhez. Napjainkban önálló művészeti forma a számítógéppel készített digitális – két- vagy háromdimenziós - alkotások létrehozása. Ezt a területet nevezzük számítógépes grafikának, az 1. Ábrán ez a szintézis folyamata. Tartalmilag és megoldási módjaiban is elkülönül azon eset, amikor az előállított digitális képek sorozata a mozgás illúzióját is tartalmazza. Ez a számítógépes animáció, amely a képfeldolgozáson belül önálló területe a szintézisnek. Ha az olvasó a filmvilág napjainkban készített sikeresebb alkotásaira gondol rögtön szembeszökő, hogy a számítógépek használata minőségileg és látvány szempontjából is élesen eltérő világot képes előállítani. Talán nem szerénység azt állítani, hogy napjainkban a sikeres film készítésének egyik feltétele, megfelelő komputer animáció előállítása. Amint háromdimenziós terepi adatokat is kinyerünk – amelyek kétdimenziós képek alapján is megtehető – és rekonstruáljuk számítógép segítségével a terepet, végigjártunk egy teljes kört az 1. Ábrán. Ilyen folyamat eredményét tekintheti meg az olvasó az Interneten, ha a Mars szondák által gyűjtött képek alapján rekonstruált tájon utazik.
7 Grafika2000 v1.0 Copyright: Berke József
3.1
Digitális kép fogalma és fajtái
A digitális kép olyan információk sokaságát jelenti, amely képpontokból (pixelekből) áll. A pixel kifejezés az elemi képpontok angol megfelelőjéből (picture elements) kialakított mozaikszó.
3.1.1 Rasztergrafika Amennyiben minden egyes pontot önállóan jellemzünk, sorról-sorra történő megadással raszteres képről beszélünk. A vízszintes és a függőleges képpontok száma adja a kép méretét. Egy 128 sorból és 256 oszlopból álló pixelsorozatra azt mondjuk, hogy 128x256-os képet reprezentál. A grafikus megjelenítő eszközök közül az SVGA 800x600as felbontása tehát a kártya vízszintes és függőleges irányú megjelenítő képességét (felbontását) mutatja. A képpontok megadása során minden egyes pixelhez számadatot is rendelünk. Ha ez a számadat két értékkel jellemezhető - 0 vagy 1 – akkor bináris képet határoznak meg a pontok. Szintén bináris képhez jutunk, ha a számunkra hasznos információt elkülönítjük a háttértől, azaz két szintre vágjuk a képet. Minden egyes pixelhez rendelhetünk 1 byte-nak megfelelő értéket is. Ez 256 különböző (egész) számértéket jelent. Legyen a 0 a fekete és a 255 a fehér, a köztük lévő egész számok pedig jelentsenek szürkeségi fokozatokat. Az így definiált képet fekete-fehér árnyalatos vagy szürkeségi fokozatokat tartalmazó képnek, idegen szóval graylevel képnek nevezzük. Vannak olyan alkalmazási területek, ahol a 8 bites szürkeségi skála nem elegendő (nyomdatechnika, röntgenfelvételek) itt gyakran 12 bites skálát alkalmaznak. Ez 212 = 4096 különböző árnyalat megkülönböztetését teszi lehetővé. Természetesen a 8 bites pixelekből felépülő képek pontjaihoz nem csak szürkeségi fokozatokat hanem színeket is rendelhetünk egy táblázat alapján. Ekkor álszínes vagy pszeudo-color képekhez jutunk. A táblázatot amely megadja, hogy az egyes értékekhez milyen színeket rendeltünk átszínező táblának vagy LUT-nak (Look-Up Table) nevezzük. Infra kamerával készített felvételeken, orvosi diagnosztikai képeken avagy anyagszerkezetet szemléltető digitális képeken a lényeg kiemelésére előszeretettel használnak álszínes megjelenítést. Valósághű színek visszaadására digitális képeknél általában 3x8 bitnek megfelelő információra van szükségünk. Itt három alapvető színnek megfelelő képek, mint sávok együtteséből alakítjuk ki a valódi színes képet. Az alkalmazási területük rendkívül széles, általában minden olyan területen használatosak, ahol valósághű színek megjelenítésre van szükség. Erről a színrendszerek tárgyalásakor később még bővebben is hallunk. 8 Grafika2000 v1.0 Copyright: Berke József
3.1.2 Vektorgrafika Amennyiben a digitális képet alkotó pontok halmaza között matematikai összefüggéseket állapítunk meg és ezen összefüggések jellemzőit tároljuk, akkor vektoros vagy vektorgrafikus képekről beszélünk. Ezek a jellemzők a két vagy háromdimenziós térben alakzatokat, objektumokat ábrázolnak. Ilyen jellemző lehet egy kör középpontjának koordinátái és sugara, egy szakasz két végpontjának vagy egy pont koordinátáinak megadása. Pontok, szakaszok, görbék és felület, mint elemi geometriai alakzatok megadásával, tetszőleges síkbeli vagy térbeli objektum felépíthető, adott pontossággal. Általában ilyen struktúrában felépített képeket használnak térinformatikai rendszerekben, ahol a cél a földrajzi koordinátákhoz kötött grafikus és alfanumerikus adatok összekapcsolása. Alapvetően tehát kétféle digitális képtípust különböztetünk meg: - a raszteres és a - vektoros képi adatokat. Nézzük meg, hogy a kétféle képi adattípus között milyen alapvető különbségek mutatkoznak és ezek a jellemzők előnyösek vagy éppen hátrányosak. A raszter alapú rendszerek előnye, hogy egyszerű adatszerkezetekkel dolgoznak és ezeken egyszerű algoritmusok is gyors elemzéseket tesznek lehetővé. Hátrányként jelentkezik az adatállományok nagyobb mérete és a rögzített geometriai felbontás. A vektoros képek adatállománya általában kisebb és független a felbontástól, hiszen az elemi objektumok mérete tetszőlegesen változtatható. Ezek a jellemzők előnyösek. Hátrányosak viszont az összetett adatszerkezetek és a bonyolult elemzési és leíró algoritmusok használata. Összetett szerkezetű képek „felépítése” gyakran hosszadalmas és jelentős gépidőt igényel. A kétféle képtípus használata, feldolgozása általában eltérő eljárásokat, módszereket jelent. Így a kétféle képtípushoz, kétféle programrendszer tartozik. Ezeket a szakirodalom és a piac is önállóan kezeli, azonban mind a raszteres, mind a vektoros szoftverek támogatják a másik adattípusra jellemző adatszerkezetek (formátumok) használatát. Pár évvel korábban a raszteres és a szoftveres „világ” jelentősen eltért. Manapság nehéz egyértelmű megállapítást tenni, vagy élesen kategorizálni a kifejlesztett szoftver rendszereket. Bővebben foglalkozunk a témával a grafikus szabványok és formátumok fejezetben.
9 Grafika2000 v1.0 Copyright: Berke József
3.1.3 Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Ismertesse a képfeldolgozás lényegét! Mit takar az analízis folyamata? Mi jellemző a szintézis folyamatára? Melyek az alapvető különbségek és azonosságok a digitális képfeldolgozás és a számítógépes grafika között? Miben különbözik a számítógépes animáció a digitális képfeldolgozástól? Mondjon gyakorlati példákat a képfeldolgozás egyes területeire! Mit nevezünk digitális képnek? Mi a raszteres és a vektoros kép közötti különbség? Hányféle szín megjelenítésére alkalmas egy bináris és egy 8 bites kép? Miért? Mit nevezünk LUT-nak? Mit takar a valódi színes kifejezés? Hány szín jeleníthető meg 24 biten? Miért?
10 Grafika2000 v1.0 Copyright: Berke József
3.2
Digitális képalkotás
A digitális képfeldolgozás azon alapul, hogy a valós világ objektumainak képe számítógéppel kezelhető adatokká alakítható. Ezt az átalakítást nevezzük digitális képalkotásnak. A digitális képalkotás célja, hogy a háromdimenziós térben lévő objektumokról a számítógép által értelmezhető és feldolgozható adatokat kapjunk. A digitalizálás folyamán ugyan információveszteség lép fel, de ezért kárpótol bennünket a számítógép által történő feldolgozás által kínált számos olyan lehetőség, amely hagyományos optikai eljárásokkal nem valósítható meg. A digitalizálás speciális eszközökkel történik, és az eszköztől függően az egyes fázisok megvalósítása különböző módon történhet. Lényegében három lépést különböztethetünk meg: 1. a leképezést, 2. a mintavételezést és 3. a kvantálást.
3.2.1 Leképezés A leképezés során a háromdimenziós térben lévő objektumokról érkező elektromágneses jelekből egy kétváltozós f(x,y) képfüggvény jön létre. A kép általában téglalap alakú. Egyszínű (monokróm) kép esetén az f(x,y) függvény értéke minden (x,y) pontban arányos a kép fényességével az adott helyen. Ezt az értéket szürkeségi szintnek vagy világosságkód értéknek szokták nevezni. A háromdimenziós térben lévő tárgyak minden (x,y,z) pontja a fényforrás fényét visszaveri. A visszavert és a saját sugárzás (ha van) természetesen függ az időponttól (t). Nem hagyhatjuk figyelmen kívül a megvilágítás szögét és a megfigyelés irányát sem, amit egy vektorral írhatunk le (n). A fény hullámhossza (λ) szintén befolyásolja a kialakuló képet. Mivel a leképezés a gyakorlatban nem egy adott frekvencián, hanem egy bizonyos hullámsávban történik, a képfüggvény a leképezés spektrális tulajdonságaitól is függ (Megj. ez bonyolult matematikai formalizmus használatával vehető csak figyelembe). A fentiek alapján felírhatjuk az e(x,y,z,t,λ,n) folytonos függvényt, ami a háromdimenziós térben kialakuló fényességfüggvényt reprezentálja. A képalkotó rendszer ebből állítja elő a kétváltozós f(x,y) képfüggvényt. A gyakorlatban a legegyszerűbb, mindenki számára jól ismert leképező rendszer a kamera vagy fényképezőgép lencserendszere. Az egyszerűbb digitális kameráknál használatos objektívek minőségi mutatói jelentősen elmaradnak a hagyományos fényképezőgépeknél használatos objektívekétől, hiszen a digitális kamerák általában jóval kevesebb képpontból és több zajjal állítják elő a képet. 11 Grafika2000 v1.0 Copyright: Berke József
3.2.2
Mintavételezés
A digitális képalkotás leképezés utáni lépése a mintavételezés. A mintavételezés az (x,y) képsík egy-egy kis területéhez a fényességtől függő számot rendel. Két jellemző határozza meg a létrejövő digitális kép minőségét. Az egyik lényeges pont a "kis területek" mérete, a másik a hozzárendelés módja. Gondolatban végezzük el a mintavételezést úgy, hogy egy fényképre rácsozott papírt borítunk. Ekkor a papír rácsozata határozza meg a "kis területeket". Satírozzunk be minden egyes kis területet, a terület közepén elhelyezkedő szürkének megfelelő árnyalatra. Nyilvánvalóan nem mindegy, hogy egy centiméteres vagy egy milliméteres oldalhosszúságú négyzetet választottunk egységnyi területnek. Finomabb rácsozat esetén jobb lesz az eredményül kapott kép, míg durvább osztás esetén a kép minősége gyengébb lesz. Ha a kapott szürkeségi értékeket számszerűen meg tudjuk határozni, és ezeket a számokat egy mátrixba (a kép geometriájának megfelelő, rendezett számhalmaz) beírjuk, lényegében elvégeztük a mintavételezést. Ezek a számok tetszőleges nem negatív valós értéket felvehetnek. Jelöljük h(k,l)-el azt a függvényt, amely minden négyzet középpontjához, a (k,l) pontokhoz hozzárendeli a mintavételezéssel kapott értéket. Ez még nem a digitális képfüggvény, mert ugyan csak a diszkrét pontokban van értelmezve, de bármely nem negatív valós számértéket felvehet.
3.2.3 Kvantálás A digitalizálás utolsó lépéseként a tetszőleges nem negatív értékű h(k,l) képpontértékekhez a megengedett (nem negatív egész) képpontértékek valamelyikét kell rendelni. Ezt a lépést nevezzük kvantálásnak, eredménye a digitális kép amit jelöljünk q(k,l)-el. A képpontértékek vagy világosságkódok ábrázolása meghatározott számú biten történik, ami a lehetséges q értékeket a következőképpen szabja meg: b 0 ≤ q ≤ 2 - 1; ahol b az Analóg/Digital (A/D) jelátalakító bitszáma. (A jelátalakító eszközök pontban az olvasó bővebb információt is megtudhat az A/D átalakítókról.) Színes kép esetében a kvantálás a mintavételezéshez hasonlóan, összetevőnként, egymástól függetlenül valósul meg. A fentiek szemléltetésére nézzük a következő példákat: 1. Legyen a A/D jelátalakító bitszáma b=8. Ekkor a képpontértékek a {0,...,255} valós, egész értékeket vehetik fel, 12 Grafika2000 v1.0 Copyright: Berke József
b
mivel 0 ≤ q ≤ 2 - 1
azaz
8
0 ≤ q ≤ 2 - 1 = 255.
2. Nézzünk egy színes képet, ahol legyen a A/D jelátalakító bitszáma b=8. Színes kép létrehozása során a mintavételezés színösszetevőként történik Ez a gyakorlatban három színösszetevőt jelent (piros, zöld és kék). Vagyis az előző feladatban számított módon meghatározzuk egy-egy összetevő 8 értékeit: Piros: 0 ≤ qp ≤ 2 - 1 = 255, 8 Zöld: 0 ≤ qz ≤ 2 - 1 = 255, 8 Kék: 0 ≤ qk ≤ 2 - 1 = 255. Így minden egyes képponthoz összetevőként 256 különböző értéket, azaz 2563 = 16 777 216 különböző értéket rendelhetünk. A kvantálást akkor tekintjük optimálisnak, ha a (négyzetes) hiba minimális. Amennyiben a bemenő képpontértékek eloszlása egyenletes, akkor az egyenlő osztásközű kvantálás az optimális. A 2. ábra a digitalizálás egyes lépéseit sematikus ábrázolásban mutatja: e(x,y,z,t,λ,n) ⇓ f(x,y) ⇓ h(k,l) ⇓ q(k,l)
- a háromdimenziós, folytonos fényességfüggvény ⇐ leképezés - a kétváltozós, folytonos képfüggvény ⇐ mintavételezés - nem negatív, valós képfüggvény ⇐ kvantálás - digitális képfüggvény 2. ábra A digitális képalkotás folyamata
A digitális kép tehát számok, multispektrális képek esetén vektorok halmaza alkotja, mely számítógépes feldolgozásra közvetlenül alkalmas.
3.2.4 Folytonos kép helyreállítása A helyreállítás során a digitális képből közelítésekkel (interpolációval) analóg képjelet állítunk elő. Az eredeti képfüggvény azonban, több okból sem állítható vissza tökéletes pontossággal. Az egyik okot maga kvantálás folyamata jelenti, ami eleve lehetetlenné teszi az eredeti mintavételezett képpontérték helyreállítását. Bizonyos feltételek teljesülése esetén az eredeti képfüggvényt mintavételezés után még tökéletes pontossággal helyre lehetne állítani, azonban a 13 Grafika2000 v1.0 Copyright: Berke József
mintavételezéssel kapcsolatosan több feltétel is a gyakorlatban nem szokott teljesülni. Így az eredeti analóg képfüggvényt csak korlátozott pontossággal lehet helyreállítani. Helyreállításra van szükségünk, ha a képen geometriai transzformációt (méret megváltoztatása, eltolás, elforgatás, nyírás) hajtunk végre. Szintén helyreállítás történik minden olyan esetben, amikor a monitoron, nyomtatón a megjelenített kép mérete, elhelyezkedése eltér az eredeti képtől. Ilyen műveletet viszonylag gyakran hajtunk végre. Gondoljunk csak egy megjelenő kép ablakának tetszőleges átméretezésére, elhelyezésére a képernyőn, vagy a kép egyes részeinek nagyítására-kicsinyítésére.
3.2.5 Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9.
Milyen lépéseket különböztetünk meg a digitalizálás folyamán? Milyen tényezők befolyásolják a háromdimenziós fényességfüggvényt? Milyen leképezésre alkalmas eszközöket ismer? Mit nevezünk mintavételezésnek? Mit jelent a kvantálás? Mikor tekintjük a kvantálást optimálisnak? Milyen értékeket vehet fel egy 12 bites kvantáló által készített digitális kép? Mi a helyreállítás lényege? Mikor van szükségünk helyreállításra?
14 Grafika2000 v1.0 Copyright: Berke József
3.3
Eszközök
Az "eszközök" alfejezetben megpróbáljuk áttekinteni a digitális képi információ alapvető hardver és szoftver eszközeit. Mivel a fejlődés üteme ezen a területen rendkívül gyors, igyekszünk az általánosságokra koncentrálni.
3.3.1 Hardver eszközök A számítógépes képfeldolgozás a szokásos, általánosan elterjedt eszközökön túl (nyomtatók, monitorok, kamerák, stb.) gyakran speciális hardver eszközök (3D szkenner, képmű kártyák, stb.) használatát is igényli. Az alábbiakban az általánosan használt hardver eszközökön túlmenően néhány egyedi célra kifejlesztett rendszert is bemutatunk elsősorban az alkalmazások oldaláról megközelítve. 3.3.1.1 Képbeviteli eszközök A képbeviteli eszközök feladata: valamely objektumról, térrészről megfelelő, számítógép által kezelhető formátumú adatok előállítása. Az adatok többnyire képpontok, melyek raszteres szervezésben tartalmazzák az intenzitás és/vagy színértékeket. Az esetek kisebb részében kaphatunk vektoros adatokat is. A képbeviteli eszközök a képérzékelők (CCD) és a jelátalakítók (illesztők, kódolók) együttesét jelentik. Az első csoportba tartoznak pl. videokamerák, a másodikba pl. a képdigitalizáló kártyák. Egyes készülékek az érzékelőket és a jelátalakítókat együtt tartalmazzák, mint egyes szkennerek vagy a digitális kamerák. A képbevitel első lépése: a kép érzékelése. Ez elsősorban a látható tartományba eső elektromágneses hullámok, azaz a fény érzékelését teszik szükségessé. Egyes speciális felhasználási területek az elektromágneses hullámok más tartományait is használhatják (távérzékelés - infratartomány, csillagászat röntgen és kozmikus tartomány, orvosi diagnosztika - röntgen tartomány). Olyan területeken is szerezhető vizuális információ ahol nem az elektromágneses hullámok az információ hordozói: pl. anyagszerkezet, szeizmológiai vizsgálatok - ultrahang. A továbbiakban vizuális információn az elektromágneses hullámok által kinyerhető információk összességét értjük. A képérzékelés lényege, hogy egy fényforrás (nap, örökvakú, izzó, stb.) által megvilágított objektum a beeső fény egy részét visszaveri. A visszavert fény információt szállít az objektum helyéről, alakjáról, felületéről, szerkezetéről. Ugyanakkor a fényforrás közvetlen érzékelése is lehet hasznos információ forrása (pl. csillagászati objektumok megfigyelése, anyagszerkezet vizsgálati infrafelvételek). A fény egy részét optikai eszközökkel (pl. objektívvel) 15 Grafika2000 v1.0 Copyright: Berke József
leképezve éles képet kapunk, melyet a képérzékelő eszköz érzékel, s pontrólpontra letapogat. A képérzékelő eszközöket többféleképpen lehet csoportosítani: feladatuk, érzékelési elvük, az érzékelés színessége és az érzékelés párhuzamossága alapján. Csoportosítás az eszköz feladata alapján I. Síkban elhelyezkedő objektumok (fényképek, iratok, átvilágítható filmek) mintázatának, képének bevitele. Néhány alapvető eszköz: Kézi (handy) szkenner kis szélességben, egyidejűleg egy teljes fekete-fehér vagy színes sort olvas be. A sorra merőleges irányban kézzel, lehetőleg egyenletes sebességgel kell mozgatni. Beépített fényforrást tartalmaz, mely a készülékkel együtt mozogva világítja meg a célobjektumot. Fekete-fehér és színes változatuk egyaránt létezik. Felhasználási területük főleg egyszerűbb dokumentumok, képek beolvasására korlátozódik. Síkágyas (flatbad) szkenner nagyobb (tipikusan A4, illetve A3 méretű) feketefehér, illetve színes dokumentumok beolvasására alkalmas. Többnyire a visszavert fény érzékelésével működik, de létezik az átmenő fény érzékelésén alapuló típus is (film vagy diaszkenner). Beépített fényforrást tartalmaz, a papír, vagy egyes típusoknál a fényforrás és az érzékelő sor - mozgatása automatikusan történik. Felhasználási területük jóval szélesebb a kézi eszközöknél: igényesebb dokumentumok, képek, filmek beolvasására alkalmazhatók. Dob-szkenner nagyméretű fekete-fehér vagy színes dokumentumok, filmek magas minőségi követelményeknek eleget tevő beolvasására alkalmas. Átmenő és visszavert fénnyel egyaránt működik. A képet dobfelületre kell rögzíteni, melyet a beolvasáshoz rendkívül nagy fordulatszámmal megforgatnak. Eközben változtatható finomságú eltolást is alkalmaznak, így a pontszerű fényforrás és az ugyancsak pontszerű érzékelő a képet spirális pályán tapogatja le. Felhasználási köre a professzionális képfeldolgozás (kiadványszerkesztés, űrfelvételek digitalizálása). Grafikus vagy digitalizáló tábla koordinátarendszerrel ellátott elektronikus rajztábla. Általában soros porton csatalakozik a számítógéphez. A készülékhez tartozik egy elektronikus ceruza vagy szálkereszttel ellátott korong. Működési elve: A táblában vékony elektromos huzalokból álló háló található. A metszéspontok egy raszteres felületet alkotnak. A raszteres felület segítségével, a kapcsolóval ellátott ceruza vagy szálkereszt helyzete megadható az általa keltett elektromos impulzus futásideje alapján. A raszterpontok közötti érzékelés esetén interpolációval állapítják meg a ceruza vagy szálkereszt pontos helyét. A pontok illetve a pontokat összekötő vonalak segítségével előállított, 16 Grafika2000 v1.0 Copyright: Berke József
tetszőleges rajz közvetlenül a számítógépbe jut. Tervrajzok, térképek és egyéb vonalas dokumentumok digitalizálására alkalmazzák. II. Térben elhelyezkedő objektumok képének bevitele A legalapvetőbb eszköztípus a TV kamera objektívvel: a képérzékelő síkjára leképezett fekete-fehér, vagy színes képet érzékelő és pl. videojellé alakító eszköz. Különböző kiegészítő eszközökkel (pl.: érzékenység és élességállító automatika, zoom, szalagos analóg vagy digitális rögzítés) ellátott változatai a mindennapi életbe közismertek. Napjaink technikai fejlődése lehetővé tette, hogy az eddig ismertetett szkennerekkel ellentétben, amelyek csak kétdimenziós digitális felvételezésre alkalmasak, a háromdimenziós felületeket is közvetlenül számítógéppel rögzíthessük. Ezen célt 3D szkennerrel érhetjük el. Működési elvüket tekintve egy lézersugár letapogatja a háromdimenziós objektum felületét, majd a visszavert fénysugarakat egy optikai leképező rendszer (gyakran videokamera) és egy komputer segítségével (interpoláció) közvetlenül előállíthatjuk. Jelenleg rendkívül magas áruk miatt még kevésbé elterjedtek. Csoportosítás az érzékelés elve alapján Hagyományos, elektroncsöves képérzékelők - pl. a vidikon, plumbikon, nuvikon - működésük alapelve: az optikai úton fényérzékeny rétegre leképezett képnek megfelelő ún. töltésképet elektronsugárral letapogatják, s a pontrólpontra változó töltés kisülésével arányos analóg jelből videojelet állítanak elő. Napjainkban jelentőségük - a CCD eszközök megjelenése következtében egyre kisebb. Töltéscsatolt félvezető érzékelők: CCD (Charge Coupled Devices) alkalmazásán alapuló kamerák napjaink legelterjedtebb eszközei. Az optikai úton leképezett kép itt is a töltés mennyiségének változását okozza. Az analóg jelek kiolvasása azonban az egyes képelemeknek megfelelő töltéscsomagok elektronikus léptetése, vezérlése útján történik. Egy-egy képelemnek több tranzisztor együttese felel meg, melyek a feltöltés - érzékelés - töltéstovábbítás állapotoknak megfelelően működnek. A korszerű videokamerák, digitális kamerák, egyszerűbb szkennerek mind ilyen érzékelővel rendelkeznek. Csoportosítás az érzékelés párhuzamossága alapján Egyetlen, pontszerű érzékelőt és kiegészítő letapogató mechanizmust tartalmaznak pl. a professzionális forgódobos szkennerek, vagy egyes műholdas képalkotó eszközök. Itt az érzékelő paramétereinek állandósága a teljes képalkotás folyamatában biztosított, azaz az eltérések kompenzációjára nincs szükség. 17 Grafika2000 v1.0 Copyright: Berke József
Vonali érzékelőt tartalmaznak az optikai lapolvasók. Ezeknél egy-egy sor minden egyes pontjához külön érzékelő tartozik. Az egyes érzékelők a jelenlegi technikai szinten százalékos pontossággal azonos érzékenységűek. Utólagos korrekció a működtető programba épített kiegyenlítéssel valósítható meg. A vonali érzékelőt 2D képalkotáshoz kiegészítő mozgatómechanizmussal kell a vonalra merőleges irányban mozgatni. Kétdimenziós érzékelőt tartalmaznak a CCD videokamerák, illetve a hagyományos (elektroncsöves) kamerák. A kép minden egyes pontjához külön érzékelő tartozik. A képalkotás egyidejű, de az egyes pontokhoz tartozó adatok kiolvasása egymás után (általában sorfolytonosan) történik. A professzionális és az amatőr célokra kifejlesztett eszközök közötti különbség érdekes módon nem elsősorban az érzékelők fizikai felbontásában jelentkezik. A professzionális kétdimenziós CCD eszközök, két alapvető hibára korrigáltak. Így az egyes érzékelő elemek közötti "áthallást" és a szórt fény okozta hibákat is megfelelő szerkezeti kialakítással kompenzálják. Csoportosítás az érzékelés színessége alapján Fekete-fehér képérzékelők a látható fény tartományában egyenletes érzékenységgel érzékelik a fényességet, s minden képpontról egyetlen adatot szolgáltatnak. Ezen adat az érzékelt tartományokban kapott jelek összegeként (integráljaként) fogható fel. A színes képérzékelők a látható fényt több (három) tartományra bontva érzékelik, így minden képpontról több adatot szolgáltatnak. Ezek az adatok az egyes tartományokban érzékelt jelek erősségével függnek össze. A színes képalkotás az eszköz felépítésétől függően, egyetlen érzékelő esetén történhet színváltással (pl. színszűrők cserélgetésével), vagy egyidejűleg több érzékelő beépítésével (három képérzékelőt tartalmazó színes kamerák). 3.3.1.2 Jelátalakítás eszközei A jelátalakító eszközök alatt többnyire azokat a hardver eszközöket értjük, melyek a képérzékelő eszköztől analóg, vagy digitális formában érkező adatokat a számítógéphez illesztik. Fontos szerepük miatt ezek közül a videódigitalizáló kártyákat érdemes kiemelni, amelyek egy vagy több bemenetükön, szabványos analóg vagy digitális videojelet tudnak fogadni. A jelek digitalizálása (analóg jel esetén) a számítógép felől vezérelhető módon történik és a digitális kép általában a kártya saját memóriájába kerül. Az így előállított digitális kép a számítógép felől tetszőlegesen módosítható. A kártyák többsége megjelenítésre alkalmas kimenőjelet is szolgáltat. A videódigitalizáló kártyáknak fontos jellemzői: - geometriai- illetve intenzitás-felbontásuk (általános a 768x512 pixel képméret, 3x8 bit/pixel intenzitásfelbontás), 18 Grafika2000 v1.0 Copyright: Berke József
- időfelbontásuk, ami az egyszeri ún. állóképek digitalizálásától a videojel szabvány által biztosított képváltási frekvenciáig - ez utóbbit nevezzük valós idejű (real time) képdigitalizálásnak - terjedhet, - bemeneteik és kimeneteik száma, - színfelbontó képességük, ez fekete-fehér felvétel esetén 8 vagy 12 bit lehet, míg színes képeknél 3x8 vagy 3x12 bit, - esetleges képfeldolgozási műveletvégző képességük. A videódigitalizáló kártyák felépítésében és működésében az elmúlt két évtized két jelentős változást is hozott. Napjainkban elterjedtek az olyan eszközök, amelyek a valós idejű képek felvételezése mellett hardveres úton szabványos tömörítést hajtanak végre a képi adatokon. Így alkalmasak VHS, S-VHS minőségű mozgó videó anyagok digitalizálására és megjelenítésére. Ezek közül leginkább elterjedt a Miro cég DC sorozatú kártyái. Bár ezek a kártyák kedvező áruk révén elősegítik a képfeldolgozási alkalmazások elterjedését és számos esetben valóban jól használhatóak, a digitalizálás minősége azonban általában gyengébb mint a professzionális képdigitalizáló kártyáké és áruk is közel van egy teljes személyi számítógép teljes árához. 3.3.1.3 Képek tárolása A számítógépes képfeldolgozás általában nagy háttértár kapacitást igényel. Egy 300 dpi (pont/inch) felbontású síkágyas szkennerrel beolvasott A4 méretű színes dokumentum közel 25 MByte adatot eredményez. A műveletvégzések hatékonysága érdekében az operatív memória méretének is a lehető legnagyobbnak kell lennie. A számítógépes képfeldolgozási célokra használt memória három csoportba tartozhat: 1. A feldolgozások, műveletvégzések során, rövid idejű rendkívül gyors elérésű memóriára van szükségünk. Ilyen rövid idejű tárolásra használt memória maga a számítógépben levő RAM, vagy a videódigitalizáló kártyák memóriája, sőt egyes processzorok önálló belső memóriát (cache) is tartalmazhatnak jelentősebb képfeldolgozási feladatok elvégzésére. Az Intel cég által forgalmazott MMX jelzésű processzorok már tartalmaznak belső gyorsítótárakat és önálló utasításokat is ezek hatékony kezeléséhez. 2. Nagy tárolókapacitású, viszonylag gyors hozzáférésű háttértár, melyet a rendszer on-line hozzáféréssel használ. Napjainkban ez rendszerint mágneses ún. merevlemezes adathordozót jelent. A merevlemezes mágneses háttértárak mellet gyakran használnak főleg archiválási célokra magneto-optikai tároló eszközöket. Ennél a tárolási módnál a információt mágneses hordozó réteg tárolja, amelynek tartalmát a hordozó mágneses polaritásának lézerrel történő felírásával változtathatjuk meg. 19 Grafika2000 v1.0 Copyright: Berke József
Előnyük, hogy hosszú ideig (30 év) megőrzik az információt és írható, olvasható tárolást tesznek lehetővé. 3. Az archiválási célra szolgáló, off-line felhasználású háttértárolók palettája rendkívül széles. Rendkívül népszerűek napjainkban a CD-ROM-ok, amelyek ugyan egyszer írhatóak, de tetszőleges sokszor olvashatók. Az írás és olvasás is optikai úton történik, szilárdtest lézer segítségével. Az első generációs (hagyományos) CD-k 650-680 MByte kapacitásúak, rövid hozzáférési idejű tárolást biztosítanak. A CD lemezek következő generációja már kétrétegű, egy vagy kétoldalas adattárolást tesz lehetővé, sokkal nagyobb adatsűrűség mellett. A DVD diszkek fizikai mérete teljesen azonos a CD-vel, tárolási kapacitásuk azonban egy nagyságrenddel nagyobb (8.5 Gbyte - kétrétegű, egyoldalas; 17 Gbyte kétrétegű, kétoldalas). További példák csak említés szintjén: - Jukeboxok, 5-100 db optikai lemezt tartalmaznak, s ezek váltása programvezérléssel történik. - Cserélhető lemezes merevlemezek. A lemezváltás többnyire emberi beavatkozást igényel. - Szalagos mágneses képrögzítés. A hétköznapi életben elterjedt formája a videoszalagok. A számítógépek világában ez streamer és DAT eszközöket jelent. Természetesen a rögzített képek időbeli stabilitása, a felvételek zajmentessége nem mérhető össze a digitális megoldásokéval. 3.3.1.4 Képmegjelenítő eszközök A képmegjelenítő eszközöket felhasználási céljuk alapján alapvetően két nagy csoportra oszthatjuk: - monitorok és - nyomtatók. Az alábbiakban a vizuális megjelenítés számítástechnikában használatos eszközeit ismertetjük. 3.3.1.4.1 Monitorok A számítástechnikai eszközökhöz használt monitorok fizikai működése nem tér el jelentősen a megszokott televízió készülékek működésétől. A képernyő fénykibocsátó felületét egy elektronsugár végigpásztázza, amely felvillanásokat okoz. Színes képek létrehozására három különböző színű (RGB azaz Red piros, Green - zöld, Blue - kék) fénykibocsátó réteget használnak. Ha közel hajolunk egy színes TV készülékhez, akkor kivehetők a három alapszínnek megfelelő pontok csoportja a képen. Általában a képernyő bal felső sarkától kezdődően, jobbra lefelé haladva történik a kép kirajzolása, amely 1/50 sec-ig 20 Grafika2000 v1.0 Copyright: Berke József
tart. A kép intenzitásának növelését az elektronsugár erősebb becsapódásával érik el. A képernyőn a kép megjelenítése kétféle elv alapján történik: - A folytonos, egymást követő soronkénti pásztázás, amely ugyan kevésbé finom felbontást, de villogásmentes, nagyobb képfrissítést jelent mint a másik módszer (kevésbé fárasztó a szem számára). Ezt non-interlacing képmegjelenítésnek hívjuk. - A váltott soros vagy interlacing képmegjelenítés esetén minden második sor kerül csak kirajzolásra, amely ugyan finomabb felbontást, de alacsonyabb képfrissítési frekvenciát eredményez. Ekkor egy teljes kép megjelenítésére 1/25 sec idő szükséges. Az egy másodperc alatt megjelenített teljes képek számát képfrissítési frekvenciának vagy függőleges eltérítési frekvenciának nevezzük. Ismerete rendkívül fontos. Szakértők szerint az ergonómiailag elfogadott érték 65-70 teljes kép másodpercenként. Ezt az értéket csupán a korszerű monitorok teljesítik vagy szárnyalják túl. Szintén a monitorok jellemzésére szolgál egy másik fontos paraméter, a vízszintes eltérítési frekvencia. Ismeretével megtudhatjuk, hogy hány sort pásztáz végig az elektronsugár egységnyi (1 szekundum) idő alatt. A monitorok műszaki leírásai között találunk egy fontos paramétert, a pontméretet. Ez az érték két egymás melletti képpont távolságát adja meg milliméterben. Tipikus értékek: 0,25-0,28 közöttiek. Az operációs rendszer által adott, monitoron történő megjelenítésre vonatkozó parancsokat először a számítógép képernyővezérlő kártyája fogadja. Ez az egység értelmezi, majd végrehajtja a parancsokat. Majd egy ún. D/A (digitálisanalóg) átalakító segítségével analóg jellé alakítja. Ezt az analóg monitorokat vezérlő elektronika már közvetlenül értelmezni tudja. Természetesen nagyon sok jellemzőt (fényerő, kontraszt, konvergencia, vezérlés, egyéb ergonómiai tulajdonságok, stb.) terjedelmi okokból nem vagy csak felületesen érintettünk. Ezek egy része a hagyományos TV technika szerves részét képezik és a felhasználók nap, mint nap találkozhatnak vele. A másik csoport részletesebb műszaki vagy ergonómiai ismereteket igényel és talán szerepük sem kiemelten fontos. 3.3.1.4.2 Nyomtatók A nyomtató az emberi látórendszer számára közvetlenül értelmezhető és olvasható másolatot állít elő. Öt alapvető csoportot különböztetünk meg, elsősorban a szerkezeti felépítés tekintetében. Bár önálló és speciális igényeket kielégítő eszközcsoportként említi a szakirodalom a levilágító berendezéseket, elsősorban a prezentációk készítésénél betöltött szerepük miatt - a nyomtatók részen belül - foglalkozunk velük. 21 Grafika2000 v1.0 Copyright: Berke József
1. Karakternyomtatók A leggyakoribb karakternyomtatók az ún. margarétanyomtatók voltak, amelyek az egyes karakterek tükörképeit egy hasított tárcsa (mint a margaréta virág) peremén tartalmazták. A forgó tárcsa mögött elektromágnessel működő kalapács a megfelelő időpontban, a megfelelő betűt a festékszalaggal együtt a papírhoz nyomta. Napjainkban gyakorlatilag teljesen eltűntek, bár nagyon jó minőségű nyomtatásra voltak alkalmasak. 1. Mátrixnyomtatók A legáltalánosabb feladatokra használt nyomtatók egyike a mátrixnyomtató. A nyomtatófejben 9 vagy 24 nyomtatótű található, amelyek mindegyike önállóan vezérelhető. A karaktereket egy 5x7-es, 9x11-es vagy 18x23-as pontmátrix rajzolja ki a nyomtatón, soronként. Az egy sorba írható pontok (dot) száma adja a nyomtató felbontását. Ez az érték 60-144 dpi között mozog általában, leggyakoribb a 72 dpi. A nagyobb tűszám jobb minőséget, de lassúbb nyomtatást eredményez. A gyártók egyes típusokat ellátnak ún. színes fejjel, amely színes nyomtatások előállítására is alkalmassá teszi a mátrixnyomtatót. Ez valójában egy olyan szalagot jelent, amely négy színnek megfelelő szalagcsíkot tartalmaz (CMYK = C - Ciánkék, M - Bíborvörös, Y - Sárga és K fekete). Így a nyomtató csekély mechanikai és szoftveres átalakítással alkalmassá tehető színes nyomtatásra is. Képek, grafikák előállítására kis felbontásuk miatt kevésbé használatosak. 3. Festékszublimációs nyomtatók A festékszublimációs nyomtatók egy különleges fóliatekercsen tárolják a CMYK színeknek megfelelő színezékeket. Ez a tekercs A/4-es nyomtatási méret esetén, a nyomtatási sorrendnek megfelelő sorrendben, négy egymás után következő, A/4-es méretű fóliák sorozatát tartalmazza. A nyomtatás során a speciális papírra illesztett színes fólia fölött egy kisméretű, fűthető elemeket tartalmazó fej halad végig. A fej által leadott hő mértékével arányos mennyiségű festék elpárolog a fóliáról és belediffundál a papírba. Ugyan a felbontásuk nem túl magas (200-600 dpi), viszont éles és színtelített képei miatt egyre inkább kezd elterjedni. Egyes típusaik - digitális kamerákhoz illeszkedő, kisméretű (maximum 10x15 cm) nyomtatásra alkalmas változataik - rendkívül olcsó áruk miatt tömegesen is piacra kerültek. Hátrányként említhetjük, hogy a nyomtatáshoz szükséges fólia és speciális papír magas ára, valamint az eszközök alacsony felbontása és a nyomtatások kis mérete, jelentősen befolyásolja alkalmazási területüket. 4. Tintasugaras nyomtatók 22 Grafika2000 v1.0 Copyright: Berke József
A tintasugaras (ink-jet) és buboréksugaras (bubble-jet) nyomtatók jó minőségű nyomtatási képeket, alacsony áron és szinte zaj nélkül képesek előállítani. A nyomtatási kép előállítása rendkívül kis méretű fúvókák segítségével történik. Hő és/vagy elektrosztatikus hatásra a parányi fúvókákon keresztül kilövellt, apró festékszemcsék hozzák létre a képet. Felbontásuk jó, 300-900 dpi között mozog. Nem igényel speciális papírt, bármilyen vízbázisú festék megkötésére alkalmas papír használható. Festéktakarékos megoldás, gyakori, hogy az egyes alapszínek külön festékkazettában foglalnak helyet. Létezik olyan változatuk is amely A0-ás méretű nyomtatásra is alkalmas. Napjaink kedvelt és tömegesen elterjedt nyomtatói, viszonylag alacsony beszerzési és üzemeltetési költségei miatt. 5. Lézernyomtatók A mikroszámítógépeknél használt nyomtató berendezések közül talán a legjobb minőségű nyomtatások előállítására a lézernyomtatók alkalmasak. Kezdő áruk közel kétszerese a tintasugaras nyomtatókénak ugyan, de a leginkább költségtakarékos eszközök. Rendkívül változatos funkciókkal és alkalmazási területekkel napjaink talán legelterjedtebb nyomtatótípusa. A működési elvük nagyon hasonló az elektrosztatikus fénymásolókéhoz. A nyomtatóban egy közel 1000 V-ra feltöltött, fényérzékeny bevonattal ellátott, forgó henger található. A forgó henger felületét - a felbontásnak (300-2400 dpi) megfelelően - az alkotója mentén végigpásztázza egy lézersugár, amelyet a nyomtatandó kép jelével modulálnak. Ahol fény éri a hengert, ott a felület a fénysugár erősségével arányos mértékben elveszti a töltését. Ezután a forgó henger elhalad egy finom festékport tartalmazó kazetta előtt. Ebből a töltés nagyságával arányos mennyiségben festékpor tapad a hengerre. Majd a henger rányomja a festéket a papír felületére. Ezek után a papír áthalad, egy magas hőmérsékletre fűtött hengerrendszer között, ahol a festékanyag mintegy ráég a papírra. A további felhasználáshoz a fényérzékeny henger felületét letisztítják. Mind a tintasugaras, mind a lézernyomtatókhoz nem csak papír hordozó, hanem (speciális) fóliák használata is megengedett. Ez tovább szélesíti alkalmazási területüket.
3.3.2 Szoftver eszközök A képfeldolgozás speciális feladatainak megoldásához, valamint eszközeinek vezérléséhez gyakran speciális programokra van szükség. Ezek többnyire önálló szoftverek (programrendszerek, meghajtó programok - driverek, egyedi modulok, önálló grafikus programnyelvek), amelyek egy-egy feladat 23 Grafika2000 v1.0 Copyright: Berke József
megoldására alkalmasak elsősorban. Így a forgalomba került programok rendkívül sokféleképpen csoportosíthatók: pl. alkalmazási cél, ár, számítógépes környezet, felhasználói ismeretek, stb. alapján. A 2. táblázatban összefoglaltunk néhány világviszonylatban elterjedt szoftverrendszert, ezek többsége ugyan nem igényel speciális hardver környezetet, de az egyes felhasználási területhez kapcsolódó speciális szakmai ismereteket igen. Az alábbiakban felsorolunk néhány jelentősebb alkalmazási területet, amelyeken használt szoftverek zöme világméretekben is jelentős felhasználású: - Nyomdai kiadványszerkesztés, DTP (DeskTop Publishing), - Távérzékeléssel kapott adatok feldolgozása, - Orvosi diagnosztika és képi információtárolás, - Ipari anyagvizsgálati képelemzés, - Rajzoló- és festőprogramok, - Ipari folyamatirányítás, - Mozgóképek szerkesztése, - Számítógépes animáció, - Térinformatika, - Számítógéppel segített tervezés- CAD (Computer Added Design), - Optikai karakter- és kézírás felismerés, - Multimédia alapú anyagok fejlesztése, - Vizuális információtömörítés és kódolás, - Vizuális szimuláció, - Virtuális valóság, - Üzleti megjelenítés, - Játék, játék és játék. A fontosabb felhasználási területek alapvető jellemzőinek ismertetésére később bővebben is kitérünk. A gyakorlatban használt szoftver eszközök árai szintén hatalmas eltérést mutatnak. Az egyszerűbb feladatok ellátására alkalmas programok olcsók (néhány ezer Ft). Gyakran az újabb programok korábbi változatai ingyenesek, szabadon letölthetők vagy hozzájuthatók, míg használatuk sem korlátozott. A legújabb programok ún. demonstrációs célokat szolgáló változatai a legtöbb esetben szabadon kipróbálhatók, ezek azonban alapvető megkötöttséget (időbeli korlátozás, funkcióbeli korlátozás, hardveres védelem, stb. ) tartalmaznak. Egyes programok speciális hardver környezetet igényelnek és áruk is rendkívül magas - akár több 10 millió Ft-ot is elérhetik (animáció, távérzékelés, orvosi diagnosztika, stb.) - mindez természetesen nagyon függ az alkalmazási terület, a használt példányszám, a számítógépes környezet, a felhasználó tevékenysége (oktatás, ipar, kereskedelem, bank, stb.) és még számos egyéb tulajdonságtól. A felhasználói ismeretek megszerzését számos eszközzel és különböző szinten támogatják a fejlesztők és a forgalmazók. A legegyszerűbb (kezdő színtű) és 24 Grafika2000 v1.0 Copyright: Berke József
talán a legtöbbet használt a programba épített "help"-rendszer és a programhoz mellékelt analóg (könyv) vagy digitális (CD, mágneses alapú) felhasználói segédlet. A gyakorlottabb felhasználói ismeretek megszerzése költségesebb és gyakran speciális kurzusok, tanfolyamok elvégzését igényli. Az 1. táblázat néhány jelenleg forgalmazott és világviszonylatban elismert programról ad áttekintést. Rendkívül örvendetes tény, hogy ezen termékek között találunk két magyar sikerterméket is (ArchiCAD és Recognita). A szoftver megnevezése
Fejlesztő cég
Jellemző alkalmazási terület
Adobe Photoshop Adobe Premiere Corel Photo-Paint Coreldraw
Adobe Inc. Adobe Inc. Corel Coorporation Corel Coorporation
Fractal Design Painters Microsoft Paint Erdas Imagine
Fractal Design Co. Microsoft Co. ERDAS Inc.
Arc/Info AutoCAD 3D Studio MAX ArchiCAD Recognita Power Animator Kai's Power Tools
ESRI Autodesk Inc. Autodesk Inc. Graphisoft R&D Rt. Recognita Rt. Alias/Wavefront Inc. Principal Inc.
Multimedia ToolBook Fractal Imager MS Powerpoint
Asymetrix Co. Iterated Inc. Microsoft Co.
Adobe Acrobat Harvard Graphics
Adobe Inc. Software Publishing Corporation
Raszteres képfeldolgozás Digitális videó editálás Raszteres képfeldolgozás Vektoros képfeldolgozás nyomdatechnikai előkészítés Raszteres képfeldolgozás Kezdő rajzolóprogram Légi- és űrfelvételek feldolgozása Térinformatika Számítógépes tervezés Számítógépes animáció Számítógépes tervezés Optikai karakterfelismerés Számítógépes animáció Raszteres és vektoros effektusok Multimédia fejlesztés Fraktál alapú képtömörítés Prezentáció, üzleti megjelenítés Prezentáció Üzleti megjelenítés
1. táblázat Elterjedt, számítógépes, vizuális alapú programrendszerek
25 Grafika2000 v1.0 Copyright: Berke József
3.3.3 Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
Nevezze meg a képfeldolgozás során általánosan használt és elterjedt eszközöket! Ismertesse a képérzékelés lényegét! Milyen szempontok alapján csoportosíthatók a képérzékelő eszközök? Ismertesse a síkban elhelyezkedő objektumok képének bevitelére szolgáló eszközök alapvető jellemzőit! Milyen eszközökkel készíthetünk digitális képeket térbeli objektumokról? Mi a CCD? Hogyan működik a digitalizáló tábla? Hol használják a vonali érzékelőket? Mire használható a grafikus tábla? Mire használható és melyek az alapvető jellemzői egy videó digitalizáló eszköznek? Mit nevezünk "overlay" technikának? Ismertesse a számítógépes képek tárolására használt memóriatípusok jellemzőit! Milyen eszközök tartoznak a képmegjelenítők csoportjába? Mi a különbség a non-interlacing és az interlacing technika között? Mit takarnak az alábbi monitor jellemzők: függőleges és vízszintes eltérítési frekvencia, pontméret? Mi az MPR II és a DPMS? Mi az alapvető különbség a grafikus és karakteres megjelenítés között? Mit takar a grafikus kártyák SVGA típusa? Ismertesse az egyes nyomtató csoportok működési elvét és jellemzőit! Hogyan történhet a lézernyomtatók számára feldolgozható információ előállítása? Hogyan működnek a diakészítő berendezések? Miben különböznek az általános célú vizuális programok a hagyományos szoftverektől? Milyen szempontok alapján csoportosítaná a vizuális programokat? Melyek a leginkább elterjedt alkalmazási területek a vizuális informatikában?
26 Grafika2000 v1.0 Copyright: Berke József
3.4
Alapvető grafikai jellemzők
Az alábbi pontokban röviden összefoglaljuk az olyan alapvető grafikai jellemzőket, amelyekkel számítógépes környezetben találkozhatunk. Az előzőekben szinte mindegyik jellemzőt érintettük már, eltérő környezetben. Például egy digitális kép méretével kapcsolatos információk részben szerepeltek a raszteres képek definiálásakor, az A/D átalakítók bemutatásakor, vagy a monitorok jellemzőinek tárgyalásakor. Mindegyik korábbi esetben a jellemzőket az adott eszköz paraméterei, tulajdonságai határozták meg. Az alábbiakban megpróbáljuk függetleníteni magunkat az eszközöktől és a felhasználó számára fontos szempontok alapján, próbáljuk vázolni ezen alapvető grafikai jellemzőket.
3.4.1 Méret A digitális kép egyik alapvető jellemzője a méret. Az analóg képek méretének a jellemzésétől eltérően itt nem az SI vagy más mértékegységrendszer alapján jellemezzük a méretet, hanem képpontokkal mint elemi objektumokkal (2.1 fejezet). A digitális kép minden esetben egy téglalap vagy ablak közé foglalható. Így a kép méretét, ha raszteres képről van szó egyszerűen a téglalap vízszintes és függőleges képpontjainak szorzata jelenti. Vektoros képek esetén önálló képméretről általában nem beszélünk. Természetesen a megjelenítés, vagy a tárolás bármilyen formája jelentősen befolyásolhatja a vektoros és raszteres képek méretét. Vegyünk egy egyszerű esetet: nézzük meg, hogyan változhat egy raszteres kép mérete a megjelenítés és tárolás során. Egy 320 pont széles és 240 pont magas kép mérete 76 800 képpont. Ez a négyszeresére nő, ha egy VGA monitoron (640x480 képpont) a megjelenítés során teljes a képernyőfelületet kihasználjuk. Természetesen az eredeti képem mérete ekkor még változatlan. Mentsük most le a VGA képernyő teljes tartalmát, ekkor már változik az eredeti képem mérete is. Ha nyomtatón kívánjuk megjeleníteni a képet, akkor a nyomtató felbontásának változtatásától függően a kinyomtatott kép mérete is jelentősen változhat. Ha a digitális kép fizikai méretén túlmenően a lementett file méretét is szeretnénk megtudni további jellemzők (színfelbontás, sávok száma, tömörítés, formátum) ismeretére is szükségünk lehet. A fenti példánkat megvizsgálva, ha minden egyes képpont 1 biten kerül tömörítés nélkül tárolásra, akkor 76800 bit azaz 9600 byte (1 byte = 8 bit) méretű lesz a lementett file. Ha viszont tudjuk, hogy minden egyes képpont 256 különböző értéket vehet fel, akkor a lementett képi információ 320x240x8=614400 bit. Mivel a fájlok méretének a jellemzésére a byte-t használjuk a továbbiakban minden esetben byte-ban adjuk meg a jellemző méretet. Esetünkben ez 614400/8=76800 byte-nak felel meg. 27 Grafika2000 v1.0 Copyright: Berke József
Amennyiben a digitális képünk három sávból épül fel, akkor a kép teljes mérete 76800x3=230400 byte, mivel mindegyik sáv mérete 76800 byte és az eredő képem mérete ennek a háromszorosa lesz. Amennyiben vektoros képről van szó vagy vektoros formátumban mentünk, akkor a kép méretét az egyes objektumok jellemzésére használt információk összege szabja meg. Tekintsük a 3. ábrán látható egyszerű vektoros képet.
3. ábra Egyszerű vektoros digitális kép A kép teljes vektoros leírásához az alábbi jellemzőket szükséges megadnunk (maximum 256 különböző szín használata, SVGA felbontás és operációs rendszerhez illeszkedő TrueType betűfontok esetén): - a teljes kép mérete (4 byte) és a kitöltő alapszín (1 byte), - a festékszóróval rajzolt baloldali objektum jellemzői (szín, típus, méret, vonalvezetés, stb.) (kb. 500 byte), - az egyenes szakasz kezdő és végkoordinátáját (4-4 byte), a vonalvastagságot (1 byte) és a színét (1 byte), - a szabadkézzel rajzolt, háromszög és nyolcszög oldallapjainak koordinátáját - csúcsonként 4 byte - és a kitöltő színt (13+33 byte), - a téglalap bal felső csúcsának koordinátáját, a vízszintes és függőleges méretet és a kitöltő színt (4+2+2+1 byte), - a körlap középpontjának koordinátáját (4 byte), a sugarának a hosszát (2 byte), a körív vastagságát és színét (1-1 byte) és a körlap kitöltő színét (1 byte) valamint a - a szöveg bal felső sarkának koordinátáját (4 byte), a betűtípust (kb. 40 byte), a betűméretet (4 byte) és a betűket (8 byte). 28 Grafika2000 v1.0 Copyright: Berke József
Ez összesen kevesebb, mint 1 Kbyte vektoros információnak felel meg. Míg a képet raszteresen lementve (800x600x1)/1024= 468,75 Kbyte a minimális fájlméret. Általában az alábbi képlet adja meg egy tetszőleges digitális raszteres kép méretét byte-ban: M = X∗Y∗C∗S ahol M - a kép mérete byte-ban, X - a kép vízszintes felbontása képpontban, Y - a kép függőleges felbontása képpontban, C - a kép színfelbontása byte-ban és S - a képsávok száma. Ahhoz, hogy a képletet egyszerűen tudjuk használni, ismerkedjük meg a színfelbontás fogalmával, valamint a színek jellemzésére szolgáló általános ismeretekkel.
3.4.2 Szín és színrendszerek A szín és a színnel kapcsolatos ismeretek tárháza rendkívül fontos életünk és környezetünk kapcsolatában, még tágabb környezetünk maga az univerzum megértéséhez is. Érdemes a témakörrel egy kicsit részletesebben is megismerkedni. A számítógépes képfeldolgozás sokszor az emberi látást próbálja modellezni, vagy az emberi látással kapcsolatos ismereteket használja, beépíti a feldolgozás folyamatába. Ezért fontosnak tartjuk áttekinteni az emberi látással, elsősorban a színlátással kapcsolatos alapvető ismereteket. Kitérünk az alapvető fogalmak ismertetésére. Végezetül áttekintjük a fontosabb színrendszereket kiemelve a számítástechnikában betöltött szerepüket. 3.4.2.1 Fizikai alapfogalmak A látható fény az elektromágneses sugárzás (EM) 380-780 nanométer (nm) tartományába esik. Ez csupán egy elenyészően kis része a teljes EM tartománynak. A tartomány felett (kisebb hullámhossz-nagyobb energia) helyezkedik el rendre az ultraibolya, a röntgen és a kozmikus tartomány. A látható EM spektrum alatt (nagyobb hullámhossz-kisebb energia) az infra, a mikrohullámú és a rádió tartományokat találjuk. Az emberi látórendszer képalkotásában csak a látható tartomány vesz részt. A többi tartomány elsősorban környezetünk és a világegyetem feltérképezésére, valamint a tudományos kutatás, az ipari, a mezőgazdasági és környezetvédelmi alkalmazás területein szolgál hasznos, általában vizuális interpretálásra alkalmas információval. Így a képfeldolgozás szerepe jelentősen megnőtt ezeken a területeken is. 29 Grafika2000 v1.0 Copyright: Berke József
A fizikai tárgyak a rájuk eső fény egy részét elnyelik, egy részét visszaverik esetleg önálló sugárzást bocsátanak ki. A teljes EM spektrumra vonatkoztatva ezeket a jellemzőket, kapjuk a spektrális elnyelődési, visszaverődési vagy sugárzási görbéket. Egyetlen fogalom tisztázására van csupán szükségünk ez a színhőmérséklet. Egy fényforrás színhőmérséklete a hozzá színben legközelebb álló, hevített fekete test (minden sugárzást elnyel) Kelvinben mért hőmérsékletével fejezhető ki. Egy hagyományos izzólámpa színhőmérséklete 2800 °K, a fehér fénycsőé 4700-5000 °K, hajnalban kb. 4000 °K - délben 5500 °K, míg tengerparton 10000 °K a jellemző színhőmérséklet. 3.4.2.2 Az emberi színlátás A látás során az elektromágneses sugárzás energiája a szemünkben jutva fényérzetet kelt. Az EM energiát a retinán található ún. pálcikák (fényesség érzékeléséért felelősek, számuk kb. 120 millió) és csapok (színérzékelésért felelősek, számuk kb. 6 millió) elnyelik. Az ingerületek továbbítása az agy látóközpontja felé többszörös áttételen keresztül, nagy hibatűrésű (ún. impulzuskódmodulációval) módon, a látóideg idegrostjain keresztül történik. Nem az összes receptor jele jut el azonban az idegpályákon az agyba. A kb. 126 millió receptorra csak kb. 1 millió idegszál jut. Ez egy rendkívül hatékony adatredukciót jelent (csak részben értett, retina-szintű előfeldolgozást takar). Elsősorban az élekre, végpontokra, gyors változásokra vonatkozó adatok jutnak a látórendszerbe. Ezen hihetetlenül bonyolult, de rendkívül hatékonyan ismert érzékszerv további működésének tárgyalása nem célunk. Az agyunkban kialakuló színérzetnek három jellemző sajátossága van. 1. Színezet (hue) - a fény hullámhosszától függ. 2. Telítettség (saturation) - mekkora a fehér fény összetevője a többi összetevőhöz képest. (A monokromatikus színek nem tartalmaznak fehér összetevőt, azaz 100 %-os telítettségűek) 3. Világosság (intensity) - az egységnyi térszögben szemünkbe érkező fényenergia mennyiségétől függ. Mind a fényesség, mind pedig a szín érzékelése környezetfüggő, ami azt jelenti, hogy adott képrészlet által keltett érzetet a szomszédos képelemek fényessége és színe is befolyásolja. A világosság érzete erősen hullámhosszfüggő, azaz azonos energiájú, különböző hullámhosszú fénysugarakat különböző világosságúnak látunk. Szemünk a zöld fényre a legérzékenyebb. Míg érzékelési tartománya 15 nagyságrendet fog át!
30 Grafika2000 v1.0 Copyright: Berke József
3.4.2.3 Színrendszerek Adott színérzetet különböző összetevők keverésével - többféle úton - is előállíthatunk. A színérzetünk tehát nem objektív érzet. Az első színkeveréssel kapcsolatos eredményeket Sir Isaac Newton érte le, a prizmával színösszetevőire bontott fehér fény vizsgálatával. Ez a felfedezés rögtön előre vetítette a kétféle színkeverés egyikét az additív színkeverést. Additív színkeverés során a keverékszín monokróm fényforrások fényének egymásra vetítésével áll elő. Így működik a TV és monitor képcső, amint azt korábban már a monitorok tárgyalásakor láthattuk. Az additív színkeverés alapszínei a vörös - R - red, zöld - G - green és a kék - B - blue. Additív színkeverésre további példa egy teljesen sötét teremben elhelyezett fehér felületre vetített RGB foltok. Ahol mindhárom alapszín találkozik ott fehéret láthatunk, míg bármelyik kettő az alábbiakban ismertetésre kerülő szubtraktív színkeverés alapszíneit eredményezi (lásd színes melléklet - piros és zöld = sárga, piros és kék = bíborvörös, zöld és kék = ciánkék). Mindhárom alapszín hiánya a feketét eredményezi. Szubtraktív színkeverés folyamán a széles sávban sugárzó fényforrás fényéből "kivonunk" egyes hullámhosszakat vagy hullámtartományokat. Ez az alapelve a színes nyomtatásnak. A szubtraktív színkeverés alapszínei a ciánkék - C - cyan, a bíborvörös - M - magenta és a sárga - Y - yellow. Egy diafelvétel vetítésekor vagy egy színes fénykép szemlélésekor is szubtraktív színkeverés részesei lehetünk. A fehér fény a diafilm színes hordozórétegén áthaladva vagy a fotóról visszaverődve a hullámtartomány egyes részeiben elnyelődik. Eredményül a fehérből (minden összetevőt tartalmazó fény) - kivont tartományokat észleljük. Ha két-két szubtraktív alapszínt felhasználva nyomtatásokat készítünk, akkor az RGB színrendszer alapszíneit kapjuk (lásd színes melléklet - sárga és bíborvörös = piros, sárga és ciánkék = zöld, ciánkék és bíborvörös = kék). A három réteg egymásra helyezésével elvileg a fekete szín áll elő. A gyakorlat azonban azt mutatja, hogy így csak barnás árnyalat állítható elő, ezért a színes nyomtatási technikába önálló színként felvették a fekete színt is (pl. a tintasugaras színes nyomtatók festékkazettája a három szubtraktív alapszín mellett a feketét is külön tartalmazza). Felismerve a feketének a nyomtatásban betöltött "kulcs"-szerepét a CMYK színrendszerben egy önálló betűt kapott az angol "Key" = kulcs szó kezdőbetűje alapján (elkerülve az additív Blue és a Black kezdőbetűinek azonosságát). A fent említett kétféle színrendszer két önálló színteret (RGB és CMY) is definiál, ahol az egyes koordinátákat az alapszínek jelentik. Sajnos mindkét színtérnek jelentős hátránya, hogy berendezésekhez, eszközökhöz kötöttek, nem független színterek. Azaz egy monitoron megjelenített színes kép nem csak az RGB jelektől, hanem a katódsugárcsőben használt foszfor-alapú 31 Grafika2000 v1.0 Copyright: Berke József
vegyület összetételétől is függ vagy egy szkenner által előállított kép nem csak az eredeti kép színeitől, hanem a szkenner fényforrásától és az esetlegesen alkalmazott színszűrőktől is függ. Míg egy nyomtatón előállított kép jelentősen függ az alkalmazott papír és a használt festék minőségétől. A gyakorlati élet több eszközhöz kötött színrendszert is létrehozott. Ilyen volt az NTSC színes televízió szabvány kialakulásakor létrejött YIQ (egy fényesség - Y és két színkülönbségi jel), amelynél az Y jel a teljes, fekete-fehér TV-hez szükséges információt tartalmazta. Az emberi látórendszerhez felépítéséhez illeszkedő szabvány az HSB színrendszer (színezet - H - Hue, telítettség - S Saturation és fényesség - B - Brightness). Szakkönyvek és a programdokumentációk gyakran használják még az IHS vagy HSL megnevezést is. YCC elnevezésű színrendszert fejlesztett ki a Kodak cég a PhotoCD rendszeréhez, amely az emberi látórendszerhez illeszkedik egy berendezés független színrendszer felhasználásával. A Kodak a PhotoCD-re való adatfeldolgozásánál a kép szkennerrel történő beolvasása után kapott adatokat, két, információs blokkra bontja. Az első blokk puszta világosságinformációkat tartalmaz. Ez az úgynevezett luminancia jelcsomag. A második, krominanciának nevezett blokk csak a színértékeket tartalmazza. Tároláshoz a négy csatornából matematikai módszerekkel meghatározható, alábbi három csatornát használják: 1. Y (luminancia) = R + G + B 2. C1 (krominancia 1) = R - Y 3. C2 (krominancia 2) = B - Y Ez az YCC-nek nevezett kódrendszer tulajdonképpen a televíziós színtovábbítás rendszeréhez hasonló CIE alapú szabvány. A módszer azt a tényt használja ki, hogy az emberi szem a világosságkülönbségeket lényegesen jobban megkülönbözteti egymástól, mint a színárnyalatokat. Az előzőekben ismertetett színterek mindegyike eszközfüggő. Az áttérések egzakt megvalósításához, egy eszköz független színrendszer kialakításához, nemzetközi szervezet alakult (Commission Internationale de L' Eclairage - CIE). A kidolgozott CIE illetve módosított CIE L*a*b* színrendszer az emberi látás matematikai modelljén alapul és szinte az egész látható spektrumot lefedi. A módosítások tartalmazzák napjaink nyomdatechnikai és számítástechnikai igényeit, az emberi szem érzékenységével arányos léptéket és szakemberek által kidolgozott egyszerű értelmezhetőséget. A grafikai és képfeldolgozó programok zöme az előzőekben ismertetett színrendszereken túl, számos berendezés független, fizikai mintákon alapuló vagy nyomdai festékrendszerekhez illeszkedő színrendszert ismer. A 2. táblázat ezen, színrendszerekről ad egy rövid áttekintést. 32 Grafika2000 v1.0 Copyright: Berke József
Színrendszer RGB CMYK HSB, IHS, HSL YCC YIQ CIE L*a*b*
Típusa Berendezésfüggő Berendezésfüggő Berendezésfüggő Berendezésfüggő Berendezésfüggő Berendezés független
PANTONE Coated, Uncoated, Process, ProSim TRUMATCH FOCOLTONE TOYO Color Finder 1050 ANPA-COLOR ROP DIC Color Guide
Berendezés független
Felhasználási terület Kijelzők, monitorok, TV Nyomtatás, fotóanyagok Képernyőn történő megjelenítés Képernyőn történő megjelenítés TV-n történő megjelenítés Általános célú, színegyeztető rendszer Színes nyomtatás, kalibrálás
Berendezés független Berendezés független Berendezés független Berendezés független Berendezés független
Színes nyomtatás, kalibrálás Próbanyomtatás, kalibrálás Színes nyomtatás, kalibrálás Hírlap nyomtatás, kalibrálás Színes nyomtatás, kalibrálás
2. táblázat Számítástechnikában használatos színrendszerek összefoglalása Végezetül térjünk vissza a raszteres kép méretét megadó képletben szereplő színfelbontás fogalmára. Ha egy képen maximálisan 256 különböző szín megjelenítésére van lehetőségünk, akkor a képünk színfelbontása 8 bit azaz 1 byte, mivel 28 = 256. A legtöbb eszköz azonban (képmegjelenítő kártyák, szkennerek, digitális fényképezőgép, stb.) lehetővé tesznek ennél nagyobb színfelbontású képek készítését is. A 24 bites kép általában az RGB színtér alapszínenkénti 8-8 bitjét jelenti, ami 3 byte-nak felel meg. Ha szeretnénk áttérni egy 24 bites RGB színtérből CMYK színtérbe, 32 biten történő ábrázolásra van szükségünk, ami 4 byte-nak felel meg. Ismerve a CMYK jelentőségét a legtöbb program alkalmas ezen és a táblázatban szereplő színterek közötti közvetlen áttérésre.
3.4.3 Formátum 3.4.3.1 A formátum választása A digitális képekkel történő munka rendkívül fontos eleme az adatok tárolási módja. A tárolás előtt több szempontot is érdemes figyelembe venni. Megfelelő adatformátum választása fontos lehet a további feldolgozás szempontjából (pl. űrfelvételek veszteséges adattárolása nem célszerű). Amennyiben nyomtatón szeretnénk megjeleníteni képünket célszerű olyan tárolási formátumot választani, amelyik támogatja mindezt (pl. olyan tárolási formátumot választok, amelyik megengedi a nyomtatásra vonatkozó alapvető jellemzők tárolását is). Ha multimédia vagy prezentációs anyagot állítunk elő, olyan tárolási 33 Grafika2000 v1.0 Copyright: Berke József
formátumokat célszerű használni, amelyik a megfelelő megjelenítést szolgálja (pl. nem ajánlatos nagy minőségromlással járó, veszteséges adatformátum használata). Az alábbiakban néhány fontosnak ítélt tárolási szempontot sorolunk fel (a legtöbbször az alábbi szempontok összefüggnek): 1. további (esetleg platform független) számítógépes feldolgozás lehetősége, 2. nyomtatásban történő megjelenítés, 3. képernyőn történő megjelenítés, 4. adatkonvertálás - szabványosított tárolási mód, 5. tömörítés - kódolás lehetősége, 6. hírközlésben használt adattovábbítás lehetősége, stb. Amennyiben nincs még konkrét elképzelésünk a felhasználást illetően, de a lehető legtöbb információt szeretnénk elmenteni a képpel és szerkesztésével, feldolgozásával kapcsolatban célszerű a feldolgozó programok saját, belső formátumát használni (Photoshop - PSD, EPS, PDD; Coreldraw - CDR, CDT; Acrobat - PDF; PowerPoint - PPT, stb.) amennyiben van ilyen. 3.4.3.2 Formátum és tömörítés Mivel vizuális adatok általában több nagyságrenddel nagyobb helyigényűek, mint egy digitális szövegoldal, előtérbe került az adatok tömörítése. A gyakorlati élet számos alkalmazása mellett (digitális TV, digitális fényképezés, digitális nyomdatechnika, távközlés, űrkutatás, stb.), az Internet terjedése is az adattömörítés fejlesztését eredményezte. Általános értelemben az adattömörítés magába foglalja a képi adatok kódolását - titkosítását és hibavédelmét - is. Általában egy adattömörítési eljárástól a következőket várjuk el: - legyen nagy hatékonyságú a tömörítési arányt illetően, - az eljárás algoritmusa legyen hatékonyan implementálható, - illeszkedjen meglevő rendszerek lehetőségeihez, - az algoritmusok használják ki a képek speciális adatszerkezetét. Egy adathalmazra, amely nem a legkisebb mennyiségű adattal jellemzi ugyanazt az információt, azt mondjuk, hogy redundáns. A képek tömörítése a felsorolt redundanciák kihasználásán alapul.
3.4.4 Ellenőrző kérdések 1. 2. 3. 4.
Hogyan határozható meg egy raszteres kép mérete? Mi jelent a színhőmérséklet fogalma? Milyen hullámhosszúságú EM sugárzás érzékelésére alkalmas az emberi szem? A szem érzékelő receptorai közül melyeknek van szerepe a fényérzékelésben, és melyeknek a színlátásban? 5. Milyen jellemzőktől függ a látás érzékenysége? 6. Mi a színérzet három jellemző sajátossága? 34 Grafika2000 v1.0 Copyright: Berke József
7. Mi a különbség az additív és szubtraktív színkeverés között? 8. Mit jelent az RGB és CMYK színtér fogalma? 9. Milyen további eszközfüggő színtereket ismer? 10. Soroljon fel eszköz független színtereket! 11. Mit jelent a denzítás fogalma? 12. Mit értünk gradáció alatt és hol van jelentősége? 13. Határozzuk meg egy 24 bites XGA felbontású digitális kép méretét! 14. Milyen szempontokat érdemes figyelembe venni képi adatok rögzítésekor? 15. Mit jelent a tömörítés fogalma? 16. Mit várunk egy tömörítő eljárástól? 17. Mi a redundancia? 18. Milyen típusait különböztetjük meg a redundanciának digitális képeknél?
3.5
Grafikus szabványok és formátumok
A grafikus szabványok és formátumok fejezetben a történeti bevezetés mellett, összefoglaljuk egy grafikus operációs rendszer alapvető ismérveit. Az utána következő részekben a vektoros, raszteres, 3D-s és mozgókép szabványok alapvető személyi számítógépes és munkaállomásokon használatos formátumainak rövid jellemzése található a teljesség igénye nélkül. Mivel a legtöbb formátum folyamatos fejlesztés alatt áll, a csoportosítás az egyes formátumok kezdeti kialakulására utal elsősorban.
3.5.1 Grafikus operációs rendszer A grafikus programok eleinte önálló grafikai felülettel rendelkeztek. Az egyes operációs rendszerek nem vagy minimális grafikai szabványtámogatást nyújtottak. Talán a Macintosh (Mac OS) és a Silicon Graphics (SGI IRIX) operációs rendszerei bizonyos értelemben kivételek, mivel a teljes operációs rendszer fejlesztése és a gépek hardveres kialakítása is alapvető képfeldolgozási feladatok hatékony támogatására koncentrálódott. A hardverhez és operációs rendszerhez nem igazított, önálló grafikus szoftverek állapota hamarosan megszűnt, mivel igényként lépett fel az egyes nyelvterületekre történő adaptálás és a gyorsan fejlődő, jó grafikus eszközök közvetlen szoftveres használata. Ezen két szemponthoz csatlakozott egy harmadik fontos elem is. A mikroprocesszorok száma és fajtája kezdett szélesedni, egyre több processzor jelent meg a piacon. Ez alapvetően megszabta nemcsak a grafikus programok, hanem a hardver és az operációs rendszerek fajtáit is. Mindezek együttesen hozták létre azon igényt, hogy egységes hardveres és szoftveres felület alakuljon ki. Ez a grafikus keretrendszer. Egy ilyen keretrendszernek az alábbi szempontokat kell kielégíteni: - egységes csatlakozási felület belső hardver fejlesztők számára, - egységes csatlakozási felület hardver perifériákat fejlesztők számára, 35 Grafika2000 v1.0 Copyright: Berke József
- egységes csatlakozási felület szoftver fejlesztők számára, - egységes felhasználói felület, - hardver és szoftver közötti kapcsolódási pontok egységesítése. Napjaink multitaszking operációs rendszerei ezeket a szempontokat rendkívül hatékonyan valósítják meg. A fenti szempontok megvalósításának mélysége viszont jelentősen eltér. A Windows 3 dinamikusan csatolható könyvtárrendszerét a Windows95, Windows NT operációs rendszereknél kiegészítették számos olyan felhasználói funkcióval, amelyek nem tisztán grafikus funkciók (API - egységes programozói felület, GUI - grafikus felhasználói felület, NTFS file kezelés, Plug-and-Play, bővített Internet használat, egységesített médiakezelés, stb.). A Macintosh OS operációs rendszere ennél is többet, közvetlen hardveres támogatást nyújt alapvető képfeldolgozási feladatok elvégzésére. Talán egyféle válasz, hogy az Intel MMX processzorokkal szerelt PC-k megfelelően felkészített szoftver esetén közvetlen processzoros grafikus (multimédia alapú) gyorsítást érhetnek el. Kétségtelenül a legjobb megoldásokat a Silicon Graphics 64 bites IRIX (6.2, 6.3, 6.4) operációs rendszere nyújtja. A 3. táblázat olyan jellemzőket tartalmaz, amelyek elsősorban képfeldolgozási, grafikai és animációs operációs rendszer színtű támogatások, összehasonlítva több operációs rendszer által nyújtott lehetőséggel. Funkció
SGI IRIX 6.4
WINDOWS98
Operációs rendszer felépítése Többprocesszoros környezet támogatása GUI - grafikus felhasználói felület Plug-and-Play bővítési lehetőség támogatása Grafikus elemek alapján felépülő fontkészlet (TTF) Multimédia támogatás Egységesített médiakezelés Közvetlen Internet támogatás
64 bit Igen Igen Igen
32 bit Nem Igen Igen
Igen
Igen
Igen Igen Igen Igen, teljesen hardveres támogatású Igen Igen, ImageVision Library
Igen Igen Igen Igen, főleg szoftveres támogatású Nem
OpenGL grafikus környezet Egységesített memóriakezelés - UMA Raszteres fejlesztői támogatás
Nem
3. táblázat Operációs rendszerek által nyújtott képfeldolgozást támogató szolgáltatások összefoglalása 36 Grafika2000 v1.0 Copyright: Berke József
3.5.2 Grafikus szabványok 3.5.2.1 SRGP A Simple Raster Graphics Package vagy röviden SRGP szabvány elsősorban a raszteres megjelenítés szabványosított környezetét jelenti. Ablakokat használó környezetre fejlesztették ki. Itt minden kép koordinátákkal rendelkező pontokból épül fel. Vagyis független a képernyőn aktuálisan megjelenített képtől. A csomag megenged alapvető elemek ún. primitívek használatát is. Ilyen elem, pl. a kör, a vonal, az ellipszis, a szöveg, a sokszög, a szín vagy a zárt objektumok kitöltő elemei (szín és mintázat). Az SRGP minden olyan alkalmazást támogat, amely interaktív üzemmódban fut (Megj. napjainkban szinte minden program ilyen). 3.5.2.2 PHIGS A vektorgrafikus szabványok közül az elsők közt fogadták el a PHIGS szabványt. Ez tulajdonképpen egy háromdimenziós struktúrát is támogató rutingyűjtemény. ANSI és ISO szabványokra támaszkodik, önálló adatbázist használ a grafikus információk tárolására és háromdimenziós megjelenítésre képes raszteres képernyőn. Ezek az alapvető tulajdonságai, amelyek megkülönböztetik az SRGP raszteres szabványtól. Sajátos modellrendszere van, amely három részből tevődik össze: - mennyiségi modellek (alapvető tudományágak - matematika, fizika, kémia, biológia, gazdaság, stb. - jellemzésére szolgáló egyenletek, grafikonok, görbék), - szervezési modellek (hierarchikus és gráfos szervezésű gyűjtemény különböző rendszerszervezési céllal), - geometriai modellek (geometriai alakzatok gyűjteménye, előre definiált jellemzők és kapcsolatok alapján). 3.5.2.3 OpenGL Az OpenGL szintén szabvány programozást segítő, kimondottan grafikus elemeket tartalmazó gyűjtemény. Nem csupán vektorgrafikus elemeket tartalmaz, hanem a raszteres és a 3D animációt segítő rutinok is megtalálhatók benne. Kifejlesztője a Silicon Graphics Inc. cég volt. Néhány fontosabb jellemzője: - geometriai és raszteres primitívek gyűjteménye, - különböző színtérben történő megjelenítési módok támogatása, - raszteres megjelenítés és modellezést támogató transzformációk, - megvilágítás és áttűnés támogatása, - rejtett felületek kezelése, 37 Grafika2000 v1.0 Copyright: Berke József
-
textúrák kezelése, különböző effektusok gyűjteménye (köd, füst, stb.), pufferelt működés támogatás.
3.5.3 Fontosabb kétdimenziós adatformátumok Az alábbiakban igyekeztünk a legáltalánosabb és a gyakorlatban leginkább előforduló kétdimenziós megjelenítést, nyomtatást szolgáló adatformátumokat összefoglalni. Ahol külön nem jeleztük, ott az egyes formátumok fájlkiterjesztése megegyezik az elnevezésben használt három karakterrel. 3.5.3.1 TIFF Az Aldus és a Microsoft által kifejlesztett TIFF (Tagged Image File Format) képformátum a raszteres képek legelterjedtebb formátuma. Az alábbiak voltak a legfontosabb jellemzők a kifejlesztéskor: - legyen operációs rendszer független, - legyen hardver független, - a file struktúra vizsgálata a teljes beolvasás nélkül megvalósítható legyen és - a kompatíbilis legyen a régebbi és lehetőleg az újabb formátumokkal is. A legújabb TIFF szabvány szinte minden kompatibilitási gondot kiküszöböl. Lehetőség van az adatok tömörítésére is veszteségmentes formában (LZW Lemple-Ziv-Welch, CCIT G3, CCIT G4, JPEG, stb.). Napjainkban alig található olyan grafikai program, amely ne tudná használni a TIFF formátumot. Amennyiben különböző platformok között akarunk képi adatokat cserélni, mindenképp a TIFF formátum a javasolt adatformátum. A TIFF formátumú fájlok kiterjesztése: .TIF. 3.5.3.2 JPEG A JPEG (Joint Photographic Experts Group) szabvány, amely elsősorban veszteséges képtömörítési szabvány, az ISO (International Standards Organization) és a CCITT (Consultation Committee on International Telephon and Telegraph) szervezetek által 1986-ban felállított munkacsoportban születtek. A diszkrét koszinusz transzformáción alapuló eljárással a látvány kismértékű romlása árán kb. 1/30-1/40 tömörítési arány is elérhető. A tömörítési arány illetve az esetleges minőségromlás mértéke felhasználói által tetszőlegesen állítható. Az eljárás úgy lett megválasztva, hogy hardveres és szoftveres úton is hatékonyan megvalósítható legyen. Veszteségmentes tömörítésre is használható, ekkor közel a felére lehet tömöríteni az adatokat. A JPEG formátumban mentett fájlok kiterjesztése: .JPG.
38 Grafika2000 v1.0 Copyright: Berke József
3.5.3.3 BMP A DOS és Windows operációs rendszerek alatt egy önálló bittérképes fájlformátum a BMP. Ezen formátumot kezelő (olvasás/írás és alapvető feldolgozások) programot a Microsoft cég minden operációs rendszeréhez csatolta (Windows 3 esetén ez a Paintbrush, Windows 9x és NT-nél a Paint). Mivel a fenti operációs rendszerek alatt futó programok mind használják, a többi pedig legalább olvasni tudja, a BMP formátum nagyon elterjedt. Mivel a BMP formátum nem engedi a képi információtól eltérő, egyéb adatok (pl. nyomtatásra vonatkozó információk, megjegyzések, copyright, stb.) lementését, ezek az adatok a mentéssel elvesznek. 3.5.3.4 PCX A PCX formátumot eredetileg a Z-Soft cég hozta létre, amikor kifejlesztette a Paintbrush nevű festőprogramját. Ez a program elsősorban DOS vagy Windows környezetben fut. Kezdetben csak maximálisan 8 bites képek voltak PCX formátumban menthetők, önálló színpaletták nélkül (version 3 szabvány). A javított PCX formátumot leíró szabvány (version 5 utáni változat) már az RGB 24 bites színmélységet is tudja kezelni. Elterjedt, szinte minden program által támogatott, egyszerű felépítésű formátum. A gyakorlatban ritkán használatos. Elsősorban a DOS vagy Windows alatti gyors megjelenítéseknél, prezentációknál vagy régebbi programváltozatok használata esetén van rá szükség. A CMYK színtérbeli adatokat nem tudja kezelni. 3.5.3.5 GIF Az Interneten történő kalandozások során az olvasó legtöbbet talán a GIF (Graphics Interchange Format) adatformátummal találkozhat. A WEB és más on-line rendszerek HTML leíró nyelvét közvetlenül kihasználó raszteres adatok tárolására alkalmas formátumról van szó. A kifejlesztő a Compuserve cég volt. Kimondottan a telefonos átvitel és a HTML nyelv lehetőségeit szem előtt tartva került kialakításra a GIF formátum. Napjainkban szinte minden program ismeri (legalább olvasni tudja). A képfeldolgozó és grafikai rendszerek pedig a GIF fájlok önálló szerkesztésére is képesek. Bináris (bitmap), árnyalatos és 8 bites színfelbontással használatos elsősorban, bár a legújabb szabvány támogatja a 24 bites színfelbontást is. Tömörített formában végzi a tárolást. Mentéskor a GIF89a szabvány felkínálja a későbbi megjelenítés normál vagy interlaced lehetőségét. Prezentációk, multimédia anyagok és a WEB-re történő fejlesztéseknél célszerű használni. A GIF formátum egy alternatív, de szinte teljesen azonos változata a PNG formátum.
39 Grafika2000 v1.0 Copyright: Berke József
3.5.3.6 PDF Az Adobe cég által kifejlesztett PDF (Portable Document Format) fájl formátum az igényes prezentációk létrehozásának kedvelt formátuma. Kifejlesztésekor az operációs rendszertől független megjelenítés volt az elsődleges cél. Így szinte minden környezetben megtalálható (Macintosh, DOS, Windows, UNIX). PostScript Level 2 leíró nyelv képezi az alapját, ami arra utal, hogy mind a raszteres, mind a vektoros adatokat tudja kezelni. Emellett kiegészítették számos olyan hasznos funkcióval, amelyeknek köszönhetően az egyik legelterjedtebb prezentációs adatformátum. Mindezek alapján állíthatjuk, hogy a multimédia alapvető elemeit tartalmazza. Ezeket az elemeket tömörített formában tárolja. A PDF formátumú dokumentumok megjelenése egy korszerű könyvre emlékeztet a kivitelezés, viszont teljesen digitális. Szerkesztésére az Adobe Acrobat programrendszer Writer, Distiller vagy Exchange tagja alkalmas, míg olvasására a számos WWW helyről szabadon letölthető és használható Adobe Acrobat Reader szolgál. Mindez egyben mutatja azon hátrányát is, hogy a legtöbb program nem képes közvetlenül olvasni. Könyvünk későbbi részeiben még részletesen foglalkozunk a PDF formátumot szerkesztő és olvasó előzőekben említett programokkal. 3.5.3.7 PhotoCD A PhotoCD, a Kodak cég által kifejlesztett rendszer és szabvány. Mintegy átmenet a hagyományos és digitális fényképezés között. Lehetőséget ad, hogy olcsón, jó minőségű, nagyfelbontású elektronikus képekhez jussunk anélkül, hogy ehhez drága digitális eszközöket vásárolnánk. Maga a fényképezés továbbra is a szokásos módon, a megszokott kamerákkal, a lehető legmagasabb felbontást biztosító filmanyagra történik. A kép csak ezután kerül digitalizálásra. A PhotoCD rendszer négy különböző összetevőből áll: • nagyfelbontású diaszkenner, • nagy teljesítményű számítógép, • speciális CD író, • professzionális színes nyomtató. A film vagy diát leolvasó szkenner felbontása 2048x3072 pixel, 24 bit színmélységgel. A PhotoCD kép teljes - nem tömörített - adatmennyisége közel 18 Mbyte. Megfelelő korrekciók (pl. színkorrekciók) elvégzése után, veszteségmentes eljárással tömörítik a képeket, majd CD-re írják. A színrendszereknél tárgyalt YCC színtérbe történő átírás után, a kapott adatokat veszteségmentes, önálló szabadalomként használt eljárással tömörítik. Az adatredukció segítségével az eredeti 18 Mbyte adatmennyiség mindegy 6 40 Grafika2000 v1.0 Copyright: Berke József
Mbyte-ra csökken. Így egy fotó CD lemezen körülbelül 100 (száz) színes kép helyezhető el. A fotó CD-n minden kép öt különböző változatban kerül tárolásra. Mind az öt képet ugyanabból az adatállományból nyerik, ezek csupán felbontásban különböznek egymástól. Az alapfelbontás - amit a Kodak Base-nak (alapnak) nevez - 512 sornak (soronként 768 képpontnak) felel meg, ami egy normál tvkép minőségével közel azonos. Emellett találunk még 4-szer, illetve 16-szor kisebb, valamint 4-szer, illetve 16-szor nagyobb felbontású képváltozatokat is: • Base/16 128 x 192 képpont • Base/4 256 x 384 képpont • Base 512 x 768 képpont • 4Base 1024 x 1536 képpont • 16Base 2048 x 3072 képpont A kisebb felbontások csupán a képek kikeresésére, valamint az úgynevezett indexképek (tartalomjegyzék) kinyomtatására szolgálnak. Ezek a képek tömörítés nélkül kerülnek a lemezre, ezáltal gyorsabban jeleníthetők meg a képernyőn. A nagyfelbontású 4 Base és 16 Base változatokat tömörítik. Ezek az adatcsomagok nem tartalmazzák a teljes kép adatait, hanem csak azokat a részeket, amelyek nem találhatók meg az alacsonyabb felbontású adatkészletekben. Ha tehát valaki 2048x3072 pontos felbontású képet szeretne kinyomtatni, akkor ahhoz nemcsak a 16 Base adatait kell leolvasnia a fotó CDről, hanem a 4 Base és a Base adatait is. A PhotoCD-re írt képfájlok kiterjesztése: .PCD. Önálló készülékkel televízión vagy megfelelő (a PhotoCD szabványt ismerő) CD-ROM olvasóval megjeleníthető. A Kodak a széleskörű alkalmazás elérése érdekében számos PhotoCD szabványt hozott létre. Az öttagú PhotoCD család tagjai: • PHOTO CD Master Disc, • PRO Photo CD Master Disc, • Photo CD Portfolio Disc, • Photo CD Catalog Disc, • Photo CD Diagnostic Disc. A 35 mm-es mérettől a 102*127 mm-es síkfilm formátumig, film vagy diafelvételek tárolására alkalmas (Master és Pro Master szabvány). Emellett nyomdai előkészítésre, interaktív üzleti- és kereskedelmi bemutatók, fotóalbumok létrehozására (Portfolio szabvány), cégek, ügynökségek, archívumok képeinek tárolására, elektronikus katalogizálásra (Catalog szabvány) és orvosi diagnosztikai célokra is (Diagnostic szabvány) használható a rendszer. Napjainkban szinte minden jelentősebb raszteres adatokat kezelni tudó program használja a szabványt. A cég WWW szerveréről a jelentősebb operációs rendszerekhez illeszkedő TWAIN modul letölthető. 41 Grafika2000 v1.0 Copyright: Berke József
3.5.3.8 VRML A WWW (World Wide Web) HTML (HiperText Markup Language) hipertextes programnyelvezetének kiegészítésére, továbbfejlesztésére született a VRML (Virtual Reality Modelling Language). Nem egy formátum, inkább egy leíró nyelv. A „virtuális világ” lehetőségeivel, előnyeivel és hátrányaival teszi lehetővé az interaktív kommunikációt. A VRML nyelv a korábban ismertetett OpenGL könyvtárára épülő OpenInventor modellező nyelvből alakult ki. A nyelv kifejlesztője a Silicon Graphics cég volt. A modellek mozgását JAVA nyelvű kódok adják. A VRML forráskód a HTML-hez hasonlóan ASCII formátumú. Az Internetre tervezett nyelv létrehozásánál fontos szempont volt a tömörség. A rendszer nem korlátozódik csupán a hálózatra. Jelentős szerepet kapott a multimédia alapú fejlesztésekben és alkalmazásokban is. A 3D térben való mozgás az egér segítségével történik, ami a felhasználótól kis gyakorlatot igényel. A VRML alkalmazásokat ma két csoportba sorolhatók: 1. Az eddigi számítógépes gyakorlatban használt 3D alkalmazások (CAD/CAM, molekulamodellezés, 3D adatábrázolás, térinformatika, orvosi alkalmazások, oktatás, stb.) 2. Bár az első felhasználók a játékipar területén jelentek meg, az interaktív virtuális valóság rövidesen komoly vetélytársa lehet a hagyományos filmnek az ismeretterjesztés, a művészet és a szórakoztatás egyes területein. A VRML formátumú fájlok kiterjesztése: .WRL. 3.5.3.9 MPEG Az MPEG szabvány ismertetésekor részletesen szóltunk az eljárás elvéről (1.5.2.4. fejezet). Most a gyakorlatban előforduló MPG kiterjesztésű adatfájlokat jellemezzük. Az MPEG formátumú fájlok leglényegesebb vonása, hogy az időben szomszédos képek közti változást kódolja. Biztonsági okokból azonban időről-időre „újrakezdi” az egymásra épülő kódolást, s ezzel meggátolja az esetleges adatátviteli hibák továbbterjedését. Leegyszerűsítve, az adatfolyam három, különböző szerepet betöltő képtípus egymásutánjából áll: 1. Különálló kép. Átlagosan fél másodpercenként egy teljes kép tömörítését jelenti, JPEG formában. Miután ez a kép a következő adatok számára mintegy referenciaként szolgál, viszonylag alacsony tömörítési arányú (12:1), viszont jó minőségű. 2. Előrebecsült kép. Az előző képhez viszonyított változást kódolja, s ezzel magas tömörítési arányt biztosít. Minél több előrebecsült kép következik egymás után, annál inkább eltérhet a helyreállított képsorozat az eredetitől. 3. Kétirányú kép. Itt a megelőző és a következő kép átlagát használják fel. Ezáltal nagyon magas tömörítési arányt érhető el. 42 Grafika2000 v1.0 Copyright: Berke József
3.5.3.10 AVI A Microsoft, amely az AVI (Audio Video Interleaved) formátum kifejlesztője, videó és hanginformáció tárolására dolgozta ki a formátumot. A videó forrás jelét digitalizálva a formátum külön kezeli a mozgókép és a hanginformációt. A hanganyagot Wave alakban, míg a képet DIB formátumban (Device Independent Bitmap) kezeli. A képinformáció tárolásakor egy képből kiindulva, a következő kép csak azon részleteit tárolják, amelyek megváltoztak. Ezeket a részképeket nevezik deltakeretnek (delta-frame). Tároláskor csak a jelentős változást elszenvedett deltakereteket veszik figyelembe és mentik el. A felvétel minőségének javítása érdekében a tömörítést végző szoftver a teles képet is rögzíti. A deltakeretek nem alkalmasak a felvételen történő gyors változások megfelelő minőségű rögzítésére, hiszen így rendkívül nagy adatállományt kapnánk. Ennek következtében a lassan változó, nyugodt felvételek egyenletesen, jó minőségben lejátszhatók, míg a gyors változásoknál a felvétel "ugrásokat" szenved. Az ugrások elkerülését a teljes megjelenítő keret kicsinyítésével csökkenthetjük. Lejátszáskor a hangadatok közvetlenül a hangkártyára, míg a képinformáció a megjelenítő eszközre kerül. A személyi számítógépes környezetben futó kép- és videó feldolgozó szoftverek könnyedén kezelik a formátumot. Még a legegyszerűbb programok is felkínálnak alapvető szerkesztési műveleteket. A Windows alapú rendszerek kedvelt mozgókép adatformátuma, mivel nem csupán a winchesterről, hanem egy CD-ROM olvasóról is lejátszhatók, minimális hardver igény mellett.
3.5.4 Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
Mi jellemzi a grafikus keretrendszert? Milyen jellemzői vannak egy grafikus operációs rendszernek? Soroljon fel grafikus operációs rendszert! Mi az SRGP primitív! Mit takar a PHIGS elnevezés? Mi jellemzi a PHIGS modellrendszerét? Ismertesse az OpenGL fontosabb jellemzőt! Mi volt a célja az MPEG bizottságnak? Ismertesse az MPEG szabványok alapvető jellemzőit! Mit takar a TIFF formátum? Milyen elvek alapján dogozik a JPEG szabvány? Mikor nem használhatunk JPEG tömörítést? Mi a kvantáló? Mi a progresszív képtömörítés lényege? Milyen jellemzőket adhatunk meg BMP formátum mentésekor? Mit tud a PCX formátumról? Mi a fraktál alapú tömörítés lényege? 43 Grafika2000 v1.0 Copyright: Berke József
18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32.
Milyen előnyei mutatkoznak a JPEG szabvánnyal szemben? Milyen színtérben dolgozik a Macintosh PICT formátum? Hol és milyen célból használnak EPS formátumot? Mi volt a GIF formátum kidolgozásának a célja? Ismertesse a PDF funkcióit! Mit takar a Kodak PhotoCD rendszere? Mire használhatók az egyes PhotoCD szabványok? Mit jelent a 16Base elnevezés? Hogyan működik a VRML? Melyek napjaink VRML alkalmazásai? Mit takar a DXF? Melyek az MPEG-1 szabvány alapvető képtípusai? Alkalmas-e a hang tárolására az AVI formátum? Mi a deltakeret? Mi a QuickTime codec?
44 Grafika2000 v1.0 Copyright: Berke József
3.6
Felhasználási területek
A vizuális adatok számítógépes feldolgozása tevékenységünk mindennapi részévé vált. A tudományos kutatástól kezdve az ipari hasznosításon át a játékokig bezárólag mindenhol előfordul. Az alábbiakban összefoglaljuk a korábban felsorolt, jelentősebb alkalmazásokhoz kapcsolódó területetek néhány jellemzőjét. A legtöbb helyen komoly hazai eredmények is születtek, ezeket külön is jelezzük.
3.6.1 Nyomdatechnika A nyomtatáshoz és a nyomtatáshoz szükséges anyagok előállításához kiemelt szerepet kap a vizuális információ számítógéppel történő kezelése. Ezek az adatok elsősorban raszteres jellegűek. A komolyabb grafikai feladatok megoldására is alkalmas személyi számítógépek megjelenése gyökeresen megváltoztatta a nyomdai munkálatokat. A kiadványszerkesztéstől kezdődően a grafikai feladatokon át az egyes színnyomatok előállításáig a legtöbb feladat könnyen megoldható számítógépek segítségével. A felhasználó általában egyegy területre szakosodik, azonban mindenki számára szükség van alapvető nyomdai, grafikai és számítástechnikai ismeretek elsajátítására. Bátran állíthatjuk, hogy napjainkra már szinte minden nyomda részben vagy teljesen áttért a digitális technika adta lehetőségek kihasználására. Hazánkban is szép számmal léteznek olyan stúdiók, nyomdák és egyéb cégek, amelyek fő profiljuknak a digitális nyomdatechnika valamely részterületét tekintik. Az alábbi főbb területek részei ennek a technikának: - kiadványszerkesztés (DTP), - grafikai előkészítés, - színrebontás, nyomtatás.
3.6.2 Távérzékelés Távérzékelés alkalmazásával két vagy háromdimenziós objektumok vizsgálhatók úgy, hogy az érzékelő eszközök nincsenek közvetlen kapcsolatban a vizsgálat tárgyával. Bár ennek az általánosan elfogadott definíciónak a mikroszkópi képfeldolgozás is eleget tesz, általában ha távérzékelésről beszélünk, akkor űr- és légi-felvételekre gondolunk. A műholdakon elhelyezett szenzorok a földfelszín különböző tárgyairól visszavert, illetve kisugározott elektromágneses energiát érzékelik, így ezek az adatok bizonyos feldolgozások után információforrásként szolgálnak a vizsgált objektumról. Az így kapott információk mindennapi életünk részei lettek. Az ezredforduló környékén az ilyen jellegű információk megszerzésére az emberiség jelentős összeget áldoz (több mint 2 milliárd USD). Az alábbi felsorolás a világviszonylatban jelentősebb alkalmazási területeket mutatja: 45 Grafika2000 v1.0 Copyright: Berke József
mezőgazdaság és erdészet, területhasznosítás, geológia, vízgazdálkodás, part menti területek védelme, meteorológia és környezetvédelem. Hazánkban a közelmúlt jelentősebb felhasználási területei: - digitális térképek előállítása (MH TÁTI, FÖMI), - termésbecslés, vegetációtérképezés, melioráció (MTA, PATE, DATE, GATE, FÖMI), - térinformatikai fejlesztések, különféle adatbázisok létrehozása (szinte minden elképzelhető területen van hazai résztvevő) - környezetvédelem (VE, GATE, BME, JATE, JPTE, KLTE), - tájrendezés, erdőgazdálkodás (KÉE, EFE), - geológia (ELTE, Geocomp) és - oktatás (egyetemek, főiskolák). A hazai sikereket, eredményeket elért Intézmények száma rendkívül magas, így a fenti lista - terjedelmi okokból - korántsem teljes.
3.6.3 Orvosi diagnosztika Az orvosi alkalmazások célja részben különböző orvosi képalkotó rendszerek képeinek javítása, részben a nagytömegű laboratóriumi (főleg mikroszkópi) vizsgálatok elvégzésének automatizálása. Természetesen mindkét vonatkozásban a kutatás is jelentős szerepet kap. A keletkező tömeges képi információ újrafeldolgozásához egyre nagyobb szerepet kap a képi adatbázist felépítő és működtető rendszerek létrehozása. A röntgenfelvételek és a mikroszkóp mellett ma már számos olyan berendezés segíti a diagnózis felállítását és a gyógyítást, amelyek vizuális információt állítanak elő: CT, ultrahangos berendezések, szcintillációs kamera, NMR, stb. A feldolgozások során általában raszteres adatok kerülnek a számítógépbe és a legkülönfélébb képfeldolgozási területek ismeretét igénylik értékelésük. Például mikroszkópi felvételek értékelésénél az alábbi lehetőségeket nyújtja a képfeldolgozás: - képszerkesztés, - lényeges részek kiemelése, - jellemzők objektív, nagy tömegű mérése, - statisztikai kiértékelés, - automatikus elemzés, - képi tudásbázis létrehozása. Érdemes megemlíteni a sikereket elért hazai Intézményeket: JATE képregisztráció, 3D modellezés, archiválás; MTA SZTAKI - CNN (Cellular Neural Network) alkalmazás; SZOTE - adatbázisok létrehozása, BME - 3D modellezés, ELTE - 3D látás, PATE Georgikon - 2D morfometriai vizsgálatok. 46 Grafika2000 v1.0 Copyright: Berke József
3.6.4 Ipari és mezőgazdasági alkalmazások Ipari és mezőgazdasági alkalmazások során elsősorban raszteres képi adatokat használunk. Ipari alkalmazásnak minősül az anyagvizsgálati laboratóriumokban végzett mikroszkópi vagy más képelemző rendszer használata, a távérzékelési alkalmazások egyes területei (pl. geológia) is. Általában ipari képfeldolgozó rendszerek alatt azonban a gyártás során végzett minőségellenőrzést, folyamatvezérlést végző rendszereket értjük. A mezőgazdaságban és élelmiszeriparban minden olyan vizuális értékelés ide tartozik, amely nem elsősorban a klasszikus távérzékelés adatait használja. A felmerülő feladatok speciális követelményeket támasztanak az alkalmazott rendszerrel szemben. Általában alapvető elvárás az ipari képfeldolgozó rendszereknél: - gyakori a real-time feldolgozás, - az adott ipari, mg-i alkalmazáshoz illeszkedő pontosság, - a mérések reprodukálhatósága, dokumentálása, - az ipari, mg-i környezetben való alkalmazhatóság, - a vezérlési, visszacsatolási funkciók biztosítása, - a nagy megbízhatóság. Az alábbi felsorolás - a teljesség igénye nélkül - néhány érdekes hazai példát szemléltet: - gyümölcs belső hibáinak detektálása - KÉE, - mezőgazdasági objektumok 3D-s alakváltozásának detektálása - PATE Mosonmagyaróvár, - gyártásvezérlés - FALCON-VISION Kft., - mg-i kísérletek értékelése - PATE Georgikon, - anyagszerkezet vizsgálat - ME, BDMF, KFKI, PICTRON, SZTAKI - biztonságtechnika - Hexium Kft., Cognitech Kft., - rendszámfelismerés - BME, - ujjlenyomat azonosítás - KLTE, - CNN chip alkalmazása - MTA SZTAKI.
3.6.5 Számítógépes animáció Animáció minden olyan tevékenység vagy termék, amely mesterségesen létrehozott mozgás érzetét kelti mozdulatlan alkotóelemek felhasználásával. A számítógépes animáció ezen mindössze annyit változtat, hogy a mozgás létrehozásában a számítógépet használjuk. Az animációnak három alapvető típusa létezik: - állandó előtérrel készült animáció, - állandó háttérrel készült animáció és az - objektum animáció. 47 Grafika2000 v1.0 Copyright: Berke József
Számítógép használata mindhárom folyamatot jelentősen leegyszerűsíti, megkönnyíti. Az animáció készítésekor a kulcsképek (a mozgás fázisainak jellegzetes pontjai) közötti átmenetet utasításaink alapján a számítógép határozza meg (tweening). Erre a legegyszerűbb példa, amikor egy képet folyamatosan áttranszformálunk (morphing) egy másik felismerhető képpé. A filmművészet számára az igazán többletet azonban nem ez adja, hanem az olyan lehetőségek széles tárháza, amelyeket egyetlen napjainkban ismert más eszközzel sem tudnánk megvalósítani (speciális -festés, -mozgatás, effektusok). A VRML ismertetésekor már érintettük a témát, hiszen a VRML nyelv egy kiváló, tömegek számára elérhető eszköztár, animációk interaktív felhasználására vagy esetleg készítésére. Az animációk tárolására önálló szerkezeti felépítésű, szabványként használt tárolási formátumok használatosak (pl. FLC, FLI, WRL, PXR). Gyakori azonban valamelyik videó formátum használata is, bár ez jelentős méretbeli növekedést okoz, azonban megtekintése nem igényel speciális szoftvert. Ma már nem szokatlanok az egész estét betöltő, számítógépes animációs filmek. Az első ezek között a Toy Story (Játékháború) volt, ami teljes egészében a PIXAR cég számítógépes "stúdiójában" készült. A világ élvonalát a számítógépes animációhoz szükséges magas tőke, a szakértelem és Hollywood egyeduralma miatt elsősorban a "szilikon völgye" jelenti. A legfrissebb hírek és az érdekességek miatt javasoljuk olvasóinknak, ha tehetik, látogassák meg a nevesebb stúdiók, cégek Web lapjait!
3.6.6 Optikai karakterfelismerés Kinyomtatott vagy írott szövegek digitális úton történő felismerését nevezzük optikai karakterfelismerésnek. A folyamat eszközigénye: - számítógép (személyi számítógép megfelelő), - lapolvasó szkenner és - OCR (Optical Character Recognization) program. Elsősorban nagymennyiségű (írott vagy nyomtatott) szöveg elektronikus bevitelére használjuk. A felismerés tárgyát képező nyomtatott vagy írott szöveget a legjobb minőség elérése érdekében lapolvasó szkenner segítségével digitalizáljuk. Eredményül egy bittérképes képet kapunk. A következő lépésben elkülönítjük az egyes leendő karaktereknek megfelelő képrészeket. Eredményül egy bittérképes karakter mátrixot kapunk. Az előfeldolgozás során, eltávolítjuk vagy megpróbáljuk redukálni a számunkra zavaró komponenseket (zaj, üres részek, nem felismerendő részek, stb.). Az egyes mátrixokat normalizáljuk, azaz megfelelő méretre, pozícióra, elhelyezkedésre, stb. transzformáljuk. A kapott normalizált képen meghatározzuk a felismeréshez szükséges jellemzőket (pl. 48 Grafika2000 v1.0 Copyright: Berke József
kétdimenziós morfológiai paraméterek, textúrák, logikai kapcsolatok, stb.). Eredményül olyan halmazt kapunk, amely kapcsolatokat, paramétereket, függvényeket tartalmaz. Az utolsó lépésben egy adatbázissal történő összehasonlítás alapján megpróbáljuk a paraméterek alapján felismerni (osztályozással) a karaktereket. A folyamat végrehajtását számos probléma nehezíti, korlátozza (eredeti nyomtatás minősége, szkenner paraméterei, OCR beállítások, stb.). A feladat láthatóan rendkívül összetett és magas fokú felkészültséget igényel elsősorban a programfejlesztők részéről. Ennek ellenére örömmel nyugtázhatjuk, hogy az OCR programok területén, világviszonylatban az egyik legnagyobb példányszámban eladott és használt programnak (Recognita) magyar cég a kifejlesztője (Recognita Rt.). A program többféle operációs rendszer alatt is dolgozik, használata egyszerű és magas találati aránnyal dolgozik. Több mint 110 különböző nyelv karakterkészletét tudja kezelni.
3.6.7 Számítógéppel támogatott tervezés A számítógépes vagy számítógéppel támogatott tervezés - CAD - során az ember és a számítógép kapcsolatában az ember az alkotó, a számítógép a részletek kidolgozója. A feladat elvégzése mindkét oldalról jelentős mennyiségű, minőségi információ (nem csak grafikus) létrehozását, feldolgozását követeli. A számítógép oldaláról ez gyors, nagy számítási teljesítményt, jelentős tárkapacitást, nagy adatbázist és célorientált fejlesztői szoftverrendszert kíván. A CAD elnevezés mellett érdemes két további fogalmat is tisztázni: 1. CAE (Computer Aided Engineering) - számítógéppel támogatott mérnöki tevékenység, 2. CIM (Computer Integrated Manufacturing) - számítógépes termelés, A CAD mellett a fenti két terület együttesével találkozunk akkor, amikor a tervek elkészítése után a számítógép az ipari termelés számára feldolgozza az adatokat és irányítja, ellenőrzi is a termelés folyamatát. Milyen előnyökkel jár egy CAD rendszer használata? - az elgondolás és a termék elkészítése közötti idő lecsökken, - a termék minősége jobb és - az előállítás költségei lecsökkennek. A CAD rendszer alkalmazása rendkívül széles. Az ipartól az űrkutatásig, az építészettől a mezőgazdaságig számos területen alkalmazzák. Mielőtt részletesebben az építészeti programokról írunk, két modellt szeretnénk megvilágítani, amelyek a háromdimenziós CAD rendszerek lényegi elemei.
49 Grafika2000 v1.0 Copyright: Berke József
A huzalmodell olyan háromdimenziós vektoros ábrázolás, amelyen a felületek nincsenek kitöltve, a tárgyak élei, kontúrjai látszanak csupán. Előnye a vele történő számítások gyorsaságában rejlik. Ugyanazon feladat elvégzése során jelentősebb számítási igény lép fel az ún. teljes modell (a felületek kitöltve, realisztikus formában állnak rendelkezésre) használatakor. A korábban ismertetett vektoros jellemzők, két- ill. háromdimenziós transzformációk, adatbázisok és más segédeszközök széles tárháza képezi egy CAD rendszer alapját. Napjaink építészeti programjai az alábbi tulajdonságokkal rendelkezhetnek személyi számítógépes környezetben: - perspektivikus ábrázolás, - az objektum és környezetének realisztikus megjelenítése, - változó megvilágítási hatások bemutatása, - ipari szabványok, előírások figyelembe vétele, - részletes kiviteli tervek előállítása és - a realisztikus képen történő szabad mozgás. Mindezek megvalósítása rendkívül összetett, sok éves fejlesztés eredményeként érhető csak el. Az ArchiCAD egy háromdimenziós építészeti tervező rendszer. A különböző objektumok létrehozásához szükséges tervek elkészítéséhez, teljes eszköztárral rendelkezik. A kétdimenziós rajzoktól a háromdimenziós modellek készítéséig minden eszköz megtalálható, egyazon adatbázist használva. Mindez azt jelenti, hogy a fejlesztés vagy megjelenítés bármely pontján változtatást hajtunk végre, az egységesen mindenre (pl. tervek, modellek, szabványok, megjelenítés) azonnali hatással van. Elképzeléseinket tetszőleges, mesterséges fényforrásokkal világíthatjuk meg, de figyelembe vehetjük a nap hely, évszak és időhöz kötött hatását is. A rendszer elismerését számos díj, kitüntetés és szakmai elismerés övezi.
3.6.8 Ellenőrző kérdések 1. 2. 3. 4. 5. 6. 7. 8. 9.
Hol alkalmazható a számítógépes grafika a nyomdatechnikában? Mit nevezünk távérzékelésnek? Mely területeken alkalmazható számítógépes képfeldolgozás? Milyen lehetőséget nyújt a vizuális információ feldolgozása az orvosi diagnosztika területén? Milyen követelmények lépnek fel az ipari alkalmazásoknál? Mely animációs területeken hasznosítható a számítógép? Mi az optikai karakterfelismerés lényege? Mit értünk számítógépes tervezés alatt? Melyek a jellemzői egy építészeti tervező programnak? 50 Grafika2000 v1.0 Copyright: Berke József
10. Mi a Recognita és az ArchiCAD? 11. Melyek a multimédia elemei? 12. Milyen (vizuális) elvárásokat támasztunk egy multimédia anyaggal szemben? 13. Mit nevezünk virtuális valóságnak? 14. Hol alkalmazható a VR?
51 Grafika2000 v1.0 Copyright: Berke József