Multimédia ismeretek 10. évfolyam informatika orientáció Összeállította: Nagy Zsolt
2
Tematika 1.
Multimédia fogalma 1.1. Médium 1.2. Média
2.
A multimédia alkalmazások alkotóelemei 2.1. Szöveges alkalmazások 2.2. Hangállományok 2.3. Grafikus objektumok 2.4. Videoállományok
3.
Multimédia alkalmazások jellemzői 3.1. Idődimenzió 3.2. Adatfolyam 3.3. Valós idejű működés
4.
Egy multimédia számítógép hardvere 4.1. CPU 4.2. Memória 4.3. Belső sínrendszer 4.4. Sínrendszerek 4.5. Monitor 4.6. Grafikus kártya 4.7. Lapolvasók 4.8. Hangkártya, hangszóró, mikrofon 4.9. Videokártya 4.10. CD technika 4.11. DVD technika
5.
Szöveges alkalmazások 5.1. Szöveg elkészítésének menete 5.2. Szövegbevitel képolvasóval 5.3. Az OCR programok működése 5.4. Objektumok csatolása és beágyazása
3
6.
Világháló 6.1. Hypertext 6.2. Hypermédia 6.3. Kép, hang és videoállományok az Interneten
7.
Digitális hangtechnika 7.1. A hang fizikai jellemzői 7.2. A hang érzékelése 7.3. Akusztikai alapfogalmak 7.4. A hang rögzítése 7.5. A hang digitális rögzítése és lejátszása 7.6. Digitális hangállomány mérete 7.7. Hangfelvétel készítése 7.8. Hangállomány tömörítése 7.9. Környezeti hangtér
8.
Grafikus alkalmazások, animáció 8.1. Az emberi látás informatikai vonatkozásai 8.2. Színlátás 8.3. Szín koordinátarendszerek 8.4. Számítógépes grafika 8.5. Képek jellemzői 8.6. Képek digitalizálása 8.7. Képállományok tömörítése 8.8. Animáció
9.
Digitális videotechnika 9.1. Színes TV rendszerek 9.2. Videojelek digitalizálása 9.3. Digitalizált videoállomány jellemzői 9.4. Videoállományok tömörítése 9.5. Videoállomány tömörítési eljárások
4
1. Multimédia 1.1. Médium fogalma: Az információk terjesztésére és bemutatására szolgáló eszközök. Pl.: nyomtatott szöveg, kép, grafika, beszéd, zene, videó. A művelés, közvetítés, kifejezés eszköze. A tömegtájékoztatás gyűjtőneve.
1.2. Média: A médium többes száma. Több médiumot jelent. Multimédia: Sok-sok médium. A multimédiát független információelemek számítógép-vezérelt, integrált előállítása, célorientált feldolgozása, bemutatása, tárolása és továbbítása jellemzi. A multimédia szó tágabb értelmezésben egy kreatív alkotó közeg, olyan rendszert definiál, amely biztosítja az egyén vagy csoportok számára a különböző struktúrában (kép, grafika, mozgókép, hang, írott szöveg, adatállományok, stb.) rögzített, nem szükségszerűen egy adatbázisban lévő digitális információ interaktív elérhetőségét, annak a felhasználás helyén történő rögzítését, átstrukturálását, bővítését. A cél tehát az ember információval történő magas színvonalú kiszolgálása, a hatékonyság érdekében lehetőleg minden érzékszervre egyidejűleg gyakorolt ingerekkel. A médiumok besorolhatók időfüggetlen (pl. szöveg, ábra) és időfüggő (hang, mozgókép) kategóriákba.
5
2. A Multimédia alkalmazások alkotóelemei 2.1. Szöveges alkalmazások: A közlendő információ szövegesen jelenik meg. Létrehozás: Hagyományos (begépelés) Beolvasás (lapolvasó) Előbb kép, majd OCR (Optical Character Recognition) karakterfelismerés. Legyen: Tömör, lényegre törő, átlátható. Kiemelések, hyperlinkek alkalmazása.
2.2. Hangállományok: A hatás javítása érdekében a multimédia alkalmazás keretein belül, hangállományt is el lehet helyezni. Digitális, lehetőleg tömörített állapotban. Feltétel, hogy a számítógépben legyen hangkártya és hangszóró. Jellemzi: Tömörítés Hangcsatornák száma o Mono 1 csatorna o Sztereo 2 csatorna o Dolby 4.1, 5.1 csatorna o Theatre 7.1 csatorna Analóg hang Hangkártya Digitális hang
2.3. Grafikus objektumok: Általában a szöveges részeket egészítik ki járulékos információkkal. Létrehozásuk: Lapolvasóval beolvasás Fényképezőgép Rajzoló, képszerkesztő programok A legelterjedtebb grafikus formátumok: BMP, TIF, GIF, JPG, PNG A formátumokat a képpontszám, a színkezelés és a tömörítés jellemzi. Grafikus kártya Monitor viszonya !?
6
2.4. Videoállományok: (videó, mozgókép) Videoállományokat elhelyezhetünk szöveges állomány kiegészítésére, pl. bemutató készítésénél figyelemfelkeltés. A videót szinkronban működő hang és mozgókép jellemzi. Videoállományok jellemzői: Képméret (szélesség * magasság) Képkocka / másodperc Színkezelés Tömörítés Hangcsatornák száma Videokártya: D A átalakítás (CRT) D (TFT) Digitalizálás: A D átalakítás
7
3. Multimédia alkalmazások jellemzői: 3.1. Idődimenzió: A szolgáltatott információ időbeli jellege szerint megkülönböztetünk: Időfüggetlen médiumokat (szöveg, állókép) időben állandó érték. Időfüggő médiumokat (hang, videó) időben változó érték.
3.2. Adatfolyam: Adatok, csomagok sorozata. Így a pillanatnyi (időponthoz kötött adatérték) változik (pl.: hang, videó, animáció, fényreklám, stb.). Van-e az adatfolyam átvitelének időbeli megkötése? Nincs aszinkron átvitel: Az adatcsomagok a vevőhöz időbeli megkötés nélkül jutnak el. Van szinkron átvitel: A csomagok a végpontok közötti maximális késleltetés mellett jutnak el a vevőhöz.
3.3. Valós idejű működés: Minden multimédia rendszer valósidejű, ha a folyamatos adatfolyamok valós időben történő feldolgozása lényeges szempont. A valós idejű rendszernek minden eseményt fogadni kell, időben fel kell dolgozni és időben vissza kell küldeni az adatokat. Kritikus időtartamok: T(eseményre reagálás) + T(feldolgozás) + T(válasz) A feldolgozás eredményének egy szigorúan szabályozott időtartamon belül (kritikus idő) az igénylő rendelkezésére kell állnia. Pl. Hangállományoknál a természetes beszéd dinamikájának (időben változó érték) megfelelően kell a hang adatfolyamot szolgáltatni a hangkártyának a hangszóróhoz. Fontos: Az átvitel és a feldolgozás sebessége. Megfelelő feldolgozási kapacitás. Tömörítés alkalmazása (kódolás dekódolás)
8
4. Egy multimédia számítógép hardvere Egy multimédia rendszerben legyen nagy számítási teljesítmény, legyen a busznak nagy átviteli sebessége és tartalmazza a multimédia-alkalmazások használatához szükséges perifériákat. Ma általában egy hagyományos munkaállomás nagyfelbontású színes képernyővel, 3D grafikus kártyával, hangszóróval és mikrofonnal, CD-ROM-mal, audió- kártyával. (+ digitalizálókkal, stb.)
4.1. CPU jellemzői: Típusok Sebesség [MHz, GHz] Címsín [32 – 64 bit] Adatsín [32 – 128 bit] Memória – processzor sebesség Kevesebb célhardver, nagyobb processzor teljesítményt igényel!
4.2. Operatív memória jellemzői: Típusok (RAM EDO, SDRAM DDR-SDRAM, DDR II, RAMBUS, stb.) Sebesség [MHz] 100, 133, 266, 333, 400, 533, 600, stb. Méret [MB, GB] 512 - …
4.3. Belső sínrendszer: Nagymennyiségű adat gyors továbbítását kell lehetővé tenni a számítógép egyik részegységétől, perifériától a másik részegységig, perifériáig. A számítógép az adatokat a belső sínrendszerén továbbítja, amely párhuzamosan futó vezetékek együttese. Részei: Adatsín Címsín Vezérlő sín A belső sínen az adatátviteli sebességet meghatározza: A sín sebessége [Hz, bit / secundum] A sín szélessége: egyszerre mennyi adatot tud továbbítani.
9
4.4. Sínrendszerek: PCI: o 32 bit széles címsín o 32 bit adatsín o átviteli sebesség 33 MHz AGP (Accelerated Graphics Port – Gyorsított Grafikus Port): Az AGP nagysebességű interfész a központi memória és a videoprocesszor között. Mivel csak két eszközt kapcsol össze, igazából nem tekinthető busznak. A processzor és a grafikus kártya közötti adatátviteli sebesség növelése miatt hozták létre. Részei:
Videoprocesszor (sebesség)
Videomemória (méret, sebesség)
Az AGP elválasztja a grafikus kártyát a többi perifériától Szorzó
sebesség
sávszélesség szélesség
2*
66 MHz
254,3 MB/s
4*
133 MHz
8*
266 MHz
32 bit
USB 1-2: o A perifériák felfűzhetők o Plug and play o USB 1.1: 1,5 MB/s; 12 MB/s o USB 2: 480 MB/s FireWire 1-2: o Főleg videorekorderek csatlakoztatása. o 1-es: 400 MB/s o 2-es: 800 MB/s
10
4.5. Monitor Grafikus kártya Monitor. A megjelenített kép minősége függ a monitortól. A monitor lelke a katódsugárcső, amelyben elektronágyúk találhatók. A monokróm monitorban egy, a színesben három. Minden elektronágyú elektronsugarat bocsát ki, mellyel bombázza a monitor belső falát borító foszfor réteget. Az így gerjesztett foszfor fényt bocsát ki. Három különböző foszforanyagot használnak. Egyet-egyet a piros – zöld – kék szín számára. Minél nagyobb az elektronsugárba csapódó elektronsugár intenzitása, annál erősebben villan fel a foszfor és annál erősebb fényt bocsát ki. Az egységnyi elrendezésben lévő három különböző típusú foszfor által kibocsátott színek keveréke adja az adott területen megjelenő színt. Azonos erősségű R, G, B fényerőnél, különböző intenzitásnál szürkeárnyalatos színeket kapunk. Különböző színeket az R, G, B elektronágyúk különböző intenzitásainál kapunk. Az elektronsugár képpontonként (3 szubpixel) halad, balról jobbra és fentről lefele. Egy eltérítő-egység változtatja az elektronsugarak hajlásszögét. A bal felső sarokból a jobb alsó sarokig haladva kirajzol egy képet. Interlaced (váltósoros) letapogatás Non interlaced (sorfolytonos) letapogatás Miután a pásztázó elektronsugár elhagyta a foszforpontot, a foszfor rövid ideig még világít, ez az utánvilágítás. Miért zavaró ez a játékoknál? A teljes képet kirajzolása után, az elektronika újra kezdi a rajzolást a képfrissítési frekvenciának megfelelően. Képfrissítési frekvencia: [kép / sec] A pixel (picture element – képpont) a képernyő legkisebb megvilágítható része. Színes technikában egy pixel 3 alpixelből áll az R, G, B színeknek megfelelően. A képernyő felbontását a képpont mérete és a képernyő nagysága határozza meg. Minél kisebb a képpont, annál több fér el egy adott nagyságú képernyőn, és annál finomabb felbontású képet kapunk. CRT: 0,31; 0,28; 0,21
11
4.6. Grafikus kártya: A számítógépből érkező digitális jeleket a grafikus kártya fogadja. A kártya az átvett analóg jelekből a digitál – analóg átalakító (DAC – Digital Analóg Converter) segítségével analóg jeleket alakít ki. A színes grafikus kártya három DAC-ot tartalmaz (R, G, B). A digitális – analóg áramkörök az egyes színekhez tartozó digitális jelekből a színnek megfelelő analóg jeleket állít elő, és ezek vezérlik a monitorok elektronsugarainak intenzitását. A grafikus kártyák alapvető jellemzői: Felbontás Megjeleníthető színek száma Felbontás: A képernyőn függőleges és vízszintes irányban megjeleníthető képpontok számát határozza meg. Adott képpont-méretnél, minél több a képpontok száma, annál nagyobb a kép. Felbontás
pixelek száma
640*480
307200
800*600
480000
1024*768
786432
1280*1024
1310720
1600*1200
1920000
1.9 Mpixel
Színmélység: A képpontokhoz tartozó színinformáció mennyisége határozza meg a képen megjeleníthető színek számát. A színek száma a színmélység, ami nagyban függ a grafikus kártyától. A grafikus kártya a videomemóriájában tárolja a képpontok színinformációit. Minél nagyobb a videomemória, annál több színinformációt lehet tárolni. Egy képpont színinformációja 1,2,4,8,16,24,32 hosszú lehet. A videomemória mérete korlátozhatja a választott felbontáshoz tartozó színmélységet. 1600*1200, 24 bit 6 MB memória szükséges. Grafikus kártya szabványok: A szabványban meghatározzák a monitor felbontását és színmélységét. Pl.: EGA, VGA, SVGA, XGA, SXGA, WXGA, stb. 12
4.7. Lapolvasók: A lapolvasó papír- vagy diahordozón található szöveget vagy ábrát bittérképes, digitális formában olvas be a számítógép memóriájába. Digitalizáláskor a lapolvasó a hordozón található információt, sűrű beosztású rácsozattal kis területekre, képelemekre bontja. Majd a képelemekhez hozzárendel egy, a képelem színétől és a lapolvasó színmélységétől függő értéket. Ez az érték a lapolvasó működésétől függően 1-24 bit lehet. A lapolvasók nem különböztetik meg a szöveget és az ábrát, mindkét fajta információt bittérképes formában olvassák be. A beolvasott szöveget nem lehet szövegszerkesztővel közvetlenül szerkeszteni, azt előbb egy optikai karakter felismerő programmal karakteres formára kell alakítani. A lapolvasók legfontosabb műszaki paraméterei: Felbontás: A felbontás megadja, hogy a lapolvasó egységnyi hosszon hány képelemet különböztet meg. Általában [dot/inch, dpi] mértékben adják meg, ami az egy inch hosszon (2,54 cm) megkülönböztetett képelemek száma. Értékei: 72 – 2400 dpi Színmélység: Egy képelem színkódját meghatározó bitek száma. Feketefehér lapolvasók két színt különböztetnek meg, 1 bit. Színes lapolvasóknál ez az érték 24 bit is lehet. Működés:
Kézi
Asztali
4.8. Hangkártya, hangszóró, mikrofon: Hangkártya: A multimédia számítógép hangkártyájának két fő rendeltetése van. Az első a külső akusztikus analóg jelek digitalizálása, hogy azok hangállományként a számítógép memóriájában vagy a lemezén tárolhatók legyenek. A második a hangállományoknak hangszórón, fejhallgatón vagy MIDI készüléken való lejátszásának biztosítása.
13
A hardver két részre osztható: Az egyik feladata a hangok vétele, digitalizálása, lejátszása. A másik rész zene előállítására szolgál. Az első a hangkártya hangosító hardvere, a másik a szintetizátor része. A hangosító hardvert egy analóg-digitális és egy digitális-analóg átalakító körül alakítják ki. A hangrögzítés legfontosabb adata a mintavételi frekvencia (pl. 44,1 KHz) A mintavételi frekvencia megadja, hogy hangfelvétel készítésekor milyen gyakorisággal vesznek az analóg hangjelből mintákat. Minél nagyobb a mintavételi frekvencia, annál élethűbben lehet az hangot rögzíteni. Viszont ekkor arányosan növekszik a digitalizált hangot tartalmazó hangállomány mérete is. Másik fontos adat a hangminták amplitúdó értékeinek tárolásához használt bitek száma, a kvantálási hossz. Minél több biten (nagyobb felosztású skálán) tároljuk az amplitúdó értékeit, annál pontosabban követi a digitális hangállomány az analóg hang alakját. A 16 bites kvantálási hossz CD minőséget eredményez. A szintetizátor hardverrel jó minőségű hangot lehet előállítani. A hangkártyák több bemenettel illetve kimenettel rendelkeznek: Mikrofon bemenet CD-ROM audio bemenet Hangszóró kimenet MIDI csatlakozó Hangszórók: A hangkártya a hangokat a hangszórón keresztül szólaltatja meg. Hangkártyán van egy kis teljesítményű erősítő, mely fejhallgató megszólaltatására alkalmas. Ha nagyobb teljesítmény szükséges, akkor aktív hangszórókat csatlakoztatnak. Erősítővel ellátott hangszórók. Mikrofon: A hangkártyához csatlakoztatott mikrofonnal lehet beszédet, zenét vagy hangeffektusokat a multimédia rendszerbe beolvasni.
14
4.9. Videokártyák: Feladata a nagy bitsebességű videoállományok digitalizálása és megjelenítése a monitoron. TV technika képmegjelenítési rendszerének és a monitorok képmegjelenítési rendszerének összekapcsolását kell megoldani. A bemeneti oldal analóg (TV, kamera) a kimeneti oldal digitalizált jelsorozat. A videodigitalizáló mintavételi frekvenciája több mint 10 MHz és bitszáma 16-24 bit. Képernyőképenként mintegy 30 MB adatot állít elő (10MHz * 3 MB ~ 30 MB), a videoállomány hossza a másodpercenkénti képváltástól függően (25 Pal, 30 NTSC) 750 MB, 900 MB lehet. Ezt az adatmennyiséget csak tömörítés után lehet megjeleníteni a számítógépen.
4.10. CD technika: CD-ROM: Az információ a lemezen spirálvonalban, az úgynevezett információs sávon szekvenciálisan szektorokba szervezve kerül rögzítésre és a spirálvonalon belülről kifelé haladva helyezkedik el. Az információkat a spirálvonalban lévő lyukak (pit-ek) síkok (land-ek) átmenetei tartalmazzák. A CD lemez keresztmetszeti képe:
CD meghajtó: Feladata a lemez írása olvasása. Ehhez: Az író olvasó fejet stabilan a sáv felett kell tartani. A lemez egyenetlenségeit korrigálni kell. Megvalósítás: három sugárnyalábos technikával.
15
A CD technika optikai és elektronikus hibajavítást használ az olvasási hibák elhárítására. A letapogatott információ azért javítható, mert a kódolásnál az információt bőven ellátták hibajavító kóddal. Ez viszont redundanciát okoz. Minden CD-nél a hibakezelést és javítást a CIRC (Cross Interleaved Reed-Solomon Code) eljárás valósítja meg. A CD-ROM meghajtó 3500 bitre kiterjedő csoportos hibát (2,5 mm hosszú karcolás) képes kijavítani. Adatátviteli sebesség: Az információ letapogatása állandó átviteli sebességgel történik (CLV – Constant Linear Velocity). 1 * audio CD: 150 Kbit/s A lemezek külső részein a spirálvonal hosszabb, tehát ott több információ található, mint a belső részeken. Ezért folyamatosan csökkenteni kell a lemez fordulatszámát, ahogy az olvasófej az információ letapogatása közben kifelé halad. A lemezt egy szervómotor forgatja, melynek fordulatszámát egy vezérlő elektronika szabályozza. A nagysebességű meghajtók állandó fordulatszámmal is képesek működni CAV (Constant Angular Velocity). Így változik az átviteli sebesség. 24 *-es 5400 ford/perc A puffer és az adatátvitel módja: 2-8 MB A nagyobb puffer kedvező, ha az adatátvitel a DMA-n keresztül valósul meg. A DMA tehermentesíti a CPU-t. CD-DA (audio CD) 120 mm 76-79 perc hosszú 44,1 KHz mintavételezési frekvenciával és 16 bit kvantálási hosszal felvett hangállományt képes tárolni. Lejátszáshoz 172,3 KB/s értékű állandó kerületi sebesség (CLV) szükséges. Hibakezelés CD-DA (digital audio) hibakezelése 1 szektorban 1/75 sec alatti adatátvitel 3234 információ byte 8*3234 = 25852 byte.
16
Ezt 17*3234 = 54978 csatornabit rögzíti a lemezen. Tehát szektoronként 8*2352 = 18816 bit hangadatot 54978 csatornabit tárol 34% felhasználói adat. CD-ROM Mode 1 1 szektorban 3236 byte (54978 csatornabit rögzít), ebből 2048 byte (8*2048 = 16384 bit) hasznos. A lemez 30%-a hasznos adat. CD-ROM Mode 2 Tömörített audio, video, kép. 1 szektorban 3234 byte, ebből 2336 byte hasznos. Kisebb biztonság.
4.11. DVD- technika: DVD lemezek: A DVD egy 2*0,6 mm vastag összeragasztott polikarbonát lemez. Mindkét hordozó tárolhat mindkét oldalán információt. DVD 5
egy oldal
egy réteg
4,7 GB
DVD 9
egy
két
8,5 GB
DVD 10
két
egy
9,4 GB
DVD 17
két
két
17,0 GB
A CD lemezeknél az információt a lemezek felső részén tárolják, míg a DVD lemezeken az információs réteg a lemez közepén található, mert biztosítani kell a kétoldalas tárolási lehetőséget. Az egyszeres sebességű DVD meghajtó 1250 Kbit/sec átviteli sebességet ad.
17
5. Szöveges alkalmazások A megjelenítendő szöveg formájának megalkotása során felmerülő kérdések: Mekkora szövegmennyiség fér egy képernyőoldalra anélkül, hogy zsúfolttá, nehezen olvashatóvá válna a képernyő? Hogyan célszerű a megjelenítendő információkat csoportosítani? Hogyan kell a szöveget kialakítani, hogy az a képernyőn szépen nézzen ki és a szöveg egyhangúságából, kiemelkedjenek azok az információk, amelyeket ki szeretnénk emelni?
5.1. A szöveg elkészítésének menete: A szöveg megfogalmazása és beírása a számítógépbe valamilyen szövegszerkesztő segítségével. A szöveg formázása, ami a szövegnek képernyő oldalakra bontásával kezdődik, majd kiemelések elvégzése. Az elkészült szöveg beépítése a multimédia alkalmazás megfelelő helyére.
5.2. Szövegbevitel lapolvasóval: Nyomtatott szöveg [digitalizálás] bittérkép, képfájl [OCR karakterfelismerés] szerkeszthető szövegfájl. A formázás többé-kevésbé megegyezik az eredetivel. A beolvasott fájl mérete: A lapolvasó felbontása és a színkezelés mértéke határozza meg a beolvasott adat mennyiségét. A lapolvasó vízszintes irányban minden sorban a felbontás által meghatározott számú képelemet olvas be, míg függőleges irányban az egységnyi hosszon beolvasott sorok száma megfelel a felbontás által meghatározott értéknek. A4-es (210 mm * 297 mm) papírlap beolvasásánál a képelemek száma: 210*297* (lappolvasó felbontása * lapolvasó felbontása) /25,4*25,4 300 dpi-nél 8700632 képelem 1 bites színmélységnél 8700632:8 = 1087579 byte
18
5.3. Az OCR programok működése: Az OCR programok a memóriában található képelemeket vizsgálva próbálják eldönteni, hogy egy-egy képelem milyen karakternek felel meg. Ez a művelet a felismerés. A két leggyakrabban használt felismerési eljárás: Összehasonlítás: Az OCR program a képelemet a karaktereknek a háttértárban tárolt mintaábrájával hasonlítja össze, hogy felismerje azt a mintaábrát, ami leginkább hasonlít a képelemhez. A mintaábra karakterkódja a felismert karakternek a kódja. A módszer hátránya a betűtípus és betűméret függőség, ami jelentősen befolyásolja a felismerés pontosságát. Körvonalelemzés: Az OCR program a képelemek körvonalelemei méretének, illetve arányainak elemzésével határozza meg a képelemekhez rendelhető karakterek kódját. Ez a módszer a betűtípustól és a betűmérettől független felismerést biztosít.
5.4. Szöveg a képernyőn: Esztétikus és ergonómikus elrendezés! 1. Betűtípusok, betűméret:
Legyen a szöveg elég nagy méretű.
Ne legyen kettőnél több betűtípus egy képernyőoldalon.
Ne legyen túl sok szöveg egy képernyőoldalon.
2. Szövegstílusok: Javítani lehet a kinézetet.
Ritkán szabad csupa nagybetűből álló szöveget készíteni.
A képernyőn félkövér betűkkel emeljünk ki, ezek feltűnőek és jól olvashatóak.
Az árnyékolt szöveg, változatos jól olvasható.
A keretezés javítja a szöveg olvashatóságát.
Használhatunk karakterek közötti változó távolságot.
3. Háttér:
Igazodjon a tartalomhoz és a stílushoz.
Ne rontsa az olvashatóságot.
19
4. Színek:
Kontrasztdús színkombinációkat célszerű használni az előtérben illetve a háttérben lévő elemeknél.
Ne legyen túl sok szín egy képernyőoldalon.
Ne csak színekkel különböztessünk meg képelemeket.
A színek hangulatot, benyomást közvetítenek.
Kerüljük a telített színeket, vakítanak!
Figyelembe kell venni a színvakokat, színtévesztőket.
5.5. Objektumok csatolása és beágyazása: Objektumként be lehet ágyazni egy dokumentumba egy másik program által készített eredményt. Ezt az OLE (Object Linking and Embeding) technika teszi lehetővé. Forrásdokumentum: ahonnan a beágyazandó objektum származik Céldokumentum: ahová az objektum beszúrásra kerül. Win95 óta a céldokumentumban lehet az OLE objektumot szerkeszteni. Ha kétszer kattintunk a beszúrt objektumon, akkor a céldokumentumon belül aktiválódik az OLE-szerver, vagyis az a program, amellyel az objektum készült. Ekkor az objektum elkészítésekor használt jelhasználói felületen keresztül szerkeszthetjük. Objektumcsatolás: Olyan eljárás, melyben az objektum a forrásdokumentumban marad. A céldokumentumba egy, a forrásdokumentumra vonatkozó referencia kerül beszúrásra. Így nem nő a fájlméret a csatolt objektummal, de a hordozhatóság korlátozott lesz. A céldokumentum nem helyezhető át másik számítógépbe. Az objektum csak a forrásdokumentumban módosítható, megjelenése a forrás- és a céldokumentumban azonos. Objektum beágyazás: Egy céldokumentumot, melybe beágyaztak egy objektumot, problémamentesen lehet egy másik számítógépre áthelyezni, mert a céldokumentum tartalmazza a teljes objektumot. Így nő a céldokumentum mérete. Az objektum a forrásdokumentumban és a céldokumentumban egymástól függetlenül módosítható.
20
6. Világháló (Internet, WWW): Az Internet vagy rövidebb nevén Web az a médium, ami lehetővé teszi az információnak az egész világon való terjesztését. Internet őse USA – ARPANET csomagkapcsolt. Katonai intézmény egyetemek, kutatóközpontok, könyvtárak. Internet CERN 1989 – kutatásokat segítő globális információs rendszer. Az Internet helyi hálózatok összessége. A helyi hálózatok eltérő felépítése, operációs rendszere és egyéb sajátosságai miatt ki kellett dolgozni a kommunikáció szabványait, amit az RFC (Request For Comments) dokumentumok tartalmaznak és a különböző hálózati protokollok valósítanak meg. Az adatforgalmat a helyi hálózatokban lévő átjárók (gateway’s) bonyolítják le. A gateway az adatforgalmat a Web felé TCP/IP protokoll szerint valósítja meg. Mivel az Internet központi számítógép nélkül működő, önszervező rendszer, nincs lehetőség arra, hogy a rajta folyó tevékenységet lehetetlenné tegyék, korlátozzák vagy cenzúrázzák. Az Internet a kliens-szerver modell alapján működik. Egyik eleme a Web-szerver, egy számítógép, ami háttértárjában információkat: szöveget, adatokat, képeket, hangokat stb. tárol. A Web-szerver funkciót egy program valósítja meg, ami azon a számítógépen fut, ahonnan információkat kell a kliens számára továbbítani. Az Internet kliens egy olyan számítógépes program, ami kapcsolatot tart a Webszerverrel. Egyik funkciója alapján böngészőnek is nevezik. A Web alkalmazások HTTP (Hypertext Transmission Protokol) alapján kommunikálnak egymással. Ezért minden Web-szervernek és kliensnek ismernie kell ezt a protokollt.
6.1. Internet szolgáltatások: Az Internetnek mint csomagkapcsolt hálózatnak a szolgáltatásait a Webszerverek különböző protokollokkal valósítják meg. A leglényegesebb protokollok: email, www, ftp, gopher, telnet.
21
6.2. HTML: Az Internet szabványos nyelve a HTML (Hypertext Markup Language), amellyel hypermédia dokumentumokat lehet előállítani. A HTML felhasználásával létrehozott dokumentumok egyszerű alfanumerikus szövegfájlok, amelyekben formátumvezérlő utasítások vannak. A HTML horgokat használ a hypermédia kapcsolatok leírására. A horgok használatával nyílik lehetőség arra, hogy egy hypermédia dokumentumban egy másik hypermédia dokumentumra hivatkozzunk, és elérjük azt.
6.3. Hypertext: Egy dokumentumot olvashatunk az elejétől a végéig is, de olvashatjuk részleteiben is. A dokumentációk gyakran viszonylag független egységekből állnak, melyekben sok kereszthivatkozás van. A kereszthivatkozásnál a hivatkozott helyet a dokumentumban meg kell keresni. Ilyen esetekben az információknak elektronikus úton történő összekapcsolása nagyon hasznos lehet. A kereszthivatkozások gyors elérésének biztosítására a dokumentumokba olyan lehetőségeket építenek be, melyekkel az alkalmazó elérheti a hivatkozott szövegrészt. Ezek a lehetőségek biztosítják, hogy az alkalmazó az általa kívánt sorrendben olvassa végig a dokumentumot. A hypertext dokumentum lényegében egy olyan szöveg, melyben kereszthivatkozások lehetnek. A hivatkozások kiindulópontjai csomópontok, melyekhez más információegységek vannak csatolva. Az egyetlen különbség egy normál és egy hypertext szöveg között az, hogy az utóbbi szöveg olvasója a képernyőn rámutathat egy csomópontként viselkedő információegységre, és ennek hatására a képernyőn megjelenik egy, a csomóponthoz tartozó „önálló tartalmú” információegység. A hypertext dokumentumban ezek a szövegrészek a készítő által meghatározott korláton belül, bármilyen sorrendben elérhetők.
6.4. Hypermédia A hypermédia dokumentum általánosított hypertext dokumentum, ami a szöveg mellett tartalmazhat képeket, audió és videó klippeket, animációkat. A hypermédia dokumentum struktúrája egy gráf, mely csomópontokból és élekből áll: A csomópontok a tulajdonképpeni információegységek. Lehetnek: szöveg, kép, hang, videó, stb.
22
Az élek létesítenek kapcsolatot a különféle információegységek között. Ezeket linkeknek vagy hivatkozásoknak szokás nevezni. A link legtöbbször egy irányított él. A hivatkozások kiindulópontja a horog (URL: Uniform Resource Locator). A horoggal lehet egy hypermédia dokumentumban egy másik hypermédia dokumentumra hivatkozni, illetve elérni azt.
6.5. Kép, hang és videoállományok az Interneten Az Interneten az átviteli sebesség figyelembe vétele mellett kell az állományok méretét meghatározni. 1 perc CD minőségű sztereó hang: 10584000 byte, 64 Kbites letöltés esetén 2,75 perc. A hang, kép és videoállományok viszonylag nagy mérete és a korlátozott letöltési sebesség miatt, tömörítést alkalmaznak. Tömörítés: Veszteséges Veszteségmentes Képfájlok: GIF fájl: Veszteségmentesen tömörített, maximum 8 bit színinformáció. Elsősorban vonalas rajzoknál, kevés színt, nagy egy nagy egyszínű foltokat tartalmazó képeknél célszerű alkalmazni. JPG fájl: Veszteséges tömörítés, maximum 24 bit színinformáció. Jó minőségű színes képeknél alkalmazzák. Videoállományok: Nagy méretűek. Az állományok méretét alapvetően befolyásolja a használt képméret, képváltási frekvencia. Az Interneten általában MPEG4 eljárással tömörített videoállományokat használnak.
23
7. Digitális hangtechnika A hang a multimédia alkalmazások elválaszthatatlan integrált részét alkotja.
7.1. A hang fizikai jellemzői: A hang mechanikai rezgés, ami valamilyen anyagi közegben terjed. A mindennapi életben hallott hang a levegő molekuláinak a hangforrástól kiinduló, egyre csillapodva terjedő mechanikai rezgése. A hang nemcsak levegőben, hanem egyéb rezgésre hajlamos rugalmas közegben is létrejöhet. A hangforrás közelében a rezgést továbbító levegő részecskéinek elmozdulása miatt nyomásingadozás keletkezik, ami átterjed a szomszédos részecskékre és így a levegőben tovaterjedő hanghullámok jönnek létre. A hang terjedési sebessége normál páratartalmú 15°C-os levegőben 340 m/s, szilárd anyagokban és folyadékokban ennél is nagyobb.
7.2. A hang érzékelése: A hang érzékelése, vagyis a hallás, az embert körülvevő közegben (levegőben) fellépő nyomásingadozások érzékelése. Az emberi hallószerv által érzékelhető hangok frekvenciája általában 16 Hz és 20 KHz közé esik. A kisebb rezgésszámú hangokat mélyebb, a nagyobb rezgésszámú hangokat pedig magasabb hangként érzékeli. Az érzékelt hangmagasság a hang frekvenciájától függ, bár kis mértékben befolyásolja a hangerősség is. 16 Hz alatti hang infrahang 20 KHz feletti hang ultrahang Az emberekben ezek nem keltenek hangérzetet.
7.3. Akusztikai alapfogalmak: Az emberi hallás jellemzőivel foglalkozik. Érzeti tulajdonságot fejez ki, hogy „hangosan beszélsz” (hangerő), „mély a hangod” (hangmagasság), vagy „fakó a hangod” (hangszín). Hangerő (hangintenzitás) a hangrezgés amplitúdója. Egyenesen arányos a hangnyomással, fordítva arányos a közvetítő közeg sűrűségével és az adott közegben a hang terjedési sebességével. Mértékegysége az egy négyzetméterre eső wattban mért hangteljesítmény. A hangerő és a hangnyomás leírására használják az akusztikus decibel 24
(db) fogalmat. Az akusztikus decibel értéke alkalmazkodik az emberi hangérzékeléshez. A hangerő nagyság tízes alapú logaritmusának húszszorosával egyenes arányban növekszik. A hallásküszöb 0 db a fájdalomküszöb 120 db. Hangmagasság a hang frekvenciájától függ. Ha a hangforrás csak egyetlen frekvenciájú hangot sugároz, akkor ezt a hangot tiszta hangnak nevezzük. Magányos szinusz rezgések a természetben nincsenek, a valóságban előforduló természetes hang fizikai szempontból több, különböző frekvenciájú és amplitúdójú szinusz rezgések összessége. A magányos szinusz rezgéseket részhangnak hívják. A folytonosan változó természetes hang különböző frekvenciákon rezgő részhangokból áll. Egy természetes hang részhangjainak összessége a hang frekvencia spektruma. A mélyebb részhang határozza meg a természetes hang alapfrekvenciáját. A további részhangok frekvenciái általában az alaphang frekvenciájával kapcsolatban álnak, legtöbbször annak egészszámú többszörösei. A természetes hangok további összetevői a felhangok. Ezeknek összetétele, amplitúdója és fázisa határozza meg a természetes hang hangszínét. Ha a felhang frekvenciája az alaphang frekvenciájának valamilyen egész számú többszöröse, akkor felharmonikusnak is szokták hívni. Az alaphang és a felhangok eredője határozza meg a természetes hangjel frekvenciatartományi viselkedését, amit az eredő hangjel burkológörgéje szemléltet. Tehát a hangszín az adott hangjel frekvenciatartományi viselkedése: sávszélessége, burkoló görbéje, a különböző frekvenciájú hangok amplitúdó és fázis viszonyai.
7.4. A hang rögzítése: Nem más, mint a levegőben keletkező nyomásingadozások tárolása az újbóli előállítás céljából. A nyomásingadozásoknak, vagyis a hangjeleknek valamilyen információhordozóra történő rögzítése.
25
Rögzítés: A hangjel átalakítása rögzíthető elektromos jelformára, melyben a jel frekvenciái és intenzitásai megfelelnek az eredeti hangjelnek. Az elektromos jel rögzítése. Lejátszás: A rögzített jelek érzékelése, elektromos jellé alakítása. Az elektromos jel felerősítése és visszaadása az eredeti hangjelhez hasonló alakban. A rögzítés történhet: Analóg Digitális formában.
7.5. A hangok digitális rögzítése és lejátszása: Eredeti formájukban a hangok analóg, időben és értékben folytonos jelek. A hangok digitális rögzítésekor az eredeti analóg hangjelekből mintákat vesznek, emiatt a mintavételezett hangjel időben és értékben nem folytonos, hanem egymástól elkülönülő impulzusok sokaságából áll. A mintavételezett impulzusok amplitúdó értékét bináris formában megadva, megkapjuk az analóg hanganyag digitális megfelelőjét, ami elkülönülő (diszkrét) minták sorozatából áll. Mintavételezés: Mintavételezéskor időben és értékben folytonos analóg hangjelekből impulzussorozatot állítunk elő. Ebben az impulzussorozatban minden egyes impulzus amplitúdója azonos az analóg jelnek az adott ponton felvett értékeivel. Shanon tétele: A mintavételezett jelből akkor lehet az eredeti jelet információveszteség nélkül visszaállítani, ha a mintavételezési frekvencia értéke legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának. A gyakorlatban ezt nem használják. telefontechnika
8 KHz
MPEG audio
32
CD-DA
44,1
DAT, Dolby Digital 48
26
Kvantálás: A mintavételezett impulzussorozat impulzusai végtelen sok értéket vehetnek fel, ezért ez a jelsorozat analóg impulzussorozatnak tekinthető. Az amplitúdók digitális jellé történő átalakítását, az analóg-digitális átalakító (A/D konverter) végzi. Az A/D konverter bemenetére vezetet impulzusok bináris adatokká átalakítva jelennek meg a konverter kimenetén. Az A/D konverter meghatározott számú bitet használ a kimenő jel amplitúdójának megadására. Az analóg bemenőjel amplitúdó értékének digitális ábrázolásához létrejövő szóhossz a szóban található bitek számától függ. Ezt a bitszámot nevezzük kvantálási hossznak. Minél finomabb felbontású a kvantálás (minél több lépcsője van), tehát minél hosszabbak (minél több bitből állnak) a kódszavak, annál pontosabb képét adja az eredeti analóg jel amplitúdójának. Általában 8 illetve 16 bites kvantálási hosszat alkalmaznak. 8 bittel 256 féle adatszó
48 db átfogható hangerő tartomány
16 bittel 65536 adatszó
96 db
7.6. Minőség Digitalizált hangállomány minőségén azt értjük, hogy milyen hibával lehet a mintavételezett és kvantált jelsorozatból visszaállítani az eredeti analóg hangot.
7.7. Digitalizált hangállomány mérete: A méretet a következő három paraméter befolyásolja: Mintavételezési frekvencia értéke. A kvantálási hossz. A rögzített hangcsatornák száma. A mintavételezési frekvencia értéke és a kvantálási hossz meghatározza az analóg hanganyagról a digitalizált hangállományba rögzített információ mennyiségét. Minél több információt rögzítünk, annál pontosabban írja le a digitalizált hangállomány az eredeti hangállományt, azonban annál nagyobb lesz az állomány mérete. A rögzített csatornák száma határozza meg, hogy milyen felvétel készül. Méret: mintavételezési frekvencia [Hz] * kvantálási hossz [bit] * csatornaszám * idő [sec] :8 = [byte]
27
Pl.: 44,1 KHz – 16 bit – sztereó – 1 sec hangállomány hossza: 44100*16*2*1:8 = 176400 byte
7.8. Hangfelvétel készítése: Hangfelvétel készíthető a hangkártya mikrofon bemenetére csatlakoztatott mikrofonról, a line in bemenetére csatlakoztatott erősítőről, esetleg a számítógép CDROM meghajtóról. Mikrofon típusai: Irányított Gömbkarakterisztikájú
7.9. Hangállomány tömörítése: Digitális hangállományokat digitalizálással állítunk elő analóg hanganyagokból. Egy digitális hangállomány hossza a mintavételi frekvenciától, a kvantálási hossztól és a csatornaszámtól függ. A CD lemezeken használt 44,1 KHz, 16 bites hangállomány hossza csatornánként és percenként 5,048 Mbyte. Ezt nehéz gazdaságosan tárolni és továbbítani. Tömörítés szükséges. A digitális hangállományok méretét az ISO egyik albizottsága az MPEG (Motion Picture Expert Group) által kidolgozott új digitális kódolási eljárással lehet csökkenteni. MPEG audio: Veszteséges tömörítési eljárás, ami kihasználja az emberi fülnek az érzékelési tulajdonságait. Még 1:12 tömörítési arány mellett is CD hangminőséget biztosít. Az MPEG audio eljárás két részre osztható. A kódolás alkalmával a wav fájlban található hangállományból tömörített bitfolyam, kódolt hangállomány készül. Ezt a hangállományt a hangkártyák dekódolás után képesek megszólaltatni. A dekódolás során a tömörített bitfolyamból wav fájl készül. A kódoló algoritmus az ember hallószervének működése alapján elemzi a hangadatokat és törli a lényegtelen és redundáns részeket. Kódoláskor az eljárás egy pszichoakusztikus modell szerinti szűrőbank számítással elemzi a hangadatok spektrális alkotóelemeit és meghatározza az érzékelhető zajszintet. A kódoló nem épít be a kódolt bitfolyamba redundáns, lényegtelen, csak zajnak tekinthető hangelemeket.
28
A tömörítési és a bitsebesség között szoros kapcsolat van. A tömörítést a bitsebességnél nehezebben lehet mérni, ezért az MPEG audio eljárással kapcsolatos információkban a bitsebesség szerepel. Az MPEG audio eljárás három réteg (layer) szerinti tömörítés közötti választást tesz lehetővé. Az egyes rétegekben különböző tömörítési arány és bitsebesség érhető el. Layer 1: A legegyszerűbb eljárás. 128 Kbit/s bitsebesség esetén használható. Layer 2: Közepes bonyolultságú eljárás. 128 Kbit/s bitsebesség körül használható. Layer 3: A legbonyolultabb eljárás. A legjobb hangminőséget 64 Kbit/s bitsebességnél biztosít csatornánként. Ez az MP3 eljárás. MPEG audio Layer 3 (MP3): A család leghatékonyabb tagja. Megadott hangminőség esetén a legkisebb bitsebesség érhető el vele, azaz egy adott bitsebességhez vele érhető el a legjobb hangminőség.
7.10. Környezeti hangtér: Cél az életszerű térbeli hanghatás elérése. A Dolby Laboratories cég: 1970-es évek vége: Dolby Stereo, Dolby Sorround 4 csatorna, 5 hangszóró: bal, közép, jobb, és két közös hangcsatornás környezeti (Sorround) hangszóró. 1992 Dolby Stereo Digital: (D.S.D.)
29
Dolby Digital (AC-3) 5.1: (D.D)
RS, R, C, C, LS egyenrangú csatornák, 20 Hz – 20 KHz közötti frekvenciatartományban. LFE opcionális (Low Frekvency Effects) alacsony frekvenciás hatások 20 Hz – 120 Hz A D.D rendszer „lebontás” jellegzetessége lehetővé teszi, hogy D.D dekódoló után a csatornaszámtól függően hangszóróval lehet megszólaltatni az 5.1 csatornás D.D. bitfolyamot. A dekódoló valósidőben állítja elő a D.D., D.S.D. keverék, sztereó vagy mono hang kimenőjelét.
30
8. Grafikus alkalmazások, animáció 8.1. Az emberi látás informatikai vonatkozásai: Két előrenéző szem miatt térlátás. Az ember nem képes egymással 2 szögpercnél kisebb szöget bezáró pontszerű fényforrásokat megkülönböztetni. Eltérő színű fényforrások színeit már 10 szögperc alatt sem tudjuk megkülönböztetni. Az ember által kellemesnek tartott képek oldalarányai 4 : 3. Folyamatos mozgás érzékeléséhez 20 – 30 képváltás elégséges másodpercenként, de csak akkor lesz villogásmentes az élmény, ha a képfrissítési frekvencia 50 Hz-nél nagyobb.
8.2. Színlátás: 400 nm – 700 nm közötti hullámhosszúság 400 nm körüli fények ibolya színűek 700 nm körül vörös < 400 nm ultraibolya > 700 nm infravörös. Az emberi szem két fényt nemcsak akkor lát azonos színűnek, ha a fények spektrális összetevői megegyeznek, hanem bizonyos feltételek mellett eltérő frekvencia spektrumú színeket is. Az azonos színűnek látott, de eltérő frekvencia spektrumú fényeket metamer színeknek nevezzük. Az emberi szem fogyatékossága miatt majdnem az egész színtartományt be lehet mutatni három, egyfrekvenciás (egyszínű) fényforrások színeinek keverésével. A mai megjelenítők (TV, monitor) a színes kép előállítására, három egyfrekvenciás fényforrást használnak: R, G, B
8.3. Szín-koordinátarendszerek: A képpont színét a képernyő vörös, zöld, kék színű képpontjaiból kilépő színes fények eredő fényereje határozza meg. A kilépő fények fényerejét és ezzel a képpont színét a képpont kódok határozzák meg. A szín koordinátarendszer a színekre vonatkozó információkat szolgáltató háromdimenziós koordinátarendszer.
31
RGB szín-koordinátarendszer: Az egyes tengelyek R, G, B színűek. A vörös, a zöld és a kék alapszín jeleit külön-külön tartalmazza. Minden más szín ezen három alapszín additív (összeadó) keverésével állítható elő. fehér: R+G+B = 1 fekete: R+G+B = 0 Azonos intenzitás esetén szürkeárnyalat. YUV szín-koordinátarendszer: Számítás: Y = 0,3 R + 0,59 G + 0,11 B U = (B – Y)*0,493 V = (R – Y)*0,877 A PAL és SECAM TV rendszerek mellett a kép- és videoállományok tömörítésében (jpeg, mpeg) használják. Y a világosságkód (luminancia). U, V a színkódok (kominancia)
8.4. A számítógépes grafika: Illusztrálható velük szöveg, felhasználhatók az egyes szövegek magyarázataként, de készíthető velük multimédiaalkalmazások számára animáció. Állóképek létrehozhatók: Rajzolóprogrammal, Digitális fényképezőgépből beolvasással, Lapolvasóval fényképről, Digitalizálással, konverzióval egyéb médiumból (video). Bármilyen módon hoztuk létre az állóképet, az a képernyőn mindig bittérképes formában jelenik meg. A bittérképes formában megjelenő színes ábra minden egyes képpontját 4 – 24 bit ír le, ezért nagy méretűek. A bittérképes formában megjelenített képeket a háttértárakban vektorgrafikus, vagy bittérképes formában lehet tárolni. Vektorgrafika: Ha egy rajzolóprogrammal vektorgrafikus képet hozunk létre, akkor a rajzolóprogram egy láthatatlan hálóra rajzolja ki a grafikát. Ezt a grafikát aztán utasítások halmazaként tárolja el a rajzolóprogram egy grafikus állományba. Az utasítások pontosan leírják az összes rajzelem (pont, vonal, kör sokszög, stb.) helyét , irányát, méretét, színét, alakját és egyéb a megjelenítéssel kapcsolatos 32
tulajdonságait. Kirajzoláskor a program végrehajtja az állományban lévő utasításokat, és összeállítja a bittérképes ábrát. A vektorgrafikával készült rajz grafikus állománya nem a képet alkotó pontokat tárolja, hanem a képben található megjelenítéséhez szükséges információkat, melyeket a megjelenítő program értelmez és végrehajt. Előnyei: Mivel a rajzelemek azonosítható formában külön-külön vannak tárolva, így egyszerűbben lehet a grafikus kép egyes részeivel műveletet végezni (nagyítás, forgatás, eltolás, tükrözés, stb.). Másik nagy előnye, hogy általában kisebb méretű az állomány, mint a bittérképes grafikánál. Hátrányként említhető, hogy minél összetettebb a kép annál tovább tart a kirajzolása. Felhasználása: műszaki vonalas ábrák (CAD/CAM). Bittérképes grafika: A kép vízszintes és függőleges irányban képpontokra van felosztva, és minden egyes pontról tárolásra kerül a színinformáció. Megjelenítéskor a képernyő képpontjaiban megjelennek az adott pontról tárolt színinformációk. Színinformáció mennyiség képpontonként.
Megjeleníthető színek száma.
4 bit
16
8 bit
256
16 bit
65536
24 bit
16777216
Minél több színinformációt szeretnénk egy-egy képpontról tárolni, annál nagyobb helyet foglal a létrejövő grafikus állomány. Előnye a jó minőségű kép! Hátránya, hogy nehéz a torzításmentes műveletvégzés!
33
8.5. A kép jellemzői: A kép mérete a képernyőn: Vízszintes és függőleges kiterjedés. Ha egy kép 320 pont széles és 240 pont magasságú, akkor 320*240 = 76800 képpontból áll: A kép megjelenítését a képernyő felbontása is befolyásolja. 320*240-es képet egy 640*480-as monitoron jelenítjük meg, akkor a kép a képernyő ¼-ét foglalja el.
Fordított a helyzet, ha a megjelenítendő kép több pontból áll, mint a képernyő felbontása. A színek száma: A megjeleníteni kívánt kép minden egyes pontján megjeleníthető színek száma a kép színmélysége. A színmélységet a színinformáció határozza meg, ami 1 bittől 24 bitig terjedhet (32 bit). Befolyásolja a képállomány méretét, színhűségét. A képállomány mérete: A képek mérete meghatározza az eltárolt információ mennyiségét, és a betöltés sebességét is. Méret = kép vízszintes felbontása képpontban * a kép függőleges felbontása képpontban * színinformáció bitben / 8 [byte]
34
8.6. Képek digitalizálása: Lapolvasó felhasználásával. Az analóg képből létrejön a kép digitális képe, ami lehetővé teszi használatát a multimédia alkalmazásokban. Mintavételezés (felbontás): A kép mintavételezésének célja összekapcsolni az analóg kép egyes képelemeit a digitális kép képpontjaival, hogy a kép valósághűen megjeleníthető legyen a képernyőn. Ez azt jelenti, hogy mintavételezéskor egy képzeletbeli rácshálót helyezünk a képre, és a rácselemeket egy egységként kezelve állapítjuk meg az eredő színinformációit (~ átlag). Ez az információ még analóg a teljes, mintavételezéssel átfogható színtartományban. Mintavételezéskor kell meghatározni a beolvasásra kerülő kép szélességét és magasságát, majd ezt rá kell helyezni a digitális képet megjelenítő képernyőre, melyet a képernyő felbontása jellemez. Mintavételezést a lapolvasó felbontásának változtatásával lehet szabályozni. A lapolvasó felbontásával lehet beállítani a digitális képállományba kerülő képpontok számát. A mintavételezés lényegében egy integrálás, mert a kapott érték a képelemet alkotó részelemek színének és fényességének összegétől függő érték (eredője). A felbontás mértékegysége: [dpi] A kvantálás: A kvantálás során történik meg az egyes analóg képelemek szín- és fényesség információinak diszkrét képpont-értékekhez való rendelése. Ezt az információt döntően befolyásolja a használt színmélység. Gondolatban végezzük el a mintavételezést úgy, hogy a képre egy milliméter rácsozatot helyezünk, és a rácsozat határozza meg a képelem méretét. A rácselemekben található képelemek színinformációinak eredője lesz a mintavételezett analóg képjel. A kép minősége:
alacsony
magas
Színmélység
kicsi
nagy
Méret
kicsi
nagy
35
8.7. A képállományok tömörítése: Cél a digitalizáláskor keletkező képállomány méretének csökkentése. GIF (Graphic Interchange Format): Veszteségmentes képtömörítési eljárás. A tömörítés alapja egy helyettesítési eljárás, melyben adatsorozatokat egy mintatáblázat sorszámával helyettesítenek. A képpontok színkódjai ismétlődő adatsorozatok. Ha ezeket az adatsorozatokat beírják egy mintatáblázatba, akkor a képpontokból alkotott adatsorozat helyettesíthető, a mintatáblázat megfelelő sorára mutató pointerrel. Pl. a fájlban: 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 A mintatáblában: 1 2 3 4 5 6 Helyettesítés után: 1 1 1 tömörített fájl A GIF fájlokkal elérhető maximális méretcsökkenés a képállományban előforduló ismétlődő minták számától függ. Nagy azonos mezőket tartalmazó képek esetén 10*es méretcsökkenés is elérhető. 16 bit színinformáció fölött licenszdíj fizetése kötelező. JPEG (Joint Fotographic Expert Group): Veszteséges képtömörítési eljárás. A jpeg eljárás elhagy a képből bizonyos adatokat. Érzékelésen alapuló tömörítési eljárás, mert az elhagyásra kerülő adatokat, az emberi szem érzékelési tulajdonságainak figyelembe vételével választja ki. Leghatékonyabban színes vagy szürkeárnyalatos képeket tömörít. Fekete-fehér képek tömörítésére nem érdemes használni. Nem tömöríti hatékonyan azokat a képeket sem, amiben sok a színváltozás. Tömörítés: Az eljárás először YUV szín-koordinátarendszerbe transzformálja a képfájlok RGB szín-koordinátarendszerben magadott színinformációit, majd elválasztja egymástól a világosság- és a színkódokat. Ezzel alkalmazkodik az emberi látás jellemzőihez. Az emberek ugyanis a képben bekövetkező kis mértékű világosság változásokat inkább észreveszik, mint a színekben bekövetkező nagymértékű változásokat. Emiatt a JPEG elsősorban a színinformáció mennyiségét csökkenti. A második lépésben az eljárás csökkenti a színkódok bitszámát. Ez a 4:1:1 (vízszintesen és
36
függőlegesen megfelezett színinformáció), vagy 4:2:2 (csak vízszintesen megfelezett színinformáció) beállítás. Az eredeti képfájlban egy képpont világosság- és két színkódját elvileg azonos számú bit alkotja. A 4:2:2 beállításnál két képpont színkódjai közül az egyik elmarad, vagyis a két képpont azonos színkódokkal rendelkezik. Emiatt a kép változik, de alig észrevehetően. A legtöbb képnél ugyanis két egymás melletti képpont színe alig különbözik egymástól. A 4:1:1 beállításnál az eljárás két sor színkódját közösen kezeli
Harmadik lépésben, a képfájlban található képpontokat 8*8 tagból álló makroblokkokra bontja, majd diszkrét koszinusz-transzformációval kiszámítja a blokkokat alkotó frekvencia komponensek amplitúdóját. Majd Huffmann-kódolással tömöríti tovább és előáll a tömörített képállomány. M-JPEG (Motion JPEG): Ha 16 képkocka/sec sebességgel jelenítünk meg képeket, akkor mozgóképet kapunk. Az M-JPEG a JPEG eljárást használja. Minden egyes képet külön-külön tömörít össze, anélkül, hogy a szomszédos képek közötti összefüggéseket vizsgálná. A képállomány egyes képei nagy pontossággal azonnal elérhetők, ezért alkalmas videoállomány szerkesztéshez, vágáshoz.
8.8. Animáció Az animáció mozgás szimuláció, melyet állókép-sorozatok megjelenítésével állítunk elő. Az animáció és a videó között alapvető különbség az, hogy az animáció önálló képekből indul el és ezek összerakásával kelti a mozgás érzetét. A videó folyamatos mozgásnál készített pillanatfelvételek sorozata. Az animáció két fontos része az előtér és a háttér. A háttér az animáció alapja, az animációban mindig a háttér előtt történik az esemény. Minden animáció elkészítésénél létre kell hozni a hátteret és az előtert.
37
9. Digitális videotechnika 9.1. Színes TV rendszerek: Színes TV műsorszórásnál az adó egyetlen jelet sugároz, ez tartalmazza a színes képjelet és a hangot. Az egyidejűleg sugárzott kép- és hangjelet a különböző vivőfrekvencia választja szét. A színes képjel a kép összes színösszetevőjének egycsatornás kombinációja. A kombinált jelet az adó a világosságkódból és a két színkódból állítja elő. A sugárzott videojelet a TV készülékek először szétbontják kép és hangjelre, majd a képjelet dekódolják, kialakítják belőle a világosságkódot és a színkódokat. A fekete-fehér TV készülékek a világosságkódból állítják elő a képeket. Különböző TV rendszerek működnek: NTSC videojel 1949 USA képváltás: 29,97 kép/sec = 59,94 félkép/sec sorok száma: 525 sor / váltósoros képarány (aspect ratio): 4:3 SECAM videojel 1957 Francia képváltás: 25 kép/sec = 50 félkép/sec sorok száma: 625 sor / váltósoros képarány: 4:3 PAL videojel 1961 Német képváltás: 25 kép/sec = 50 félkép/sec sorok száma: 625 sor képarány: 4:3 1996-ban az MTV is áttért a PAL rendszerre. A különböző videojel rendszerekben készített TV készülékek képernyőinek felbontását a képarány ismeretében lehet megbecsülni az alábbi formulából: Vízszintes felbontás = sorok száma * képarány [képpont/sor] Függőleges felbontás = sorok száma
38
9.2. Videojelek digitalizálása A számítógépnek a videojeleket először hang- és képjelekre kell bontani. A hangjel a hangkártyára kerül, amelyből mintavételezés és kvantálás után lesz digitális hangállomány. Az analóg képjelet is csak digitalizálás után lehet használni, amelyet egy digitalizáló hardver végez (videokártya, digitalizálókártya). A képjelek digitalizálása több lépésben történik, ezek: leképezés, mintavételezés, kvantálás. A képjelek digitalizálásakor az analóg jelből indulnak ki, melyben analóg formában rögzített képkockák vannak. A digitalizálás eredménye a digitális képállomány, a képkockák képpontjainak digitális adataival. Leképezés: Az a művelet, melynek során az analóg képjelből kétdimenziós képfüggvény jön létre. A képfüggvény tartalmazza a képjelek képkockáit. A leképezés során kialakuló képfüggvényből történik a mintavételezés és a kvantálás. Mintavételezés: A mintavételezés az állóképek mintavételezéséhez hasonlóan történik. Ekkor jön létre a kapcsolat az analóg képjelek képelemei és a digitális képkockák képpontjai között. A képsíkot kis területekre (képelemekre) bontjuk. A létrejövő digitális képkocka minőségét alapvetően befolyásoló tényező a képelem mérete és a képelemet reprezentáló elektromos jel értéke. Minél kisebb a képelem mérete, annál finomabb felbontású a kép. A felbontás azonban nem tetszőleges nagyságú. A képelemek vízszintes irányú számának meg kell egyeznie a digitális kép egyes soraiban található pixelek számával. A képelemek függőleges száma azonos a digitális képet alkotó sorok számával. Tehát az analóg képet annyi képelemre kell bontani, ahány pixelből áll majd a digitális képkocka. A mintavételezési frekvencia: 10 MHz.
39
Kvantálás: A kvantálásnál kerül bináris számokkal megadásra a mintavételezéssel kapott analóg jel világosságkódja, és két színkódja. Ezek a kódok alkotják majd a képpont értékét. A művelet végén minden képpontnak lesz egy háromdimenziós értéke, ezekből áll össze a digitális kép. A képpont értékek ábrázolása meghatározott számú biten történik. A bitszámot az A/D átalakító bitszáma adja meg. Szokásosan 3*8 bit az R, G, B színeknek.
9.3. A digitalizált videoállomány jellemzői: Képváltási frekvencia: A mozgások jó minőségű előállításához 50 állóképet kell másodpercenként az embernek egymás után látni. A TV-nél 50-60 félképet sugároznak. A számítástechnikában 70-100 Hz. Képméret: 4:3-as aránynál
320*240 352*288
16:9-es arány A digitális videoállomány mérete: videoállomány mérete: képfájl + hangfájl képfájl mérete: képkocka mérete [byte] * képváltási frekvencia [Hz] * video hossza [sec] képkocka mérete: pl. 320*240*24/8 [byte]
9.4. Videoállományok tömörítése: 1 sec hosszú digitalizált videoállomány kb. 5,661 MB. 1 perc 339,66 MB. A tömörített állományok lényegesen kevesebb helyet foglalnak el, és mozgatásukhoz is kisebb átviteli sebesség szükséges. A tömörített állományokat a felhasználás előtt vissza kell alakítani eredeti formájukra. Ez a kicsomagolás vagy dekódolás művelete. A tömörítés / kibontás történhet: Szoftverrel a CPU-t terheli. Hardverrel a célhardver processzorát terheli.
40
Tömörítés képkockák között: A videoállományok képkockák sorozatából állnak. Legtöbbször az egymást követő képkockák alig térnek el egymástól. Egyes tömörítő eljárások kihasználják azt a lehetőséget, hogy egy képkocka legnagyobb része azonos az előzővel. Ezek az eljárások egy képkockáról nem a teljes képpont információt tárolják, hanem csak azon képrészek információit, melyek az előző képkockához képest megváltoztak. A képkockák közötti tömörítés esetén az eljárás keretbe foglalja a megváltozott képrészeket, és egy képkockánál csak ezt a keretet tárolja. Ennek a keretnek deltakeret a neve. A képkocka képe, tehát a korábbi képkockákból származó adatokból, és a hozzáadott deltakeretekből állítható össze. Egy képsorozat összes képkockáját nem lehet a képkockát megelőző képkockákból származtatni, mert ez teljesen lehetetlenné teszi a vágást. Ezért a sorozatokban mindig találhatók olyan képkockák, melyek kódolt változatának kibontásához nincs szükség az előtte található képkocka ismeretére. Ezek az úgynevezett referencia képkockák. A leggyakrabban minden 15. képkocka referencia képkocka. A referencia képkockák lehetnek vágási pontok. Vannak ezenkívül olyan képkockák, amelyek nem származtathatók a korábbi képkockákból, ezeknél a képkockáknál az eljárás felrajzolja a teljes képkockát. A referencia képkocka is teljes képkocka. A képkockák közötti tömörítést alkalmazó eljárások veszteséges tömörítési eljárások, viszont a velük elérhető tömörítési arány jóval nagyobb, mint amit a képkockán belüli tömörítéssel el lehet érni (M-JPEG). A tömörítő eljárások bizonyos módszerekkel döntik el, hogy mely képrészeket tekintsenek megváltozottnak, és melyeket változatlannak. Bitsebesség: Egyes tömörítő eljárások pontosan meghatározott bitsebességgel működnek. Ez azt jelenti, hogy minden képernyőre rajzolt képkocka kibontása mindig meghatározott számú bitből kerül kialakításra. Ezt a meghatározott számú bitet kell a számítógépnek a háttértárolóról beolvasni. Pl.: 24 bit színmélységnél, 320*240, 25 Hz képváltás esetén: 8*5625 KB = 40000 Kbit = 43,35 MBit/s. Tízszeres tömörítés esetén csak ~4500 Kbit/s.
41
9.5. Videoállomány-tömörítési eljárások: A videoállományokat veszteséges tömörítési eljárásokkal szokták tömöríteni, mert a veszteségmentes eljárásokkal nem érhető el elég nagy tömörség. AVI (Audio Video Interleaved) A neve arra utal, hogy az állományokban a kép- és hanginformáció váltakozva követi egymást. Így az AVI állomány lejátszásakor a számítógép egymás után olvassa be, majd jeleníti meg a kép és hanginformációkat. A Microsoft által kidolgozott AVI formátum a RIFF formátumnak egy speciális fajtája. A RIFF formátum egy általános célú multimédia fájlformátum, amit a Microsoft és az IBM dolgozott ki. Az AVI fájl fejléccel kezdődik, amit különböző típusú adatfolyamok követnek. Egy AVI fájl tartalmazhat 0-1 kép adatfolyamot, továbbá 0-n hang-adatfolyamot. A képadatok lehetnek tömörítés nélküli adatok, vagy tömörített adatok. A tömörítés nélküli képadatok DIB formátumúak. A DIB (Device Independent Bitmap) formátum azonos az ismert bittérkép formátummal. A képadatokat különböző eljárásokkal lehet tömöríteni, de a tömörítési eljárásokat ismerni kell a Windows alatti lejátszóknak, szerkesztőknek. A képadat-folyamban található adatok formátumát a képadat-folyam fejléce tartalmazza. Függetlenül a képadatok belső formátumától, az AVI szoftver képkockák közötti tömörítést is végez. A tömörítő szoftver nagyvonalúan dönt arról, hogy egy képkocka melyik részét tekintse megváltozottnak, ezért csak a jelentősen átalakult képrészeket tekinti módosultnak. Az AVI fájlokban általában kisméretű deltakeretek találhatók, bár emiatt elvész néhány apró képadat. Nagy tömörítés kis deltakeretekkel érhető el, ennek viszont képminőség romlás az ára. A képminőség egyébként is minden deltakeret megjelenése után romlik, ezért bizonyos számú deltakeret megjelenése után a deltakeret felismerhetetlenné válik. Ennek megakadályozására az AVI szoftver bizonyos számú (ált. 15) képkocka után egy teljes képkockát (referencia képkocka) rögzít. Ha egy képkocka-sorozatban sok gyors mozgás követi egymást, akkor az egyes képkockák nagymértékben különböznek egymástól. Ebben az esetben az egyes deltakeretek is nagyméretűek lehetnek, azaz sok adatot tartalmaznak, emiatt nő az AVI állomány mérete.
42
Az AVI állományban a hang és kép felváltva kerül tárolásra. Egy képelem egy képkocka képállományát tartalmazza. Ezt követi a képkockához tartozó hangelem. Képkocka-elem + hangelem rekord. Az AVI állományok felvételekor a videojelet egy videodigitalizáló kártya digitalizálja, azaz a képjelet bittérképes képsorrá alakítja. Ezzel párhuzamosan digitalizálja a hangjelet a hangkártya. Az AVI-nál a hang általában nem tömörített. Lejátszásnál elcsúszás nem következhet be a kép- és a hanginformációknál, mert a szinkronizálás az egymásutánisággal biztosítva van. Ha a deltakeret kisméretű, a feldolgozandó adatmennyiség csekély, vagyis a lejátszást kisebb teljesítménnyel is meg lehet oldani. Viszont a video minősége is rosszabb. MPEG (Moving Picture Experts Group) Egy digitális tömörítési szabványcsalád és fájlformátum neve. Az MPEG szabványok az AVI, Indeo szabványoknál jobb képminőség mellett nagyobb tömörítést biztosítanak. Az MPEG eljárások veszteséges tömörítési eljárások, melyekkel nagyfokú tömörítés érhető el. Elfogadható képminőség mellett 1:50, 1:200 tömörítési arány is elérhető. A képek mellett a hangadatot is jó minőséggel tömörítik. MPEG 1: 1992, 320*240 képpontból álló videoállományt olyan mértékben lehet tömöríteni, hogy az 1,5 MBit/s sebességgel kiolvasható a háttértárolóról. Ezzel a bitsebességgel a 2* CD-ROM meghajtók képesek működni. RGB YUV JPEG alapú képkockán belüli képkockák közötti tömörítés. A tömörítés végén egy állományba helyezi átlapoltan a tömörített kép és hang adatokat. MPEG 2: Az adatátviteli sebesség és ezzel a tömörítés változtatható 3 MBit/s – 40 GBit/s értékig. A leggyakrabban használt átviteli sebesség 4 – 15 MBit/s. A bitsebesség növelése lehetővé teszi a digitális videotechnikában használt, igen nagy méretű (1920*1600) képpontból is állhat. A DVD technika használja.
43
MPEG 3: Nem készült el. MPEG 4: 1998 Ez a szabvány kis átviteli sebességre készült (4,8 – 64 Kbit/s). A multimédia kommunikáció számára dolgozták ki. Legfontosabb újdonsága, hogy tetszőleges alakú képi objektumokat lehet önállóan kezelni. (A DivX, Xvid is erre épül.)
44