Multimédia I.
!" # $%%&
A tananyag a Phare HU-94.05 támogatásával készült "A felsõoktatás sokoldalúbbá tétele" címû program keretében, a BME TUBMEN 0201-L004-07 számú szerzõdés alapján
I. E
LÕSZÓ
Multimédia témában nagyon sok publikáció (cikk, tanulmány) valamint könyv jelent meg az utóbbi idõben, ám közülük kevés az átfogó mû, sokszor találkozunk 2-3 népszerû, pontosabban felkapott témára (OCR, JPEG, MPEG, CD-ROM, ISDN stb.) épülõ "A multimédia" anyaggal. Hangsúlyozandó, hogy e bõvített óravázlattal sem volt célunk minden multimédiával kapcsolatos téma felvetése, hisz például a multimédia szellemi hatását az egyénre, illetve a társadalomra már érezzük, de globális elemzést és visszacsatolást nyújtani még nem tudunk. A bõ (és köztük néhány nagyon jól szerkesztett) szakirodalom mellé nem kívántunk egy újabb itt-isminden-megtalálható-amirõl-mi-azt-hisszük-hogy-az-a-multimédia jellegû könyvet készíteni, bõvített óravázlatunkban a már hagyományosnak mondható szerkezet mellett a bõvülést azon részek kapták, melyek más multimédia anyagokban véleményünk és oktatási-gyakorlati tapasztalatunk szerint hiányosan vagy egyáltalán nem fordulnak elõ. A tartalomjegyzéket áttekintve egy változatos mû képe tárulhat a Kedves Olvasó elé. Nemcsak a témák, hanem a stílus is változik olykor, míg például a Hangok Világa és Képek Világa fejezetek kellemesen olvasmányosak, addig hozzájuk képest az optikai tárolókról szóló fejezet száraz technikai összefoglalónak tûnhet. Az elõbb említett fejezetekhez még el kell mondjuk, hogy az elméleti anyagnak nem célja digitális hang- és képkódolás témákban mély elméleti ismeretek nyújtása, erre a gyakorlatok szolgálnak, mely gyakorlatok feladatanyaga a függelékben megtalálható. Bõvített óravázlatunk további kiegészítéseképp' bátran javasolhatjuk a multimédia témát bõségesen tárgyaló Ralf Steinmetz: Multimédia (Springer, 1993.) valamint Tóth Dezsõ: Multimédia (LSI Oktatóközpont) könyveket. Elsõ látásra meglepõ lehet még esetleg az oldalak számozása. Mivel a fejezeteinket kitevõ témák többsége jelenleg is gyorsan változik, az itt közölt adatok némelyike akár a nagyon közeli jövõben is jelentõsen megváltozhat, célszerûnek láttuk a moduláris könyvfelépítési módszert alkalmazni, amelynek következményeképp' egy-egy fejezet bõvítésekor a többi fejezet újranyomtatása nélkül sem csúsznak el az oldalszámok. Az olvasmányos részekhez kellemes szórakozást, a technikai részletekhez jó böngészést, az újra-és-újra felbukkanó "... kitalálását az Olvasóra bízzuk" jellegû, önálló gondolkodásra buzdító kérdésekhez pedig jó fejtörést kívánunk.
I/2
= II. B
EVEZETÉS, ALAPFOGALMAK
A multimédia
! " #$ % "
! & ! !
"' (a multimédia definíció szerint definiálhatatlan( %%"
= ) " '! & Multimédia '" *
! + ,-
& %% &" *%
. " '! %% " !" / 0 $ %
1 & + ,- / + ,- " ! + 0 ! ! 2 $ % ( &( %
" & " " ! ,) 2++ ) 1 !" " 3 (Lépjen be az Internet multimédia világába!(4 1 /
5 0 ! $ &$ ) !
&" '
1.+#
&' & 1.+# &6 ' 7 & !
89: ' + + 3 8 ;
" vagy például " " (G.R.Wichman,
) %
"* ! * multi- " 3 több sok ) 6
! $ ! % " & "Medium- [lat.: a közbülsõ helyen található], általános közeg,
közvetítõ elem információnak beszéd, mozdulatok, arckifejezések, írás stb. útján történõ továbbadására vagy terjesztésére." 9 '
" ! ' %% ) 29: '& / 2& 1 9>& : &0 =??@ & ' / 0 / 0 % % " / 2.1. ábrá0
" # !
$ %
2.1. ábra: ) 29:
) " 3 Miként érzékeljük az információt?
!
/ 0 /% ' & & &0 ! % & & &$ /A
" 0 & * & $ * &$
! " # " ! $ ", valamint " $% & %% %#'"("; érdemes felfigyelnünk az utóbbi magyarázatban található "%#'"" szóra.
!
"
"
Itt is felhívjuk a figyelmet arra a tényre, hogy a köznyelvünkben egyre gyakrabban hallható
"
1991. december)
"médiák" helytelen és ezért kerülendõ; a média szó önmagában többesszámot képvisel, a médium
"
szó többesszáma.
" (A. Speed, 1991)
11<=
11
& ; C & " /! "
0
Hogyan kerül be az információ az átviteli rendszerbe és hogyan kerül ki az információ az átviteli rendszerbõl?
) % " '& $ %% $ * /& 0 / & 0 %% 9 & * " !
Miként kódoljuk az információt?
/ % $ $ 0 $ " & &
" '! & ).11 D)
) & ' " "
& ' & ! ! ' ! $ !
&' 4 % ' ! 6 &
! % " E ! !
/ !
0 / 0 $ ! % $
Hogyan/Hol tároljuk illetve továbbítjuk?
) 6 /& 0 /& & 0 % & $ '& ) '& $ $ % $ % $ ! %%
$
% & 3 () $ + ,- " & ! % (
& ! " !
≠
% ) !
F% " $ "'! ;
9 $ & !
29:
! $ % &
! !
G ! " /$
0 /$ 0 9 & . D5 H & '
& & !
! "
H ! /! 0 $
9 &
" &
#
) % %%
'
! % ' 6 " & ) ' 6 ' %%
" $
9 & & /! ' & ' 21 0 " ) ! 3 & '& % ' ) ! & 6 &
%& " " " '
)
* % & ! & ! % / 0 % & ! $ 11<@
) " '!
" 9 $ '
% " $ 11
) 29: '&
& % definíció 3 ) $
' " &
" ' "
! ' $ $
& H " !
! 4
6
/ 0 '
! ! $ # $ !
6 ;
) ! &' !& > /!& > 0 !& /!& 0 G
"'
* ! !
.% információcsomópontok ! % 6 kapcsolat(link-) rendszer " navigáció
) !& > ' ! ' & ! 4 $ %% &' %
9 * /(
(0 " '&
%! , '& /5 0 /' >& 0 /& ' 0 / 0 /& 0 ! $ / ' 0
' " ! '! '! &
/ & 0 & !
" 11<J
% / 0
' * '& % K $ ' "
* % " / ! & F& * H 0 & / 0 / & & G & H ! H - '! F%&
! &' ! 04 $ * & " L 3 Ki mondja meg, hogy mi legyen, milyen legyen, hogyan legyen? %$ $ ) %% !
3 ( ' )1 + ,-
! & D) µ 5 & .A & " ! (
=??M 5 ! 5 '& & " & /8 0 % ) ! $ %
8 B &'' / 2.1. táblázat0 ) ! 5 5 "$ " %% $ 3 '! ! ! 8 B % %
8 ' "& 8 ' + ,- + ,- 2 +<)
NMINO.P BJ 2 I A =OM A B> /@MM A <0 IMM =O .:) BJO "*
NMINO+P 8 OO 2 N A @IM A B> /@MM A <0 BNM =O .:) OJJ@O "*
2.1. táblázat: ) 8 B &'' #! ! % /
1+1 " & 0 / 3 "
8 .' & Q +810 ' * 4 ! 6 % / * @ + $ 0 & ! 11
III. A
! ! ! " # ! ! $! $$ $$ $$$ %! & ! " '(' # ! $ $ ) * + S O N O T Y L O F
. * ! ! " # ! % / . ! $$ !$ ! $ " ! # ! $ $ ! $ ! ! &
FOLYTONOS
. $ && ! $ % & ! $ "0 ! # 10 1 " # 1 ! 1 " # ! 1 1 " # 2 & *
DISZKRÉT
2
T
3 * = ρ⋅ [ ] ρ ! %% $ $ . $ - 4 5 4$ W m
3 ! ! & "3! $ ! # É R K Z SI D
! !
& $ !
! "
#
''',-
''',6
3 * -7 ⋅ -7 [ ] = 67 ⋅ 67[µ8 ] [9] : % ! &$ "-67 9# ! &$ "7 9# . $ 676; 9 $$ $$ % $ & −12 W m
. $ & $$ " ! ! $$$ # ! + ! ! $ 4
! " " # . < ! -=>64 ! "# $! # $$ $$ $! . $ " $ ! # ! $ ! ! $ $ ! ! !
"
. $ " $$ #
?& $ $ ! ! ! 4
. ! ! 4 ! @ 6767777 ! $ $ $$ ! $$& # % &
. ! $ ! % 4 ! >==;7 ! . $ $ $
$ &
$$
$
$$ ! ! ) ! ! &
' & & ( & ) *
$$$ !
% # #& #& # #& #
''',>
''',A
BB77 D>>> E777 --777 --76B
-,A C !4 ! " # -,> C !4 ! " # ) $! µ4 ! .4 0 -,6 C !4 ! "# -,A C F( !4 !
-;777
:D664 $!
>DE77
F(4GH,I. J K L 8 $ D>B ,
AA7B; AA-77 AE777
"
F( ! ! "F(4 (.) # (.) ! !
) ! ! 9 " $ # >77>A77 ! 4 $$ $ E & ! !
< &
& 4 $ ' -- 4 ! 3 9 ! ! 8F4 & 11 $ $ ) & E -; ! ! ! ? ! ! + & ( $ *
M&% N ! & & % !& . * " $!# " # %! " # 9 & & $! $ ! ! $$ $$ & $0 7 % $ 0 $ % % $ ! !
% . ! ! "# % ! $ ! ! & $$ x[k]
Interpolátor
H(f)
Decimátor
N
x[N/M*k]
M
O !
. < 4$$ ! $ & 4 $$ " $$ ! 0 # ! $$ " $$ ! 4 0 # 0 $$ ! . $ " ! $ ! # $$ " # ! ! 1 1 $$ $ ! $
$$ ! $$ # % $ (*
"
'#& # ( )*)
+ )*) " +*( , - ≈ ( -./, ) # # " # # 0 #
1 2$ )*) "
''',B
''',;
$ ! ! P $ ! % $ & $ " $ # $$ & " # ! . !$ $$ $ & ! ! & " ! # $ & 2 ! $ ! $ & $ $ ! & ! ! " ! # ! ! 4 $
$ 0 µ4 0# ! . ! " $ ! $ ! # ! &$ & ; 94 ! . ! < 4$ $ * &$ &$ ! -67 9 $ && $ 2 0 $ 1 1 E $ %
$$ ! && 8 ABB7 94 " ! BB;7 94 # ! F(4. -; $ !
#
! $
$ / 24 0 $ & / . $$ ! 4 ! ! $ $ $ ! $ ! ! ! ! "1 1# $ . ! $$ Q 0 ! $! " ! & ! # 2 & ! ! ! !$$ ! ! !! @ , " # 4 !0 " R3. S $
%
#
3 # ) # #& # # ## # #&#
$
! & "
%
4 , #& & " #& #& 5 # 6 #& , "#& # ) # &
4 #& &
, 2 4 % ! 2 ! 5 T4$ $ ! G'<< 5.U µ4 3 .R
. ! $ $ 6 ! ! $ $ ! ! V $$ E $ ! E $ " $ $$ ! $ $$ # 3 " -7777777 ! 7------- $ $$ ! $$ ! # ) ! ! $ ! ! 1& $$1 $ " $ $ $ # ? 4D6E ! (3G
#& # " #
''',D
''',E
!"
. ! & ! $ * $ " 4 # 0 $ " 0 # ) $$ $ $$ " # 0 ! ! $$ . "W # & $ "3W3 # !$$ $ $ 1 1 !
! $$ $ 0
$ & T 4 & $$ & % ! " - # &
! $ 0 Y $! !$ * 82:46 . D #
. ! " $ # $$ $ & 8 ! ! " %! . # & ! $ $ '
Y ! ! P %* % "0 %%# $ ? $ $ 4 %! ! %! . % 4 ! %& $ H! $
. < $ $ $$ '
9 & # # #& #
7"# #& # #&, #& # # # #& # #
.
3 ! & $ $ . 3 $ "XWX # $$ "GWG# $ H! $
-
&
τ
'#& ) -:;$, <=,4 8
#8 ) & "
8 & # " " # #&
& "
#
''',=
''',-7
$! %
3 $ 0 & ! ' % 0 $!
& " % # $ !
2 -- 4 ! ! ! " # -; $ ! ! . 4 $ ! (,. E $ ! WE ! W-; 4 " #
!
! $ α # WE 4 ! ! / β# W-; 4 ! ! / ".
$ ! %! +#
! α # WE 4 ! ! / β# W-; 4 ! ! / ".
$ ! $ ! 4 ! +#
!& ! % "! $ & $! # Q "? ! ! +# " & '
? I) 3
"# -6
. 3:'
.
!
3 $
T !
'GF.
() %
" &
.
!
( & ! $ ) $ " # % ! 0 / $ ! 2
! ! ! ! $ $ ! ! "E $# ! ! "E $, @ & " ## ! ! $ $ ! ! $ ! ! "E $, @ # >- A @ " # Z 1 K 1 " ! # Z !
7 ) # #& " & "#) )" #)
''',--
> ) 4?@@
''',-6
2 ! $ $$ X 4- → X 46 → X 4>* $ $$ $$ ! @ $ "X7# $$"G7# ! W >6 ! AA- ! AE 9 $ W X 4-* >6AAE $ X 46* >6>EA $ X 4>* >6>67 $ V F(4. & *
)! ' *)+
@ & ! " $ < #
@ -; T4& @ -6E &! ! Z 1 K 1 " ! #
!
, & ' *, +
. :3 "# $ ":3 # !$ -> $ $ $ % ! $ ! $ 9 $
:3 $! 0 % $! $$ $
& 4 & "$4 $ $ # !& $
XX6 X>
!"" # $ %%& -*A -=6 $ - * ;E -6E=; $ - * -7-6 ;AB; $
0 '123$" %
< & $ 82:4-4 . $$ ! ! 0 ! W -; 667B 6A ! 82:4$ $ W E $ )$$ $ $$ X<2-A $$ !% X $* $ W X7 $$ W G7 [* $ W X7 Z C Z $ C $ $$ W G7 Z C Z $ C $$ ?9F * [ !
-.,
. 82:4. " - 6 ># ! 8 2[ : ! $$ [0 $$ . 2 % ! ! $ $ $ $$ ! H! ! $$ ! % % 82:4- ! 82:46 $!
#
0 '123$ %
( $ V * >6 ! $ $ X 4>4$ ''',->
!
A # #& )"B #& C ) "& # 7C3D,4 E & ,2 & #
"
EF @ G & 3 F
#
F )
''',-A
Az eddigiekben sík képek megjelenítésével foglalkoztunk. Tekintsük át, milyen lehetõségeink vannak besüllyedés-kiemelkedés ("mélység") érzékeltetésére!
Az emberi látás korlátai
A mozgóképek köztudottan állóképek sorozatából állnak. Amint a szem felbontó képességérõl szóló bekezdésben már említettük, villogásmentes kép elõállításához a képfrissítés ütemével túl kell lépni a szem 50..60 Hz-es fúziós frekvenciáját, ugyanakkor folyamatos mozgás benyomásának keltéséhez 20..30 kép másodpercenkénti bemutatása elégséges. A mozikban ezt úgy használják ki egyszerûen, hogy egymás után kétszer (házimoziban 3-szor) vetítik ugyanazt a képkockát, így felezve (harmadolva) a szükséges film nyersanyagot. A televíziótechnika hasonló okokból a váltott-soros képletapogatás (interlace) módszerét használja. E megoldások elvileg nem hibátlanok, ám a gyakorlatban általában tökéletesen használhatónak bizonyultak. Intra- és inter-frame kódolás
További jelentõs spórolást érhetünk el a szükséges bitmennyiség tekintetében, ha kihasználjuk, hogy a képszekvenciák szomszédos képei egymáshoz általában igencsak hasonlítanak. Ezen felismerést minden modern mozgóképkódolási technika használja, és jelentõs megtakarítást ér el az idõbeni korreláció csökkentésével (inter-frame coding). A képszekvenciák hatékony kódolását nyújtó inter-frame kódoláshoz szükséges a mozgásdetekció, amivel az egyes objektumok vagy blokkok elmozdulását keressük meg a képeken, és magát a mozgást is hozzárendeljük a képekhez. Felhívjuk azonban a figyelmet, hogy nem lehet az összes képet az õt megelõzõbõl származtatni, hisz ez megfosztana minket a vágás illetve például a visszailletve gyors-tekerés lehetõségeitõl. Ezért a szekvenciákban mindig elhelyeznek (például minden 15. képként) olyan képeket (intra-coded frames), melyek kódolt változatának dekódolásához nincs szükség az elõtte levõ képsorozat ismeretére, e helyek szolgálhatnak vágási pontként, avagy például ugrópontokként tetszõleges irányú gyorstekeréshez.
3-D képek
Az ú.n. 3 dimenziós (3-D) képek jellemzõje, hogy szemben a sztereoszkópikus képekkel, akár egyik, akár mindkét szemünkkel nézzük, ugyanazt a hatást keltik bennünk; a kép mélységének meglátása sem különleges gyakorlást sem különleges eszközt nem igényel. Az ilyen képek egy egyszerû monitoron is teljes értékkel megjeleníthetõek. Sok lehetõségünk adódik mélység érzékeltetésére, a felsorolt módszerek külön-külön is vagy kombináltan is használhatóak. Ügyesen kombinált használatuk alapvetõ mélységérzetet kelt bennünk. Az árnyékok használatával elérhetjük, hogy az objektum úgy tûnik, mintha egy felületen feküdne. Tudjuk, hogy egy objektum akkor tûnik nagyobbnak, ha közelebb van hozzánk, és kisebbnek, ha messzebb van tõlünk. A memóriánk segít megítélni egy ismert objektum távolságát a méretébõl (gondoljunk például a közeledõ majd távolodó villamosra!).
Fény és árnyék, illetve relatív méretváltozás hatása a mélységérzetre. Úgy érzékeljük, hogy a jegyzet, amelyet most
olvasunk (akár kinyomtatva akár a képernyõn), közelebb van hozzánk, mint például a mögötte lévõ asztallap. Ez többek között azért van így, mert nem látunk keresztül a jegyzeten.
Egy jól ismert példa a nézelõdés a mozgó autóból. Mindenki IV/12
IV/13
tapasztalhatta már, hogy haladás közben a közeli villanyoszlopok sokkal gyorsabban mozognak, mint a messzebb lévõ hegyek. A mozgás parallaxis használata igen jó mélységérzetet kelthet, nemcsak az objektumok eltolódása, hanem forgásuk által is. ! A néha geometrikusnak vagy fényképészetinek nevezett perspektivikus nézet a legfontosabb mélységérzetet nyújtó monokuláris látvány, nagyon könnyen érzékeltethetõ segítségével a mélység. # Lencsés sztereoszkóp.
A képpár fölé helyezett állványra szerelt, szemtávolságra (65 mm) lévõ két egyszerû lencse! szétválasztja a két képet, tehát biztosítja, hogy mindkét szemünkkel csak egy-egy képet nézzünk. Ezenkívül a képeket épp' a gyújtótávolságba helyezve megkönnyítik, hogy közel párhuzamos szemtengellyel nézhessük a õket. Az egyszerû lencsés sztereoszkóp hátránya, hogy a szemtávolságnál nagyobb méretû képeket csak úgy szemlélhetjük, ha az átfedõ képrészt a szembázis felezõvonalában levágjuk. Egy sztereoszkópikus képpár két képének szétválasztására használt optikai megoldások közül a régebbi, a két kép szemlélését közvetítõ fény hullámhosszbeli különbségén alapuló úgynevezett & eljárás. Az eljárásnál a két képet egymásra vetítjük. A szétválaszthatóságot azzal érjük el, hogy a vetítés két egymást kiegészítõ színnel történik (például vörös-zöld összeállítás lehetséges), és a képet ugyanilyen szín-összeállítású szemüvegen át szemléljük. Ha a kiegészítõ színben készült képeket fehér alapra vetítjük, akkor mindegyik szem az elõtte lévõ szemüveg színének kiegészítõ színét feketén látja, a másik szín eltûnik, beleolvad a világos környezetbe. Azaz mindkét szem csak a megfelelõ képet látja, és a két kép összeolvadásából létrejön a térmodell szürke színben. Ez az úgynevezett % '. Ha azonban fehér-fekete tónusú képeket vetítünk ki úgy, hogy eléjük zöld és vörös színszûrõt helyezünk, akkor a kép világos részei vörös, illetve zöld foltokban jelennek meg, a sötét részek természetesen megvilágítás nélkül maradnak. Ezt szemlélve vörös-zöld szemüveggel, a vörös szemüvegen át nézett
" Egymáshoz képesti takarás illetve perspektivikus
ábrázolás hatása a mélységérzetre.
Egy-képes sztereogrammok
Továbbra is csak egy képbõl állnak, mégis mindkét szemünkre (és sok türelemre) van szükség a mélységérzet keltésére szintén képes auto-sztereogrammok (egy-képes sztereogrammok) meglátásához. Léteznek ismétlõdõ mintázat alapú sztereogrammok (lásd a Mágikus Szemek címû könyvben), illetve álvéletlen mintázatúak (ilyen például a Wandel & Goltermann cég logo-ja), és természetesen leggyakrabban a két típus kombinációjával találkozhatunk. Sztereó képmegjelenítés
Két-képes, azaz sztereó képmegjelenítéshez két szemünkön kívül speciális eszközre is szükségünk van, amely "megszervezi", hogy mindkét szemünk csakis a neki szóló látványban részesüljön. Néhány ilyen, a gyakorlatban is terjedõ és kipróbálható eszköz mûködését ismertetjük az alábbiakban.
A legegyszerûbb mechanikai sztereó képmegjelenítõ eszköz az # n látható 1852 óta ismert $ %. !
IV/14
A kismértékû nagyítás itt nem lényeges hatását figyelmen kívül hagyhatjuk.
IV/15
zöld foltok beleolvadnak a kép sötét részeibe, míg a vörös foltok világosnak látszanak. Ugyanígy a zöld szemüvegen keresztül is csak a kép világos részeit látjuk. A két kép ismét térmodellé egyesül, de most a sötét alapból világos szürke színben emelkedik ki. Ez az ( ) '. Az anaglif eljárás elõnye, hogy nagy képfelület hozható létre, amelyet egyszerre több személy is szemlélhet. Hátránya az, hogy színtévesztõk nem használhatják, továbbá nagy a fényveszteség, amely a szûrõk és a szemüvegek használatának következménye. A fényveszteség miatt a keletkezõ modell csak elsötétített helyen látható jól. ! A képek szétválasztása megoldható úgy is, ha a két szem más-más állapotú fényben szemléli a kivetített képeket. Ez a $% '. Lényege az, hogy a két képet egymásra merõleges polarizált fényben vetítjük ki és a képeket szemüveg foglalatba helyezett polárszûrõkön keresztül szemléljük, melyek polarizációs síkja párhuzamos a neki megfelelõ képet vetítõ fény polarizációs síkjával. Ekkor mindegyik szem csak a neki szóló képet látja, a másik képet vetítõ fényt a szûrõ kioltja. Az eljárás elõnye, hogy színtévesztõk is használhatják, valamint színes képek is kivetíthetõek segítségével. Hátránya, hogy a hatás csak a polarizációs síkok adott iránya mellett érvényesül, tehát érzékeny a szemlélõ fejtartására. " A képek mechanikai szétválasztására az idõbeli elkülönítést szokás alkalmazni. Ez abból áll, hogy a bal és a jobb képet nem egyszerre, hanem gyors egymásutánban váltakozva vetítik ki. A szemlélõ szeme elé olyan mechanizmust illesztenek, amely a kivetítés ritmusával megegyezõ ritmusban az egyik, majd a másik szemet hagyja szabadon úgy, hogy a bal szemmel csak a kivetített bal képet, a jobb szemmel pedig csak a jobb képet lássa a szemlélõ. Amennyiben a váltakozás megfelelõen gyors, akkor a látás folyamatának tehetetlensége miatt a szemben maradó látás élmény a két képet térmodellé egyesíti. Az ilyen eljárás fényvesztesége kisebb, mint az anaglif eljárásé, azonban a túl alacsony frekvenciájú váltakoztatás esetén a szemlélés fárasztó lehet. A legegyszerûbb számítógépes megoldás alapját tulajdonképpen a fentebb ismertetett mechanikus eljárás képzi. A szükséges hardware egy szemüveg, amely két folyadékkristály (Liquid Crystal, LC) fényzárat tartalmaz. A IV/16
monitoron egymás után kerül megjelenítésre a bal és a jobb oldali kép, például 60 Hz-es képfrekvenciával. A szemüveg bal és jobb oldali fényzára ennek megfelelõen felváltva 1/60 másodpercig nyitva, majd szintén 1/60 másodpercig zárva van. Ma ez a módszer igényli a legolcsóbb és a legegyszerûbben megvalósítható hardware-t. Hátránya, hogy a leggyengébb szubjektív minõséget adja a késõbbiekben ismertetésre kerülõ megoldásokkal szemben. A módszer felépítésébõl adódó vibrálás is igen fárasztó lehet hosszú távon. Az egyik ilyen, több számítástechnikai szaküzletben kapható, sztereoszkópikus szemüveg a CyberShades 3D nevet viseli. #
$
$ Egy másik, igen elterjedt megoldás, az interlaced sztereó módszeren alapul. Interlaced módban egy kép megjelenítése egy monitoron két félképbõl tevõdik össze, a páratlan sorok képzik az egyik félképet, míg a páros sorok a másik félképet. Amennyiben a páratlan sorokban a bal oldali kép, a páros sorokban a jobb oldali kép kerül megjelenítésre, máris rendelkezésünkre áll a sztereoszkópikus képpár, csak egy megfelelõ hardware-re van szükségünk, amely szétválasztja a bal, illetve a jobb szemünknek szánt képet. Egy ilyen megoldás a CyberMaxx nevet viselõ sztereoszkópikus sisak. Ez két LC képernyõt tartalmaz, mely képernyõk a bal és a jobb oldali képek megjelenítésére szolgálnak. A sisak a PC monitor kártyájára csatlakozik és egyszerûen a páratlan sorokat a bal oldali LC képernyõn, míg a páros sorokat a jobb oldali LC képernyõn jeleníti meg". A módszer hátránya a felbontás mértékének csökkenése, hiszen a monitoron 640·480 pixel felbontást beállítva az LC képernyõk felbontása 640·240 pixel lesz. Az említett CyberMaxx sztereoszkópikus sisak LC képernyõinek maximális felbontása 640·240 pixel. %&
Egy viszonylag új eljárás a vízszintes megosztást alkalmazó megjelenítési formátum. Az eljárás két félképet használ az * nak megfelelõ elrendezésben. A felsõ félkép felel meg a bal oldali képnek, az alsó félkép pedig a jobb oldali képnek. A félképek függõleges felbontása fele az eredetinek. "
Ez az összerendelés természetesen a sisakon váltható, meglepõ hatást okozva fordított poziciójában.
IV/17
Amikor egy például 120 Hz-es képfrekvencián üzemelõ monitoron jelenítjük meg az ilyen módszerrel készült képpárokat, a térben egymás mellé helyezett félképek idõben kerülnek egymás mellé. Amennyiben a félképek között egy plusz képszinkron impulzust biztosítunk a monitornak, a monitor automatikusan széthúzza a képet függõleges irányban és így a megfelelõ méretben jeleníti meg azt. A megfelelõ szemüveget - amely itt is két folyadékkristály fényzárat tartalmaz - viselve, mindkét szemünk 60 képet fog látni másodpercenként, míg a másik 60 kép megjelenítésének ideje alatt nem fog látni semmit. A szemüvegben lévõ fényzárakat egy adó emittere infravörös jellel vezérli, a monitornak adott képszinkron impulzusok ütemében.
+, Függõleges megosztás.
Az eljárás két félképet használ az ábrának megfelelõ elrendezésben. A bal félkép felel meg a bal oldali képnek, a jobb félkép pedig a jobb oldali képnek. A félképek vízszintes felbontása fele az eredetinek. A bal kép megjelenítése esetén a jobb képet takarjuk ki és megfordítva. A nem kívánt kép megjelenítése helyett - a fennmaradó soridõben - a sorszinkron impulzust kioltásra állítjuk, majd a megjelenítendõ kép esetén ismét visszaállítjuk. Az elõbbi eljárásnál említett szemüveget viselve, mindkét szemünk 60 képet fog látni másodpercenként, míg a másik 60 kép megjelenítésének ideje alatt nem fog látni semmit. A szemüvegben lévõ fényzárak vezérlése a vízszintes megosztás elvén mûködõ eszközével megegyezõ. Egy, a gyakorlatban megvalósított függõleges megosztást alkalmazó hardware a CrystalEyes 2 elektronikus LCD szemüveg. )* ) +,-#. A fenti nevû eljárás jó minõségû és olcsó megoldást kínál a sztereoszkópikus képek megjelenítésének problémájára. Minden egyes kép alján, az utolsó pixel sorban, egy fehér vonal kerül a képre. Ez az ++ n látható módon jelzi, hogy az adott kép bal vagy jobb oldali kép. Ennél az eljárásnál is szükséges a két folyadékkristály fényzárat tartalmazó szemüveg. Amikor a szemüvegbe épített elektronika érzékeli a képernyõn kijelzésre került fehér vonalat, elvégzi a szem elõtt lévõ fényzár kapcsolását.
* Vízszintes megosztás.
Amennyiben a megjelenítésre szánt képnek elegendõen nagy - legalább 480 sor képenként - a függõleges irányú felbontása, a végeredmény kielégítõ szubjektív minõséget ad. Amennyiben viszont alatta maradunk ennek a korlátnak, a végeredmény kezd kockássá válni. Egy, a gyakorlatban megvalósított vízszintes megosztást alkalmazó hardware a CrystalEyes PC elektronikus LCD szemüveg. '( A vízszintes megosztást alkalmazó megjelenítési formátum problémájának miszerint nincs elegendõ sor képenként - megoldására fejlesztették ki a függõleges megosztást alkalmazó megjelenítési formátumot ( +, ).
#
IV/18
WLC - White Line Code
IV/19
1 #
' (GIF) (Compuserve) 87a, 89a; ejtsd: dzsif Színmélység: 1..8 bpp Lempel-Ziv-Welch (LZW) kódolást használ, max. 12 bites táblával Létezik interleaved GIF: minden 8. sor, minden 4. sor, maradék sorok Létezik átlátszó GIF: egyik palettaelem jelenti az átlátszó színt Létezik animált GIF Az Unisys szabadalmi díjat szed a Welch-módosításra minden 1995. január 1. utáni kereskedelmi program$ esetén Egyéb chunk-ot (pl. egyszerû szöveg) is tartalmazhat, de a dekóderekben ritkán valósítják meg a helyes kezelésüket ! 2 1 (PNG) Ejtsd: ping Régebben: Portable Bitmap Format (PBF) LZ77-et használ GIF helyett ajánljott, mert ez szabadalmi díj mentes Tud 24 bites színmélységet Még fejlesztés alatt áll 3 " ! (BMP) (DIB) (Microsoft) Színmélység: 1, 4, 8 vagy 24 bpp Raw, RLE4 vagy RLE8; RLE-t sok dekóderben nem valósítják meg (RLE=futamhosszkódolás) Színpaletta összetevõi 32 bitesek (Red+Green+Blue+reserved (RGBx), vagy például Cyan+Magenta+Yellow+blacK (CMYK)) 4 # ' ' (TIFF) (Aldus & Microsoft) Fejléc: tag-ek Kódolás: Bõ lehetõségek: Fax Group3, Fax Group4, LZW%, JPG *!51 ' #
' (JFIF) (JPEG: Joint Photographic Experts Group) 24 bites színmélység ("real life images"), nem célszerû számítógépes grafikák, rajzok esetében használni Módusok:
Bal oldali kép
Jobb oldali kép
++ "Jelzés a képernyõn"
Egy, a gyakorlatban megvalósított "jelzés a képernyõn" módszert alkalmazó hardware a SimulEyes VR elektronikus LCD szemüveg.
Digitális képállományainkat számítógépünkön tárolnunk kell, kézenfekvõen állományok formájában. A számítástechnikában elterjedten használt hangállomány formátumok ismertetésénél elmondottak megismétlése nélkül, kivonatosan ismertetünk néhány, a gyakorlatban gyakran megtalálható képtárolási formátumot. Raszter alapú (bittérképes) képformátumok
!-/ (ZSoft Paint) (1980) Színmélység: 1..24 bpp RLE kódolás: 11xxxxxx & érték, xxxxxx = hossz Gond: fejlécében a HRes és VRes mezõk értéke nem egyértelmû (" ! & $ - $ ") (olykor 800·600, olykor 100·100, olykor 217·305, ...) 0-/ Képszekvenciák tárolására Maximum 1023 darab PCX Tipikusan többoldalas fax-képek IV/20
$
%
Ezért jogdíjas a unix compress programja, de pld. a PKZip eredeti LZ77-et használ, ezért nem jogdíjas az Unisys felé. Unisys patent miatt nem ajánlott.
IV/21
1. veszteséges, szekvenciális DCT alapú 2. kiterjesztett veszteséges DCT alapú 3. veszteségmentes 4. hierarchikus DCT = Diszkrét Koszinusz Transzformáció Tipikusan csak az 1. módust implementálják (mert a legegyszerûbb és szabadalmi díj mentes) Szimmetrikus (komplexitású) kódoló-dekódoló algoritmus
Kódolás: hardware vagy off-line Sofware dekóderek alig bírják tartani a szinkron sebességet MPEG-1: "Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mbps" International Standard IS-11172, 1992. október MPEG-2: "Generic Coding of Moving Pictures and Associated Audio" International Standard IS-13818, 1994. november MPEG-3: beolvasztva az MPEG-2-be MPEG-4: "Very Low Bitrate Audio-Visual Coding" Call for Proposals, 1. határidõ: 1995. október 1. A szabvány 4 részbõl áll: system (szinkron, audio & video multiplexálás), video compression, audio compression, teljesítési (compliance) tesztelés Sokszor csak intra-kódolt képet tartalmaz - ilyen szekvenciát egyszerûbb elõállítani #$ 9:; (MOV) (Intel) Apple QuickTime Full-screen, 30 kép/másodperc Pentiumon Nem igényel dedikált hardware-t Ingyenes (<) - Nem támogat teljes-képernyõs módot 320·240 pixel, 15 kép/másodperc, megy i80386-on is
Képleíró (vektorgrafikus) formátumok
,$2 " ' (WMF) (Microsoft) MS-Windows GDI függvényhívások sorozatából áll (5
$) ! 6 (PS, EPS) (Adobe Systems) Turing-complete, inverse-polish, harmadfokú Bézier görbe primitívekkel Elsõ 4 karakter: "" 6-bites& (text') Bittérképes grafikára használni nem célszerû EPS: " ", legfeljebb 1 oldalas, nincs benne "" ! 0 ' (PDF) (Adobe Systems) Adobe's Acrobat Reader PostScript utód, LZ tömörítés és hypertext lehetõségekkel Mozgókép formátumok
"7*!51 (M-JPEG) Csak intra-frame kódolás (JPEG) $ %$ #
$ (AVI) (Microsoft) Hang: RIFF-WAVE Kép: DIB, "delta-frame"-ekben ; frissítéskor olykor teljes képek " ! 58 1 (MPEG) Nem állományformátum, hanem kódolási technika (JPEG-JFIF) &
'
A MS-Windows PS nyomtató meghajtó programja sajnos odatesz elé és utána egy-egy Ctrl-D karaktert, ezzel sok PS nyomtatót, illetve PS feldolgozó programot megzavar. Ezért célszerûtlen pl. uucode-olni. csak a bizonyos mértéknél jobban eltérõ képrészleteket tárolják
IV/22
AVI vagy M-JPEG állományból
IV/23
A szem felbontó képessége
IV. Á
-, -, 3--, -
Az emberi látás informatikai vonatkozásai
! "# $
$ # $ $ #$ %$ & ' # $ $ $ ($ # # ) ) ' # $ * ' $$ $ + # $ " $ # $ * $ # + $ , # "
Az olyan népszerû témák mint a DCT, JPEG vagy MPEG többé-kevésbé részletes ismertetésének elhagyása a multimédia irodalomban hagyománytörésnek számít, ám e döntésünk szándékos, igyekeztünk õket a szerintünk szükséges és elégséges mértékben illetve helyen bemutatni. Már itt feltûnhet a Kedves Olvasónak a megkülönböztetés a sztereó látvány, illetve a három dimenziós (3-D) látvány között, mely utóbbi (nevével ellentétben) az elterjedt terminológia szerint 3-D érzetet kiváltó, de általában sík (2-D) képre utal. Az érdeklõdés növelése érdekében már itt megjegyezzük azt is, hogy a sztereó képek egy típusának megnézéséhez elegendõ a két szemünk - a másik típushoz viszont nem.
-(./
' #' 01" # ! $$ , ' '! ' /21 $$ 3 # ' $ ' # 456 # 027 ! # # 822 #$ 922:822" # # 0262 #.
% # % )% ) ;282 < = ## # $ #$ $% " '
% /85> % ' !
"
#
A színlátás és következményei
?$ " *# + ' # " # # $ $
' # ' $
# @ # ' #$ , " *% ' + # $ $$ A' $$ $ 422B22 $% C $ $ ! $% *'!+ ! "
#
A határszög két ívperc, azaz 1/30-ad szögfok. E kísérletek könnyen reprodukálhatóak. Színezzünk egy négyzethálós füzetben szomszédos négyzeteket sakktáblaszerûen fekete-fehérre illetve tarkára. Társainkkal nézessük meg az így preparált füzetoldalt a megfelelõ távolságokból. 20°/2' = 600, illetve 600 · 4/3 = 800.
-(.0
! D-E "
' $ % ' * + $
λ
" ' ' $ $ * + E #$ ' # ! " #' D-E B22 " *K K+ ;48/ " *M M+ 46;9 " *N$ N+
KMN $ $ # * !+ $
λ
λ
λ
D-E ' F 1 G ' $ $ ! # HIJ $
Metamer színek és a három alapszín
K ' $ '! # L '$ $" ' $ ' '! " # $% ' # ' G ) #" ) " $
A színekkel foglalkozó összes ábrára vonatkozik megjegyzésünk, miszerint az egyszínû nyomdatechnika természetesen nem tudja teljes értékûen visszaadni az ábrák tartalmát, ám a jegyzet elektronikus változatában illetve a kapcsolódó tantárgy elõadási fóliaanyagában ezen képek (is) színesben találhatóak meg.
-(.6
λ
λ
' #' ' " ' C " ' ' ) ' ) M$ $' #$ ' '
) )" $ $ *#$ ' + ' $ ! $ E ' ' " $ # L
$ #$ # '# "
# KMN C " ! ! *' + #$ ' # $$ ' # ## # ! * ' + -(.4
# ' = " Színkeverés
#' ' $ '$ * + ' ' *' " " D " O P+ ' = '
$ * + '#$% *$' + ' G$' ' ! ' #' ' '
#' # #$ ' &
Szín-koordinátarendszerek
E ' KMN ' ' $ $" " $ ! $ CIE színösszetevõk (XYZ)
G'5
%
R
G
G
B
B
R
R
G
B
Ye
Cy
'
Ma
W
A ' ' ' ' '
' ' ' ' !! ' ' ! ' * P " + ' #$ #$ QG# %
R 2828B 2/B68 2022/ K O = 20>99 2;989 2//44 ⋅ M & 2 2288/ ///;2 N .++ 15 KFCC MFCC NFCC ' $% K M N #' 25 R O & ' ' @ $$ O %
' S KMN 62T" ;>T" //T" U #$ ' # '! *#$ + ' ' #$
Szubtraktív színkeverésnél (az additívval ellentétben) a fehérbõl színszûrõkkel távolítjuk el a felesleges színösszetevõket, ez történik például a festékek keverésekor.
-(.;
&
'
Ezen, nem is oly egyszerû eljárásokat Black Generation, Undercolor Removal illetve Gray Color Replacement-nek nevezi a mûszaki irodalom. A jegyzetben nem kívántuk pontosan definiálni a fényforrás vagy színinger fényességének illetve világosságának fogalmát, e kifejezéseket felcserélhetõ módon, a hétköznapi értelmükben használjuk. Megjegyezzük, hogy jelenleg a monokróm monitorok tervezõi mégsem a viszonylag egyszerû Y=0.3R+0.59G+0.11B egyenletet alkalmazzák, hanem a még egyszerûbb Y=G egyenletet, azaz a megjelenített (egyszínû) képpont fényességét csak az eredeti pont zöld szín tartalmától teszik függõvé. E tény következményeinek átgondolását a Kedves Olvasóra bízzuk.
-(.8
N" ' N $ N$ ' 25 ' KMN ' ' ! * ##\
! + ' " ' " ' "! ' ! <
CIE színkoordináták (xyz)
G'5
RO& (S ) V RW OW & (
)
5 " ' " ! YIQ
E 5 X,GD ' *@G + G'5 O 20>> 2;9B 2//4 K - = 2;>8 −20B; −260/ ⋅ M Y 20/0 −2;06 26// N 15 O D-E ' - ' $ Y # -" % # 25 X,GD ' O-Y Yuv
E 5 Q ? G ' *E$#+ G'5 O 20>> 2;9B 2//4 K $ = −2/4B −209> 2468 ⋅ M 28/; −2;/; −2/ N 15 O$ '" # # L G #% KMN ' ' 25 $" " % ' 'L $ V *N"O+ . 026 V *K"O+ . //4 HSB
E 5 ' *<$ + ' *G$+ *N + ' ' G'5 N V O <$ V **K"O+.*N"O++ G$ V / " ZKMN[.O 15
Képdigitalizálás
G' # * + # # $ ) ) " M# * + / N " /222 */8222 # /8 .+ $ # #" *922:822 #S .# 9 .#S 0; #.# + # " 92 # ] C ' $ $ " # $ !5 # # # $ # # # $ < $ $$ $ " # # $ % # ' " $$ # # $
Más módon is megközelíthetjük a különbözõ médiumok bitjei fontosságának kérdését. Amennyiben az elõzõ mondatban található "külö nbözõ" szó egy bit hibája miatt "külö mbözõ" karaktersorozattá hibásodna meg, akkor ez a bithiba (kiemelés nélkül is) minden olvasónak feltûnne. Ha a jegyzet szövegével megegyezõ bitnyi mozgófilm egy pixeljének egy bitje változik meg, akkor gyakorlatilag nincs esélyünk azt észrevenni. Általánosságban igaz az, hogy a képek rossz minõsége kevésbé bántó, mint a hangoké, egy betûelírás (helyesírási hiba) még bántóbb.
-(.9
Mintavételezés
A# $$ $ 5 $ # QS ' $ ## # * #$ KMN #+ ' # ' E
# #S #S !! # ' ' 5 #S " 8425492 V 9225822 V /2045B89 V /0925>82 = 4:3 #S !! " $ $ *. ^Q-+ G $ #S !! " * + # $ /22:/22 #S ' 022:022 #S # G * '! +
$ # #S # * ! + % % ! " ! # E $ %$ $ # ' P ' #
Kvantálás
# " #S ' ' '! # ! # A #S $ ' ' # #S ' *#$ + < #$ ## ' #' 9 #S ' 024 * /8BBB0/8 + ' # ' '
# 922:822:6 V /442222 " " " # '] Színek, színárnyalatok száma
/8 0;8 8;;68 /8BBB0/8
bit/pixel
4 9 /8 04
# # )<"D) ),$ "D)
,#$ '
!! '# 5 ! # $ ' ' * 04 # + #S ' S $ # G$ $ " ' #$ 0;8 '! # C ' $ # 5
$ # # # ( # '# ' " # J G # # $$ # ) )
Gondoljunk egy sakktábla-szerûen kitöltött ábrára.
-(.>
Megjegyzés
-(./2
E ! * + 0 .#S ' ! # " )# )
A '"
-(.//
V. A C D (CD)
Sony & Philips fejlesztés Rétegstruktúra: lásd a 5.1. ábrán. Lézernyaláb felbontóképessége miatt 3-nál kevesebb land vagy pit nem lehet egymás mellett ⇒ két szomszédos "1" között legalább két darab "0" kell legyen Fázishelyes szinkronjel kinyerhetõsége céljából 11-nél több land vagy pit nem lehet egymás mellett ⇒ két szomszédos "1" között legfeljebb tíz darab "0" lehet 3 lézernyalábos letapogatás (2 vezetõ + 1 letapogató nyaláb)
• • •
A CD egységet a legtöbb szerzõ a multimédia alapelemének tekinti, sõt. Ezt tényként elfogadni nem szabad, hisz egy multimédia rendszer a bevezetõben megfogalmazott definiciónk szerint nem feltétlenül igényel optikai elvû tárolót, bár kétségtelen, hogy alacsony áruk, aránylag nagy tárolókapacitásuk és (néhány) dinamikusan javuló jellemzõjük miatt közkedveltségnek örvendenek. Szeretnénk továbbá azt a feltételezést is eloszlatni, hogy a CD lemezek érzéketlenek a sérülésekre. Bár az alkalmazott hibatûrõ kódolás elvileg komoly hibadetektálási és hibajavítási lehetõséget ad a lejátszóegységnek, ám a mai (nem-professzionális) lejátszók e lehetõségbõl csak a hibadetektálással élnek, tehát továbbra is óvjuk lemezeinket a sérülésektõl! Bár a mágneses elven alapuló tárolók (hajlékony- illetve merevlemezes egységek, digitális hangrögzítõk (DAT)) kódolási rendszere hasonló mértékben fontos, mint az optikai tárolók kódolási rendszere, ám a téma "menõsége" miatt a multimédia irodalom csak az utóbbira korlátozódik. Hogy a jegyzetünkbõl tanuló Kedves Olvasó se érezze magát megfosztva e téma ismeretétõl, az alábbiakban nagyon röviden és nagyon tömören összefoglaljuk az adathordozóról (azaz magáról a CD-rõl) és mûködési elvérõl az egyes (színes könyveknek is nevezett) szabványok legfontosabb gondolatait, majd a fejezet végén egy kompatibilitási táblázatot közlünk. Megjegyzendõ még, hogy a CD-k nem fedik le az optikai tárolók osztályát, hisz utóbbihoz tartoznak például a számítástechnikában ritkán használt, alapvetõen zenei hanganyagok tárolására kifejlesztett Sony MiniDisc-ek is, vagy például a LaserVision típusú, mozgófilmek analóg kódolású tárolására alkalmazott képlemezek - ám ezek elõfordulása a számítástechnikával inegrált multimédia rendszerek világában nem jellemzõ, szemben az alábbiakban felsorolt katalizátorként mûködõ CD típusokkal. A leírásból elhagytuk a lemez olvasó, illetve író berendezések fizikai mûködésének leírását is, hisz multimédia anyagunk készítése közben erre csekély szükségünk lenne; a formátumválasztási lehetõségek bemutatásán kívül igyekeztünk azokra a gondolatokra szorítkozni (mint például az egyes lehetséges formátumok adott tulajdonságai, illetve megválasztható további paraméterezési lehetõségei), amikkel egy-egy CD anyag tervezésekor és készítésekor találkozhatunk.
•
•
!!!
!!!
5.1. ábra: A CD adathrodozó rétegstruktúrája. A "land" a teljes visszaverõdést, a "pit" a 180°-os fáziskésleltetést, és így a jelentõs (pontosabban ≈70%-os) kioltást okozó felületrészt jelöli. Logikai "1"-nek a land→pit vagy pit→land átmenetek felelnek meg, míg logikai "0"-nak a land→land vagy pit→pit egymásutánisága számít.
Így biztosítható, hogy garantált idõhatárok között legyen 0 → 1 vagy 1 → 0 átmenet (egyszerû órajelkinyerés, DC elnyomás, motor szervo egység).
V/1
V/2
⇒
NRZ kód
• • • • • • • •
•
Forráskódolás: L+R, 44100 Hz, 16 bit lineáris, 2-es komplemens PCM ⇒ 1411200 bps ≈ 1.35 Mbps Hibavédõ kódolás: Cross-Interleaved Reed-Solomon Code (CIRC). Kódtávolság = 5 ⇒ 4 hibát jelez, 2 egyszerû hibát javít, 4 törléses hibát javít EFM = 8→14 moduláció Logikai alapegység: keret (frame), 6 (L+R) minta, részletezve lásd a 5.1. táblázat ban Interleave burst-jellegû hibák ellen 24 keretenként (lásd a 5.2. táblázatban) Dekódoló (=hibajavító) algoritmus szabadon választható 1 keret = 6 sztereó forrás minta (192 bit = 24 byte) 1 szektor (blokk) = 98 keret = 1/75 sec, amiben 2352 audio adatbyte (588 sztereó minta) van
szinkron (Synchron) vezérlõ+indikátor (CB) (audio) forrás (AudioData) hibajavító CIRC összekötõ és DC elnyomó!
8 6·(16+16)= 2·4·8=64 264
Σ
• • •
• •
•
Kapacitás: névlegesen 74 perc (333000 szektor), de léteznek 76:25-ös lemezek is, max. 79 perc; max 99 audio track; track-enként max. 99 index ∅ 120 mm; CD-S (single): ∅ 80 mm, 21 perc (régebben adapterrel) Digitális másolást tiltó bit Egyébként is gond a másolás: nem minden CD-ROM olvasó képes a kevés szinkronbit miatt, amelyek elvileg képesek is, sokszor csak audiojitter-rel tudnak újrapozicionálni" CD Audio Maxi Single: mint CD-S, de így nem kell adapter; dekoratív, (jó demo anyag) CD+G: egyik alcsatornában karakteres grafika (szöveg, kotta) az audio adatokkal szinkronban; TV-re kapcsolható; lemezek < 1/2 %-a; Karaoke-CD elõdje CD+G+M: M=MIDI rögzítés mintavétel L ↓ R ↓ L ↓ R ... ... ↓ L ↓ R q
24 14 6·((2·14)+(2·14))=336 2·4·16=112 34·3=102
1
1
2
2
6
6
A CD-Audio adatszerkezete logikai alapegységének felépítése. Az adatok következményeként a bitolvasási sebesség 4.3 Mbps, és mivel az egység 1.2-1.4 m/s állandó vonalmenti sebességgel (CLV) dolgozik, így a lemez 200-530 fordulat/perc (RPM) sebességgel forog.
5.1. táblázat:
1
→
→
L R L R ... L R q
L R L R ... L R q
7
13
7
13
8
14
8
14
12
18
12
18
2
3
... ... ... ... ... ... ... ... ...
→
L R L R ... L R q
139 139
140 140
144 144
p ,p p ,p p ,p p ,p ... p ,p p ,p 1
2
3
4
5
6
7
8
21
22
23
24
24
A 24 keretenkénti interleave megvalósítása. L és R a 16 bites mintákat, p és q a 32 paritás (CIRC) biteket jelöli. 5.2. táblázat:
A 16384 darab lehetséges csatornakód közül 267 olyan van melyben min. 2 és max. 10 szomszédos zérus van, kihagyva közülük 11-et, 256 darabot kapunk.
!
Két bit a min. 2 és max. 10 szomszédos "0" feltétel betartására, plusz még egy bit a szomszédos kódszavak átlagértékének minimalizálására minden egyes 14 bites egység közé; gond, ha egy 10 "0"-ra végzõdõ után egy 10 "0"-val kezdõdõ kerülne.
V/3
"
Ha hibás beolvasás vagy egyéb háttérmûvelet miatt nem tud folyamatosan olvasni a lemezrõl (hisz a CD-Audio lemezen nincs header!).
V/4
! •
• •
Red Book (fizikai és low-level formátum) + High Sierra (logikai formátum) (ISO9660) • Audio Track • Mode 1 track számítógépes adatoknak # • Mode 2 track $ (tömörített) hang, kép céljára HS Level 1: 8.3 állománynév, 8.0 alkönyvtárnév, alkönyvtármélység max 8; Level 2: nem kötött névhossz; Level 3: fenntartva Mixed-Mode CD: különbözõ track-eket tartalmaz; tipikusan 1. track Mode 1, a többi Audio; CD-Audio lejátszóval lejátszhatóak%
szinkron fejléc másodlagos fejléc felhasználó forrás adatai extra EDC üres extra ECC Σ
"
##$ •
• • • • • • •
Fejlesztések: • Mode 2 track / XA Form 1 szektor számítógépes adatoknak • Mode 2 track / XA Form 2 szektor hang (lásd CD-I), illetve (tömörített) álló- és mozgóképek céljára Form 1 és Form 2 szektorok egy Mode 2 / XA track-en belül is keverhetõek, így az eltérõ típusú adatok egymásba fésülve folytonosan olvashatóak Tömörített audio kicsit gyengébb és CD-Audio-n nem lejátszható Ebbõl a típusból fejlõdött ki a Karaoke-CD Csak XA-s olvasóval mûködik& "63 perces" lemez (636 MByte, 553 MByte' User Data): 1.2 m/s CLV "74 perces" lemez (747 MByte, 650 MByte User Data): 1.4 m/s CLV Definiálva van 512 byte-os (4 logikai blokk / szektor), 1024 byte-os (2 logikai blokk / szektor) illetve 2048 byte-os (1 logikai blokk / szektor) logikai blokk is, de az MSCDEX jelenleg csak a 2048 byte-ost támogatja
Ilyen a legtöbb nem XA-s CD-ROM.
$
Nem terjedt el, inkább Mode 2 XA.
%
Csak némítson!
(747MB) (650MB) (741MB) ! !
12 4
12 4
"
#$
""%
#$
"
"
"
"
4 8 276
'
276
"$
4
"
#% &' #( ) %
* • • • •
Teljes rendszert ír le, Motorola 68000 processzorral ≈ CD-ROM Mode2-XA Form1 & Form2 szektorok A Real Time Operating System (CD-RTOS) rajta van minden CD-I lemezen A drive néhány más típusú lemezt is képes lejátszani • audiojel: ADPCM (lehetõségeket lásd a 5.4. táblázat ban) • képleírás: 360 · 240 pixel, 720 · 240 pixel, ... YUV: 18 bit/pixel, max. 262144 (=2 ) szín/kép → 194400 byte/kép (360·240 pixel) színpaletta: 3 v. 4 v. 7 v. 8 bit/pixel RGB: (3 · 5 + 1) bit/pixel, max. 65536 (=2 ) szín/kép • animáció: 10000-20000 byte/kép CD-I Full Motion Video (FMV) • videojel: 1.18 Mbps • audiojel: 192 kbps • képleírás: 384 · 240 pixel , 25 Hz ("film mód") dekóder CD-I-hoz külön vásárolandó 18
16
"CD-Plus" trükk: 2 session, 1.: max. 98 CD-DA, 2.: adat track - így már csak a
Ellentétben a Mixed-Mode CD-ROM-mal.
PAL mód: 384 · 280 pixel
2048 / 2352
NTSC mód: 29.97 Hz
V/5
4
12 4 8
A CD-ROM-XA típusban használható szektor típusok felépítése. A 4 byte-os fejlécben az 1. byte a percet, a 2. byte a másodpercet jelenti, a 3. byte a szektorszám, a 4. byte pedig a mód típusszáma.
nem multi-session CD-ROM olvasóknál van gond.
&
12 4 8
5.3. táblázat:
•
#
V/6
•
nem kompatíbilis a White Book Video-CD-vel, ám 1994 januárjától a Philips is áttért a Video-DC formátumra CD-I Ready némely track (tipikusan csak az 1.) index és index közti pregap-ben: CD-I információ (általában rövid kép hanggal, szöveg); asztali CDAudio lejátszó átugorja egyébként minden track Red Book a CD-I lejátszó elõbb beolvassa a szokványosnál hosszabb (182 sec) pregap-et, majd lejátsza a track-et 00
& '( )*+
&, -.)
&, -.)
&, -.)
A CD-I rendszerben használható hangcsatornák jellemzõi. Összehasonlításként feltüntettük a CD-Audio jellemzõit is.
V/7
• • •
01
! . ) /01 44.1 37.8 37.8 18.9 2 )+ 16 bit PCM 8 bit ADPCM 4 bit ADPCM 4 bit ADPCM ! 3 4+ 5 /2 1 - / 74 perc 4.8 / 2.4 9.6 / 4.8 19.2 / 9.6 !62 7 48 9 + -/1 4/2 8/4 16 / 8 ! 3: !62 )4 ;) ! < - / 100 25 / 50 12.5 / 25 6.25 / 12.5
!62 ! 3 4+ 5 /2 1 98 96 60 60 !62 4*. !5 7 LP URH FM KH AM 5.4. táblázat:
+ Átmenet (bridge) a CD-ROM-XA és a CD-I között Mode 1 track nem megengedett Több "session" is lehet rajta; a multi-session kompatíbilis olvasó mindig az utolsót értelmezi! " (az író tud választani), a nem kompatíbilis (és a mai asztali CD-Audio lejátszó) pedig az elsõt Minden session elsõ track-je Mode 2, utána bármilyen; összesen max. 99 track Csak írható lemeznél van értelme több session-nek Multi-volume CD = elõzõ session-re hivatkozás nélküli multi-session CD ,
• • •
, %+
- • • • •
•
Kodak & Philips termék CD-Bridge elsõ alkalmazása CD-ROM Mode 2 XA Form 1 Hybrid CD (= multi-session, de az 1. session már gyártáskor a lemezre kerül) YUV, 3 · 8 bit 6144 · 4096 pixel (Photo CD Medical) 3072 · 2048 pixel (tömörített) → 100 kép 768 · 512 pixel → 800 kép (Photo CD Portfolio) 6000 kép (Photo CD Catalog) Portfolio (rendszer): fényképekkel szinkronban zene (Audio vagy Form 2 tömörített hang track) + grafika + adat lehívható
. ( / 0
1 •
(≠ CD-Video, ami 6 perc (analóg PAL) kép (LaserVision formátum) + 20 perc hang + speciális CD-V lejátszó, arany színû lemez) • videojel: MPEG-1, 1.1519 Mbps, max. 74 perc • audiojel: MPEG-1, 224 kbps, 44.1 kHz sztereó vagy kéthangú • képleírás: 352 · 240 pixel #, 23.976 Hz $ ("film mód")
Mivel a CD-I-ben nem lehet Mode 1 track.
!
Azt is csak a lemez lezárása után (fixing).
"
Adatként ott is tipikusan csak az elsõ track-et.
#
PAL mód: 352 · 288 pixel
V/8
0 %+
##$ • • • • •
• •
• • •
; 99 << 936
Írható lemezek CD-R = Power Calibration Area + Program Memory Area + ∑session PMA: nem-lezárt session adatai, hogy a lemez kivehetõ és folytatható legyen Session = LIA + PA + LOA LIA: 4500 szektor (1 perc, ≈8.8 MByte); session lezárásakor (finalising) íródik bele a TOC (Track-ek száma és kezdõ-vég pontja); ha egyben a lemezt is lezárjuk (fixing), akkor e tény bejegyzõdik, ha nem, akkor hely foglalódik egy új LIA-nak PA: Pregap% + TrackData + 2 run-out frame + PostGap& LOA: LOA = 6750 üres szektor' (1.5 perc, ≈13.2 MByte), LOA ≠ = 2250 üres szektor (1 perc, ≈4.4 MByte); multi-session olvasó ez alapján találja meg az utolsó session-t "Multi-track" trükk, hogy ne menjen el oly sok hely LIA/LOA-ra: lehet csak új track-eket felírni ugyanabba a session-be (csak CD íróknál mûködik) Kb. 10 mW-os lézer égeti a pit-eket Sebesség megadása: már gyárilag a lemezen
i
i
i
i
1
i 1
2 '33 ' 45676 76 8+7 59: • • •
Philips & Sony & 3M fejlesztés "high density" 7.4 GByte Dupla rétegû struktúrák
• •
&= ;!+! → >>>>>>>>>>> ;). 5 9 ↓ ,AB %%# 7 & & ,! 7
i
Hitachi & Matsushita & MCA & Pioneer & Thomson & Toshiba & Time Warner fejlesztés "Super density" 10 GByte
$
PAL mód: 25 Hz; NTSC mód: 29.97 Hz
%
Audio-audio track-ek között nem kell, adat-adat: 150 szektor (2sec), eltérõ szomszéd track-ek
?
√ √ √ √
@7@ & 7 & ,AB %%# !) &=B
!
150 szektor (2 sec), csak akkor kell, ha a szomszédos track-ek típusa eltér.
'
Kompatibilitási okból hosszabb az elsõ.
! ! → D >>>>>>>>>> & &=B C( & . 7 )4+2 ↓ E & √ . & √ √ √ √ &=B √ √ . C( & √ √ . E & F GE √ √ . &, √ √ √ . &, H &E
V/9
(1): ha a (z elsõ) session még nincs lezárva (2): ha az utolsó session üres (3): ha az utolsó session nem üres
között 225 szektor (3sec).
&
& ,! 7
1 darab Mode 1 adat track + max. 98 audio track
V/10
&,
&,6&E
√
√
√ √
√