Rip *** INFORMÁCIÓELMÉLETI ALAPOK
A KOMMUNIKÁCIÓ A szó latin eredetű, magyar jelentése: közlés. Kicsit általánosabban magát a közlésfolyamatot értjük alatta, melynek szereplői: az adó és a vevő, valamint a csatorna (amely tulajdonképpen az adó és a vevő közti út)... Attól függően, hogy a szereplők kifélék-mifélék, szoktunk beszélni interperszonális (azaz: személyek közötti), illetve tömegkommunikációról (mint az újságok, a rádió, a tévé). A kommunikáció jellege alapján megkülönböztetjük a verbális (nyelvi eszközökkel történő: beszéd, írás*) és a nonverbális (gesztus, mimika, testbeszéd) eseteket.
Az interperszonális kommunikáció Alappéldánk egy verbális példát szemléltet (ez a leggyakoribb): Gondolat-2
Gondolat-1
Adó
Vevő
Első ábránkon egy egyszerű kommunikációs lánc látható. Az adónak valamilyen gondolata támad, és úgy véli, hogy ezt megosztja a vevővel, akiben - jó esetben - ugyanolyan, vagy hasonló gondolatot vált ki. Az a hullámos nyíl (a csatornán) maga az információ, amely a közleményben van "elbújtatva". Gyanúsan egyszerű, cseppet sem bonyolult ez az egész... Valóban: ez még kétségbeejtően primitív, nem mond semmit sem az adóról, sem a vevőről. Pedig kellene. Nézzük csak meg tüzetesebben! Gondolat-1
Gondolat-2
beszéddé alakít
beszédet megért
Adó
Vevő
* Vannak olyan szakírók, akik alapfeltételként fogalmazzák meg a visszacsatolás szükségességét. Az általunk vázolt esetet ők nem tartják kommunikációnak. (Az írást sem!)
Rip
GAMMA (4.0)
1
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az ábra új elemei láthatóvá teszik, hogy a közlésfolyamat bizony munka, nem is akármilyen! A gondolatokat "átfogalmazni" beszédre, valamint az ilyen beszédet megérteni -- elég bonyolult tevékenység... A gondolatok beszédre való lefordítása, illetve a hallott beszéd visszafordítása "gondolati nyelvre": ez a kommunikáció központi kérdése. A beszédképzés (és hallás) fiziológiai alapjaival nem foglalkozunk; feltételezzük, hogy a kommunikációs lánc mindkét szereplője minden szempontból megfelelően működik e tekintetben. A mindennapi életben, amikor emberek kommunikálnak emberekkel - még egy fontos gondolati elem szerepel a láncban: hogy mit is tud - vagy gondol - az adó a vevőről, és viszont. Ez a jelenség az úgynevezett metakép*. A metaképben szervezi egységbe a két kommunikációs partner az egymásról kialakult véleményét, jellegükre nézve ezek tehát képzeti modellek. E modellek megléte - nyilvánvalóan - befolyásolja a közlés folyamatát, hiszen másként beszélünk egy barátunkkal, és megint másképp egy olyan emberrel, akiről tudjuk, hogy "akkor is hazudik, ha kérdez"... Ha meg akarjuk fogalmazni, hogy milyen funkciója van a metaképnek, akkor a válasz egyszerű: a gondolato(ka)t megszűri, hogy minél jobban megérthetőek legyenek a másik félről alkotott gondolati képet is figyelembe véve. Ugyancsak szűrő hatása van a beszédre való le- és visszafordításnak: nyilvánvaló, egy adott nyelvi szókincs is szükséges ahhoz, hogy megfelelően, a félreértés minél kisebb veszélyével tudjunk kommunikálni. A félreértés, a meg nem értés a legnagyobb probléma, ami a közlésfolyamatban jelentkezhet. Ennek elkerülésére mindent meg kell tennünk, hiszen akkor a mi gondolatunk helyett egy olyan gondolat születhet a vevőben, ami nem is hasonlít a mienkére... Ráadásul a valóságos életben a kommunikációs csatornán mindig van valamilyen zavaró hatás, aminek a neve: zaj. Gondolat-2
Gondolat-1 metakép a VEVŐ-ről
metakép az ADÓ-ról
beszéddé alakít
beszédet megért
Adó
Vevő
Zaj Ez az ábránk már elfogadható árnyaltsággal próbálja megjeleníteni a valóságos közléshelyzetet (ne feledjük, hogy verbális és interperszonális esetről van szó). Jegyezzük meg, hogy a kommunikáció iránya mindig az adótól a vevő felé mutat. Ezen az sem változtat, ha "felelgetős" a kommunikáció (ezt dialógusnak hívjuk). Ilyen esetben a szerepek megcserélődnek, az addigi adóból vevő lesz -- de az információáramlás iránya állandó marad, az adótól a vevő felé mutat. Jó esetben ilyenkor működik a visszacsatolás (feedback). *
meta - szóösszetételekben valamin való túllétet, valami felettséget jelent Rip
GAMMA (4.0)
2
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Kommunikációink során érdemes kerülnünk a "panelekből való építkezést", a közhelyességet, hiszen csak ekkor lesz a kommunikáció egyedi, csak ránk jellemző. Ebben a témakörben Ilf-Petrov: Tizenkét szék című könyvéből választottam elrettentő példát, az Emberevő Ellocska fejezetből. [O1] Itt a "panelek" ugyan abszolút egyediek, de az életre való reagálás közhelyessége az "elrettentő". Hozzá kell tegyük, hogy a - nyelvi - panelek azonban nagyon sokszor segíthetik is a kommunikációt (pl. az időjárás, mint téma)... Az eddigiekben csupán a verbális kommunikációt tárgyaltuk, de - természetesen minden érzékszervünk alkalmas arra, hogy környezetünkből közléseket fogadjon: a szagok, az ízek, a tapintás szerepe a vizuális (szemmel érzékelhető), vagy auditív (füllel hallható) információfelvételhez képest jelentősen visszaszorult, az intimszférában van jelentőségük, de ott aztán nagy. Az élővilágban azonban se szeri, se száma az ízleléssel, szaglással, tapintással megvalósuló kommunikációs helyzeteknek, de ezek ismertetésétől a terjedelem korlátai miatt el kell tekintenünk. Az érzékszervek szerepe a közlésfolyamatban kiemelt jelentőségű. Nemcsak nyelvi eszközökkel kommunikálhatunk. Egy simogatás, vagy egy kellemes illatú dezodor kommunikációs helyzetet is teremthet, szavak nélkül is megérthetjük egymást. Ám általában nem ez a gyakoribb. Sokkal többször találkozhatunk olyan helyzettel, amikor a nyelvi eszközökkel elmondottak alátámasztására, netán gyengítésére használjuk a nonverbális kommunikációt. Pl. az arckifejezésünket ("arcokat vágunk", biggyesztjük az ajkunkat, mosolygunk, kacsintunk, stb.), a mondanivaló nyomatékosítására mozgathatjuk a kezünket (gesztikulálunk). A szakirodalomban ezt metakommunikációnak szokás nevezni. Testünk tartását, ahogy állunk, ülünk, ahogy kezünket pl. a zsebünkben tároljuk, stb., értő vevő mindig megfigyeli, s ebből az általunk elmondottakra nézve következtetéseket tud levonni. Tulajdonképpen nem is az általunk közölt információra, hanem a róla kialakított metaképünkre nézve kap felvilágosítást. A szakirodalom az ilyenfajta kommunikációt testbeszédnek (body-language-nek) hívja. Érdemes figyelni ezekre a - látszólag jelentéktelen árnyalatokra, ugyanis hazudni szóban (verbálisan) nagyon könnyű; de testünknek sokkal nehezebb parancsolni. Az Internet megjelenése kapcsán a verbális (de írásos) kommunikáció során - pl. beszélgetőcsatornákon, IRC-n, v. levelezéskor - nagyon zavaró tud lenni, hogy a metakommunikációs elemek hiányoznak a "társalgásból". Erre vezették be a kis vigyori :-) , vagy bús :-( pofákat, a smiley-ket. Használatukkal bizonyos hangulati elemeket is bele tudunk csempészni a csupán írásjelekkel zajló kommunikációba. Itt említjük meg azt, hogy a hálózati "ismerőseinkről" alkotott metaképünk sokszor borzasztóan hiányos, vagy nincs is!!
Az írás Fontossága miatt nem mellőzhető, hogy a rögzített beszédet, az írást az előző említésen túl is részletezzük. A fejlődés hatására napjainkra szinte kizárólagossá vált a hangírás, amikor a beszédhangoknak egy-egy jel (betű) felel meg. Ezekből a jelekből "rakjuk össze" a szavakat, a mondatokat, ill. a legnagyobb egységet, a szöveget.
Rip
GAMMA (4.0)
3
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Természetesen ismerünk manapság is olyan írásokat (Kína, Japán), ahol nem hangokat, hanem fogalmakat rögzítenek egy-egy jellel. Ezek az ún. ideogramok. Számunkra meglehetősen idegennek tűnik ez az alapelv, s talán nem lesz haszontalan a Függelékben Clavell: A sógun c. könyvéből az a részlet, amelyben a főhőst a japán írásra, annak alapelveire tanítják. [O2] Az írás az egyetlen kommunikációs lehetőség bizonyos esetekben: ilyen pl. a lábadozása alatt beszélni nem tudó Zemlényi Zoltán - akit 15 éves korában ütött el egy autó HOPPÁRÉZIMI! könyvében publikált "kommunikációs táblája" is. Sérülése miatt a kezét sem tudta használni. A táblázat, mint látható, Zoltán egyfajta "alapszókincsének" elemeit tartalmazza.
A tömegkommunikáció Ebben az esetben az adó és a vevő között vagy nincsen "élő" kapcsolat (ennek kiváló példája lehet ez a könyv is), ennek ellenére a kommunikáció - mivel a vevőnek a közlésfolyamat során gondolatai támadnak - rendben megvalósul, célját eléri. Vagy nem egy, hanem több vevő működik. a helyzet vonatkozik a rádió-, vagy tévéadásokra, illetve az újságokra (magnókazettákra, CD-lemezekre, CD-ROM-okra, stb.) is. Ilyen esetben az adás időben is elkülönülhet a vételtől, de az eredmény ugyanaz marad. Az adónak annyi hátránya van az interperszonális helyzethez képest, hogy viszonylag gyenge - és nem is igazán gyakori - a vevő visszajelzése arról, hogy egyáltalán "vette-e" a közlést. Az iskolai tanóra közléselméleti szempontból egy tömegkommunikációs helyzet, annak ellenére, hogy az adás és a vétel egyidejű.
A tömegkommunikációs közléshelyzetben az adótól a vevőig terjedő út (a csatorna) egy más nevet kapott: ez az ún. médium*; a média ennek többesszáma. Átvitt *
latin eredetiből származtatva köztességet, közvetítőt, közeget jelent Rip
GAMMA (4.0)
4
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
értelemben ez utóbbival szoktak hivatkozni a tömegkommunikációs eszközökre (sajtó, rádió, tévé). Abban az esetben, ha több érzékszervünk, több szinten kap közlést, akkor szokás használni a multimédia kifejezést is.
AZ INFORMÁCIÓ Az eddigiekből is kiviláglik, hogy nem is olyan egyszerű a helyzetünk, ha információhoz akarunk jutni: a kommunikációban az információ ugyan valahol ott van, de kinyerni onnan nehéz...
Zűrzavar az információ szó körül Az informatika táján egyre inkább megszokottá kezd válni számunkra az, hogy az alapfogalmak terén - enyhén szólva - sok a megnevezésbeli (értelmezésbeli) különbség. Csoda lenne, ha az "információ" és az "adat" fogalmánál nem ezzel találkoznánk. A köznyelvi gyakorlatban valamennyien "érezzük" ezt a fogalmat - ki így, ki úgy sőt: használjuk is; ez azonban korántsem jelenti azt, hogy tisztában is vagyunk azzal, hogy mit jelent. Éppen ezért a köznyelv felől fogunk közelíteni. Üssük csak fel a Magyar Nyelv Értelmező Szótárát!) információ: l. Vmely személyre v. ügyre vonatkozó tájékoztatás. 2. Értesülés. 3. (Tud.) Hír. Ígérete ellenére bizony még a harmadik jelentés sem elégíti ki tudományos igényeinket! Mindössze annyival lettünk okosabbak, hogy valamifajta közléssel van dolgunk: ahhoz, hogy információhoz jussunk, valakinek (vagy valaminek) azt közölnie kell velünk. Mi nem elégszünk meg ennyivel, megpróbáljuk jobban körüljárni, pontosítani a szó jelentését. Kiindulásként tekintsük az alábbi példamondatokat (közléseket): a) "Fáj a fejem." Ebben az esetben arról van szó, hogy valami "fej" nevű dolog (amely a közlőé) fáj. b) "Budapesten 1988-ban összesen 660 mm csapadék esett." Ez arról tájékoztat, hogy valahol, valamikor, valami történt (azaz: "Budapesten", "1988ban", "csapadék" és "esett"). Ám, ha a tartalmi elemzés szempontjait finomítjuk, akkor nem mehetünk el amellett, ami a "csapadék" szóra vonatkozik: tudniillik, hogy ez a csapadék "valamennyi". A közlésekben tehát ismeretek vannak, amelyeket arra szánunk, hogy valaki valamilyen célra - hasznosítsa azokat. Nézzük csak: milyen esetekben hasznosíthatók ezek az ismeretek?
Rip
GAMMA (4.0)
5
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
a) eset Hasznosíthatja-e ezt egy olyan - értelmes - élőlény (mondjuk: egy idegen naprendszer lakója), akinek nincs ugyan feje, de megérti, amit mondunk? Vagy: mit kezd ezzel az ismerettel ugyanez a földönkívüli, ha feje ugyan van, de életében sohasem érzett fájdalmat? (Persze, ez a kiagyalt "földönkívüli" valószínűleg ebből a - magyar nyelven elhangzott - neki "vartyogásnak" tűnő valamiből semmit sem értene meg. Akkor ez számára nem hordoz ismeretet, tehát csak egy "hanghalmazt" hall -- már, ha egyáltalán van érzékszerve [füle], amely a hangokat érzékeli.) Az a) közlés tartalmát csak olyasvalaki tudja hasznosítani, aki a fejfájást valaha is érezte, hiszen a közlő nem magyarázkodik, mi is a fejfájás, mert feltételezi, hogy a közlés címzettjének vannak ilyen irányú tapasztalatai. Mivel biológiai felépítésük hasonló, a vevő ezek után mindent ért. Az esetek többségében - a köznapi jellegű közléseknél - ez így is van. Mert működik. b) eset Nyilvánvalóan nem hasznosítható ez az ismeret annak számára, aki: - valamelyik tartalmi egységet ("Budapest", vagy "csapadék") nem ismeri; - ha a "csapadékot" ismeri ugyan, de fogalma sincs a mm-ről. Ez a mondat egy átlagosan művelt ember számára sem mond többet, mint azt, hogy: "Budapesten 1988-ban esett csapadék". A meteorológusok, vagy a természetföldrajz jó ismerői - természetesen - előnyben vannak e közlés hallatán, hiszen ők tudják, hogy ez tulajdonképpen mennyi vizet is jelent; tisztában vannak a budapesti, a magyar és nemzetközi átlagokkal, stb. A közlés felfogása után ők rögtön hasonlítanak, mérlegelnek, elgondolkodnak (ha ezt egy szóban akarnánk kifejezni: értelmezik a közlést). Érdekesség, hogy a közölt ismeret egy furcsa tulajdonságot rejt magában: egy bizonyos pontig mindenki számára ugyanazt jelenti, végeredményben azonban mindenki számára mást mond. Mivel ezernyi szállal kötődik a világról alkotott korábbi ismeretekhez, és ezek az ismeretek meg a személyhez kötődnek, még két, teljesen hasonló ember számára sem jelenthetik ugyanazt.
Szintaxis* és szemantika Ahhoz, hogy a közlés hasznosítható, a benne hordozott ismeret átvehető legyen, az ismeretet fogadónak érzékelnie kell, valamint fel kell fognia a közlést. Világos, hogy nem tudja hasznosítani a fenti közléseket az, aki nem ismeri a vonatkozó szintaktikai szabályokat (egyszerűbben kifejezve, és példáinkat nézve: aki nem tud magyarul. Ebből is kitűnik, hogy nem kell ehhez rögtön a Földön kívülre mennünk!) Előbbi példamondatainkat rendszereknek tekinthetjük, mivel egymással összefüggő elemekből épülnek fel. Keressük meg ezeket az elemeket!
*
A szintaxis (alaktan) a nyelvtannak a szavak képzésével és ragozásával foglalkozó része
Rip
GAMMA (4.0)
6
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
A két kijelentés azonos szerkezetű: az a) példamondatot latin betűk (alfabetikus karakterek**), illetve a b) kijelentést számok és betűk (alfanumerikus karakterek) alkotják. De tekinthetjük a mondatok szavait is. Ezek a rendszer elemei. A rendszer leírásához azonban az elemek közötti összefüggés meghatározása is szükséges. Mi határozza meg azt, hogy milyen formában csoportosítjuk ezeket a karaktereket? Egyrészt - a szavakra vonatkozóan - a magyar nyelv nyelvtani szabályai (ezt hívják szintaxisnak); másrészt - a számoknál - a matematikai szabályok. Ezek a közlés szerkezeti (formai) követelményei, szintaktikai szabályoknak hívjuk őket. Nézzük most meg azt az esetet, amikor a szintaxissal semmi baj, nyelvi szempontból tökéletesen megformált, "csak" éppen értelme nincsen. Ez az ún. "halandzsa". Például: Ingyom-bingyom táliber, tutáliber, máliber... (már tudniillik, hogy hová megy a kisnyulacska). Meg ilyenek. Lewis Carroll jópár ilyen, halandzsa-verset is írt. Egyik első versszakát közlöm, két magyar költő fordításában. Jabberwocky
Szajkóhukky (Weöres Sándor)
Twas brillig, and the slithy towes Did gyre and gimble int he wabe; All mimsy were the borogoves, And the mome rats outgrabe
Volt a brillős, a csuszbrugó, gimbelt és gált távlengibe, minden mimicre purrogó, mómája ingibe.
A gruffacsór (Tótfalusi István) Nézsonra járt, nyalkás brigyók turboltak, purrtak a zepén, nyamlongott mind a pirityók, bröftyent a mamsi plény.
Annak ellenére, hogy minden rag és képző a helyén van -- nem nagyon értelmezhető(ek) a közlés(ek). [O3] Bár a közlés tartalma függ a szavak, kifejezések mondaton belüli sorrendjétől, szerepétől is, a mondatszerkesztés (grammatika) szabályainak betartása még nem elég. Gondoljunk csak egy szövegszerkesztő helyesírásellenőrzőjére! A közlésnek még meg kell felenie a jelentéstani (tartalmi) követelményeknek is, ezeket idegen szóval szemantikai szabályoknak nevezünk. Mit is jelent ez? Legtöbbször egyszerűen annyit: ha megszólalunk, akkor legyen értelme, veleje annak, amit mondunk. A vevőnek - a közlő szándékainak megfelelően - meg kell értenie a közlést, ami csak akkor történhet meg, ha a közlés címzettje ismeri az ehhez szükséges szemantikai és szintaktikai szabályokat, azaz a közlésben szereplő szavak jelentését, és az összefűzésük módját.
Adat és információ Adatnak nevezzük a tények és elképzelések nem értelmezett, de értelmezhető formában való közlését. Az "értelmezhető" kifejezésen a számunkra ismeretes szintaktikai és szemantikai szabályoknak való megfelelést, mint tulajdonságot (alapfeltételt) kell érteni. Az értelmezhető ismeret tehát mindenki számára adat*. **
Itt jelek értelmében használatos, pontosabb meghatározása a Logikai és fizikai adatszintek részben
Rip
GAMMA (4.0)
7
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Ámde! Lehetnek olyan emberek, akik ezt az adatot más -- addig megszerzett -ismereteikhez tudják (és akarják) kötni. Tudják, mert rendelkeznek a kapcsolódó ismeretek halmazával. Akarják, mert szükségük van rá. Ezért a közölt ismeretet gondolati - logikai és matematikai - műveleteknek vetik alá. Információnak nevezzük az adatokon végrehajtott gondolati műveletek értelmezett eredményét. Ilyformán az adat a gondolati művelet tárgya, az információ pedig az eredménye. Az információ tehát értelmezett ismeret. Nem maga az ismeret, hanem annak az emberi gondolkodási folyamatnak az eredménye, amely az ismeret közlését követi. Az a földönkívüli, akinek feje ugyan nincs, de érti azt, amit mondtunk, természetesen értelmezni is tudja fejfájásra vonatkozó közlésünket; számára tehát e közlés információ. Ha a fejnélküli, de fájdalmat nem érző földönkívülivel tudatjuk ugyanezt, akkor mivel a közlés hasonlóságot tételez fel - ez csak adat. ("Hát persze!" - gondolhatná magában - "Feje is van, fáj is: nyilván azért van a feje, hogy fájjon. Ez csak természetes...") A közlés tehát hasznosult ugyan, de nem azon a szinten, ahogy a közlő szerette volna: ő információt szeretett volna átadni, de - rajta kívülálló okokból - az értelmezés elmaradt, ezért a közlés címzettje csak adathoz juthatott. A b) esetben, ha valaki nem tudja, hol van Budapest, vagy, hogy mi is az a csapadék, akkor egy olyan "adatsaláta" birtokába jut, amely az eredetileg közöltekhez képest csak hiányosan értelmezhető. Nézzük végig - sorrendben - a rendszer (példamondat) elemeit (a szavakat), s szedjük össze azok minden fontosabb lehetséges jelentésárnyalatát! Budapest -- Magyarország fővárosa, egy földrajzi hely, amelynek kiterjedése (mérhető területe) van. A fővárosi jelleget azért kell hangsúlyoznunk, mert a kiterjedés - azaz, hogy Budapest mettől-meddig tart is tulajdonképpen - az ún. "közigazgatási határ"-tól függ; s ezt nem természetföldrajzi elemek, hanem államigazgatási szempontok határozzák meg elsősorban. 1988 -- ez egy évszám (az idő számításának történelmi kialakulásától most tekintsünk el), mégpedig az időszámítás kezdete - Krisztus születése - óta eltelt évek közül az ezerkilencszáznyolcvannyolcadik (sorszámnév!) időpont; de ne felejtsük el azt sem, hogy - mivel az év az időnek egyik mértékegysége is jelenti a január 1-je 0 óra 0 perctől december 31. 24 óráig terjedő időtartamot is (amennyi idő alatt a Föld a Nap körül egy teljes fordulatot tesz). 660 mm -- ez egy méret, mégpedig valamilyen hosszúságé; a megadásban az SI-rendszer szerint eljárva, a hosszúság mértékének - a méternek - az ezredrészét fogjuk felmérni. A hozzá rendelt - tízes számrendszerbeli - szám pedig egy mennyiséget jelölő jel. (Itt az a jelentése, hogy ennyiszer kellett a millimétert, mint távolságot egymás után felmérnünk ahhoz, hogy azt a "valamilyen" hosszúságot pontosan meghatározzuk.) csapadék -- olyan meteorológiai jelenségek gyűjtőneve, amelyek a víznek valamilyen halmazállapotú előfordulásai a levegőben (az atmoszférában); általában folyékony halmazállapotra számolják át. esik -- a gravitációs térben egy nagyobb helyzeti energiájú ekvipotenciális felület felől ("felülről") egy alacsonyabb helyzeti energiájú ekvipotenciális felület (a tömegközéppont) irányába ("lefelé") elmozdul valami; ezt a mozgást külső akadály nem korlátozza, tehát egyenletesen gyorsuló. *
Mások az adatnál alapvetőnek tekintik a rögzítettséget; ez itt fölösleges megszorítás lenne
Rip
GAMMA (4.0)
8
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az egyes elemek jelentésárnyalatából most megállapíthatjuk a rendszer jelentését: egy bizonyos területen egy adott időtartam alatt 660 mm hosszú víz jut szabadeséssel a talajra. Nem akar ez összejönni... Minden rendben van, csak a "660 mm" okoz problémát. Mert ugye: hogy is lehetne térfogatot hosszúságegységgel mérni? Ez az eset: a köznapi tudat szintje (a miénk). Mi lehet az a "többlet", amely a meteorológus számára ebben a közlésben benne rejtőzik? A meteorológiai állomáson egy olyan edényben fogják föl a hullott csapadékot, amelynek oldalán beosztás van, ami közvetlenül megmutatja: ha ez a folyékony - víz egy négyzetméternyi felületre esett volna (és nem folyna széjjel), akkor annyi milliméter magasan állna (az pedig már az általános iskolás tanulmányokból is tudható, hogy egy 1 mm "magas", 1 m2 alapú négyzetes oszlop térfogata pontosan 1 dm3, azaz: 1 liter). Az "1988-ban összesen 660 mm" csapadék tehát az év folyamán lehullott összes eső, hó, havas eső, stb. mennyiségét adja meg, literben (egy négyzetméterre). Hogy ez most sok, vagy éppen kevés, ez attól függ. Ha az ember nyakába zúdul váratlanul, akkor – szerintem – határozottan sok. Ahhoz viszont, hogy szörfözni lehessen rajta, – nézetem szerint kevés. Már ebből is látszanak az értelmezés bonyodalmai, ezért nem is folytatjuk: aki a meteorológiai értelmezésre kíváncsi, az utánanézhet (pl. egy földrajzkönyvben, és rájöhet, hogy ez az év - Budapesten - egy viszonylag szárazabb év volt)... Ahhoz, hogy az adatból információt nyerhessünk - mint tudjuk -, értelmeznünk kell, és ez nem mindig könnyű feladat. Többször előfordulhat, hogy az adat - önmagában értelmezhetetlen; ezért, ha értelmezni akarjuk, szükségünk lesz arra, hogy az összefüggések kiderítése érdekében az adatokat valamilyen szempont szerint csoportosítsuk. Ezzel tulajdonképpen nem "értelmezünk", csak előkészítjük az értelmezést. E folyamatot szokás adatfeldolgozásnak nevezni, általánosságban. Sokszor halljuk-olvassuk az "adatfeldolgozás" helyett az "információfeldolgozás" kifejezést. E kifejezés alapvetően helytelen. Miért? Definíciónk szerint az információ az adatban megtestesülő ismeret értelmezésének eredménye, mindenképpen az értelmező személyéhez kötődő fogalom. Mivel végeredmény, ezért további "feldolgozása" szükségtelen, fölösleges, és a valóságban nem is történik meg. Akkor pedig "információfeldolgozás"-ról beszélni értelmetlen. Nem az információt dolgozzuk fel, hanem az adatot.
Rip
GAMMA (4.0)
9
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Feladatok: 1. a) Hernádi Miklós: Közhelyszótár c. munkájából gyűjts legalább öt közhelyet, amit már te is használtál valamikor! b) Sokan azt állítják, hogy a giccs és a közhely "rokonságban vannak". Összegyűjtendő legalább 5 (vizuális) közhely, ill giccs! c) Állítsuk össze (az O1 nyomán) Paréj Péter "nyelvi paneljeit"! Legalább 10 megemlítése szükséges. 2. Írj saját halandzsaverset!
Értelmezd a Weöres-féle első versszakot!
3. Gondold végig, hogy milyen szempont alapján választasz dezodort (parfümöt)! 4. Találjon ki az Olvasó legalább 2 extrém "kommunikációs helyzetet"! ("Extrém" alatt olyan érzékszervekkel történő kommunikációt értünk, amely nem szerepel a könyvben.) 5. Mi a véleményed: mindig, minden tanóra "tömegkommunikációs helyzet"-e?! Mi teszi azzá? 6. Tételezzük fel, hogy - eléggé el nem ítélhető módon - miközben vevők vagyunk, az adóval úgy kommunikálunk, hogy kényelmesen - hm - "eltehénkedünk". Milyen következtetésre juthat ennek alapján metaképünkről az adó? 7.: Néhány "szmájli", mutatóba: Készíts ehhez hasonló újakat!
:-P --- ez nyelvet öltött; ;-) --- kacsint; :-o --- csodálkozik; :-] --- ez egy fapofa.
8. Nosza, kedves Olvasó! Használja csak a fantáziáját! Adjon értelmet a Weöres-fordította első versszaknak!
Rip
GAMMA (4.0)
10
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
9. A kép Verne: Várkastély a Kárpátokban c. könyvének illusztrációja. Jól mutatja azt, hogyan gondolták el kb. 120 évvel ezelőtt a majdani "multimédiát". Orth báró ebben a formában tudta csak megjeleníteni tragikus halált halt énekesnő-szerelmét. Valahol a képen megtalálható a vetítő (laterna magica) és az - akkor már ismert - hangkeltő eszköz (a fonográf) is... Keresd meg ezeket a képen! Miben tévedett a rajzoló, és miben jósolta meg helyesen a jövőt? Mit gondolsz: a képen ábrázolt - kivetített - női alak vajon álló- (dia-), vagy mozgókép lehet? 10. A mindennapi kommunikáció során nagyon gyakran használunk (mobil)telefont eszközül. Állíts össze legalább 5, a (mobil)telefonálásban használt "dallamfordulatot" -- közhelyet, vagy udvariassági szólamot!
Rip
GAMMA (4.0)
11
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
MÉRJÜK MEG AZ INFORMÁCIÓT! Az információ matematikai megközelítése Az eddigiekben az információfogalom meghatározásához teljesen általánosan, a kommunikáció-, megértés- és jelelmélet (szemiotika) megközelítési irányából jutottunk el. Ezt most sürgősen tegyük félre! A következőkben kizárólag a mennyisége, mérhetősége érdekel bennünket. Eltekintünk attól, hogy jelentést hordoz, hiszen az egyes értelmezők által az adaton végzett gondolati (értelmezési) munka nagyon nehezen lehetne mérhető, mivel a gondolkodási stílusok különbözők - csakúgy, mint azok az emberek, akik gondolkodnak. A mérésről eddig azt tanultuk, hogy egy ismert valamivel (ez a mértékegység) összehasonlítottuk az ismeretlen megmérendőt. Itt sajnos nem áll a rendelkezésünkre mértékegység... Azonban van a mérésnek egy másik definíciója is: STEVENS szerint a mérés nem más, mint számok hozzárendelése a való világ objektumaihoz. Tehát, amikor valakinek a testmagasságát mérik: hozzárendelnek egy számot. Ahhoz azonban, hogy az információ egységét is szabatosan meghatározzuk, segítségül kell hívnunk az információelméletnek azt a részét, amely a kommunikáció matematikai elméletével foglalkozik. Az elmélet megteremtője Claude Elwood Shannon, aki felismerte: az információ mennyiségét számmal lehet jellemezni (hasonlóan ahhoz, ahogyan számmal lehet kifejezni a távolságot, az időt, a tömeget, a hőmennyiséget, a testmagasságot, stb.).
Segít a barkochba-játék [Ezt a játékot - állítólag - Bár Kochba zsidó hadvezérről nevezték el. Amikor a zsidók i.sz. 135-ben szabadságharcot indítottak a római elnyomás ellen, ő volt a vezérük. Neve azt jelenti: "a csillag fia". A túlerőben lévő római hadsereg ostrom alá vette a várat, amelyet Bár Kochba vezetésével egy kis létszámú, de elszánt helyőrség hősiesen védett. Ezek történeti tények. A játék a nevét onnan kapta, hogy Bár Kochba kiküldött egy felderítőt, kikémlelni a rómaiak táborát; a felderítőt azonban a rómaiak elfogták, és kegyetlenül megkínozták, többek között kivágták a nyelvét. A felderítő megszökött a római fogságból és jelentkezett Bár Kochbánál, beszélni azonban nem tudott, és így szavakkal nem tudta elmondani, hogy mit látott. A vezér erre olyan kérdéseket tett föl neki, amelyekre a megkínzott katona fejbólintással ("IGEN"), illetve fejrázással ("NEM") válaszolt. Így aztán Bár Kochba mindent megtudott a római felderítőtől, amire a vár védelméhez szüksége volt. A baj csak az, hogy e meggyőzően hangzó történetről a forrásmunkák nem tudnak. A legendát valószínűleg az költötte, aki a barkochba-játékot kitalálta, és Bár Kochbáról elnevezte; de, hogy ez ki volt, azt nem sikerült eddig kideríteni. Gyanús, hogy Budapesten keletkezett a század elején, igen népszerű volt, főleg az írók köreiben; Karinthy és Kosztolányi írásaikban többször is említik, s nagy mesterei is voltak e játéknak.]
Célunk, hogy kitaláljuk, amit feladtak a többiek. Az, hogy ehhez mennyi információra van szükség, azzal mérhető, hány kérdés kell a kitaláláshoz a legcélravezetőbb kérdezés mellett. "Kérdés" alatt, persze, a barkochba játékszabályainak megfelelően, olyan
Rip
GAMMA (4.0)
12
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
kérdés értendő, amely igennel, vagy nemmel megválaszolható (azzal a megkötéssel, hogy az "IS" nem megengedett). A kapott válaszokat leírva, és "igen" helyett 1-est, "nem" helyett 0-t írva, a kapott válaszsorozat helyettesíthető egy 0 és 1 jegyekből álló számsorozattal. Ez egy kódolási eljárás, maga a 0 és 1 jegyekből álló számsorozat a kódszó. A kódolással - a továbbiakban még részletesen foglalkozni fogunk. Szemléletesen - de nem pontosan - megfogalmazva: egy tetszőleges információ mennyiségét úgy mérjük meg, hogy a szóban forgó információt átírjuk (azaz: kódoljuk) 0 és 1 jegyekből álló sorozattá, a lehető legcélszerűbb módon (hogy a legrövidebb jelsorozatot kapjuk), és az így kapott jelsorozat - kódszó - hosszával (a számjegyek számával) mérjük. Tételezzük fel, hogy barkochba-játékban Petőfi Sándorra gondoltunk. Lejegyeztük egy játékos kérdéseit, utána zárójelben vannak a válaszok: 1) Személy? 2) Férfi? 3) Ismerem? 4) Él? 5) A XX.sz-ban halt meg? 6) Híres ember? 7) Magyar? 8) Hős volt? 9) Szabadságharcos? (Megjegyezzük, hogy a játékos itt már "gyanított rákérdezni.) 10) Meghalt a szabadságharcban? 11) Verseket írt? 12) Petőfi Sándor?
(Igen = 1) (Igen = 1) (Igen = 1) (Nem = 0) (Nem = 0) (Igen = 1) (Igen = 1) (Igen = 1) (Igen = 1) valamit", csak még nem akart (Igen = 1) (Igen = 1) (Igen = 1)
((már TUDJA!)) ((kitalálta!!))
Tehát játékosunk 12 lépésből kitalálta Petőfi Sándor személyét. A "gyanú" föltámadása után igyekezett "bebiztosítani" magát, tehát még föltett néhány pontosító kérdést. Ezeket nyugodtan tekinthetjük "fölöslegeseknek", legalábbis a mi elemzésünk szempontjából. Az ő számára természetesen korántsem voltak fölöslegesek ezek a kérdések, hiszen, aki rákérdezéskor nem találja ki a föltett feladatot, az veszített a játékban. Ha így nézzük, akkor fölösleges a 4), a 8)-10) közül valamelyik, és a 12) kérdés. (Itt újra hangsúlyozzuk, hogy még nagyon messze vagyunk a matematika által megkívánt szabatos megfogalmazástól, ezért mások véleménye a miénktől a fölösleges kérdések megítélésében jelentősen eltérhet.) Összefoglalva: a Petőfi Sándorra vonatkozó információ megszerzésének útja ez esetben 9 egység hosszú. Ez a mennyiségi meghatározás azonban a barkochba-játék játékosától is függően - nem igazán pontos. Mint tudjuk: az információ a közlést vevő személyétől, annak előzetes ismereteitől nem válaszható el. Ezért a lehető legcélszerűbb átkódolásnál azt a sorozatot vegyük figyelembe, amelyből egy magyar, általános iskolát végzett személy már Petőfire gondol.
Rip
GAMMA (4.0)
13
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Többször, jópár osztályban végigjátszva a "Petőfi-barkochbát", a legkevesebb kérdés 7 egységnyi, a legtöbb 22 egységnyi kitalálási útvonalat eredményezett. A 7 egységnyinek szerencséje is volt, a 22 egységnyi pedig nem célirányosan kérdezett (rossz logikával, figyelmetlenül, vagy érdektelen volt: mindegy). Amikor "csaltunk", azaz kiszűrtük a fölösleges kérdéseket, átlagosan 9-11 egységnyinek adódott Petőfi Sándor barkochba-beli kitalálásának útvonalhossza. ELEJE
VÉGE
"GONDOLTAM VALAMIT!"
- Rákérdezek: PETŐFI?
22 LÉPÉSBEN 7 LÉPÉSBEN 100 %
A BIZONYTALANSÁG ÉRTÉKE
0%
Sajnos, a barkochbában szinte végtelen a kitalálható dolgok száma, ez is bonyolítja a helyzetünket. Mennyivel egyszrűbb lenne, ha pontosan tudnánk, hány lehetőségből kell azt a bizonyos egyet kiválasztani...
Az információ egysége: az elemi információ (a bit) Az információ egysége a bit. Értéke: egyetlenegy, "igen"-nel, vagy "nem"-mel megválaszolható kérdésre adott válaszban foglalt információ mennyisége (ha egyenlő esélyünk van mindkét válaszlehetőségre). NAGYON FONTOS figyelembe vennünk azt, hogy amikor az információnak a mennyiségét akarjuk mérni (azaz: egy számmal kifejezni), akkor szándékosan, és tudatosan figyelmen kívül hagyjuk az információ tartalmának és jelentőségének kérdését - azaz: a jelentését. Arra a kérdésre például, hogy "Kisasszony, szereti Ön a sajtot?" - akár igen, akár nem a válasz -, ugyanúgy 1 egységnyi információt tartalmaz a válaszoló közlése, mint arra a kérdésre, hogy "Kisasszony, akar a feleségem lenni?" Pedig hát a két válasz tartalma és jelentősége egészen más.
Az információ egységének elnevezése azzal függ össze, hogy a kettes alapú számrendszerben felírt szám minden egyes számjegye (mivel vagy 0, vagy 1 lehet) 1 egységnyi információt tartalmaz. A bit (angolul: BInary digiT*) rövidítés magyarul "kettes számrendszerbeli számjegy"-et jelent. Másrészt az elnevezésben még egy szójáték is el van rejtve, hiszen "bit" angolul azt jelenti, hogy valaminek egy kis darabkája, morzsája, tehát a bit: egy "morzsányi információ". Ritkán rövidítik, az átviteltechnikában pl. kis b betűvel.
*
Mások szerint BInary uniT az eredeztetés alapja; Rényi Alfréd nyomán mi nem így gondoljuk
Rip
GAMMA (4.0)
14
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az eddig megismert mértékegységek közül a kondenzátorok kapacitásához hasonlíthatjuk. Ott a töltésmennyiséget, itt az információmennyiséget tároljuk; tehát az információegység egyfajta tárolókapacitást jelöl. Az információ nagyobb egysége a Byte (ejtsd: bájt), amelynek értéke 8 bit. (Gyakran B-vel rövidítik, tehát pl. 1 B = 23 = 8 bit) A számítástechnikában sokszor a B nagyobb egységeit használjuk, amelyet a SImértékrendszer szabványos prefixumainak megfelelően, az azokhoz közelálló bináris hatványértékekkel alakítottak ki. Ilyen pl. a KiB (itt a Ki = 210 = 1024, épp ezért helytelen a "kilo" prefixum használata!), vagy a MeB (ez sem jogosan "mega", mert nem egymillió; hanem 220 = 1048576 B!). Sajnos, azonban ezek a helytelen megnevezések a számítástechnikában rendkívül elterjedtek*. A számítógépek világában kizárólagosan a kétállapotú tárolók váltak be. Eddig emiatt egyértelműen kettes számrendszerbeli (bináris) információegységgel dolgoztunk. (Ezt modellezte a barkochba-játék is.) Pedig van tízes számrendszerbeli információegység is. Ez a decit. Senki sem használja. [Gondoljunk csak bele! Ha a barkochba-játékot tízes számrendszerbeli információegységekre akarnánk értelmezni, akkor pontosan tíz, egyforma értékű információmennyiséget tükröző válaszfajtát kellene kialakítanunk - hasonlóan ahhoz, mikor a szerelmes tépkedi a virágszirmokat: "Szeret? Nem szeret? Szívből? Igazán?" stb. Ez pedig lehetetlen. No, nem csak a megfelelő szavak hiányoznak, hanem a mögöttük levő egyenlő információmennyiségek is...]
Barkochbázzunk a kártyával! Vegyünk egy 32 lapos, ún. "magyar" kártyát. Válasszunk ki ebből egy bizonyos lapot! Hány lépésben tudnánk kitalálni, méghozzá "kibarkochbázni", hogy melyik lapot választottuk? (Természetesen, a legrövidebb úton!) Vajon hány kérdésből tudnánk kitalálni pl. a piros királyt? Radikálisan csökkenthető a szóbajöhető kártyák száma azzal, ha olyan kérdéseket teszünk fel, amelyek egyszerre a lapok felére vonatkoznak. Jegyezzük meg, hogy a kettes számrendszer itt is jelen van: valaminek a fele nem más, mint valami * 2-1! Esetünkben pl. felezi a lapok számát az, ha a szám-figura kérdésre kapunk egybites választ. Tehát legyen a kérdés: 1. Szám?
(Nem = 0)
így maradt az a 16 lap, amelyen számok nélkül vannak az alakok. Ezeknek azonban meghatározott sorrendjük van: alsó - felső - király - ász. Ezt kéne - valahogy - felezni. * Az USA szabványügyi hatósága és az IEC (International Electrotechnical Comission) ennek rendezésére 1999 elején az alábbi - bináris - előtagokat és szimbólumokat fogadta el: kibi- (Ki) = 210 mebi- (Mi) = 220 gibi- (Gi) = 230 tebi- (Ti) = 240 pebi- (Pi) = 250 exbi- (Ei) = 260 Tehát ennek megfelelően pl. egy tárolóeszköz 40 gibibyte-os (40 GiB-os)...
Rip
GAMMA (4.0)
15
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Kérdezhetnénk pl. azt, hogy: 2. Ha sorrendbe rakom, akkor a két szélső közül valamelyik? (Nem = 0) "ugrottak" az alsók és az ászok, még van 8 lap. 3. Ez egy király?
(Igen = 1)
most már sínen vagyunk; csak a színét kellene gyorsan kitalálni a maradék 4 lapból. Itt nem is olyan könnyű olyan kérdést föltenni, amely a zöld - tök - makk - piros négyesből pontosan a felére vonatkozik A "növény?" nem jó, mert csak a piros nem növény, így a kelleténél nagyobb szerepet kapna a szerencse. De jónak tűnik a: 4. Termés?
(Nem = 0) csak zöld és piros lehet! (2 lap.)
Ugyanilyen jó volna a lap színmegnevezése egy szín neve is? (Igen = 1) ugyanazzal az eredménnyel... Kérdezzünk rá: 5. Zöld?
(Nem = 0)
Akkor csak a piros király lehet! Öt kérdéssel kitaláltuk az adott lapot. A pakli színei 2, az értékek pedig 3 bit információt tartalmaznak. Annak, hogy a válasz Igen, vagy Nem volt, nincs jelentősége a kitalálás szempontjából. A fenti gondolatmenet nem volt egészen mentes a jelentéstől, a tetszetős (pl. színre, vagy figurára) való kérdezgetés nélkül is megoldható a feladat. Valahogyan elvontabban: matematikai alapon kellene ezt a dolgot megközelítenünk Induljunk pl. ki a pakli lapjainak számából. Ez, ugye, 32. Sorszámozzuk meg a lapokat, valamelyik sorszám lesz a piros királyé. Tegyük fel, hogy a válaszoló a megkevert pakliban a 13. helyen találja meg a piros királyt - amit, persze, nekünk nem mond meg. Ha mindig azt kérdezzük: a pakli melyik felében van a kérdéses kártya (itt is a felezéses módszert alkalmazzuk, csak most a felezés nem logikai, hanem fizikai szempontok szerint történik); majd a megtalált félpaklit újra megfeleztetve, újra ugyanígy kérdezünk, s í.t., akkor az ötödik kérdésre biztosan azonosítani fogjuk a piros királyt.
Van-e lehetőség arra, hogy az előbb említett 5 kérdést egyszerre feltéve azonosítsuk a keresett lapot? Igen, van ilyen lehetőség. Ehhez azonban egy kis ügyeskedésre lesz szükségünk: a sorszámokat írjuk át bináris (kettes számrendszerbeli) számokra, úgy, hogy a sorszámozást ne 1-től, hanem 0-tól indítsuk.
Rip
GAMMA (4.0)
16
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Így minden kártyalaphoz tartozik egy 5 jegyű bináris szám (az ötnél kevesebb jegyű számokat ötjegyűvé tesszük azáltal, hogy 0-kat írunk az elejére, pl. a 0. sorszámnak 00000, az 1. sorszámnak a 00001 felel meg), valahogy így: sorszám 0. 1. 2. 13. 30. 31.
bináris sorszám kártyalap 00000 makk király 00001 zöld nyolcas 00010 piros alsó ... stb., stb., 01101 piros király ... stb., stb., 11110 tök felső 11111 zöld ász (ez az utolsó, 32. lap.)
Tegyük föl most azt a kérdést, hogy a kitalálandó kártya kettes számrendszerbeli sorszámában egyes van-e az egyes helyiértékeken? Ez az egy kérdés valójában öt kérdés ám! 1. Az első számjegy egyes-e? 2. A második számjegy egyes-e? 3. A harmadik számjegy egyes-e? 4. A negyedik számjegy egyes-e? 5. Az ötödik számjegy egyes-e? Erre az öt kérdésre rendre a "nem; igen; igen; nem; igen" válaszokat kapjuk. A szokásos kódolással 01101 bináris sorszámot kapva (ez a 13.), máris elmondhatjuk, hogy a kártyát 5 bitnyi információ segítségével azonosítottuk! Ezért elmondhatjuk, hogy a magyar kártyapakli - egy lap kitalálása szempontjából - ötbitnyi információt tartalmaz, akár a felezéses, akár pedig a bináris sorszámozásos módszert alkalmaztuk; azaz: akár egymás után, akár egyszerre tesszük föl öt kérdésünket. Mindez, persze, azért mehetett ilyen simán, mert a magyar kártya 32 lapból áll. A 32 pedig éppen az 5. hatványa a bináris alapszámnak, a 2-nek. Ezért kellett pontosan 5 kérdés egy lap kitalálásához (ahogy a matematikusok mondják: ennyi szükséges és elégséges). Más volt a helyzet a Petőfi-barkochbánál: az eddigiek után világos, hogy sokkal célszerűbben tudtunk volna kérdezősködni, ha előre ismerjük, mekkora halmaz elemét kell kibarkochbáznunk. A következőkben két ilyen példát mutatunk be.
Megvizsgáljuk a személyi szám és a személyi igazolványszám információtartalmát Magyarországon minden magyar állampolgár egy 11 jegyű, ún. "személyi számot" kap. Most azt fogjuk megnézni: hány bitnyi információt tartalmaz ez az azonosító? Ehhez
Rip
GAMMA (4.0)
17
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
szükségünk lesz Magyarország lakosainak számára; ez a szám - az eddig megtanultakból világos - egy adat. A KSH adatai szerint 1998-ban Magyarország lakosainak száma 10135000 fő volt. Így tehát itt arról lesz szó, hogy ha valaki egy tetszőleges magyar állampolgárra gondol, akkor mi azt hány kérdésből tudjuk "kibarkochbázni". Ahány kérdés kell ehhez, annyi bit információt fog tartalmazni a személyi szám. A lakosság számát - amelyre a személyi azonosító vonatkozik - mintasokaságnak, vagy mintának hívjuk.
Rip
GAMMA (4.0)
18
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
(Ehhez egy segédtáblázatot is mellékeltünk, amely tartalmazza a 2 hatványait, a 45. kitevőértékig. Az alábbi számítás eredményeit ott ellenőrizhetjük.) Mivel a 10 135000 a 2-nek a 23. és 24. hatványértékei közé esik, ehhez a kitaláláshoz 24 kérdés már elég (ez ugyanis 16 777 216 magyar állampolgárt azonosítana, de a lakosság száma ennél kevesebb). Viszont 23 kérdés kevés lenne, hiszen ennyivel 8 388 608 főnél többet nem tudnánk azonosítani, aminél pedig több a magyar állampolgárok száma. Ezek miatt nem egyaránt nem lenne helyes, ha kérdésünkre akár azt a választ adnánk, hogy a személyi szám információtartalma 23 bit; akár azt, hogy pontosan 24 bit (= 3 B). A helyes válasz: 23 bitnél több, 3 B-nál kevesebb információt tartalmaz a magyar állampolgárok személyi száma. Ha a kérdésünk az, hogy a személyi igazolvány számés betűjele hány bitnyi információt tartalmaz, akkor tudnunk kell a mintasokaság (a 14 évesnél idősebbek) számértékét. A KSH-adat alapján a 0-14 éves korosztály aránya (1998-ban) az összlakossághoz képest 17,3 %, azaz kb. 1753000 fő, ezt levonva az összesből, 8382000 főt kapunk a mintasokaság eredményeként, tehát: 22 bit < személyi igazolvány szám- és betűjelének információtartalma < 23 bit! (...De itt aztán valóban a határon vagyunk, mert a kerekítésből adódó hibalehetőség alapvető eredménybeli eltéréseket is okozhat.) Visszatérve a barkochba szemléletességi korlátaihoz: az Igen-Nem válaszokkal csak egészszámú biteket, bitsorozatokat tudunk értelmezni. Ez azonban a matematikai precizitáshoz csak különleges esetekben (mint a kártyánál) elég.A hasonló feladatoknak van egy "kaptafá"-ja: ha valamilyen mintasokaságot jellemző kód információtartalmát kell meghatároznunk, akkor:
•
A 2 HATVÁNYAI kitevő 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
hatványérték 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864 134217728 268435456 536870912 1073741824 2147483648 4294967296 8589934592 17179869184 34359738368 68719476736 137438953472 274877906944 549755813888 1099511627776 2199023255552 4398046511104 8796093022208 17592186044416 35184372088832
legelőször meghatározzuk a kód által jellemzett mintasokaság értékét; • megnézzük, hogy ez az érték hol helyezkedik el a 2 hatványértékei között; • a két kitevőértéket (amely a bitmennyiségnek felel meg) egy egyenlőtlenség-rendszer két határaként felírjuk. "Egyenlőtlenség-rendszer"-ről azért beszélünk, mert nagyon ritka eset az, amit a magyar kártyával csináltunk, nevezetesen, hogy a mintasokaság pontosan megegyezik a 2 egy hatványértékével...
Rip
GAMMA (4.0)
19
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Feladatok 1. Határozd meg a Posta által használt négyjegyű irányítószámok információtartalmát! (Magyarországon kb. 3080 önálló település van, egy településnek csak egy irányítószám "jár"! -- Ez persze - főleg a nagyvárosok esetében - nem így van, de mi itt nem a pontosságra, hanem az elv bemutatására törekszünk.) 2. Egy könyvtár köteteinek száma 28500. Hány bit információt tartalmaz a könyv raktári száma? 3. Ugyannak a könyvtárnak 2041 beiratkozott olvasója van; az olvasójegyek vonalkódosak. Hány bit információt tartalmaz ez a vonalkód? 4. Egy telefonközpont 50000 készülékszámig bővíthető. Hány bitnyi információt tartalmaznak az ehhez a körzethez tartozó telefonszámok? 5. A matematikából ismert "mérlegelési" feladatok közül a legjellemzőbb: "nyolc egyforma átmérőjű golyó közül az egyik könnyebb. Hány mérésből lehet rájönni, hogy melyik ez?" -Itt is a felezéses módszert alkalmazva három mérés elég kell legyen, hiszen az előzőekben láttuk, hogy 23 = 8 (azaz a mintasokaság 3 bitnyi információt tartalmaz). Vajon legkevesebb mennyi mérés kell az egy "hamis" golyó kiszűréséhez, ha összesen hat; kilenc; tizenkettő golyónk van?
6. Baloldalt látható a vakok által használt Braille-ábécé. Hány bitnyi információt tartalmaz egy Braille-jel?
Rip
GAMMA (4.0)
20
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
"A RÚT KISKACSA": AZ ADAT ANDERSEN egyik meséjében szerepel a rút kiskacsa, amelyik annyira csúnya, hogy a baromfiudvar lakói kigúnyolják; csúnyasága saját maga számára is zavaró. Azonban a mese végén kiderül, hogy azért tűnhetett "csúnyának", mert ő tulajdonképpen nem is kacsa-, hanem hattyúfióka volt. A mese végén diadalmasan szárnyal föl a magasba a csodaszép hattyú. Valahogy így vagyunk azzal a szegény adattal is. Eddig csak a "hattyú-formájú" információt vizsgálgattuk, és nem túl sokat törődtünk azzal a "rút kiskacsával", amelyből lesz: pedig tudhatjuk, hogy minden értelmezhető ismeret (mindenki számára) adat.
Van-e az adatnak egysége? Természetesen: van. A neve: ELEMI ADAT, item (latin kifejezéssel). Mi a könyvben a továbbiakban - a félreértések elkerülésére - az "item" megjelölést használjuk, hogy meg tudjuk különböztetni, mikor beszélünk az adatról általában, és mikor az elemi adatról (konkrétan). Az item szó jelentése: "ugyanúgy, ismét, hasonlóképpen, továbbá". Angolul (pl. könyvelési) tételt, darabot jelent. Az adat egységének elnevezésére azért választották, mert nagyobb egységeket kisebb (elemi) részekre tagolt - régebben, amikor a latin nyelv használata megszokott és általános volt; leginkább a végrendeletekben találkozhattunk vele. Jellegzetes példaként idézzük Villon - 1456-ban írott, "Hagyaték" című versének részleteit (Mészöly Dezső fordításában): " IX.
XI.
... XXXI.
Atya, Fiú, Szent Lélek Isten, S az örök kárhozat felett Győzelmes Szűz Anya nevében Ki által élnek mindenek: Ihol, testálom híremet, Magiszter Vilhelminus Villonnak, Kit méltán övez tisztelet: Meghajtom néki lobogómat.
ITEM, Ythier Marchant uram, Kit nem felejtek el sohasem, Megkapja jóélű vasam (Vagy Lean le Cornu-é legyen?) zálogba csaptam egy helyen, Hol tartozásom nyolc garas... Ezennel úgy rendelkezem: Aki fizet, azé a vas.
ITEM, borbélyom tartsa meg Örökre s végérvényesen Minden levágott tincsemet. Vén csizmám vargámé legyen; S az ócskásé a köpenyem. Mert újnak el nem adhatom: Midőn e holmit levetem, Nagylelkűen rájuk hagyom.
X.
... XXVII.
... XL.
ITEM, az említett leánynak, Ki eltaszított ridegen, Hogy egyre érte öl a bánat, És nincs azóta örömem: Fakó, halott, dermedt szívem Hagyom ereklye-tokba téve. Akármit vétett ellenem, Isten ne verje őt meg érte.
ITEM, a Sorbonne-on kapott Tudós magiszter rangomat Kapják a csóró kispapok, Hogy címemmel, mit nékik ad E lemondó nyilatkozat, Tisztességben megéljenek. Szívem már majd belészakadt, Látván, hogy olyan mezítlenek.
Kelt jelzett év karácsonyán Jó VILLON testamentuma, Ki nem él fügén-datolyán: Szikár, sötét, mint piszkafa; Se birtoka, se holmija: - Megkapták mind a cimborák S ha még maradt egy-két vasa: Holnapra már nyakára hág.
Rip
GAMMA (4.0)
21
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Villon után a neves kultúrtörténész, Ráth-Végh István: "Az emberi butaság" című könyvéből merítettem két példát - olvasmányként [O4]-, ugyancsak az item használatára. Az item olyan adat, amely kisebb részekre már nem osztható föl anélkül, hogy az általa hordozott információ ne veszne el, vagy ne torzulna. Érdemes észrevennünk, hogy az "adat"-fogalmat itt az információfogalomra vezetjük vissza... Szemléltetésül hozzunk föl egy példát: a személyi igazolvány első (fóliával leborított) lapján levő adatokat! Ha ezt a "rendszert" tartalmilag elemezzük: ebben a megközelítésben 3 fő tartalmi elemet különböztethetünk meg (a fényképet, az írásos adatokat és a "kiszurkált" igazolványazonosítót). Nézzük most ugyanezt az elemi adat, az item szempontjából! Tekinthető-e egy itemnek az egész első oldal adattartalma? Induljunk ki az item definíciójából! E szerint ugyanis, ha bármit is elhagynánk belőle, az információ értelmezhetetlenné válna.Az első lap adataiban hordozott közlés értelmezése (információtartalma) az, hogy a Magyar Köztársaság állampolgáraiból egy bizonyos állampolgárt, a személyi igazolvány tulajdonosát, azonosítsa.) Az azonosítás szempontjából (pl. ha igazoltatják a személyi igazolvány tulajdonosát) - az egész első oldal vehető egy itemnek. Ha azonban az információ értékének nem ezt tartjuk, hanem a "valahonnan való visszakereshetőséget", akkor a dolog kicsit módosul. Ehhez a következőket célszerű tudni: a személyi l. lapján levő adat (a személyi igazolvány sorozatjele, ill. száma) a BM Igazgatásrendészet nyilvántartási rendszerének (a személyin kívül még: útlevél, jogosítvány, stb. kiállítása és nyilvántartása) eleme. Figyelembe véve a fentieket, a személyi igazolvány l. oldalának, mint rendszernek az elemeit jelentő adatokat az alábbiak szerint csoportosíthatjuk: 1) vizuális információt hordozó adatok (fénykép, aláírás): ezek a visszakereshetőség szempontjából nyugodtan elhagyhatóak - még ekkor sem vész el (hangsúlyozzuk: a VISSZAKERESÉS szempontjából) információ.
Rip
GAMMA (4.0)
22
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Bár az utcán igazoltató rendőr számára nagyon fontos információ(ka)t hordozhat, jóval többet, mint egy körözési személyleírás - amely szöveges. (Nemhiába mondták a régi kínaiak: "Egy kép: tízezer szó!" Ezért is tettük ezt a könyv címlapjára...)
A fénykép és az aláírás feldolgozásmódja ugyanaz: egy adott mintával való összehasonlítás. (Ez a visszakeresésben nem játszik szerepet.) 2) az egyéb információt hordozó adatok: amennyiben a nyilvántartásban szerepelnek (ezt joggal feltételezhetjük), akkor nem hagyhatók el. Az az adat, amelynek alapján visszakeresünk, nem hiányozhat! Családi név Utónév Leánykori családi és utónév Születési hely
Rákóczi István Péter Gyula
Láthatjuk, hogy ebből a szempontból nézve pl. a személyi igazolvány 1. lapjának előbb felsorolt adatai önállóan is elemi adatoknak, itemeknek tekinthetők. Hozzátéve: a visszakereshetőséget biztosító adatok bármilyen csonkítása alapvetően hiúsítja meg a célt. (Pl. nedvesség érte és elmosódott a családi név egy betűje.) Fárasztó vizsgálódásunk végére érve, szomorúan állapíthatjuk meg azt, hogy az itemet korántsem tudjuk olyan szépen, szabatosan, "matematikai" pontossággal meghatározni, mint a bitet. Ez azért van így, mert az adat nem matematikai, hanem technikaimódszertani fogalom, s az itemet mindig az határozza meg, hogy milyen "rendezőelv" alapján tekintjük egy egységnek. Tehát, hogy milyen logikával próbáljuk szemlélni az egységet. Rendezőelv - még ugyanolyan adatra nézve is - nagyon sokféle lehet, ezért nem is lehet igazán jó megfogalmazást adni arra, hogy tulajdonképpen mit is lehet tekinteni itemnek, azaz: elemi adatnak. Ez tehát attól függ... mitől is?? Elsősorban a megoldandó feladattól és tőlünk...
Logikai és fizikai adatszintek a számítástechnikában Az adat nagyobb egységeire nézve felállítható egy - a többi mértékegységnél is megszokott - rangsor, csak itt két dologra kell figyelemmel lenni: egyrészt a logikára, melynek mentén az adatot egységként kezeljük; másrészt az eszközre, amely ezt az adatot rögzíti. Eszerint szokás beszélni a számítástechnikában logikai és fizikai adatszintekről (adathierarchiáról). Logikai adatszintek Fizikai adatszintek adatbázis (adat)állomány [file] rekord item (mező)
<- - - - - - - -> <- - - - - - - -> <- - - - - - - ->
data set blokk karaktersorozat karakter
Kezdjük az elején (az alján)!
Rip
GAMMA (4.0)
23
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Adatokat a géppel legegyszerűbben a billentyűzetről közölhetünk; egy billentyű, vagy gomb lenyomásakor megjelenik a képernyőn a leütött billentyűnek megfelelő szám, betű, vagyis egy karakter. Mivel "félgomb", vagy "félbillentyű" nincs - az sem működik, hogy a billentyűt "csak félig" nyomjuk le: ui. vagy megjelenik valami a képernyőn, vagy nem -, ennélfogva a karakternél kisebb fizikai egységet nem tudunk találni. A logikai adatszinteknél az item szinonímája a mező. (Ilyen lehet példának okáért egy osztálynapló egy tantárgyi oszlopában egy érdemjegy. Vagy ugyanott egy név...) A mezővel egy szinten áll - a fizikaiaknál - a karaktersorozat. Ez (nyilván) karakterek olyan sorozata, amelyet egy bizonyos karakter határol (idegen szóval: terminál). Elvileg mindegy, melyiket választják ilyen termináló karakternek, de azt már másra nem lehet használni. A megegyezés szerint - pl. az <ENTER>-gomb megnyomásával - állítható elő. A rekord mezők (itemek) rendszere, amely mezők azért tartoznak egybe, mert van valamilyen közös tulajdonságuk. (Ilyen pl. az egy tanulóhoz tartozó adatok az osztálynaplóban.) A rekorddal egy szinten álló blokk már egy kicsit elvontabb fizikai egység. A számítástechnika történetében elég messzire - a magnószalagegységekig - kell visszanyúlnunk a megmagyarázásához. A szalagegységek óriási mennyiségű adatot tudtak tárolni, ám a szalag felgyorsítása/lefékezése bonyodalmas volt, s ezért a kisebb mennyiségű adatokat egy gyűjtőben összegyűjtötték, s egyszerre "söpörték ki" a szalagra a gyűjtőtár egész tartalmát. Ez volt a blokk. Megeshetett ugyan, hogy csak egy karaktert kellett rögzíteni, de akkor is egy egész blokkot (az egy karaktert, és a gyűjtőtár teljes - üres - tartalmát) kellett kiírni a szalagegységre. Tehát a blokk a rögzítő eszköz által kezelt legkisebb mennyiségű adat (méretét - természetesen - információegységben megadva). A mai számítógépekben a merevlemezek (HDD), a floppyk (FDD) és a CDmeghajtók (CDD) adatkezelése is blokkokon alapul. A blokkokat egymástól el kell választani, ezt az úgynevezett gap (ejtsd: "gep") -- vagy magyarul: "blokk-köz" -- végzi el. A logikai adatszintek következő tagja az (adat)állomány (file), amely rekordok rendszere. E rekordok azért tartoznak egybe, mert van valamilyen közös tulajdonságuk. (Előbbi hasonlatainknál maradva: ilyen maga a teljes személyi igazolvány, vagy az összes tanuló adatait tartalmazó osztálynapló.) A fizikai adatszinten az állománynak a data set felel meg. Ez nem más, mint az adott (logikai) állományhoz tartozó adatblokkok gyűjtőneve. Nagy a kavarodás abban, hogy az "állomány" mikor jelent fizikai, és mikor logikai együvétartozást. Sajnos, az angolszász szakirodalomban a megnevezéseknél egyként jelölik - állományként - mind a fizikai, mind a logikai szintet. Mivel ez több félreértés forrása lehet, célszerű már a nevében is megkülönböztetni a kettőt. Az adatbázis szintje a logikai adatszint legbonyolultabbja (nincs is megfelelője a fizikaiaknál): állományok rendszere, melyek valamilyen tulajdonságuk (tulajdonságaik) alapján összetartoznak.
Feladat: Rip
GAMMA (4.0)
24
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
1. Próbáld meghatározni a két (sz.igazolvány, napló) hasonlatnál az adatbázis-szintet! 2. Keress az Interneten adatbázisokat (pl. a http://www.ripe.net URL-en)!
Nemcsak az adat "hordoz", az adato(ka)t is hordozzák Eddig az adatokról általánosságban ejtettünk szót, holott az "általános adat" fogalma a napi életből teljesen hiányzik. Az adat mindig valamire vonatkozik, valahol található, és valamilyen formában jelenik meg. Ahol az adat megtalálható, nagyon sokféle lehet (előző példánkban a személyi igazolvány, illetve az oda beragasztott fénykép papírja). De nem csak papíron tárolhatunk adatot! Vegyünk példának okáért egy közönséges hanglemezt, egy CD-t. Ismereteink és tapasztalataink alapján tudjuk, hogy ezen is adatok vannak. "Természetesen" - mondhatnánk, csakhogy eszünkbe jut valami: ahhoz, hogy valamit adatnak nevezzünk, alapvetően szükséges az, hogy értelmezni tudjuk és az általa hordozott információt hasznosíthassuk, érzékelnünk kell. A hanglemezt azonban akárhogy nézzük (mondjuk: nagyítóval), vagy tapogatjuk, esetleg megízleljük vagy szaglásszuk; semmiképpen sem tudjuk értelmezni a benne (vagy rajta, mindegy) rejlő "ismeretet". Pedig az ott van! Csak föl kell tenni egy lemezjátszóra, erősítőt és hangfalakat kapcsolni rá, és máris tapasztalhatjuk, hogy az információ valóban ott is van. Akkor nyilván a lemezjátszó a dolog nyitja: netán az értelmezné a lemezen levő adatokban rejlő információt? Szó sincs róla: a lemezjátszó egy gép, ráadásul nem is nagyon bonyolult. Értelmezni pedig csak az ember tud bármit is, hiszen az értelmezés az adaton végzett gondolati műveletek összessége. A lemezjátszó nem értelmezi, hanem átalakítja a rajta lévő adatokat a számunkra is - a fülünkkel - érzékelhető formába, és innen tovább már ismerjük az utat, amelynek az eredménye az információ. 1877 óta tudjuk a hangot (fonográfon) rögzíteni, az álló-, vagy mozgókép megőrzési eljárásait szintén a 19. században kísérletezték ki. Az emberiség korábban információt csak írásban, vagy (rajzolt/festett) képen tudott tárolni. A rögzített adatokat tartalmazó tárgyakat, eszközöket a továbbiakban adathordozóknak nevezzük. Azonban ma is kitüntetett szerepkör illeti meg azokat az adathordozókat, amelyeken tárolt adatokat közvetlenül tudjuk érzékelni, ezek az elsődleges adathordozók. Az összes többi adathordozót másodlagos adathordozónak hívjuk. (Ilyen a példánkban említett CD-lemez, vagy bármely mágneses elven működő eszköz is.) A rajtuk tárolt adatokat az érzékszerveinkkel közvetlenül nem is tudjuk hasznosítani. A hasznosításhoz át kell alakítani az adatokat; de ehhez elég ismernünk az átalakító gép, eszköz használatát. S hogy közvetlenül, vagy csak átalakítással történhet meg az adatok értelmezése, azzal a továbbiak során nem foglalkozunk, csak akkor, ha erre alapos okunk lesz.
Rip
GAMMA (4.0)
25
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az adathordozók fontos tulajdonsága, jellemzője, hogy mennyi adatot (ill. mennyi információt) tudnak tárolni. Ez a tárolókapacitás. Értéke az adathordozóra jellemző, és kiválasztásuknál nagy súllyal esik latba. Érdekesség, hogy a tárolókapacitást nem itemben adjuk meg - pedig látszólag ez lenne a logikus -, hanem bitben (vagy nagyobb egységeiben). Az információegységre vetített beszerzési költség a fajlagos tárolási költség. Az írásos adatokat tartalmazó adathordozót - a szervezéselméletben és a szervezés módszertanában - bizonylatnak nevezik. A bizonylat kitüntetett szerepét a számítástechnika is elismeri, mivel a tényeket és elképzeléseket először bizonylatokon rögzítik A másodlagos adathordozók - nevükkel ellentétben - óriási szerepet játszanak a számítástechnikában. Ide tartozik - a teljesség igénye nélkül - pl. a lyukkártya, a lyukszalag, a mágnesszalag, -lemez és -kártya, a CD, stb. Ahhoz ugyanis, hogy az adatokat egyáltalán tárolni tudjuk, mindenképpen át kell alakítanunk őket (legtöbbször nem is egyszer, és meglehetősen bonyolult módon). Az átalakított adat is adat ugyan, de számunkra közvetlenül nem mindig felfogható. A számítástechnikában nagyon sokszor szembekerülünk ezzel a problémával. Természetesen az adat tárolási formája az adathordozótól is függ; és - ha most a hangrögzítésnél maradunk - hiába is akarnánk lejátszani egy egyszerű lemezjátszón CD-lemezt, vagy egy magnószalagot: a hang rögzítésének alapelve mindhárom esetben más és más.
Az adat megjelenési formája: a kód A kód* kifejezés - a "chiffre" (ejtsd: sifr) szóval együtt - a titkosírások megjelenésével, azok megfejtésével kapcsolatban került be a köztudatba, s később az adatfeldolgozás és az informatika szótárába. Az adat megjelenési formájára nézve egyszerű választ adhatunk: az adat mindig kódolt formában van -- függetlenül megjelenése helyétől! Információelméleti szempontból egész életünk során egyebet sem teszünk, mint kódolunk, és dekódolunk. A kódok előállítása a kódolás; ennek fordított művelete a dekódolás. Meglepetésünk rögtön eloszlik, ha belegondolunk: gondolatainkat miképpen tudatjuk, közöljük másokkal. Agyunk kialakítja mondanivalónkat: az emlékezet "képeihez" fogalmakat rendel hozzá, s ezeket a fogalmakat egy beszélt nyelv szavainak hangalakjaira "kódolja". Ez - mivel a beszélt nyelv legtöbbször az anyanyelv, s ezt az ember kisgyermekkorában kezdi megtanulni - már teljesen automatikusan megy végbe; közben nem gondolkodunk rajta. Természetesen ehhez azért nem ártalmas, hogy ha a beszélt nyelv szavaiból elégséges mennyiségű szavunk, szókészletünk van... A szavakat - a hangoknak megfelelően betűkkel, vagy számokkal kódoljuk át "megőrizhető" formába. Ehhez persze, az kell, hogy tudjunk írni, azaz ismerjük az írás szintaktikai szabályrendszerét. Ezt - tervszerűen - az általános iskola 1. osztályában kezdjük megtanulni.
*
Jelek, szimbólumok rendszere az információk továbbítására
Rip
GAMMA (4.0)
26
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az olvasás már egy dekódolási folyamat, megtanulása, valamint megfelelő gyakorlás után, természetesen már éppúgy automatikusan megy, mint az írás is. Kódoknak nevezzük azokat az adatokat, amelyek adott szintaktikai szabályoknak megfelelően tükrözik a közlés tartalmát. A kódolás során törekszünk az egyértelmű dekódolhatóságra. A kód legyen lehetőleg rövid és kényelmesen kezelhető. Ez a megfogalmazás kielégíti mind a közléselméleti, mind a számítástechnikai kívánalmakat. Ne felejtsük el, hogy az információt általában a továbbítás céljából kell kódolni, méghozzá a továbbítás módjának - és a csatorna tulajdonságainak - megfelelően. Az persze, hogy ki mit vesz "kényelmesebbnek", nemcsak attól függ, hogy kiről van szó, hanem a kezelés eszközétől is. (Pl. e könyv szerzője kényelmesebben rögzíti az élőbeszédet írásban, mint pl. magnókazettán. Ennek nem csak az az oka, hogy a magnóhoz kell mikrofon, kazetta, magnó és áram, hanem az, hogy az élőbeszéd hallgatása közben már értelmezhetjük is az elmondottakat; saját számunkra - írásban - csak a lényeget rögzítjük. Ezzel, persze, elveszítjük a teljes pontosságot. Az viszont már erősen meggondolandó, hogy - példának okáért - egy háromnegyedórás tanóra tartalmát saját magunk, vagy mások számára, kétoldalnyi írásos jegyzetből, vagy pedig egy háromnegyedórás magnókazetta végighallgattatásával idézzük vissza. Szerintem az utóbbi eset sokkal több időt igényel, ezért az előbbi - nekem - kényelmesebb.) Ebből még egy másik szempontot is kideríthettünk - a kényelem mellett - a rövidséget. Mivel már a barkochbánál elárultuk, hogy az eljárás neve: kódolás, most - az előbbiek tudatában - fogalmaztuk meg pontosabb formában a definíciónkat!
Így például - az előbb már említett eseteken kívül - a zenét ötvonalas papírra, kottákkal "kódoljuk"; egy távirat továbbításához a (CCITT-) telexkódot alkalmazzák (régebben a morzeábécét használták). Ismert kódszó az SOS (• • • - - - • • •) morzejel-sorozat is. A számokkal pedig a mennyiségeket - matematikai precizitással fogalmazva: a halmazok számosságát kódoljuk, arab (vagy római), tízes számrendszerű számokba. Vagy nézzünk egy másik jellegzetes példát: a tévéadó a képet úgy kódolja, hogy azt kis (3 színű) pontokra bontja; és annak megfelelően, hogy a pontok világosak, vagy sötétek, ad le jeleket. Ezeket a jeleket elekromágneses hullámok továbbítják a tévévevőkészülékhez, amely azokat visszaalakítja színes képpé, másszóval dekódolja. Mióta az emberiség fennáll, létezett az, hogy egyes, fontosnak ítélt információkat valaki mások elől szeretne elzárni: ilyen célokra fejlesztették ki a titkosírásokat. A titkosírások történetével nem foglalkozunk különösebben - akit jobban érdekel, több, ezzel foglalkozó könyv közül is válogathat -, itt csupán utalunk rá, hogy eddigi ismereteink birtokában már tudjuk, mitől "titkos" egy írás. Attól, hogy nem mindenki ismeri az illető írás szintaktikai és szemantikai szabályrendszerét. Számunkra pl. "titkosírás"-nak lenne vehető egy olyan írott szöveg, amelyet nem az általunk ismert (latin, vagy cirill) betűk, hanem más írásjelek alkotnak. Nem tudnánk elolvasni az egyiptomi hieroglifákat, a sumer ékírást, a maja csomóírást - a kiput -, a székely rovásírást sem. Mert sem a szintaxist, sem a szemantikát nem ismerjük. (Ezeket a "kódrendszereket" az eltelt századok alatt jobbára már megfejtették.)
Vélhetően kellően igazoltuk, hogy a kódolás és dekódolás így át- meg átszövi mindennapi életünket. Az már más kérdés, hogy az esetek többségében automatikusan végezzük mind a kódolási, mind pedig a dekódolási műveletet; csak akkor lepődünk meg, ha
Rip
GAMMA (4.0)
27
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
ebbe bele is gondolunk. Hasonlítunk egy kicsit Moliere "Az úrhatnám polgár" című darabjának szereplőjére, aki nem tudta, hogy ő egész életében prózában beszélt... (Irodalmi példát arra, amikor a nyelvet ugyan ismerjük, de a kódkialakítás módszerét nem, Verne "Sándor Mátyás" c. könyvében találhatunk.) Eddig főleg a közléselmélet szempontjából vizsgáltuk a kódokat, és a kódolást. Mivel a számítástechnika, az adatfeldolgozás során kiemelt szerepet juttat a kódoknak, ill. a kódrendszereknek - az adatok kiemelt jelentőségének megfelelően - a továbbiakban ezekről majd részletesebben is szólunk.
Feladatok: 1. Készíts a Sándor Mátyás által használthoz hasonló (12*12-es) rácsot, és kódolj le vele egy üzenetet! 2. Tájékozódj, milyen kódokat tartalmaz a siketek "jelbeszéde", melyek a szintaktikai szabályai! 3. Az elektromos távíró elődje volt a (Chappe-féle) telegráf. Milyen manővert valósít meg a segítségével Monte Christo grófja? 4. Alább a hajókon régebben használt zászlójelek láthatók. Kódold le ezekkel a jelekkel a "Partvonal tiszta!"-üzenetet!
Chappe-készülék és ábécéje
Rip
GAMMA (4.0)
28
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
5. Bercsényi Miklós [balról] és Gárdonyi Géza [alul] titkosírása; a világháborús Enigma-titkosító (rejtjelző)gép [jobbról]
Rip
GAMMA (4.0)
29
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
AZ INFORMÁCIÓ ZAJOS ÚTJÁN A csatorna az az út, amelyen az információ a kódolótól a dekódolóig eljut. Telefonbeszélgetésnél pl. a csatorna egy (fémből, vagy fénykábelből álló) vezeték; az űrhajóról, más bolygóról küldött üzenet esetében az egész Világegyetem; tehát elég sokféle lehet. A "csatorna" fogalmával a számítógépeknél is találkozunk - akkor ugyan a számítástechnikai részletekre helyezve a hangsúlyt, de funkciója ott is az itt megismert marad.
Áthaladás a kommunikációs csatornán Nem mindegy az, hogy adataink milyen "tágas" úton vándorolnak az adótól a vevőig. Egy, vagy több vezetéket használunk a kommunikációra. Az első esetben - egy vezetéknél - a kódok sorban, egymás után haladnak az ismert irányban. Ez a soros adatátvitel. Más a helyzet több vezeték alkalmazásánál: ekkor a kódolt információ egységei időben egyszerre haladnak át a csatornán a vevő felé. Ezt hívjuk párhuzamos adatátvitelnek. Szemléletes hasonlatot használva: beláthatjuk, hogy egységnyi idő alatt jóval kevesebb víz képes áthaladni egy mosdókagyló vízcsapján, mint pl. egy tűzoltóautó tömlőjén. Az átviteli sebesség az "áteresztőképesség" figyelembevételével változik (nőni fog). Ahogy az adathordozóknál jellemzőnek vettük a tárolókapacitást, itt, az adótól a vevőig terjedő kommunikációs láncnak szintén van egy nagyon fontos jellemzője: az átviteli sebesség, vagy áteresztőképesség. Az időegység alatt - a kommunikációs láncon - átvitt információmennyiséget mérő mértékegységet adat- (v. információ-)átviteli sebességnek nevezzük. Az információ átviteli sebességének mértékegysége a baud (Bd, ejtsd: bód). 1 Bd = 1 bit/s. Belátható, hogy a teljes kommunikációs lánc sebességét a átbocsátóképességű (átviteli sebességű) elem átviteli sebessége határozza meg.
legkisebb
A csatornában a zaj hatására az áthaladó információ véletlenszerűen módosulhat, vagy eltorzulhat. A zaj egy nemkívánt jelenség, amely képes arra, hogy a csatornán kúszó információt torzítsa, vagy - elfedéssel - "megszüntesse". Természetesen, nemcsak hangban tapasztalhatjuk magát a zajt, hanem pl. a televízióképnél is. Ilyenkor a "zaj" különböző zavarjelek formájában, vizuálisan jelenik meg (rontva a tv-vétel minőségét). Szintén vizuális zajjelenséget - az ún. "lézerzajt" - tapasztalhatunk akkor, ha egy lézerrel valamilyen sima felületet világítunk meg: a fényes felületet tüzetesen szemügyre véve, megállapíthatjuk, hogy az nem egységes, hanem abban kis pontok "hemzsegnek", vagy "zsizsegnek", hogy hangulatfestő szavakkal próbáljam meg leírni a jelenséget. Ezt ugyanis látni kell... Nyilvánvaló, hogy ez ellen tenni kell, vagy tenni kéne valamit. Ehhez két alapvető lehetőségünk van: Rip
GAMMA (4.0)
30
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
a) a jel/zaj arány növelése Ebben az esetben azt kíséreljük meg, hogy "túlordítsuk" a zajforrást, hogy mégis eljusson a csatornán a vevőhöz az információ. Mindannyian tapasztalhattuk, hogy egy forgalmas utca egyik oldaláról a másikra, bizony emberes munka átkiabálni az ismerősünknek. Mivel a forgalom zaját csökkenteni nem áll módunkban (ez rajtunk kívülálló - objektív - jelenség), csak azt tehetjük, hogy emeljük a hangerőnket -- ameddig a torkunk bírja. Általában nem bírja sokáig; erről bárki meggyőződhet pl. egy diszkóbeli "beszélgetés" utáni berekedt hangjával. Az információ továbbításánál a mi beszédünk a "jel"; és a zavaró tényező - pl. a nagy hangerejű zene - a "zaj". A kettő aránya - s itt a jel van a tört számlálójában, a zaj a nevezőjében - fogja meghatározni, hogy vajon milyen sikerrel tudjuk útjára bocsátani információnkat a csatornán. A jel-zaj viszony javítása a tört számlálójának növelésével történhet, tehát üvöltünk. Míg bírjuk... Hiába is utáljuk a zajt, bizony egy határon túl nem áll módunkban túlkiabálni. Amennyiben azonban a zaj az erősebb, akkor a vevő azt fogja hallani, és nem a mi információnkat.
b) A "tervezett" redundancia Kézenfekvő az a megoldás, hogy megismételjük az eredeti közlést, reménykedve azon, hogy néhányszori ismétlés után a zaj(ok) az üzenetnek nem egyforma részeit teszik vehetetlenné. Kicsit Karinthy alakjára hasonlítunk, aki "Maga megbolondult? Maga megbolondult? Hogy mindent kétszer mond? Hogy mindent kétszer mond?"... Ezt az ismétlést redundanciának nevezzük (a szó fölöslegességet, szövegeknél "dagályosságot" - terjengősséget, szóvirágokat, semmit-mondást - jelent). Itt: jelfölösleg. A redundancia értéke számszerűen (százalékosan) is meghatározható: ha kivonjuk a teljes közlésből az eredeti közlés információmennyiségét, bitekben mérve, és ezt az értéket a teljes közlés értékéhez viszonyítjuk* (azzal elosztjuk, és megszorozzuk 100-zal). Legyen pl. az eredeti közlésünk 200 Byte, és ismételjük meg háromszor (600 B). A teljes, csatornára bocsátott információmennyiség tehát 800 B. A redundancia: R = [(800-200)/800] * 100 = (600/800) * 100 = (3/4) * 100 = 75 % De, hogy valóban fölösleges lenne? Lássunk erre egy példát! * Logikusabb lenne az eredeti közléshez viszonyítanunk, de Shannon óta a teljes közlést vesszük százalékalapként. Ez azt jelenti, hogy a teljes üzenetnek ennyi(ed) részét hagyhatjuk el úgy, hogy az eredeti üzenetünk sértetlenül megmaradjon.
Rip
GAMMA (4.0)
31
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
1998-ban egy Mars-szondát tettek le a bolygóra, és az több hónapon keresztül közvetített képeket az általa látottakról. A képközvetítésekben biztosra vehetjük a redundancia meglétét (ugyanis a képek elég nagyméretűek voltak, tehát a közlésfolyamat időigénye alatt a zaj akár többször is "támadhatott"). Nézzük, hogy mi történik akkor, amikor egy (időben lejátszódó) közlést többször -- sokszor -- megismétlünk!
Az ábrából leolvasható, hogy az első ismétlésnél még nagyon zajos. Ebből bizony szerfölött nehéz lenne az Idő-felirat ő-betűje fölötti közléselem fontosságát kiszűrni. Amennyiben az ismételt közléseket egymással összehasonlítva tároljuk, lehet látni, hogy minél több közlést hasonlítunk össze, annál inkább "eltűnik" a zaj. A bal oldalon szereplő számok az összehasonlított és tárolt közlések számát mutatják. Látható az is, hogy 2 ismétlés figyelembevétele még elég zajos, de már 16 ismétlés egyidejű figyelembe vétele kellően "tiszta" vételt eredményez. (A redundancia definíciójából kiindulva -- mivel a baloldali számok az ismétléseket jelentik -- a közlésfolyamat redundanciáját [százalékban!] megkapjuk, ha azokat megszorozzuk 100-zal. A 16-osnál ez (16/17) * 100 = 94,12 %!) Ezt a technikát azért alkalmazhatjuk, mert - mint már előbb megállapítottuk - a zaj mindig véletlenszerűen jelentkezik, értéke akár "pozitív", akár "negatív" lehet (mert ez is véletlenül alakul)... A sok-sok "véletlent" egymással "összevonva" jó reményünk lehet
Rip
GAMMA (4.0)
32
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
arra, hogy a pozitív és negatív zaj-előfordulások "kioltják" egymást, s csak az eredeti közlésünk marad meg.
A paritás-ellenőrzés A számítógép operatív tárjában, a RAM-ban a memória modulokban található; egy-egy modul memóriacellákból, azok pedig - kétállapotú - tárolóelemekből állnak. A memóriacellák - általában - 1 B-osak, azaz nyolc tárolóelem található bennük. De nem mindig. Van olyan eset (ezt hívják "paritásos" memóriának), amikor a gyártó memóriacellánként 1 bitet még hozzáad ehhez, tehát a memóriacella 8+1 bites. Miért nem hívjuk akkor ezt a fajta memóriamodult "9 bites"-nek? Azért, mert mi - felhasználók - nem érjük el ezt az elemet, saját céljainkra nem tudjuk használni. Mert ez a tárolóelem egy speciális információt, a paritásbitet* tárolja. A gyártó ugyanis úgy alakítja ki a memóriamodul elektronikáját, hogy már beírás közben végezzen ellenőrzést a beírás helyessége tekintetében. Ennek a "helyességnek" a jelzője az ún. "paritásbit". Ehhez kiválasztja, hogy páratlan, vagy páros paritásellenőrzést al-kalmaz. (A két megoldás teljesen egyenértékű, ráadásul a gyártók is kb. felefele arányban oszlanak meg a technika kiválasztásában. Mi a továbbiakban a páratlan paritás-ellenőzést szemléltetjük, annak leszögezésével, hogy a másikat is választhattuk volna.) Legyen mondjuk a tárolni kívánt bitsorozatunk 11001010. A "páratlan" paritás-ellenőrzésnél az elektronika megvizsgálja, hogy a beírás során hány bináris 1-est kell tárolni, és a paritásbit értékét ennek megfelelően állítja be. A paritásbit értéke 0, ha a tárolni kíván bitsorozat páratlan számú 1-est tartalmaz, és 1 akkor, ha a tárolni kívánt bitsorozat 1-eseinek a száma páros. Esetünkben:
memóriacella
paritásbit
Mivel a tárolni kívánt bitsorozat 11001010, az ebben levő egyesek száma páros. Ha páratlan paritást használunk - márpedig ez így van -, a paritásbit értéke itt 1 kell, hogy legyen.
11 0 0 1 0 1 0 memóriacella
1 paritásbit
O.K.!
Tegyük fel, hogy - valami miatt; hogy mi miatt, az most nem igazán lényeges - az első helyiértéken álló 1 értéke megváltozik (0 lesz). Abban a pillanatban, ahogy ennek a cellának a tartalmához nyúlunk, az elektronika újból paritás-ellenőrzést végez, és hibát jelez:
01 0 0 1 0 1 0 memóriacella *
1 paritásbit
Error!
a paritás: itt párosságot jelent
Rip
GAMMA (4.0)
33
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Az aktuális memóriacella-tartalom (item) tehát sérült, ez derül ki a paritásbit 1 értékéből. Most már nem az elektronika, ill. a gép problémája a további: mi döntjük el, hogy ezek után mit is tegyünk. (Nyilvánvaló, hogy helyes eredményre sérült adatokból nem fogunk jutni.) Gondolatkísérletünket folytassuk: változzon 0-ra a (jobbról) negyedik elem értéke! Láthatjuk, hogy az elektronika most nem fog hibát jelezni -- hiszen miért is tenné? A tárolandó adatban (már!!) párosszámú 1 van, tehát ez így jó...
01 0 0 0 0 1 0 memóriacella
1 paritásbit
O.K.!
Pedig az eredeti adatunkhoz képest a tárolt item igencsak megváltozott! Foglaljuk össze eredményeinket: a paritásellenőrzés - egy bit felhasználásával nagyon érzékenyen reagál 1 bitnyi tévesztésre a rögzítésnél/tárolásnál. Amennyiben a tévesztés 2 bites, hibajelzést nem kapunk. (Kiterjesztve az eddigieket: páratlan számú tévesztésre adódik a hibajelzés, párosszámúra nem.) A redundanciát értelmezve az elmondottakra: 1 bit hozzáadásával alkalmaztunk egy ellenőrzési módszert az adathelyességre, tehát a közlésünk redundanciát tartalmaz. (Már jóval előbb megegyeztünk, hogy ilyen esetben a közlés tartalmával nem foglalkozunk!) Ki is számíthatjuk a szokott módon: (9 bit -8 bit) / 9 bit * 100 = (1/9) * 100 = 11,11 % Talán nem túlságosan nagy ár egy ellenőrzési lehetőségért... Hozzá kell ehhez fűzni, hogy a paritásellenőrzés a legegyszerűbb "tervezett" redundancia, manapság már a memóriamodulokban sem mindig alkalmazzák. Régebben, amikor a számítástechnika még sok "hibaveszélyes" eszközzel (lyukszalaglyukasztó, stb.) dolgozott, nagyon elterjedt ellenőrzési mód volt. [A 8 csatornás lyukszalagon a szalag hosszirányában futó lyukasztásokat hívták "csatorná"-nak, az arra merőlegesen - keresztirányban - levő lyuksort pedig "oszlop"-nak. Mivel egy-egy lyukszalagtekercs kb. 270 méter volt, többmillió bitnyi információt tartalmazhatott és ilymódon fontos lehetett, hogy az adatok "sértetlenségében" biztosak lehessünk. Ha hosszirányú paritásellenőrzést alkalmaztak (azaz: 1 bitet adtak hozzá csatornánként), a redundancia elhanyagolhatóan kicsiny lett; ha pedig a 8-ból egy csatornát keresztirányú paritásellenőrzésre tartottak fenn, ennek redundanciája 12,5 % (egynyolcad * 100)...] Manapság ennél jóval bonyolultabb, úgynevezett CRC-módszerrel (ciklikus redundanciakódokkal) óvjuk adataink épségét (idegen szóval: integritását). A CRC-kódokat pl. a HDD-knál, CDD-knál is megtalálhatjuk, de az elterjedt tömörítőprogramok (ARJ, RAR, ZIP) is használják.
Rip
GAMMA (4.0)
34
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
A "spontán" redundancia A redundancia nemcsak mesterségesen hozható létre, hanem önmagától is kialakulhat. Shannon, akinek munkássága teremtette meg a "matematikai" információelméletet, bebizonyította, hogy az angol nyelv redundanciája mintegy 50 %. Pontosan, mint Karinthy emberénél... Ha az élő, beszélt nyelveket megvizsgáljuk, látható, hogy Shannon megállapítása általában ezekre is igaz, így a magyar nyelvre is. Vagyis ha a szöveg mintegy felét olvashatatlanná tesszük, akkor a maradékból még kitalálható az értelme. A "tartalmi redundancia" azonban nemcsak hasznos lehet, hanem káros is. Órákig lehet beszélni úgy, hogy a lényegről semmit se mondunk. Sok beszédnek sok az alja...
Feladatok: 1. Grätzer J.: Rébusz c. könyvéből idézzük itt a helyközöket megnövelve, és a "megzajosított" karaktereket -- kb. 47 % -- ponttal jelölve: Gyön . . . . s . é . ta . . szi r . . . el gyül . . . z . . k a diá . o . az is . . . . u . . . r . n. Örö . ü . . en, h . . y ki . á . du . . i m . . n . k, n . . y zsi . a . j . l tö . . ö . t . k m . g a . épü . . t . t. Víg . . ind . . . ak a vil . a . . sm . . . ll . hoz és fe . . zá . lt . k a Hű . . . v . . g . f . l . m . . ő ko . . . ra. H . ng . s be . . . dd . l t . lt az . dő, k . . iru . t . k az a . co ., m . . d ö . . mri . . lg . s k . zep . . t . . rk . zt . k a v . gá . lo . á . ra. Egy . . . s . n a r . . re m . . t . k s ott rö . . . e . . n k . . la . .lt . k a já . . zó cs . . . rt . k.
2. Ez a szöveg Dumas: Monte-Christo grófja c. regényéből való, Faria abbé ennek a töredékes iratnak a megfejtése során jutott a Spada-család kincseinek nyomára - s melyet Edmondra hagyományozott. A mai napon, 1498. április 25-én attól tartok, hogy nem éri be tőlem, és Caprara megmérgeztek, tudatom hogy egy olyan helyen, ahol Christo nevű kis sziget barlangjában elástam, aranypénzben, drágakövekben, gyémántokban, ékszerekben nek a kincsnek a létezéséről, amely ezt megtalálhatja, ha a kis keleti huszadik sziklát eltávolítja. A a kincs a második üreg legtávolabbi és reá ruházok minden tulajdonjogot, 1498. április 25. Ces
3. A magyar nyelv redundanciája nem valami mesebeszéd: tanítványaim, mikor ezt a témakört tanulják, házi feladatként ki is próbálhatják, hogy igaz-e. Egy-egy újságcikket (amelynél persze, fontos, hogy ne legyen szakszöveg, ne tartalmazzon túl sok személynevet, stb.) "megzajosítanak" azzal, hogy - teljesen véletlenszerűen - a cikk karaktereinek kb. felét, fekete filccel például, olvashatatlanná teszik. Ebben az esetben a szövegbeli szóközöket is
Rip
GAMMA (4.0)
35
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
figyelembe vesszük. Nagy tanulság, hogy - annak ellenére, hogy a betűk fele olvashatatlan - a szöveg (na, persze, némi munkával) kiegészíthető, kitalálható. [Meg kell jegyeznünk, hogy a szövegkiegészítés ugyan nagyon jól megmutatja a nyelv "védekezését" a zaj jelensége ellen, mégsem illeszkedik bele harmonikusan a shannoni információelmélet szellemébe. Ne felejtsük el ugyanis, hogy fejezetünk elején azt ígértük: nem fogunk foglalkozni a jelentéssel, s most mégis azt tettük. Mindebben segítségünkre volt a nyelv belső szerkezete is, és a szövegkörnyezet (amelyet kontextusnak is hívnak). Minden bizonnyal akkor kapnánk erről tiszta képet, ha a szövegkiegészítést teljesen objektív módon, mondjuk, számítógéppel végeztetnénk. Ennek elméleti alapjai, valamint az ehhez kapcsolódó gépi fordításelmélet részletezése azonban messze meghaladná e tankönyv terjedelmi kereteit.]
BARANGOLÁS "KÓDORSZÁGBAN" Az első adatfeldolgozási kódrendszer: a lyukkártya A 19. század végén, az Egyesült Államokban a népszámlálási adatok mennyisége olyan nagy volt, hogy megpróbálták gépesíteni az adatok feldolgozását. Ehhez használta fel Hollerith a lyukkártyát. Olyan (18,7 cm hosszú, 8,3 cm széles, az akkor forgalomban lévő papírdollárral megegyező méretű) téglalap alakú kartonlapokat alkalmazott, amelyre lyukasztással - perforálással - rögzítették az adatokat. Ezeket a perforált lyukkártyákat a továbbiakban mechanikusan működő gépekkel dolgozták föl, az adatok csoportosításához, megszámlálásához használták. Ezt a lyukkártyát fejlesztették tovább és egészen hosszú ideig használták adatok és programkódok rögzítésére.
Az ábrán látható lyukkártyán 80 oszlop és 12 sor van. A sorok és oszlopok találkozásánál vannak a perforációk. Az oszlopokat 1-80-ig számozzák, a sorok számozása szerepel a lyukkártyán, a felső két számozatlan sor a 11. és 12. sor. Egy karakter kódja egy oszlopot foglal el, tehát a lyukkártyán maximum 80 karakter rögzíthető. (Az ábra két, egymást részben fedő lyukkártyát mutat.)
Rip
GAMMA (4.0)
36
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Ha számjegyet ábrázolunk, annak oszlopába mindig egy lyukasztás kerül mégpedig a számjegynek megfelelő sorszámú sorba (pl. 7 esetén a hetes sorszámúba), és a felső két sor (ami a 11.,12. sorszámot viseli) ilyenkor üres. A betűk oszlopában legalább két lyukasztás van, egyik a 1-9. sor egyikében, a másik a (felső) 11-12., esetleg a 0. sorszámú sorok valamelyikében, ezzel mintegy "felüllyukasztva" a számkódot. A különleges jelek rögzítése a betűkhöz hasonló. A lyukkártya a maga idejében igen korszerű eszköz volt, nagyon hosszú ideig ez volt a számítógépbe bemenő és kimenő adatok hordozója. Külön készülék szolgált a lyukasztásra ill. az olvasásra. A mágneses jelrögzítés megjelenése után, annak előnyei miatt az utóbbi 10 évben már teljesen eltűnt A lyukkártyák használatát megnehezítette, hogy ha a kártyák véletlenül összekeveredtek, kezdetben szinte lehetetlen volt ismét helyes sorrendbe rakni őket. Rendezésük megkönnyítése érdekében később a kártya felső szélére rányomtatták a rajta rögzített karaktereket, sőt rögzítették rá a lyukkártya (kötegbeli) saját sorszámát is.
A bináris kódolás alapesete: a BCD-kód Az elnevezésben szereplő B és C a "bináris kódolás" angol kezdőbetüjéből származnak, a D pedig arra utal, hogy ezt a kódrendszert decimális - tízes számrendszerbeli - számok sajátos tárolásához, kódolásához alkalmazzák. Rendeljük hozzá a számjegyekhez a kettes számrendszerben meghatározott éréküket! Mivel csak 0-tól 9-ig terjedő számjegyeket - - szándékozunk kódolni, ehhez 4 bit elég, de annyi kell is, hiszen 3 biten még csak a 7-ig juthatnánk el. 0 1 2 3 4
0000 0001 0010 0011 0100
Rip
5 6 7 8 9
GAMMA (4.0)
0101 0110 0111 1000 1001
37
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
A számokat számjegyenként alakítjuk bináris értékek láncolatává. Ez annyit jelent, hogy minden számjegy 4 biten ábrázolható, és az eredeti - decimális - szám jegyeinek hosszától függ a bináris láncolat hossza Nézzük 65 536-nak a BCD-kódját !
6553610 = 01100101010100110110BCD
A karakterenkénti átkódolásnál. nem spórolhatjuk el a közbülső "vezetőnullákat", különben az információ "összekeveredne". Dekódoláskor az egyértelmű értelmezéshez szükséges, hogy mindig egy bitnégyes adjon egy számjegyet. A BCD-kód nem a szám bináris értéke (mert az esetünkben 100000000000000002 lenne), hanem egy bináris láncolat, amellyel a bináris számoknál megtanult műveletek nem végezhetők el. Akkor meg miért jó nekünk ez a kódrendszer? Például óriási könnyebbség egy számot a számjegyei szerint binárisan kódolni, ahhoz képest, amit ugyane számnak a rögtöni bináris értékké való alakítása jelentene. Egy számítógépnek, persze nem okozna nagy nehézséget maga az átszámítás sem, de azért egy 12 jegyű (decimális) számot meglehetősen hosszadalmas dolog átalakítani bináris számmá. A BCD-kódolást használva azonban az adatbevitel sokkal gyorsabb. pl. - az összes zsebszámológép (kalkulátor) billentyűzete és megjelenítője ezzel amódszerrel dolgozik. Az persze, már egészen más kérdés, hogy a gépben műveletet végezni csak valódi bináris számmal lehet, tehát ha műveletet akarunk végezni a tárolt számmal, akkor a BCDkódot később át kell alakítani bináris értékké. (Vagy egy eredmény kijelzésénél ugyanezt visszafelé...) Ezek a "bináris értékek" - természetesen - nem az általunk használt 0-ból és 1-ből álló karaktersorozatok, hanem az adathordozótól függően kialakított két állapotnak megfelelő szimbólumok. Ha az adathordozó lyukkártya, vagy lyukszalag, az 1 tulajdonképpen a perforálásnak felel meg; a 0 pedig a perforálatlanságnak. Ha az adathordozó mágneses jelrögzítést használ, akkor az 1 azt jelenti, hogy ott - mondjuk - északi iránynak megfelelően van mágnesezve az adathordozó, a 0 pedig azt, hogy azon a helyen déli irányú. Amennyiben a félvezetős memória (RAM) egyes celláit nézzük, akkor az 1 valamilyen fizikai jel (többnyire adott értékű feszültség) meglétének, a 0 pedig a hiányának felel meg. Mi a továbbiakban - ezt tudomásul véve - továbbra is a bináris, oktális, hexadecimális, vagy decimális értékeket adjuk meg -- hiszen ezek minden további nélkül, mindig átalakíthatóak 0-k és 1-ek sorozatává: bináris értékekké... A BCD-kódot az IBM a nagygépei számára kiterjesztette, és EBCDIC (ejtsd: "ebszidik") kódként nemcsak számok, hanem 256 egymástól különböző karakter (pl. betűk, írásjelek) tárolására használta, ehhez egyenként 8 bitet lefoglalva. Hogy mennyi bitet kell lefoglalnunk a "teljes" BCD-kódrendszerhez - nyilván - attól függ, hogy mennyi karaktert akarunk "bezsúfolni" elemként a kódrendszerbe. Tulajdonképpen az összes, íráshoz használt (cirill, görög, arab, kínai, japán, stb.) karaktert "bekódolhatnánk" a BCD-eljárással, de minek?
Rip
GAMMA (4.0)
38
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Ha egy - ésszerű - határon túl akarjuk növelni. a rendszer elemeinek számát, akkor pontosan azt a rövidséget, és kényelmet veszítenénk el, amiért pedig az egészet elkezdtük.
CCITT - a nemzetközi telexkódrendszer A decimális számjegyek alaki értékeinek kódolásához, mint láttuk, elég a 4 bit. Nézzük meg, hogy hány karaktert tudnánk kódolni 5 biten! Már a kártyapakli óta tudjuk a választ: maximum 32 különböző karaktert tudunk egyértelműen azonosítani 5 bit segítségével. A postai forgalomban is használt távgépírók (közkeletű kifejezéssel: telexgépek) 5 bites kódokat használnak. Nem túl kevés ez? Hiszen az alfanumerikus és a speciális karakterek száma együtt jóval több, mint harminckettő! Mégis lehet szöveget is továbbítani ötbites kódokkal, csak egy zseniális ötlet kellett hozzá: definiáltak két kódot, amely meghatározza, hogy az utána következő kódokat betűknek, vagy számoknak kell-e értelmezni (azaz: dekódolni). A számjel (FS), és a betűjel (LS) felhasználásával maximálisan 58 karakter azonosítható a CCITT-kódrendszerben, úgy, hogy egyazon kódnak megfelel egy alfás, meg egy "numerikus" karakter is, s csak az FS és az LS dönti el, hogy minek kell értelmezni. A maximális szám azért 58, mert az FS és LS kódokon kívül még a blank (a "teljesen üres"), a soremelés (LF), a szóköz (SP), és a kocsi vissza (CR) vezérlőkarakterek kódjai is egyediek, tehát nincs másfajta értelmezési lehetőségük. A telexkód tipikus adathordozója az ötcsatornás lyukszalag, ahol a bináris 1-nek egy kör alakú perforáció felel meg. A 0 itt is az lesz, ha a szalagot nem lyukasztottuk ki.
Az ASCII-kódrendszer A számítástechnikában kezdetben sokféle kód alakult ki, szinte minden számítógépépítő csinált magának egy saját adatfeldolgozó kódot. Itt már említettük az EBCDIC kódkészletet az IBM nagygépeinél. Ám létrejött egy másik kódrendszer is, az ASCII (ejtsd: eszki), amelyet az USA Szabványügyi Hivatala dolgozott ki, tehát nem egy nagy gyártó nevéhez fűződött (az elnevezés az American Standard Codes for Information and Interchange kezdőbetűiből adódott). A DEC által gyártott kis- és minigépek, később pedig a házi (homelab) számítógépek, sőt később a megjelenő a PC-k is ezt használták. A fejlődés során először a 7 bites ASCII-kód terjedt el: ezen 128, egymástól különböző karakter volt tárolható (ne feledjük, hogy 27=128). Ez vált világszabvánnyá -- azaz e kódok az egész világon ugyanolyanok. A későbbiek során a nyolcadik bitet is bevonva, 256 egymástól különböző karaktert tudtak 1 B-on ábrázolni. Viszonylag rövid idő -- 6-8 év -- alatt ez a kódrendszer vált uralkodóvá, ugyanis a számítástechnika fejlődése megkövetelte a kódrendszerek egységesítését, tehát választani kellett a kódrendszerek közül.
Rip
GAMMA (4.0)
39
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
De vajon miért volt jobb az ASCII, mint az EBCDIC? Az ASCII táblában gyakorlatilag csak 32 vezérlő karakter van, míg az EBCDICben 64, ennek megfelelően az ASCII-ban több hely marad a tényleges karakterek számára. Ezen kívül az ASCII táblában a számok megelőzik a betűket, az EBCDIC-ben pedig fordítva. Az alkalmazások szempontjából tehát az ASCII megoldása kedvezőbb. A vezérlőkarakterek azért születtek, mert a kommunikáció, az átvitel közben bizonyos ellenőrző, vezérlő funkciók is szükségesek (az egyes eszközöktől függően, pl. az átvitel, vagy az adathordozó végének jelzésére). Ezek a karakterek ilyen célokra vannak fenntartva; hasonlóan a CCITT-kódrendszer FS és LS karaktereihez. Már hivatkoztunk egy ilyen karakterre a fizikai adatszinteknél: a karaktersorozatoknál. Ez egy termináló karakter, és az <ENTER>-billentyű lenyomása eredményezi. Az ASCII-kódja 13. (Régebben nem minden billentyűzeten lehetett minden vezérlőkaraktert "lenyomni", s ezért a
-billentyű lenyomásával és lenyomva tartásával egy másik billentyűt is megnyomunk. Ez az ún. "billentyűkombináció". Az <ENTER> gombot pl., amely a CR -- carriage return, kocsi vissza -- nevet viseli, a <M> billentyűkombinációval helyettesíthetjük.) Mivel az ASCII-kódtáblák elég széles körben nyilvánosak, nem tartjuk szükségesnek, hogy itt egy teljes kódtáblát publikáljunk; viszont az esetek nagy részében a megjelent kódtáblázatok a 32-es kódnál (a helyköznél) kezdődnek. Emiatt talán nem lesz felesleges az első 32 vezérlőkarakter említésszerű felsorolása (ld. a 2. Függelékben).
A nemzeti kódtáblák A Microsoft által elkészített MS-DOS operációs rendszer kezdetben különböző grafikus -- és különleges -- jeleket tárolt a "felső" 128 helyen, és csak később (a rendszer 5.0 verziójától) alkalmazott a különböző nemzeti sajátosságoknak megfelelő, ún. "nemzeti", az IBM által kidolgozott kódtáblákat. Az eredeti (US nevű) tábla száma a 437es; a közép-európai kódtábla száma 850-es (ebben az ő,Ő,ű,Ű betűk helyett "hullámos", ill "tetős" karakterek jelennek meg); a magyar ékezetes hangzók karaktereit teljes egészében a 852-es kódtábla tartalmazza. Hazánkban 1993 óta szabvány rögzíti ennek a kódlapnak a használatát, illetve -- ami ezzel szervesen összefügg -- a billentyűzet MS-DOS szerinti magyar "kiosztását" is. Szintén a Microsoft nevéhez fűződik a Windows elnevezésű grafikus környezet (ill. később már operációs rendszer) elkészítése is: itt szintén nemzeti nyelven és -karakterekkel lehetett a számítógépet használni. A Windows által használt - a 852-eshez igazodó kódtábla pedig a 1250-es számú.
Az UNICODE-kódrendszer 1991-ben a Unicode konzorcium (tagjai: Apple Computer, Inc., Digital Equipment Corporation, Hewlett-Packard Company, IBM Corporation, Justsystem Corporation, Microsoft Corporation, NCR, NeXT Software, Inc., Novell, Inc., The Research Libraries Group, Inc., Silicon Graphics, Inc., Sybase, Inc., Unisys Corporation) kiadta az Unicode
Rip
GAMMA (4.0)
40
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
szabvány első verzióját. Az Unicode 16 biten ábrázolja a karaktereket. Egy ilyen tábla 65536 (216) karakter befogadására alkalmas. Ilyen irdatlan mennyiségű karakter tárolására talán nincs is szükség mondhatnánk, és valóban: jelen pillanatban csak 38887 karakternek "van helye" az Unicode 2.1 verziójában. Ebben - természetesen - már benne van az arab, héber, kínai, japán karakterek alapkészlete is. A Microsoft egy új hálózati operációs rendszert is megjelentetett, amelynek a Windows NT (New Technology) nevet adta. Ebben az operációs rendszerben a karakterek tárolására az eddigiektől teljesen eltérő kódrendszert, az UNICODE-kódokat alkalmazta.
Az Unicode elterjedése megszüntethetné a mai helyzet kuszaságát. Egy 16 bites ábrázolásra való áttérés azonban nem egyszerű feladat. Mert célszerűségi okokból a szabvány kidolgozói ugyan a lehető legnagyobb összhangra törekedtek a már meglevő kódtáblákkal, de számunkra, magyarok számára (megint az ő,Ő,ű,Ű betűknél) ez nem sikerült valami fényesen. Ennek köszönhető az, hogy az Office 97-től kezdődően a Word szövegszerkesztő "elfelejtette" a 852-es kódtáblát, és már az Unicode-kódokat használja, seregnyi konverziós problémát (és pénzköltést) okozva ezzel.
Egy további közismert kódrendszer: a vonalkód Az utóbbi időben - főleg a számítógépesített kereskedelemben - egyre többször találkozhatunk az egyes áruféleségeken, nyilvántartani szükséges "itemeken" különböző vastagságú függőleges vonalakat tartalmazó csíkkal. Ezeket vagy öntapadós etiketten, vagy nyomdailag teszik rá a megjelölendő árucikkféleségekre. (Mint erre a könyvre is...) A vonalkódot aztán vonalkódolvasóval leolvasva közvetlenül számítógépbe adható a kód által hordozott információ. Látható, hogy a vonalcsíkok felett (vagy: alatt) a kódolt karaktersorozat a számunkra értelmezhető formában - számjegyekkel - is föl van tüntetve. Általában ez jellemző e kódtípus használatánál.
Konverzió kódrendszerek között - a szabványosítás fontossága Természetesen, minden kódrendszernek megvan a maga logikája, azonban az esetek legnagyobb többségében ez a logika csak véletlenül (vagy úgy sem) találkozik a másik rendszer logikájával, önkényesen rendelik hozzá a karakterekhez a kódokat. Számtalanszor előfordul, hogy az egyik kódrendszerben rögzített adatot egy másik kódrendszert használó szoftvereszközzel kell beolvasnunk A kódoknak az egyik kódrendszerből a másikba történő átalakítását (átkódolását) konverziónak nevezzük.
Rip
GAMMA (4.0)
41
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Ahhoz, hogy ez az átalakítás bonyodalmak nélkül menjen végbe, az egyes kódrendszereknek - ha már egymással nem egyeztethetőek össze - legalább az összes felhasználó körében egységesnek (másképp fogalmazva: szabványosaknak) kell lenniük. A "szabvány" egy előírt elvárásrendszert, mintát határoz meg, amelyhez aztán alkalmazkodni kell. Tulajdonképpen törvény -- a termelőfolyamatok törvénye. Régebben a szabványok egy-egy nagyobb gyártó saját szabályrendszerét tartalmazták. (Ezt "ipari szabvány"-nak, vagy "szokvány"-nak hívják.)
A mai korban ez nem egészen így van: jelenleg már szükség van arra, hogy egyegy szabvány nemzetközi együttműködéssel készüljön el, és ezután kapjon nyilvánosságot. Ezt a munkát a Nemzetközi Szabványügyi Szervezet, az ISO végzi. Azért, persze, ma is úgy van, hogy könnyebben lesz szabvány egy olyan (pl. kód-) rendszerből, amit tömegesen használnak...
AZ INFORMATIKÁHOZ KAPCSOLÓDÓ ERKÖLCSI ÉS JOGI SZABÁLYOK Otthoni gépünket úgy használhatjuk, ahogy éppen a kedvünk tartja: akármikor, akármilyen programot futtathatunk rajta (persze, azért ez nem teljesen igaz, mivel a család is rendelkezhet a felhasználás ideje és jellege felől). Azonban ekkor is figyelembe kell vennünk annak az államnak a törvényeit, ahol élünk. Komplikáltabb a helyzet, ha a gépünk nem egyedülálló, hanem egy nagyobb rendszer - egy hálózat - része. Itt alkalmazkodnunk kell bizonyos alapelvekhez, amelyek éppen a több, egyidejű felhasználó eredményes munkáját hivatottak biztosítani. A hálózati használat során oda kell figyelnünk olyan dolgokra is, mint pl.: hogy mások elérhetik-e a mi gépünkön levő állományokat; ill., hogy mi megtehetjük-e ezt más gépek állományaival (erőforrásaival).
Erkölcs és jog; az állam Az állam igazán pontos meghatározásától most el kell tekintenünk; legyen most csak annyi elég, hogy tulajdonképpen egy szervezetről van szó. Ez a szervezet gondoskodik a polgárairól, védelmezi őket és teret ad nekik ahhoz, hogy egyéni céljaikat megvalósíthassák. Mindehhez szükséges az, hogy hatalma legyen mindehhez -- adott esetben az erő hatalmát is alkalmazva. Már ebből is világos, hogy a legalapvetőbbnek az állampolgár és az állam egymáshoz való viszonyát kell tartanunk: azt, hogy ez a szervezet mennyire "telepedik rá" a polgárára, ill., hogy annak mennyi lehetősége van befolyásolni az állam működését. Ebben a felfogásban a történelem tanúbizonysága szerint nem túl szerencsés - már t.i. az állampolgárnak - az, ha nagyon nagy hatalom van az államszervezet kezében: még korunkban is egyes diktátorok példázzák ennek veszélyeit.
Rip
GAMMA (4.0)
42
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Emiatt törekvés már régóta, hogy a hatalmat több, ún. "hatalmi ág"-ra bontsák széjjel: minél nagyobb kört bevonva az állam irányító szerepkörébe. Szokás beszélni eszerint ún. törvényhozó hatalmi ágról (ez minden államnak a törvényhozó testülete), a végrehajtó ágról (amely az irányítás napi gondjával-bajával törődik -- ez a kormányzat), illetve arról a hatalmi ágról, amely a törvények adta kereteken belüli állampolgári magatartást szabályozza -- ezek a bíróságok. (Egyes szakírók a mai államokban a tömegkommunikációs eszközöket, a médiát különösen nagy véleményformáló szerepe miatt - szokták a "negyedik hatalmi ág"-nak nevezni. Ha jobban belegondolunk, ez logikus, hiszen a nyilvánosság szerepe korszerű, demokratikus államberendezkedéseknél nagyon fontos lehet. De nem "hatalmi ág"!) Az athéni példa óta azt az államformát, amely polgárainak a legnagyobb lehetőséget adja választott képviselőiken keresztül - az ügyekbe való beleszólásra, demokráciának nevezzük. A demokratikus állam ellentéte a nem-demokratikus: ilyen jellegzetes példa a diktatúra. Itt egy ember, vagy emberek szűkebb csoportja kaparintja kezébe a hatalom nagyrészét, és él (vissza) azzal. Az állam életében, a politikában nagy szerepük van a pártoknak, amelyek tagjaik számára megteremtik a közügyekbe való közvetlen beleszólás lehetőségeit. Ha az állami és a párthatalom összemosódik (a hatalmi ágak nem válnak szét világosan), pártállamról szoktunk beszélni. Itt az állampárt a hatalom letéteményese, nélküle semmi nem történhet. Az ilyen állam gyakran "rátelepszik" az állampolgárra, de nem durván, hanem inkább atyáskodva, gyámkodva felette. Az állampolgár ilyenkor passzív: mindent "felülről vár"...
Erkölcs Erkölcsnek nevezzük a társadalmi érintkezés formáinak megszabott, de nem mindig leírt és konkrétan megfogalmazott rendszerét. Etikának hívjuk az erkölcsi és magatartásbeli szabályok összességét. Egy gesztus vagy viselkedési forma az egyik társadalmi csoportban udvarias lehet, de egy másikban akár udvariatlannak is számíthat. Etikusan viselkedik az, aki erkölcsös, becsületes, tisztességes. Ezek a fogalmak viszonylagosak, kultúrkörönként másként értelmezhetik őket, ugyanakkor sok erkölcsi alapelvet, parancsot majdnem mindenki elfogad (pl. ne ölj, ne lopj). Az erkölcs kulcsszava az "illik".
Jog Ellentétben az erkölccsel, a jog már egyfajta írott, "becikkelyezett" magatartási szabálygyűjtemény, s ezen az írásbeliségen informatikailag - már Hammurapi törvényoszlopa (részlete jobboldalt) óta - nemigen csodálkozhatunk. A jogi szabályozást az állam hatalmi ágai végzik; a leírtak pedig a törvények és jogszabályok. A jog jelképe a § -- erre szokás azt mondani, hogy azért van két kampója, hogy mindenbe beleakadjon, és azért van a közepén lyuk, hogy át lehessen bújni rajta...
Rip
GAMMA (4.0)
43
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Tehát annak ellenére, hogy a jog írott, mégsem mindig egyértelmű az alkalmazása. Ugyanis nagyon sok olyan magatartási probléma, erkölcsi visszásság lehet, amelyre nem lehettek figyelemmel teljes egészében a jogalkotók. Az ilyen esetekben segít a jogértelmezés. Ezt a bíróságok végzik. A jogi szabályozás erősebb az erkölcsi elveknél. Kulcsszava a "szabad*".
Az állam -- az Alkotmány Az állam jogi megalapozottságának, az ún. jogállamiságnak a törvények rangsorában kell elsősorban megnyilvánulnia. Ebből a szempontból kitüntetett fontosságú az a törvény, amelyből az összes többi törvény, jogszabály "levezethető". Ez az alaptörvény, az Alkotmány. Informatikai szempontból tekintve az Alkotmányt, szemünkbe ötlik két megnevezés - mindkettő adat -, s ezért ezekkel kezdjük. Az állampolgárokat megilleti a személyes adatok védelméhez való jog, ill. minden állampolgárnak jogában áll, hogy a közérdekű adatokat megismerje, illetőleg terjessze.
Személyes és közérdekű adatok 1. személyes adat: a meghatározott természetes személlyel (a továbbiakban: érintett) kapcsolatba hozható adat, az adatból levonható, az érintettre vonatkozó következtetés. A személyes adat az adatkezelés során mindaddig megőrzi e minőségét, amíg kapcsolata az érintettel helyreállítható; 2. különleges adat: a) a faji eredetre, a nemzeti, nemzetiségi és etnikai hovatartozásra, a politikai véleményre vagy pártállásra, a vallásos vagy más meggyőződésre, b) az egészségi állapotra, a kóros szenvedélyre, a szexuális életre, valamint a büntetett előéletre vonatkozó személyes adatok; 3. közérdekű adat: az állami vagy helyi önkormányzati feladatot ellátó szerv vagy személy kezelésében lévő, a személyes adat fogalma alá nem eső adat; 4. adatkezelés: az alkalmazott eljárástól függetlenül a személyes adatok felvétele és tárolása, feldolgozása, hasznosítása (ideértve a továbbítást és a nyilvánosságra hozatalt), adatkezelésnek számít az adatok megváltoztatása és további felhasználásuk megakadályozása is; 5. adattovábbítás: ha az adatot meghatározott harmadik személy számára hozzáférhetővé teszik;
*
Éppúgy megfelelne a tilos is...
Rip
GAMMA (4.0)
44
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
6. nyilvánosságra hozatal: ha az adatot bárki számára hozzáférhetővé teszik; 7. adatkezelő: a 4. pontban meghatározott tevékenységet végző vagy mással végeztető szerv vagy személy; 8. adattörlés: az adatok felismerhetetlenné tétele oly módon, hogy a helyreállításuk nem lehetséges. Az adatvédelem állami biztosa, akit az Országgyűlés választ meg erre a tisztségre, őrködik az előbbiekben elmondottak védelmén, az idevonatkozó szabályok betartásán és betartatásán. Bárki fordulhat az adatvédelmi biztoshoz, ha véleménye szerint személyes adatainak kezelésével vagy a közérdekű adatok megismeréséhez fűződő jogainak gyakorlásával kapcsolatban jogsérelem érte.
Információs önrendelkezési jog A személyes adatok védelméhez való jogot nem hagyományos védelmi jogként értelmezzük, hanem annak aktív állampolgári oldalát is figyelembe véve, információs önrendelkezési jogként. Ennek az a tartalma, hogy mindenki maga rendelkezik személyes adatainak feltárásáról és felhasználásáról. Személyes adatot felvenni és felhasználni tehát általában csakis az érintett beleegyezésével szabad; mindenki számára követhetővé és ellenőrizhetővé kell tenni az adatfeldolgozás egész útját, vagyis mindenkinek joga van tudni, ki, hol, mikor, milyen célra használja fel az ő személyes adatát. Az információs önrendelkezési jog gyakorlásának feltétele és egyben legfontosabb garanciája a célhozkötöttség. Ez azt jelenti, hogy személyes adatot feldolgozni csak pontosan meghatározott és jogszerű célra szabad. Az adatfeldolgozásnak minden szakaszában meg kell felelnie a bejelentett és rögzített célnak. Az adatfeldolgozás célját úgy kell az érintettel közölni, hogy az megítélhesse az adatfeldolgozás hatását jogaira, és megalapozottan dönthessen az adat kiadásáról; továbbá, hogy a céltól eltérő felhasználás esetén élhessen jogaival. A célhozkötöttségből következik, hogy a meghatározott cél nélküli, ,,készletre'', előre nem meghatározott jövőbeni felhasználásra való adatgyűjtés és -tárolás alkotmányellenes.
Szellemi alkotások védelme A szellemi alkotások két nagy jogintézmény keretében részesülnek védelemben: a főleg műszaki szellemi alkotások (pl. különböző fajta találmányok) az iparjogvédelem különböző ágaiban, a nem műszaki jellegű szellemi alkotások pedig a szerzői jog keretében részesülnek jogi védelemben. Szerzői jogról természetesen csak a szellemi tulajdon mint tulajdonforma megjelenése után beszélhetünk. Ehhez elsősorban arra volt szükség, hogy a szellemi termék függetleníthető legyen alkotójától. Ennek első, legősibb eszköze az írás, -- vagyis írásbeliséggel nem rendelkező társadalmakban kizárt a szerzői jog megjelenése, hiszen a tudás és tudója nem elválaszthatók.
Rip
GAMMA (4.0)
45
Rip *** INFORMÁCIÓELMÉLETI ALAPOK Maga az intézmény, a copyright-törvény 1842-ben jelent meg Angliában. Ekkorra már Magyarországon is létezett ezzel kapcsolatos szabályozás, Mária Terézia 1772-ben hozott rendeletet a jogosulatlan utánnyomással kapcsolatban, ez azonban még a kiadót védte, a szerzőt nem. 1846-ban született az az osztrák pátens, ami már a szerzőt is védte, bár csak évekkel később lépett hatályba. A magyar törvénykezés először 1884-ben alkotott szerzői jogi törvényt, két évvel az országok közötti kölcsönösség elveit rögzítő Berni Konvenció előtt.
A szerzői jog az irodalom, tudomány és művészet alkotásait védi, és ilyen alkotásként tekintjük a számítógépi programot és a hozzájuk tartozó dokumentációkat (a szoftvert) is. A "hozzájuk tartozó dokumentáció" kifejezés azt jelenti, hogy a szoftverrel kapcsolatos minden előkészítő, kísérő, eligazító, felhasználást elősegítő, stb. anyag ide tartozik. A szerzői jog ugyanis az “irodalmi” kifejezésen nemcsak a szépirodalmat érti, a szerzői jog hatálya alá tartozik minden írásmű (szak-, tudományos-, ismeretterjesztő írásmű, stb.). A védelem szempontjából szükséges feltétel: a mű eredeti jelleggel kell, hogy rendelkezzék. A védelem fennállásának kérdésében kizárólag a bíróság dönthet, ebben a kérdésben más hatóság nem foglalhat állást. Példa a "szerzőség"-re: az Anyám tyúkja című versről minden, általános iskolát elvégzett magyar ember tudja, ez az alkotás Petőfi Sándor nevéhez fűződik. Hasonlóképpen bármely szerzőnek joga van ahhoz, hogy az alkotását az ő nevéhez kössék. (Ilyen szempontból azt is mondhatnánk, hogy az alkotás, a "szellemi termék" egy speciális személyes adat...) Mindezen az sem változtat, ha a név nem valódi, hanem fölvett - pl. írói - álnév, mint a halhatatlan Mark Twain esetében. Léteznek szerzői "szomszédos" jogok is, amelyek jobbára gazdasági jellegűek, azaz, a szerzői jogi védelem ideje alatt (mely a világon szokásos szabályozás szerint 70 év a szerző halálától számítva) különböző jogdíjakról, azok fizetésének módjáról rendelkeznek. Ez alól egy kivétel van: ez az ún. "szabad felhasználás".
A szabad felhasználás esetei: Egy mű részletét - az átvevő mű jellege és célja által indokolt terjedelemben és az eredetihez híven - a forrás, valamint az ott megjelölt szerző megnevezésével bárki idézheti. Nyilvánosságra hozott irodalmi vagy zenei mű részlete, vagy kisebb terjedelmű ilyen önálló mű iskolai oktatási célra, valamint tudományos ismeretterjesztés céljára a forrás és az ott megjelölt szerző megnevezésével átvehető. Átvételnek minősül a mű olyan mértékű felhasználása más műben, amely az idézést meghaladja. Magáncélra bárki készíthet a műről másolatot, ha az jövedelemszerzés vagy jövedelemfokozás célját közvetve sem szolgálja. E rendelkezés nem vonatkozik az építészeti műre, a műszaki létesítményre, a szoftverre és a számítástechnikai eszközzel működtetett adattárra, valamint a mű nyilvános előadásának kép- vagy hanghordozóra való rögzítésére. Teljes könyv, továbbá a folyóirat vagy a napilap egésze magáncélra is csak kézírással vagy írógéppel másolható. Nem minősül szabad felhasználásnak -- függetlenül attól, hogy magáncélra történik-e --, ha a műről számítógéppel, illetve elektronikus adathordozóra készíttetnek mással másolatot. Könyvként kiadott mű egyes részei, valamint újság- és folyóiratcikkek az
Rip
GAMMA (4.0)
46
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
iskolai oktatás céljára egy-egy iskolai osztály létszámának megfelelő példányszámban többszörözhetők. A szerző szomszédos (gazdasági) jogai ilyen esetekben sem sérülhetnek meg, ugyanis az egyes adathordozók, mint amilyen pl. az üres magnó- vagy videókazetta, illetve az írható CD-ROM ára már tartalmaz egy "szerzői jogi pluszt" is, amelyet az adathordozót forgalmazóknak kell befizetni egy központi alapba. A számítástechnikai sokszorozás tilalma azért indokolt, mert ebben a formában nagyon egyszerű és minőségromlás nélkül is véghez vihető lenne a jogosulatlan másolatkészítés.
A szoftverek csoportosítása a terjesztés és a felhasználás szempontjából A freeware (szabad felhasználású) szoftvereknél, mivel a szoftverhez a közreadó hozzáférhetővé teszi a szoftver forráskódját bárki számára, a megváltoztatás és a megváltoztatott formában történő továbbadás megengedett - ill. bizonyos szabályokhoz van kötve. Ez attól függ, hogy az adott programok a BSD vagy GPL típusú szerzői jogi védelem alá esnek-e. A BSD-programokat bárki használhatja, másolhatja, módosíthatja, csak azzal a kikötéssel, hogy a (jog)tulajdonos neve és a "copyright notice" maradjon meg a programon belül. A GPL-programoknál ezeket a szerzői jogi kérdéseket aprólékosan szabályozták, tehát, ha egy ilyen program új programokat "fial", akkor az összes "leszármazott" is a GPL alá esik -- azaz a végfelhasználók biztosak lehetnek abban, hogy jogaik mindig megilletik őket. Volt ugyanis arra már példa, hogy egy freeware szoftvert (az UNIX operációs rendszerre gondolok) hirtelen "kivontak a forgalomból". Majd "visszatért", természetesen: fizetős formában... A Szabad Szoftver Alapítvány által kidolgozott GNU*-projekt keretében nyilvánosságra hozott programok legfontosabb tulajdonsága az ingyenesség. Ez csak eszköz annak szavatolására, hogy a forráskód mindig hozzáférhető legyen. Fizetni persze kell, de csak az adathordozóért, ill. a posta- vagy terjesztési költségek miatt. Sokszor megesik, hogy az Internetről le lehet tölteni az adott szoftvereket -- nehogy azt higgyük, hogy ingyen: az időnkkel (és a hálózati forgalom megteremtése, ill. használata miatt) itt is fizetünk... Ebbe az "eszmei vonulatba" illeszkedik pl. az UNIX "hőskorszakát" idéző Linux-projekt is, ahol a fejlesztést világméretekben az egész számítógépes társadalom végzi. Az átmenetet a teljesen szabad és a "fizetős" szoftverek között az ún. cardware szoftverek jelentik; ilyenkor a programozó az elégedett felhasználótól mindössze egy képeslapot kér... A shareware szoftvereknél a kipróbálási lehetőség (pl. valamilyen ideig) ingyenes, de a kipróbálás után bizonyos - nem túl magas - összeget a fejlesztő(k)nek fizetni kell. Ez
*
GNU = "GNU not UNIX"; ez egy rekurzív mozaikszó, jelentése: a GNU nem UNIX...
Rip
GAMMA (4.0)
47
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
az "anyagi juttatás" lehet pl. a záloga annak, hogy - mondjuk - egy nagyobb teljesítményű változathoz juthassunk hozzá. Vagy: hogy tiszta legyen a lelkiismeretünk... A kommerciális (üzleti célú) szoftverekért minden körülmények között fizetni kell; ezeknél a kipróbálást általában csökkentett funkciókkal (pl. nem tud menteni, stb.) teszik lehetővé. Ezek az ún. trial version; "kipróbálós" programok.
EULA Ez a - hangulatában női nevet idéző - szó az End User Licence Agreement (Végfelhasználói Licenszszerződés) rövidítése. Lássunk egy példát: »VÉGFELHASZNÁLÓI LICENCSZERZŐDÉS MICROSOFT SZOFTVERRE FONTOS - FIGYELMESEN OLVASSA EL! A jelen Microsoft Végfelhasználói Licencszerződés ("EULA") Ön (mint magánszemély vagy gazdasági szervezet) és a Microsoft Corporation között létrejött jogilag kötelező megállapodás a fent megnevezett szoftvertermékre, amely magában foglalja a számítógépes szoftvert, ezen felül magában foglalhatja a kapcsolódó adathordozókat, nyomtatott anyagokat, és az "online" vagy elektronikus dokumentációt is (továbbiakban: "SZOFTVERTERMÉK"). A SZOFTVERTERMÉK telepítésével, másolásával, illetve bármiféle egyéb módon történő használatával Ön kötelező érvénnyel vállalja a jelen EULA feltételeit. Amennyiben jelen EULA feltételeit nem fogadja el magára nézve kötelezőnek, nem telepítheti vagy használhatja a SZOFTVERTERMÉKET; ugyanakkor visszajuttathatja azt a vásárlás helyére a teljes vételár visszatérítése érdekében. A SZOFTVERTERMÉK a szerzői jog és nemzetközi szerzői jogi egyezmények, valamint egyéb, a szellemi tulajdonra vonatkozó jogszabályok és nemzetközi egyezmények védelme alatt áll. A jelen licencszerződéssel a SZOFTVERTERMÉK használatát engedélyezzük, de tulajdonát nem ruházzuk át.«
Ez világos beszéd: a pénzünkért tehát nem tulajdonjogot, hanem használati lehetőséget vásároltunk. Ha ezt a logikát elfogadjuk, teljesen nyilvánvaló, hogy nem adhatjuk kölcsön (vagy bérbe) valakinek. Viszont "átruházhatjuk": »Ön jogosult a jelen EULA alapján Önt megillető összes jogot másra végleges jelleggel átruházni, feltéve, ha az átruházás során átadja a SZOFTVERTERMÉK összes másolatát, a SZOFTVERTERMÉK egészét (beleértve az összes alkotóelemet, a hordozóanyagokat, a nyomtatott anyagokat, az összes frissítést, a jelen EULÁ-t, és ha van ilyen, a Származási Bizonyítványt), és ha az átvevő elfogadja jelen EULA feltételeit. Amennyiben a SZOFTVERTERMÉK frissítés, a SZOFTVERTERMÉK összes előző változatát köteles az átruházáskor átadni.«
Az előbbiekben futólag megemlítettük a szerzői jogokat, de nem a kommerciális szoftvergyártók szempontjából. Érdemes megvizsgálni, hogy az EULA miképp rendelkezik erről: »A SZOFTVERTERMÉKNEK (ideértve többek között a SZOFTVERTERMÉKBE beépített képeket, fényképeket, animációt, videó- és hangfelvételeket, zenét, szöveget és mini-applikációkat), az összes írásos dokumentációnak, a SZOFTVERTERMÉK összes másolatának a tulajdonosi és szerzői joga a Microsoftot vagy a Microsoft szállítóit illeti meg. A SZOFTVERTERMÉKET a szerzői jog és nemzetközi szerzői jogi egyezmények védik. Ezért a SZOFTVERTERMÉKET bármilyen más szerzői jog által védett anyaghoz hasonlóan kell kezelnie, azzal a kitétellel, hogy a SZOFTVERTERMÉKET egyetlen számítógépre telepítheti, amennyiben az eredeti példányt kizárólag biztonsági másolás, illetve tárolás céljából őrzi meg. A SZOFTVERTERMÉKHEZ tartozó nyomtatott anyagokat nem másolhatja le.«
Rip
GAMMA (4.0)
48
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Természetesen választhattunk volna más szoftvergyártót is, de a többi EULA is hasonló "kaptafára" készült. Ez legalább magyarul van, s ez az országunkban megvásárolható szoftvereknél nem mindig van így. Legyen tanulság az, hogy a vásárlásnál nem haszontalan alaposan áttanulmányozni az EULÁ-t, bármilyen apró betűkkel is írják...
Szoftverkalózkodás A jogtalan szoftverhasználat kérdésére adott válasz, bizony, egybites. Vagy megsértem az ezzel kapcsolatos jogi szabályozást, vagy sem. Nagyon ritkán lehetnek ugyan vitás esetek, de "kicsit" nem lehet jogszerűtlenkedni: ez éppúgy lehetetlen, mint "kicsit kilépni" a tizedik emelet ablakán... MARABU rajza a HÓCIPŐből erre céloz. Ezen az sem változtat, ha "átalakított", azaz a számítógépes szakzsargonban elterjedt kifejezés szerint: crackelt (megfelelő programmal feltört) szoftvereket használunk, amelyek nem szólnak, hogy lejárt a kipróbálási periódus. Az eddigiekből látható, hogy bármilyen szoftvert "csak úgy" feltelepíteni a gépünkre, használni - a szabad szoftvereken kívül - jogsértő. A gyártók mindenféle rafinált megoldással védekeznek az ilyen használat ellen. A védekezés módjai az egyedi azonosító (regisztrációs) kódok, hologramos (azaz: fénymásolhatatlan) tanúsítványok, a szoftver által létrehozott adatállományban - sokszor nem egyszerűen felismerhetően, hanem többszörösen átkódoltan - elhelyezett felhasználóazonosítók, digitális "vízjelek" alkalmazásai. A gyártó által írott "büntető"-programok (ezek tulajdonképpen vírusprogramok) és a hardveres védelem (az ún. "hardverlock") szerencsére már évekkel ezelőtt kivesztek a szoftvergyártók másolásvédelmi repertoárjából... A BSA: (Business Software Alliance = Üzleti Szoftverszövetség) azért jött létre, hogy civil szervezetként segítse elő a nem jogszerű szoftverhasználat visszaszorítását. Eszközei között semmiféle kényszer közvetlen alkalmazása nem szerepel, épp ezért a köztudatban elterjedt "szoftverrendőrség" megnevezés nem igazán helyes. A jogszerűtlen szoftverhasználat felderítésében közreműködnek ugyan, de ez csak a rendvédelmi szervek aktív segítségével történhet. A jogsértő magatartás büntetést von maga után. A következőkben ezt tekintjük át.
Büntetőszankciók - Btk Rip
GAMMA (4.0)
49
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
A büntetőjog alapja a Büntető Törvénykönyv (Btk). A könyv írásának idején hatályban lévő Btk az ezzel összefüggő eseteket a 329. §-ában szabályozza, az alábbiak szerint:
Bitorlás 329. § Aki a) más szellemi alkotását, találmányát, újítását vagy ipari mintáját sajátjaként tünteti fel és ezzel a jogosultnak vagyoni hátrányt okoz, b) gazdálkodó szervezetnél betöltött munkakörével visszaélve más szellemi alkotásának, találmányának, újításának vagy ipari mintájának hasznosítását vagy érvényesítését attól teszi függővé, hogy annak díjából, illetve az abból származó haszonból vagy nyereségből részesítsék, bűntettet követ el, és három évig terjedő szabadságvesztéssel büntetendő.
Szerzői és a szomszédos jogok megsértése 1993: XVII. törvény 72. §-a 329/A. § (1) Aki irodalmi, tudományos vagy művészeti alkotás szerzőjének művén, előadóművésznek előadói teljesítményén, hangfelvétel előállítójának hangfelvételén, rádiónak vagy televíziónak a műsorán fennálló jog megsértésével vagyoni hátrányt okoz, vétséget követ el, és két évig terjedő szabadságvesztéssel, közérdekű munkával vagy pénzbüntetéssel büntetendő. (2) A büntetés bűntett miatt három évig terjedő szabadságvesztés, ha a szerzői és szomszédos jogok megsértését a) jelentős vagyoni hátrányt okozva; b) üzletszerűen követik el. (3) A büntetés öt évig terjedő szabadságvesztés, ha a szerzői és szomszédos jogok megsértését különösen nagy vagyoni hátrányt okozva követik el. (4) Aki a szerzői és szomszédos jogok megsértését gondatlanságból követi el, vétség miatt egy évig terjedő szabadságvesztéssel, közérdekű munkával vagy pénzbüntetéssel büntetendő. (5) A szerzői és szomszédos jogok megsértése esetén el kell kobozni azt az elkövető tulajdonában lévő dolgot, amelyre a bűncselekményt elkövetik. Az elkobzásnak akkor is helye van, ha a dolog nem az elkövető tulajdona, de a tulajdonos a bűncselekmény elkövetéséről előzetesen tudott.« Jó ezt tudni... Rip
GAMMA (4.0)
50
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Erkölcs és jog a hálózatokon Helyi hálózat - a rendszergazda és a felhasználó Alappéldánk e fejezetben az volt, hogy a számítógépünk egy hálózat része. Emlékeztetünk arra, hogy a (számítógépes) hálózat nem más, mint kommunikációs célzattal összekapcsolt számítógépek rendszere. A hálózatok közül a legegyszerűbb a LAN*, a helyi hálózat. A hálózat gépeinek normális együttműködését össze kell hangolni -- ez a rendszergazda (a sysop, supervisor, administrator, root, system manager) dolga. A gépek használói (a userek) alkalmazkodnak a közös géphasználat kereteihez. A felhasználóknak jogaik vannak, mint például: • • • • • •
az accounthoz** való hozzájutás joga (a technikai lehetőségektől függően); magán homepage (címlap) fenntartásának lehetősége (az erőforrások függvényében); a személyiségi jogok és a levéltitok tiszteletben tartása a hálózat üzemeltetői részéről; a "zaklatás" (pl. kéretlen levelek) ellen való védelemkérés lehetősége; a technikai problémákról (pl. rendszerkarbantartás, levelek elveszése) való tájékoztatás kötelessége a rendszergazdák részéről; a hálózati szolgáltatások használatához szükséges alapismeretek megszerzésének módja és lehetősége, stb.
A felhasználók kötelességei például: • • • •
a rendszergazda utasításainak megfelelő munkavégzés, a fölöslegessé vált accountok bejelentése; az account átruházásának tilalma; a helyi hálózati szabályzat megismerésének kötelessége, stb. Sok esetben jelenik meg a rendszergazda -- felhasználó viszony, mint "főnökbeosztott" kapcsolat. Ez igaz is, meg nem is. Nyilvánvaló, hogy a felhasználói igények hálózati kielégítése nem lehet korlátlan; de a rendszergazda mozgásterét is megkötik a jogi és erkölcsi keretek. A felhasználók jog által védett adataihoz hozzáférni csak technikai vagy biztonsági okokból szabad, de ilyenkor is csak a feltétlenül szükséges mértékben és az érintettek megfelelő tájékoztatásával. Erre csak az illetékes hálózat menedzsment jogosult, amely azonban az ilyen módon tudomására jutott információkat nem hozhatja nyilvánosságra, valamint másokkal nem közölheti. Azutóbbi eset alól kivétel, ha a szabályzat megsérté* LAN -- Local Area Network ** account -- itt: személyre szóló
hozzáférés egy hálózati számítógép bármely erőforrásához
Rip
GAMMA (4.0)
51
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
sének gyanúja merül fel, ebben az esetben az információk a kivizsgálásra illetékes személyekkel közölhetők. Az iskolákban használt LAN-oknál viszonylag egyszerű a helyzet, de mindez világméretben -- már kevésbé. Informatikai közhely, hogy az Internet a "hálózatok hálózata". Olyan világméretű háló, amelynek "csomópontjai" más - esetleg hálózatokat összekötő - hálózatok. Kicsit szakszerűbb megfogalmazásban az Internetet egyfajta metahálózatnak is tekinthetjük, s itt - ellentétben a LAN-nal - nincs egyvalaki, aki irányítaná, vagy felügyelné ezt a gépegyüttest. Ez egyrészt jó, másrészt nem az. Nem szabad elfelejteni, hogy a számítógépeket összekötő világháló az amerikai egyetemek diákjainak és tanárainak "haveri alapú" kommunikációs rendszeréből nőtte ki magát. Itt nincs különösebb alá-, vagy fölérendeltség, hierarchikus kapcsolat. Az Internet szabadosságát hangoztatók szerint ez a rendszer nem alkalmas arra, hogy sajátmagát, önmaga működését kielégítően szabályozza, hiszen itt káosz, anarchia van. Ennek ellenére az Internet - ha időnként lassacskán, cammogva is, de - működik. A hálózatot - éppúgy, ahogy a társadalmat - szabályozza a jog (AUP) és erkölcs (netikett) is.
INTERNET - az AUP* Az Internetre nem lehet "csak úgy, egyszerűen fellépni": ehhez valamilyen (al)hálózathoz kell, hogy tartozzon az Internet erőforrásait kihasználni akaró számítógép. Magyarországon a legnagyobb múltú ilyen hálózat az akadémiai-egyetemi, amely a Hungarnet névre hallgat. Nem lesz haszontalan a Hungarnet hálózathasználati szabályzatát (AUP) szemügyre vennünk: III. Milyen célra szolgál a Hungarnet hálózat? A Hungarnet hálózat célja a Hungarnet közösség alapszabály szerinti tevékenységének a szolgálata. Megengedett a hálózatnak az alaptevékenységhez kapcsolódó menedzsmenttel, és adminisztratív, információs feladatokkal összefüggő célokra történő használata. Korlátozott mértékben megengedett a hálózat magáncélra (pl. magánjellegű levelezés) történő felhasználása, ha ez nem jelent üzleti célú felhasználást. A Hungarnet hálózat ezen belül minden olyan tevékenységre használható, amelyet a IV. pont nem tilt. Aki a Hungarnet hálózaton keresztül más hálózatba átlép, idegen szolgáltatót vesz igénybe, az az idegen hálózatra érvényes szabályokat is köteles betartani. IV. Mire nem szabad használni a hálózatot? A Hungarnet hálózat nem használható az alábbi tevékenységekre:
*
AUP -- Acceptable Use Policy (elfogadott használati rend)
Rip
GAMMA (4.0)
52
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
1. az érvényes magyar törvényekbe ütköző cselekmények, ideértve a következőket, de nem korlátozódva ezekre: mások személyiségi jogainak megsértése; tiltott haszonszerzésre irányuló tevékenység (pl. piramis-, pilótajáték); a szerzői jogok megsértése; szoftver szándékos és tudatos illegális terjesztése, 2. a nem Hungarnet közösséghez tartozók egymás közötti átmenő forgalmának bonyolítása, 3. a Hungarnet hálózathoz kapcsolódó más - hazai vagy nemzetközi - hálózatok szabályaiba ütköző tevékenységek, amennyiben ezek a tevékenységek ezen hálózatokat érintik, 4. a Hungarnet hálózat szolgáltatásainak nem Hungarnet intézmények számára való továbbítása, 5. profitszerzést célzó direkt üzleti célú tevékenység, reklámok terjesztése, 6. a hálózat, illetve erőforrásai normális működését megzavaró, veszélyeztető tevékenység, 7. a hálózatot, illetve erőforrásait indokolatlanul, vagy szándékosan túlzott mértékben, pazarló módon igénybevevő tevékenység (pl. levélbombák, elektronikus játékok), 8. a hálózat erőforrásaihoz, a hálózaton elérhető adatokhoz történő illetéktelen hozzáférés, azok illetéktelen használata, 9. a hálózat erőforrásainak, a hálózaton elérhető adatoknak illetéktelen módosítására, megrongálására, megsemmisítésére irányuló tevékenység, 10. a hálózat biztonságát veszélyeztető információk, programok terjesztése, 11. másokra nézve sértő, mások vallási, etnikai, politikai vagy más jellegű érzékenységét sértő, másokat zaklató tevékenység, (pl. pornográf anyagok közzététele), 12. mások munkájának indokolatlan és túlzott mértékű zavarása, vagy akadályozása (pl. kéretlen levelek), 13. a hálózati erőforrások magáncélra való túlzott mértékű használata. Javaslatok, ajánlások Ajánlott, hogy minden, a Hungarnet hálózathoz kapcsolódó szervezet és intézmény hozza létre saját hálózat használati szabályzatát, amely a jelen szabályzattal összhangban van. A helyi szabályzatok részben vagy egészben tartalmazhatják a jelen szabályzatot is, de a Hungarnet szabályzatnak ezen belül egyértelműen azonosíthatónak és felismerhetőnek kell maradnia. A helyi szabályzatoknak célszerű tartalmaznia a következőket:
• helyi rendszerek specialitásai és a hálózati sávszélesség miatt szükséges további szabályok, korlátozások; • szabályok betartásának ellenőrzési módja. Az egyes részfeladatok végrehajtásáért felelős személyek neve, beosztása, elérhetősége; • szabályok megsértése esetén követendő eljárások és alkalmazandó szankciók ismertetése. A komolyabb hálózati üzemzavarok, támadások és egyéb veszélyhelyzetek esetében szükséges intézkedések.
Ez a szabályzat a Hungarnet működésének jogi kerete, de amikor valaki az Interneten kóborol, vajon milyen szabályok alapján kell alkalmazkodjon a közösséghez?
Rip
GAMMA (4.0)
53
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
INTERNET - a NETIKETT Ahogy a törvény kényszerítő erejével hat ránk, az Interneten ugyanolyan kényszer az eddigi működés során kialakult, leszűrődött magatartási szabályok erkölcsi kódexe, az úgynevezett "netikett". Az elnevezés azért is szerencsés, mert az etikett (főleg a spanyol királyok udvarában) rendkívül erős magatartási kényszert erőltetett az udvartartásra. Nem írták ugyan le a ceremóniamesterek, de ez a szigorból nem vont le semmit. Erősebb volt a törvénynél is, hiszen az uralkodó akaratát testesítette meg. Az Interneten nincs(enek) uralkodó(k), de a többség akaratával és véleményével megegyező együttélési szabályrendszer van.
A Netikett - írott formában - megtalálható az Interneten, úgynevezett RFCdokumentumokban: RFC 1087. Ethics and the Internet. ftp://ftp.ripe.net/rfc/rfc1087.txt RFC 1855. Netiquette guidelines. ftp://ftp.ripe.net/rfc/rfc1855.txt Magyar fordítása: Magyar Netikett. Magyar Elektronikus Könyvtár, URL: gopher://gopher.mek.iif.hu:7070/00/porta/szint/muszaki/szamtech/wan/rfc1855h.hun Ha az ember elolvassa - nem idegesítően hosszú -, hamar rájön, hogy néhány, a józan ésszel belátható alapszabály tudomásulvételével és betartásával mennyire megkönnyíti a sajátmaga és a többi netező életét...
KI VAGYOK ÉN? Digitális azonosítás, elektronikus dokumentumok Ennek a könyvnek a középtáján már szó esett a bizonylatról, mint elsődleges adathordozóról. Azt is megállapítottuk, hogy a bizonylat az adatkezelés folyamatában egyidejűleg jön létre - pusztán a rögzítés által. Érdekes kérdés az, hogy vajon ugyanez lesz-e a helyzet, ha a "bizonylatunk" nem papíron készül, hanem - pl. egy szövegszerkesztőben a képernyőn jelenik meg (mint ahogy én ezt most írom). Ehhez előbb azonban meg kell vizsgálnunk, hogy a jog mit mond a bizonylatról. A jogi frázisrendszerben a bizonylat (vagy dokumentum) neve: okirat. Fajtájára nézve két, alapvetően különböző okiratot különböztet meg a Polgári Perrendtartás (Pp.) magánokiratot és közokiratot. Mindkettő megegyezik abban, hogy az okirat kibocsátója - őt "kiadmányozó"-nak hívják - valamifajta kötelezettséget vállal, s ezt alkalmas módon hitelesíti (aláírja, vagy lepecsételi). Foglalkozzunk most kissé a magánokirattal! A Pp. szerint ún. "teljes bizonyító erejű" magánokirat az olyan, amelyet a kiadmányozó teljes egészében saját kézírásával írt, és aláírt. (Lehet ilyen pl. egy végrendelet.) A géppel, vagy szövegszerkesztővel előállított magánokirat csak akkor fogadható el teljes bizonyítóerejűnek, ha azt a kiadmányozó - sajátkezűleg - aláírta, és aláírásának
Rip
GAMMA (4.0)
54
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
hitelességét két tanú a sajátkezű aláírásával igazolja. (Ugyanezt a hitelesítést közjegyző is elvégezheti.) A két tanú - mint hagyomány - jelenik meg az egyébként közokiratnak számító házassági anyakönyv aláírásánál... Egy elektronikus "bizonylatban" bárki számára be kell tudnunk bizonyítani, hogy az a bizonylat hozzánk tartozik (ugye, ez egy újabb speciális személyes adat lesz, s csak a visszautalás kedvéért említjük az itemnél felhozott "aláírás-mintát"), valamint védekeznünk kell azellen, hogy más a nevünkben ilyet ne bocsáthasson ki. Lehet-e vajon "digitális aláírást" előállítani? Gondolnánk, ez nagyon egyszerű: csak egy gép és egy szkenner kell hozzá. Az aláírásunkat beszkennelve megvan a vágyott digitális aláírás (képállomány formájában). Ezt aztán beilleszthetjük a szövegszerkesztőben a dokumentumunkba. Igenám, de ahogy ezt mi megcsináljuk, bárki is megteheti, aki rendelkezik az aláírásunk mintájával; azaz: aláírásunk nem hiteles. Az "igazi" digitális aláírást másképpen kell megcsinálnunk. Igen, jól sejti az Olvasó: titkos, speciális kódot kell előállítanunk számítógéppel, s azt alkalmas módon hitelesíttetnünk kell. "Digitális aláírás" tehát az az elektronikus okirat védelmét szolgáló titkos aláírási kulccsal készített digitális jelsorozat (kód), amely egy hozzá tartozó időbélyegzővel és hitelesítési tanúsítvánnyal azonosítja az aláírási kulcs tulajdonosát és egyértelműen bizonyítja az okirat hitelességét és sértetlenségét. A könyv megírásának idején Magyarországon még nincs törvényben szabályozva az efféle elektronikus dokumentum alaki és tartalmi szabályrendszere, de a változó világ felmutatta kényszer előbb-utóbb a jogalkotókat is rászorítja ennek szabályozására -- az Interneten pl. már most is (Pl. a VeriSign Inc-től) beszerezhetünk ilyen "digitális aláírást", viszonylag mérsékelt áron. A fejlődés arrafelé mutat, hogy az elektronikus okirat jogi hatálya azonos legyen a más úton keletkezett okiratéval (a bizonylattal); érvényessége, kikényszeríthetősége, vagy bizonyítékként való elismerése ne legyen megtagadható pusztán azért, mert elektronikus formában létezik.
Titkosított üzenetek Az általános iskolában e sorok írója is "titkosírt" osztálytársainak, barátainak különböző "fontos" üzeneteket, de az email - más néven villanylevél, vagy drótposta korszakában inkább ezt a kommunikációs formát választja. Csakhogy: az email-re egy nagyon fontos szabály vonatkozik. Senki, soha ne írjon email-ben olyat, amelyet nem merne megírni egy levelezőlapon! Mert - levéltitok ide, vagy oda - a villanylevél nagyon "sérülékeny" és könnyen megnézhető... Ennek csak egy gyógyszere van: valamilyen "elektronikus titkosírást" kell használni. Ha a titkosító kód kellően bonyolult, akkor bizony alapos munkát kell végezni a "kéretlen olvasó"-nak a dekódoláskor.
Rip
GAMMA (4.0)
55
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
Erre szolgál például - többek között - a PGP* kódolási módszer. Ennél - egy adott kódoló algoritmus segítségével elkészül egy privát (titkos) és egy nyilvános kulcs. A nyilvános kulcsot a tulajdonos terjeszti, mindenki használhatja titkosításra, aki neki akar kódolt, sifrírozott levelet küldeni. Ezt ugyanis csak a tulajdonos privát kulcsával lehet dekódolni. Az eljárás bonyolultnak tűnik, de néhány kódolás - és dekódolás - után rá lehet kapni az "ízére". Ráadásul a PGP attól "pretty good", hogy nagyon nehéz feltörni, azaz egy idegen által dekódolni az üzenetet.
A névtelenség illúziója Az ember szörföl az Interneten, és nem is gondolja, hogy bizony elég világos és látható nyomokat hagy maga után... Kezdjük mindjárt azzal, hogy minden számítógép, amely az Internetre kapcsolódik, ezt csak akkor tudja megtenni, ha arra az időre az Internet részévé válik. Ez azt jelenti, hogy a gép kap egy "IP-cím"-nek nevezett "Internet-telefonszámot". Bármely számítógép sajátmagát a 127.0.0.1 IP-címen találja meg; ez az ún. "localhost" száma. Az Interneten működő forgalomirányítók - az ún. routerek - szintén egyedi IP-címmel, és sok esetben még névvel is rendelkeznek. Vannak olyan diagnosztikai programok - mint például a traceroute -, amelyek megmutatják, hogy a mi gépünktől a célszámítógépig hány, és milyen számítógépen megy át a közlésünk. Tessék arra gondolni, hogy ezek közül bármelyikről "lenyúlhatja" egy hacker ("csáklyás"), aki külön élvezet talál abban, hogy mások elektronikus leveleiben turkáljon. Ráadásul az IP-cím alapján nagyon könnyen beazonosíthatóak leszünk (ne tessék elfelejteni, hogy az Interneten minden számítógépnek egyedi IP-címe - vagy egy tűzfal számítógépnél egyedi Ethernet-azonosítója - van)! Nézzünk egy példát: célpont az USA-beli ismert levelezőszerver, a www.hotmail.com. Tracing route to www.hotmail.com [207.82.252.251] over a maximum of 30 hops:
1 175 ms 162 ms 139 ms c3-5200.c3.hu [194.38.96.67] 2 130 ms 128 ms 133 ms c3-7507.c3.hu [194.38.96.65] 3 780 ms 686 ms 676 ms NO-NIT-TN-0.taide.net [193.219.193.57] 4 664 ms 702 ms 668 ms NO-NIT-TN-1.taide.net [193.219.193.131] 5 776 ms 774 ms 774 ms gin-nyy-ac1.Teleglobe.net [207.45.199.161] 6 771 ms 787 ms 762 ms gin-nyy-core1.Teleglobe.net [207.45.223.158] 7 787 ms 786 ms 788 ms bbr05-p1-1.jrcy01.exodus.net [209.185.9.5]
*
PGP -- Pretty Good Privacy (egészen jó titkosítás)
Rip
GAMMA (4.0)
56
Rip *** INFORMÁCIÓELMÉLETI ALAPOK 8 858 ms 798 ms 788 ms dcr01-f1-1-0.jrcy01.exodus.net [209.1.169.53] 9 811 ms 851 ms 812 ms bbr02-p0-0.jrcy01.exodus.net [209.1.169.185] 10 828 ms 837 ms 827 ms bbr02-p0-2.sntc01.exodus.net [209.1.169.173] 11 821 ms 858 ms 838 ms dcr03-p6-0-0.sntc01.exodus.net [209.185.249.93] 12
*
*
*
Request timed out.
13
*
*
*
Request timed out.
[...] ez folytatódott, egészen a 30. lépésig, valószínűleg valami probléma lehetett az USÁban. Trace complete.
A trace-ből megállapítható, hogy a Soros-C3-ön keresztül léptem fel az Internetre (továbbá az is, hogy az adott irányban a hálózat meglehetősen lassú -- magyar idő szerint reggel 6 órakor). Nézzünk egy magyar, szabad használatú levelezőszervert! Tracing route to egon.gyaloglo.hu [194.143.248.34] over a maximum of 30 hops:
1 163 ms 132 ms 142 ms c3-5200.c3.hu [194.38.96.67] 2 148 ms 137 ms 149 ms c3-7507.c3.hu [194.38.96.65] 3 150 ms 151 ms 160 ms bix-2501-s1.c3.hu [194.38.98.42] 4 156 ms 152 ms 149 ms nix.elender.hu [193.188.137.16] 5 186 ms 212 ms 198 ms 194.143.248.241 6 177 ms 147 ms 135 ms c3640.elender.hu [194.143.224.27] 7 159 ms 149 ms 163 ms gw.vaciut.elender.hu [194.143.248.250] 8 228 ms 263 ms 223 ms c7200-www.elender.hu [194.143.248.254] 9 173 ms 200 ms 186 ms egon.gyaloglo.hu [194.143.248.34]
Trace complete.
... Ahhoz képest, hogy Budapestről Budapestre "közlekedtem", a 9 közbeeső állomás szerintem elég sok. Szerintem ezek a listák nagyon tanulságosak. Nem csak e-mail-ek
Rip
GAMMA (4.0)
57
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
küldésénél, de a szörfölésnél is ugyanilyen nyomokat hagyunk magunk után a hálózat csomópontjain. S akkor még nem is szóltam azokról a "sütik"-ről (cookies), amelyeket az általam felkeresett szerverek küldözgetnek az én gépemre... Az adatok védelmét igyekeztünk sokoldalúan bemutatni. Nyilvánvaló, hogy saját adatainkra, azok megfelelő biztonságára elsősorban nekünk kell odafigyelni; helyettünk ezt más nem fogja megtenni. Figyelni kell... Állandóan. Mindenre...
»PANTA RHEI!« Az ókori görögök egyik jellemző mondásával ("Minden mozog!") zárom könyvemet, elsősorban arra utalva, hogy az orgver, az informatika szervezési--jogi környezete állandó fejlődésben, mozgásban van. Beépíti magába az új technológiákat -- nekünk, embereknek csak arra kell ügyelnünk, nehogy minket is beépítsen...
Feladatok 1. Keresd meg az adatvédelmi biztos hivatalát és az adatvédelmi törvényt az Interneten! 2. Olvasd el Orwell 1984, valamint Gillet Perrault Az 51-es dosszié c. könyvét! Hol és hogyan sérülnek a regény szereplőinek (adatvédelmi szempontú) jogai? 3. Nézd meg az Oktatási Törvényben, hogy milyen adatokat gyűjthet rólad az iskolád!
Rip
GAMMA (4.0)
58
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
FÜGGELÉK (OLVASMÁNYOK) 1. olvasmány: »William Shakespeare szókincse, a kutatók számlálási eredménye szerint, tizenkétezer szóból áll. A mumbojumbo emberevő törzshöz tartozó néger szókincse háromszáz szót foglal magában. Ellocska Scsukina tökéletesen beérte harminccal. Íme, azok a szavak, kifejezések és indulatszók, amelyekei a nagy, gazdag és hatalmas orosz nyelvből szeszélyesen kiválogatott: 1. Bugriskodik. 2. Hohó! (A körülmények szerint kifejez: gúnyt, csodálkozást, elragadtatást, gyűlöletet, örömöt, megvetést és elégedettséget.) 3. Nagyszerű. 4. Zord. (Kapcsolatban bármivel. Pl.: "a zord Petya van itt", "zord idő", "zord eset", "zord kandúr" s í. t.) 5. Sötétség. 6. Borzadály. (Borzalmas. Például egy ismerős hölggyel való találkozáskor: "Borzalmas találkozás.") 7. Kölyök. (Minden férfiismerőssel szemben, függetlenül annak korától és társadalmi helyzetétől.) 8. Ne tanítson engem élni. 9. Mint egy gyereket. ("Megverem, mint egy gyereket" - kártyázásnál. "Ujjaim köré csavartam, mint egy gyereket" - pénzbeszedőkkel való érintkezésben.) 10. B-bűbáj! 11. Kövér és szép. (A legkülönfélébb élettelen tárgyak és élőlények jellemzésére alkalmazható.) 12. Üljünk kocsiba. (A férjnek mondják.) 13. Üljünk taxiba. (Férfi ismerősöknek.) 14. Az egész háta fehér. (Élc.) 15. Mondd már! 16. UIja. (Becenév-végződés. Például: Misulja, Zinulja.) 17. Ojjé! (Gúny, csodálkozás, elragadtatás, gyűlölet. öröm, megvetés és elégedettség.) A rendkívül jelentéktelen mennyiségben fennmaradt többi szó összekötő kapocsként szolgált Ellocska és az áruházak segédei között.«
2. olvasmány: "Tanuld meg az írásjeleket" - felelte Mariko. "Képtelen vagyok rá. Sokáig tartana. Kivehetetlen krikszkraksz mindegyik." "Pedig roppant egyszerűek, Andzsin-szan. A kínaiak nagyon okosak. Az ő írásukat vettük kőlcsőn vagy ezer éve. Nézzük például ezt a jelet, amely a disznót jelképezi." "Egyáltalán nem emlékeztet disznóra." "Valaha emlékeztetett, Andzsin-szan. Hadd mutassam meg. Látod? És ha a disznó jele fölé egy tetőjelet rajzolsz, akkor mit kapsz?" "Egy disznót meg egy tetőt." "De mit jelent? Mit jelent ez az új írásjel?" "Nem tudom." "Otthont. A régi időkben a kínaiak azt tartották, egy disznó a tető alatt egyenlő az otthonnal. Mivel nem buddhisták, hanem húsevők, a disznó az ő szemükben, a parasztok szemében a gazdagságot, tehát a jó otthont jelképezte. Innen az írásjel." "De hogy kell kiejteni?" "Az attól függ, hogy kínai vagy, vagy japán." "Ó kó!" "De ó kó ám - nevetett Mariko. - Itt egy másik jel. Tetőjel, disznójel és asszonyjel. A tetőjel alatt két disznójel azt jelenti: elégedettség. A tetőjel alatt két asszonyjel pedig azt: viszálykodás. Ne?" "De mennyire!" "Persze, a kínaiak sok tekintetben nagyon ostobák, például az asszonyokat nem úgy nevelik, mint nálunk. A te otthonodban nincs viszálykodás, igaz?"
Rip
GAMMA (4.0)
59
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
3. olvasmány: Mivel tanítványaim - mikor azt adom nekik házi feladatként, hogy mégis értelmezzék az első versszakot - meglepő kedvvel és kreativitással írnak mindenfélét, azt hiszem, nem lesz haszontalan, ha - olvasmányként - egy lehetséges (Révbíró Tamás fordította) megoldást iktatok ide: »-- Nem tudom, mit ért azon, hogy "dicsőség" -- mondta Alice. Dingidungi megvetően mosolygott. -- Hát persze, hogy nem érted, amíg én meg nem mondom. Úgy értettem: "Ez aztán az elsöprő erejű érvelés, mi?" -- De hát a "dicsőség" nem jelenti azt, hogy "elsöprő erejű érvelés" -- ellenkezett Alice. -- Ha én használok egy szót -- mondta Dingidungi megrovó hangsúllyal --, akkor az azt jelenti amit én akarok, sem többet, sem kevesebbet! -- Az a kérdés -- hitetlenkedett Alice --, vajon engedelmeskednek-e a szavak. -- Az a kérdés -- így Dingidungi --, ki az úr és kész. Alice sokkal zavartabb volt, semhogy erre bármit is válaszolni tudjon, s így egy perc elmúltával Dingidungi újból rákezdte: -- Mindegyiknek megvan a maga hangulata... különösen az igék, azok a legrátartibbak. A melléknevekkel azt csinál az ember, amit akar, az igékkel nem... de én féken tudom tartani az egész társaságot! Kitapogathatatlanság! Csak ennyit mondok! -- Volna szíves elárulni, hogy ez mit jelent? -- kérdezte Alice. -- No, így beszél egy értelmes gyerek -- mondta Dingidungi nagyon elégedetten. A "kitapogathatatlanság" azt jelenti, hogy erről a témáról már eleget beszéltünk, és most már ideje elárulnod, mi járatban vagy, mert azt hiszem, nem itt akarod leélni a hátralévő éveidet. -- Elég sok mindent jelent ez az egyetlen szó. -- Alice elgondolkodott. -- Ha ennyire megdolgoztatok egy szót -- mondta Dingidungi --, akkor mindig adok neki jutalmat. -- Aha! -- Alice elképedésében egyebet nem tudott szólni. -- Látnod kellene őket, amint szombat délután körém gyűlnek -- mondta Dingidungi, és komolyan ingatta a fejét --, tudod, a járandóságukért. (Alice nem merte megkérdezni, hogy vajon mivel jutalmazza őket, így aztán én sem tudom elárulni.) -- Úgy látom, ön kitűnően ismeri a szavak jelentését -- mondta Alice. Nem magyarázná el nekem A GRUFFACSÓR című vers értelmét? -- Halljuk! -- szólt Dingidungi. -- Meg tudok magyarázni minden verset, amit csak megírtak, és jó néhányat azok közül is, amelyet még nem írtak meg. Ez nagyon ígéretesen hangzott, ezért Alice elszavalta az első vesszakot: Nézsonra járt, nyalkás brigyók turboltak, purrtak a zepén, nyamlongott mind a pirityók, bröftyent a mamsi plény. -- Kezdetnek ennyi elég -- vágott közbe Dingidungi. -- Már ebben is elég sok nehéz szó van. NÉZSON azt jelenti: négy óra, uzsonnaidő. -- Ezt eddig értem -- mondta Alice --, és mit jelent a NYALKÁS? -- NYALKÁS azt jelenti: NYALka és nyálKÁS. Nyalka ugyanaz, mint délceg. Két szó jelentése összevonva egy szóban. -- Értem. És mik azok a BRIGYÓK? -- Hát... a BRIGYÓ kicsit olyan, mint a borz, kicsit olyan, mint a gyík, és kicsit olyan, mint a dugóhúzó. -- Fura teremtmény lehet. -- Az is -- mondta Dingidungi --, a fészkét napórák alá rakja, és sajtot eszik. -- És mit jelent az, hogy TURBOLTAK, PURRTAK? -- TURBOLNI annyit tesz, mint pörögni körbe-körbe, akár a TURBina. PURRNI pedig azt jelenti: fúrni, mint a pergő fúró. -- A ZEPE pedig a füves tisztás a napóra körül, ugye? -- kérdezte Alice, és maga is meglepődött saját leleményességétől.
Rip
GAMMA (4.0)
60
Rip *** INFORMÁCIÓELMÉLETI ALAPOK -- Persze. Azért ZEPE a neve, mert... -- Mert a napóra köZEPÉN van -- fejezte be a magyarázatot Alice. -- Pontosan. Mármost NYAMLONG azt jelenti, hogy NYAMvadtan és lengén szálLONG (itt is két szó van összegyúrva). A PIRITYÓK egy sovány, borzas madár, mindenfelé kiállnak a tollai, úgyhogy olyan az egész, mint egy eleven tollseprű. -- És a MAMSI PLÉNY? -- tudakolta tovább Alice. -- De csak ha nem terhelem vele túlságosan. -- Hát a MAMSI amolyan zöld disznó, de hogy a PLÉNY micsoda, abban nem vagyok biztos. Azt hiszem, onnan kapta a nevét, hogy eltévedt, és egyre azt mondogatja "fogalMAM SIncs, hol vagyok". -- És mit jelent az, hogy BRÖFTYEN? -- A BRÖFTYENÉS valahol a bömbölés és a füttyentés között van félúton, a középen röfögéssel... Lehet, hogy majd egyszer hallani fogod itt az erdőben... és mondhatom, egyszer hallani untig elég. Ki szavalta el neked ezt a nehéz költeményt? -- Egy könyvben olvastam -- felelte Alice.«
4. olvasmány: "Teljesen más természetű volt az egyéni bűnper, amelyet a bűnös állat nyakába akasztottak... Az eljárást az illetékes bíróság folytatta le. Előfordult, hogy a bűnös állatnak hivatalból védőt rendeltek. Kihallgatták az események tanúit, esetleg helyszíni szemlét is tartottak, s mindenről részletes jegyzőkönyvet vettek fel... Az eljárás folyama alatt a vádlott állat bús letartóztatásban töltötte napjait. Ugyanabban a börtönben, ugyanazon börtönőr felügyelete alatt, mint fogoly embertársai... Ha a főtárgyalás adatai alapján a vádlott állat bűnössége bebizonyult, a bíróság meghozta az ítéletet... A gyilkosságot elkövető állat büntetése halálra szólt. A kivégzési módok közül a legszégyenteljesebbet, az akasztást szokták elrendelni... A halálbüntetést a hivatalos hóhér hajtotta végre, és éppúgy megkapta a hivatalos díjazást, mint a rendes esetekben. Meulan, francia város levéltárában ma is megvan az 1403-i számadás egy elítélt disznó kivégzése körül felmerült költségekről. Így szól a nevezetes okirat: »A disznó élelmezésére a fogházban: 6 párizsi garas. Item, a hóhérnak, aki Párizsból jött az ítélet végrehajtása céljából, a főbíró úr rendelete folytán 54 párizsi garas. Item, a szekér díja, melyen a disznót a vesztőhelyre vitték, Item, a kötélért, mellyel megköttetett és felakasztatott, 2 párizsi garas és 8 dénár. Item, kesztyűért 2 párizsi dénár.« A számadásból az is kiderül, hogy a hóhér a drámai aktusnál kesztyűt használt, akár csak emberen hajtotta volna végre az ítéletet... ...Nem tudom magyarra fordítani ezt a szót: chicane. A lexikon szerint: "rossz szándékból eredő akadály, melyet valaki egy másnak az útjába gördít, hogy célja elérését hátráltassa." A bosszantás közelítené meg leginkább az értelmét, de a szó nem eléggé átfogó jelentésű, nem jellemzi pontosan épp az idevágó eseteket, amelyekben a koporsóból kinyúló kéz fügét mutat, de egyszersmind ököllel csap le. [A mai szlengben az ilyet csak "szívatás"-nak nevezzük.] A legártatlanabb füge-mutogatást egy Tolam nevű öreg irlandi rendezte a XVIII. század végén. Az öregúrnak zsugori híre volt, és a chicane-végrendelet igazolta is a közvéleményt: Sógornőmnek hagyományozom azt a két pár ócska harisnyát, amely az ágy végében található. Item, Charles unokaöcsémnek hagyok egy pár másik - szintén ócska - harisnyát. Item, John Steine hadnagynak egy kék harisnyát, és a vörös kabátomat. Item, unokahúgomnak egy ócska cipőt. Item, Hannah-nak, hűséges cselédemnek csorba korsómat. ..." (Nem tartozik szorosan a példához, de megjegyezzük, hogy a végrendelet felolvasása után - írja Ráth-Végh István - Hannah, feltehetőleg dühében, felrúgta az immár tulajdonává vált csorba korsót. Az - természetesen el is törött. Akkor lett ám nagy meglepetés: a korsóban többszáz tallér volt.)
Rip
GAMMA (4.0)
61
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
FÜGGELÉK-2 Az ASCII-ben használt vezérlőkódok:
Kód
röv.
00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
NULL SOH STX EXT EOT ENQ ACK BEL BS HT LF VT FF CR SO SI DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US SP
angol megnevezés "blank" start of heading start of text end of text end of transmission enquiry acknowledge Bell backspace (régebben: rubout) horizontal tabulation line feed vertical tabulation form feed carriage return SHIFT out SHIFT in data link escape device control one device control two device control three device control four negative acknowledge synchronous idle end of transmission block cancel end of medium substitute escape file separator group separator record separator unit separator space
Rip
magyar megfelelője nincs semmilyen adat, "üres" fej-, v. címkerész kezdete szöveg (közlemény) kezdete szöveg (közlemény) vége átvitel vége kérdező (tudakozódó) karakter nyugtázás ("megkaptam!") hangjel (ha van csengő, megszólal) visszatörlés vízszintes tabulálás soremelés függőleges tabulálás lapdobás kocsi vissza (nagy)betűváltó kikapcsolva (nagy)betűváltó bekapcsolva adatkapcsolatból kilépés 1. eszköz vezérlése 2. eszköz vezérlése 3. eszköz vezérlése 4. eszköz vezérlése a 06 ellentéte ("nem kaptam meg!") szinkronizáló karakter blokk-adatátvitel vége "mégse" ("felejtsük el!") adathordozó vége MS-DOS-ban EOF (end of file) kilépés file-elválasztó csoport-elválasztó rekord-elválasztó egység-elválasztó helyköz
GAMMA (4.0)
62
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
FÜGGELÉK-3
Egy MS-DOS 852-es kódlapot használó betűtípus ASCII-táblázata Windows 1250 kódtábla alatt
Egy UNICODE-kódokat használó betűtípus kódtáblája (érdemes összehasonlítani az ASCII-val!)
Rip
GAMMA (4.0)
63
Rip *** INFORMÁCIÓELMÉLETI ALAPOK
IRODALOMJEGYZÉK BAKOS Ferenc (szerk)
Idegen szavak és kifejezések szótára
Akadémiai, Bp. 1974. Beszéd a szavak mögött Tömegkommunikációs Kutatóközpont (MEMBRÁN könyvek) Bp. 1980. CARROLL, Lewis Alice Tükörországban Móra, Bp. 1980. CHURCHMAN, West Rendszerszemlélet Statisztikai Kiadó, Bp. 1974. CSIHA Csaba Rendszerelméleti fogalmak Dacia Kiadó, Kolozsvár, 1989. CSUKOVSZKIJ, Kornyej Járni tanul a szó... Tömegkommunikációs Kutatóközpont (MEMBRÁN könyvek), Bp. 1982. GÁBOR Dénes Válogatott tanulmányok Gondolat, Bp. 1976. GRÄTZER József Rébusz Móra, Bp. 1960. HALASSY Béla dr. Az információs rendszerek alapfogalmai SZÁMALK, Bp. 1982. HETÉNYI Pálné (szerk) Számítástechnika középfokon OMIKK, Bp. 1987. HORÁNYI Özséb Jel, jelentés, információ Magvető (Gyorsuló Idő), Bp. 1976. INFORMATIKA tanári mközösség INFORMATIKA tanári segédanyag Szaktudás Kiadó (PSZMP), Bp. 1993. JODÁL Endre (szerk) Számítástechnikai kislexikon Kriterion, Bukarest, 1990. KEMENY, John G. Az ember és a számítógép Gondolat, Bp. 1978. KINDLER József dr. -- PAPP Ottó dr. Komplex rendszerek vizsgálata Műszaki, Bp. 1977. (II. kiadás: 1988.) NORDENSTRENG, Kaarle Közléselmélet Tömegkommunikációs Kutatóközpont (MEMBRÁN könyvek), Bp. 1981. PLÉH Csaba -- TERESTYÉNI Tamás Beszédaktus--kommunikáció--interakció Tömegkommunikációs Kutatóközpont, Bp. 1979. RÁKÓCZI István Péter Gondolkodástechnikai alapok (2. kiadás) APC-Stúdió, Gyula, 1996. RÁKÓCZI István Péter Rendszerelméleti alapok APC-stúdió, Gyula, 1993. RÉNYI Alfréd Napló az információelméletről Gondolat, Bp. 1976. RÉVAY Zoltán Titkosírások Zrínyi, Bp. 1978. SHANNON, C. E. -- WEAVER, W. A kommunikáció matematikai elmélete OMIKK, Bp. 1988. SZENT-GYÖRGYI Albert Válogatott tanulmányok Gondolat, Bp. 1988. URBÁN János dr. Matematikai logika (13234/VI.) Tankönyvkiadó, Bp. 1987. VARGA Tamás Matematikai logika kezdőknek (52257) Tankönyvkiadó, Bp. 1966. VERNE, J. Várkastély a Kárpátokban Franklin, Bp. 1937. WIENER, Norbert Válogatott tanulmányok Gondolat, Bp. 1974. BUDA Béla
Rip
GAMMA (4.0)
64
Rip *** INFORMÁCIÓELMÉLETI ALAPOK A KOMMUNIKÁCIÓ...................................................................................................................................... 1 Az interperszonális kommunikáció..................................................................................................... 1 Az írás................................................................................................................................................. 3 A tömegkommunikáció....................................................................................................................... 4 AZ INFORMÁCIÓ........................................................................................................................................... 5 Zűrzavar az információ szó körül ....................................................................................................... 5 Szintaxis és szemantika ...................................................................................................................... 6 Adat és információ.............................................................................................................................. 7 Feladatok: ............................................................................................................................. 10 MÉRJÜK MEG AZ INFORMÁCIÓT! ............................................................................................................ 12 Az információ matematikai megközelítése......................................................................................... 12 Segít a barkochba-játék....................................................................................................................... 12 Az információ egysége: az elemi információ (a bit)........................................................................... 14 Barkochbázzunk a kártyával!.............................................................................................................. 15 Megvizsgáljuk a személyi szám és a személyi igazolványszám információtartalmát............................................................................................................................. 17 "A RÚT KISKACSA": AZ ADAT................................................................................................................... 21 Van-e az adatnak egysége? ................................................................................................................. 21 Logikai és fizikai adatszintek a számítástechnikában......................................................................... 23 Nemcsak az adat "hordoz", az adato(ka)t is hordozzák ...................................................................... 25 Az adat megjelenési formája: a kód.................................................................................................... 26 Feladatok: ............................................................................................................................. 28 AZ INFORMÁCIÓ ZAJOS ÚTJÁn ................................................................................................................. 30 Áthaladás a kommunikációs csatornán............................................................................................... 30 a) a jel/zaj arány növelése................................................................................................................... 31 b) A "tervezett" redundancia............................................................................................................... 31 A paritás-ellenőrzés ............................................................................................................................ 33 A "spontán" redundancia .................................................................................................................... 35 Feladatok: ............................................................................................................................. 35 BARANGOLÁS "KÓDORSZÁGBAN".......................................................................................................... 36 Az első adatfeldolgozási kódrendszer: a lyukkártya........................................................................... 36 A bináris kódolás alapesete: a BCD-kód ............................................................................................ 37 CCITT - a nemzetközi telexkódrendszer ............................................................................................ 39 Az ASCII-kódrendszer ....................................................................................................................... 39 A nemzeti kódtáblák ........................................................................................................................... 40 Az UNICODE-kódrendszer................................................................................................................ 40 Egy további közismert kódrendszer: a vonalkód ............................................................................... 41 Konverzió kódrendszerek között - a szabványosítás fontossága ........................................................ 41 AZ Informatikához kapcsolódó erkölcsi és jogi szabályok .............................................................................. 42 Erkölcs és jog; az állam ...................................................................................................................... 42 Erkölcs .................................................................................................................................. 43 Jog......................................................................................................................................... 43 Az állam -- az Alkotmány..................................................................................................... 44 Személyes és közérdekű adatok.......................................................................................................... 44 Információs önrendelkezési jog .......................................................................................................... 45 Szellemi alkotások védelme................................................................................................................ 45 A szabad felhasználás esetei:................................................................................................ 46 A szoftverek csoportosítása a terjesztés és a felhasználás szempontjából.......................................... 47 EULA ................................................................................................................................... 48 Szoftverkalózkodás............................................................................................................................. 49
Rip
GAMMA (4.0)
65
Rip *** INFORMÁCIÓELMÉLETI ALAPOK Büntetőszankciók - Btk....................................................................................................................... 49 Bitorlás.................................................................................................................................. 50 Szerzői és a szomszédos jogok megsértése 1993: XVII. törvény 72. §-a............................. 50 Erkölcs és jog a hálózatokon .............................................................................................................. 51 Helyi hálózat - a rendszergazda és a felhasználó.................................................................. 51 INTERNET - az AUP........................................................................................................... 52 INTERNET - a NETIKETT ................................................................................................. 54 KI VAGYOK ÉN?.............................................................................................................................. 54 Digitális azonosítás, elektronikus dokumentumok ............................................................... 54 Titkosított üzenetek .............................................................................................................. 55 A névtelenség illúziója ......................................................................................................... 56 »PANTA RHEI!« ............................................................................................................................................. 58 Feladatok .............................................................................................................................. 58 FÜGGELÉK (Olvasmányok) ........................................................................................................................... 59 1. olvasmány:........................................................................................................................ 59 2. olvasmány:........................................................................................................................ 59 3. olvasmány:........................................................................................................................ 60 4. olvasmány:........................................................................................................................ 61 Függelék-2 ........................................................................................................................................................ 62 Függelék-3 ........................................................................................................................................................ 63 .............................................................................................................................................. 63 IRODALOMJEGYZÉK ..................................................................................................................... 64
Rip
GAMMA (4.0)
66