Érzékelő alapú rendszerek FONTOS!!!! Az alábbi dokumentum nem lett teljes körűen tesztelve, ezért lehetnek még benne gépelési, értelmezési és persze elvi (0 pont) hibák is. Ezt a doksit az órai jegyzetből, és ahol szükséges volt különböző forrásokból szedtük össze. (Megpróbáltuk mindenhol megjelölni a forrást, de nincs mindenhol feltüntetve!) Sajnos igyekezetünk, és jó szándékunk ellenére sincs semmi biztosíték arra, hogy csak a doksiban leírtak megtanulása elegendő lenne a vizsga sikeres telesítésére. Mivel ebből a tárgyból államvizsgázni is fogunk, ezért szeretnénk, ha az észrevételeiteket, megjegyzéseiteket, tanácsaitokat, kiegészítéseiteket, hibáinkat megírnátok a BIR –es levlistára (vagy személyesen nekünk).
Tartalomjegyzék 1. Szenzorok csoportosítása (passzív, aktív, hagyományos, intelligens). Az egyes csoportok jelentésének magyarázata, példák. ............................................................................................. 2 2. Részecskeszámlálók működése, jellemzői ........................................................................... 12 3. Szcintillációs detektorok működési elve (Gamma-kamera, PET, rajz, magyarázat) ........... 16 4. Távolságmérés elvei (Ultrahangos, lézeres, radaros)........................................................... 20 5. CCD-k működése ................................................................................................................. 22 6. Képfelvevő csövek (Vidicon) működése. Vázlatos rajz a magyarázathoz. ......................... 25 7. Jelek jellemzői (analóg, majdnem digitális, digitális).......................................................... 27 8. Mintavételi törvény .............................................................................................................. 29 9. A mérőhíd felépítése, működésének magyarázata ............................................................... 30 10. Optikai enkóderek működése (ábra és magyarázat, kis elmozdulások mérése nagyméretű szenzorokkal) ........................................................................................................................... 31 11. Az intelligens szenzorok általános felépítése……………………………………………..33 12. Jelek szűrésére, formázására alkalmazott eljárások ismertetése (átlagolás, határolás, medián szűrés, furier szűrés).................................................................................................... 35 13. Szervomotorok felépítése, működése.[2] ........................................................................... 36 14. Képek jellemzői.................................................................................................................. 37 15. Képek szűrése (konvolúciós szűrők, morfológiai szűrők). Magyarázatok ábrákkal.[1] .... 39 16. A "Opening" és a "Closing" algoritmusok ismertetése, használatuknak eredménye, célja példákkal illusztrálva................................................................................................................ 45 17. Képfeldolgozás (küszöbölés célja, megvalósításának lehetõségei) ................................... 53 18. Képfeldolgozás (Adaptív küszöbölés célja, megvalósítása, Niblack algoritmus).............. 54 19. Képfeldolgozás (szegmentálás megvalósításai, célja) ....................................................... 55 20. Képfeldolgozás (objektumok azonosítása, objektumok jellemzõi).................................... 56
1
1. Szenzorok csoportosítása (passzív, aktív, hagyományos, intelligens). Az egyes csoportok jelentésének magyarázata, példák.
Kétféle csoportosítás: -
aktív és passzív hagyományos és intelligens
Fizikailag:
Fotórezisztor (fotóellenállás): Fény érzékelésére alkalmas ellenállás. A beeső fény változtatja az ellen-állás értékét és a változás áramkör segítségével elektromos jellé alakítható. Anyaga félvezető. A beeső fotonok növelik a töltés-hordozók számát, ez okozza az ellenállásérték megváltozását. A fényerő növelésével az ellenállás értéke csökken, a kettő közötti kapcsolat azonban eltér a lineáristól.
Fotódióda: Félvezető dióda, olyan fényelektromos érzékelő, amelyben a félvezetőknek azt a tulajdonságát hasznosítják, hogy fény hatására megnő a vezetőképességük. Kapcsolásokban alkalmazzák, amelyekkel fény v. fényváltozás hatására kell elindítani valamely elektromos folyamatot (pl. fényrelé, tűzjelző működtetése). Sajátos körülmények esetén a fotonok számlálására is használható.
2
Fotótranzisztor: Levezethető a fénnyel arányos jel. Bázisra adott jel => nyílt/zárt a tranzisztor Munkapont jó beállítása => fényérzékelés Olyan tranzisztor, amelyben a félvezetőknek azt a tulajdonságát használják fel, hogy fény hatására megnő a vezetőképességük. Előnye a fotodiódával szemben, hogy a fény hatására létrejött gyenge áramot egyben fel is erősíti. Fényérzékelő, fénymérő berendezésekben, kapcsolásokban alkalmazzák.
Szenzorok karakterisztikája Olyan tartomány választunk, ahol nincs inflexiós pont. Függvény meghatározása – korrigáljuk a mért értéket.
Légnyomás mérése: barométer Ha az egyik ellenállás megváltozik, nagyobb áram lesz az árammérőn. A Hőérzékenység miatt hőkompenzálni kell a hidat, (két érzékelős ellenállás alkalmazása).Az egyik érzékelős ellenállást úgy alakítom, hogy a nyomás függvényében is változhasson, a másikat pedig elzárom a környezettől, így hőmérsékletváltozásra hőkompenzálni fog. Az összes híd áramkörbe hőkompenzáció kell (u.o. típusú szenzorok – 2 db (alsó ábra).)
Eddig láttuk, hogy könnyedén mérhető például a hőmérsékletváltozás ellenállással, hogy ha
3
hőmérséklet nő, akkor ellenállás nő. De vannak ellentétesen működő ellenállások is (1 fok változásra mennyi az ellenállás értékének változása): • PTC-ellenállás (hőmérséklet növekedésnél csökken az ellenállása) (PTC - angol kif. Positive Temperature Coefficient) Pozitív hőfoktényezőjű • NTC-ellenállás (hőmérséklet csökkenésnél csökken az ellenállása) (NTC - angol kif. Negative Temperature Coefficient) Negatív hőfoktényezőjú
Aktív/passzív szenzorok (Hagyományos szenzorok?) -
Aktív: mérőjel kibocsátása pl. megvilágítás/vaku használatával lesz aktív, egyébként passzív
o Távolságmérő
A szenzor folyamatos távolságmérést végez és közben az analóg kimenti feszültség értéke változik a mért távolság függvényében. Segédjellel működik, amit kibocsátunk Infrareflexiós szenzor így működik Előny: megbízható Hullámhosszfüggőség: adott feladathoz mérten kell elkészíteni
o Hangkibocsátás Ultrahang kibocsátása Hangkibocsátás és visszhang érzékelés között eltelt időnek a felével dolgozik – távolságmérés Hang terjedési sebessége ~1000km/h (függ a légnyomástól, közegtől stb.)
4
olcsó szerkesztés => 1 küszöböt megtalál az a jel UH: magasabb frekvencia miatt jobb DE van egy minimálist távolság, amin belül nem működik => t0 holtidőn belül nem mér a szenzor Jel energiája csökken a távolság függvényében Van egy maximálisan mérhető távolság:
o Fénnyel való megvalósítás: Sebesség: ~300.000 km/h
5
Ehhez nincs számláló, de Hold-Föld távolság megmérésére van (Elsőként magyarok radarral mérték), de minket kis távolság érdekel Megoldás?
• •
vagy
•
o Fázisdiszkriminátor
kibocsátott és eltolt jelek (vékony és vastag vonallal jelölt) 2 azonos frekvenciájú, de fázisban eltolt négyszögjel
6
könnyű olyan áramkört készíteni, amely fázist eltol => ezáltal időt mérhetünk szélesség nő/csökken => effektív szint változása => analóggá alakítás
a fény nagy frekvenciája miatt nagy sávszélességen használjuk
o Radarok Vívő: rádiófrekvenciás jel Visszaverődött jel befogása => itt is távolságmérés Frekvencia: mekkora a tárgy, amelyről visszaverődött (nagy frekvencia sok kis dolgot is befog, így vakriasztás esete is fennállhat) Elve ugyanaz, mint a lézeres rendszernél Használata: mozgó járművek bemérése => Doppler radar • Hullámfrontok (érdekes megfigyelés, hogy ha a vonat felénk jön, akkor magas a hang, ha pedig megy, akkor mély, mert a jelek ritkulnak)
• •
a modulált (visszaverődött) jel frekvenciáját kell nézni:
7
• • •
t0-t1 viszonyából megállapítható a sebesség (ma: lézeres mérés) t1 torzulás => mennyire sűrűsödik a frekvencia, és ha közeledik akkor a jel sűrűsödik Frekvenciaeltolódás (Doppler-eltolódás), amely annak következtében jön létre, hogy a sugárzást kibocsátó forrás távolodó, vagy közeledő mozgásban van a megfigyelőhöz képest. A frekvenciaeltolódás a relatív sebességtől függ. Folyamatosan távolodó forrásnál a megfigyelő alacsonyabb, folyamatosan közeledőnél magasabb frekvenciát észlel a kibocsátottnál (vöröseltolódás, illetve kékeltolódás). Vagy másképp megfogalmazva: Bárki tapasztalhatja, bár talán nem mindenki figyelte meg, a Doppler-hatást. Ha egy autó nagy sebességgel halad el mellettünk, az általa keltett hang magasságában hirtelen csökkenést tapasztalunk. De ugyanezt tapasztaljuk akkor is, ha mi mozgunk az állandó hangot adó hangforrás mellett. A mozgás következtében megfigyelhető hangmagasság-változást hívjuk Doppler-hatásnak. Az érzékelhető frekvencia természetesen matematikai összefüggéssel is kifejezhető. A jelenségnek az a magyarázata, hogy a közeledő hangforrás az újabb és újabb hanghullámokat mind közelebb bocsátja ki, így előtte a hullámfrontok közelebb vannak egymáshoz, mint mögötte. Ez pedig azt jelenti, hogy az előtte álló megfigyelő gyakoribb hullámfrontokat, vagyis nagyobb frekvenciát, tehát magasabb hangot érzékel. A mögötte álló megfigyelő ritkább hullámfrontokat, vagyis kisebb frekvenciájú, alacsonyabb hangokat érzékel, mint a kibocsátás valódi frekvenciája. Ha a megfigyelő mozog, akkor a hangforrástól távolodó, egymástól egyenlő távolságra haladó hullámfrontokat a közeledő rövidebb időközönként metszi (nagyobb frekvencia, magasabb hang), a távolodó nagyobb időközönként metszi (kisebb frekvencia, mélyebb hang), mint ahogy azok valóban követik egymást.
•
Egyik előnye a Doppler radarnak, hogy lakásriasztóként nagyon jól használható, mert akár be is vakolható
o A/D jeleket kibocsátó szenzor Pl. nukleáris sugárzásmérő
8
Gáztöltésű cső fém burkolattal, ami gamma sugarak mérésére szolgál Közepében vezető pálca van elhelyezve Gerjesztő feszültség rákapcsolása (100-150 V) Ionizálás határán van (ionizálva fényjelenség figyelhető meg, de U_kisülés-ig semmi, vagy minimális áram, majd nagy feszültség)
cső előfeszítése ha a középső elektródába ionizáló hatású részecskét bocsátunk, akkor világít, de előfeszítés nélkül nem fog
sugárzásintenzitás = becsapódások sűrűségével arányos de kisülés alatt újat nem tud detektálni, mert a feszültség még nem ment vissza az eredeti értékre szenzor kimenete: impulzus sorozatok α sugarak: minden elnyeli β sugarak: elektronsugár, röntgen γ sugarak: legkisebb tömeg, nagy sebesség, fémen (Al) is átmegy 9
folyamatos háttérsugárzás mindig tapasztalható -
Passzív: semmilyen mérőjelet nem bocsát ki o o
Hőérzékelő ellenállás (szenzor szolgáltatása passzív) Napelem: Si lapon fény hatására a fotonból elektron kilökése => maguktól áramot gerjesztenek => fényerősség mérése (Annál nagyobb áram alakul ki, minél több foton érkezett be a napelem felszínére időegység alatt.)
o Légnyomásmérő
Intelligens szenzorok Bevezetés????
- Kilométeróra o Impulzusszám egységnyi ideig való mérése megadja a frekvenciát o Küllőre jeladó felszerelése (mágneses tér érzékelése)
o o Ha elhalad előtte a mágnes, akkor ad egy impulzust
o o Ha több jeladó van, akkor gyakrabban jön az impulzus o Távolság a kerék sugarának ismeretében kerül kiszámításra
- Speciális fényérzékelő elem o Fény hatására változik a frekvenciája
10
o o van egy határfrekvencia o μp helyett CT (számláló), ennek kell tudni a határfrekvenciáját, amin belül még fel tudja dolgozni
- Frekvenciamérő o Egységnyi időnként mérem a frekvenciát és LCD-n kiírom az értéket
o
Intelligens szenzor, AGC – Lásd 11. tétel ☺
11
2. Részecskeszámlálók működése, jellemzői − A Geiger-Müller számlálócső (GM-cső) radioaktív sugárzások kimutatására ill. számlálására alkalmas. A számlálás a sugárzás ionizáló hatása révén történik. − A GM-cső egy hengeres katódból és egy a katód tengelyében kifeszített acél vagy volfrám anódszálból áll. A cső háza lehet maga a katód (vörösréz), vagy egy üvegcső. Az utóbbi esetben a katód rendszerint az üvegcső fém vagy grafit bevonata. Az ilyen GM-cső fala általában csak a gammasugárzást engedi át. A gamma-sugárzást mérő csövek esetében a cső falából kiváltott elektronok szolgáltatják a kezdeti gázionizációt. − Ha alfa vagy béta részeket is kívánunk detektálni, akkor alumínium vagy csillámvégablakos csövet kell használnunk. Az ablakvastagságot a vizsgálni kívánt sugárzás energiájának, tehát hatótávolságának megfele1ően kell megválasztani. − A csövet légritkítás után 12 000 Pa (90 torr) nyomású argongáz és 1 300 Pa (10 torr) nyomású nagy molekulájú szerves vegyület (pl. alkohol) keverékével töltik meg: szerves vegyület helyett néha halogéngáz (pl. brómgőz) adalékot használnak. − Ha a csövön áthaladó ionizáló részecske annak érzékeny térfogatában legalább egy elektron-ionpárt kelt, akkor ez a csőben egy lavina kialakulását indítja el. − A nagy mozgékonyságú elektronok az anódszál felé mozognak. A szál közvetlen közelében, attól 0,1–0,2 mm-re kialakult erős elektromos térben az elsődleges (primer) elektronok elegendő energiára tesznek szert újabb gázatomok ionizálásához. A primer és az ütközési folyamatokban keletkezett elektronlavina kb. 10-7 s alatt fut fel az anódra; ez szolgáltatja a detektor-jelet. − Az elektronütközések egy része az argon atomok gerjesztéshez vezet. Ezek legerjesztődéskor ultraibolya fotonokat bocsátanak ki. A rövid hullámhosszú fotonok fotoelektromos hatás révén újabb lavinákat indítanak el a szál közelében, és kiterjesztik a kisülést a szál egész hosszában. − Az anódon kapott impulzus nagysága tehát független lesz a kezdeti ionizáció mértékétő1, a kimenő - viszonylag nagy amplitúdójú- jelek csak számlálásra alkalmazhatók, spektrometriai célra nem. − A nagyobb tömegük miatt kisebb mozgékonyságú pozitív ionok a szál környezetében pozitív tértöltést hoznak létre, amely a térerősséget a GM-küszöb alá csökkenti kb.105 –10-6 s időtartamra: ezen az un. holt-időn belül újabb sokszorozási folyamat nem indulhat meg. − Az argon-atomok legerjesztődésekor olyan, aránylag nagy hullámhosszúságú ultraibolya fotonok is keletkeznek, amelyek áthatolóképessége nagyobb. Ezek a gáztöltésen átjutva a katód felületéből váltanak ki fotoelektronokat
12
− A fotoelektronok közül azok, amelyek a holtidő eltelte után érkeznek az anódszál közelébe, újabb lavinát és ezzel újabb kisülést hoznak létre. Ugyanilyen következményekkel járhat a 10-5–10-4 s-on belül a katódhoz érkező pozitív ionok rekombinációját követő másodlagos elektron ill. ultraibolya foton kiváltása is. − Amíg a pozitív tértöltés-felhő a katód felé vándorol, a térerősség az anódszál közelében fokozatosan növekszik. Amíg ez a GM-küszöböt el nem éri, a cső újabb ionizáló részecskét nem tud jelezni (holt-idő). Ez az idő 100–300 μs körüli érték. − A GM-küszöbnél nagyobb térerősség esetén a keletkező impulzus amplitúdója a pillanatnyi térerősségtől függ; maximumát akkor éri el, amikor a pozitív ionok elérik a katódot. Ebben a második un. regenerálódási időszakban a normálisnál kisebb impulzusok keletkeznek. − Ezekből a GM-csőhöz csatolt elektronikus rendszer (erősítő, diszkriminátor) csak egy - a diszkriminátoron beállítható - minimális amplitúdónál nagyobbat tud érzékelni. − Meg kell tehát különböztetni a számlálócső holt-idejét (τ) és, az egész számlálóberendezés feloldási idejét (κ) Ez utóbbin azt a legrövidebb időt értjük, amelyen belül egymást követően beérkező két részecskét a berendezés még külön regisztrálni képes; gyakorlati szempontból ennek az ismerete a fontosabb. − A GM cső képes a megfelelő típusú és energiájú radioaktív sugárzásból elektromos impulzusokat előállítani. Ennek a közelébe, egy megfelelően kialakított tartóba, helyezzük a radioaktív izotópot, amely esetünkben gamma sugarakat bocsát ki.
Tehát az előfeszített gázcsőbe való becsapódáskor impulzusok keletkeznek, így előny az, hogy „csak” ezeket az impulzusokat kell figyelni, és nem kell A/D konverter. http://ion.elte.hu/~kornyezet/kornyfiz/dem/dem.htm
13
http://www.reak.bme.hu/~sukosd/Eloadas04.pdf
14
15
3. Szcintillációs detektorok működési elve (Gammakamera, PET, rajz, magyarázat) GAMMA-SUGÁRZÁS: nagy energiájú (nagy frekvenciájú, azaz kis hullámhosszú) elektromágneses sugárzás, a hullámhossza 10 pm alatti. SZCINTILLÁCIÓS KRISTÁLY: monolit kristály (egykristály), általában KI vagy NaI molekulák alkotják. Mivel az alkotó atomoknak kvantumos elektronszerkezete (több elektronhéja) van, ezért foton általi gerjesztés után rekombináció történik, mely elektronsugárzással jár. ELEKTRONSOKSZOROZÓ CSŐ: a bemenetén egyetlen bejövő elektron is lavinahatást kelt, és a kimeneten ennek hatására elektronimpulzus képződik. Ez az impulzus csak analóg oszcilloszkóppal mérhető, mert idődiagramjának statisztikai jellegű, sztochasztikus görbe formája van. SZCINTILLÁCIÓS DETEKTOR: olyan eszköz, amely egyetlen bejövő gamma-fotonból is mérhető feszültségjelet generál. Felépítése: egy szcintillációs kristályhoz tartozó elektronsokszorozó cső. Működése (az előbbiekben tárgyalt részegységek alapján): a bejövő gamma-sugár hatására a kimeneten mérhető elektronimpulzus keletkezik. Mivel az erős látható fény tönkreteheti az érzékelőt, ezért ólomházban van elhelyezve, és a bemenete elé pár mikrométer vastag Al-lemez kerül. Ez a gamma-kamera és a PET érzékelő egysége. GAMMA-KAMERA: olyan eszköz, mely egy testből jövő gamma-sugárzásról kétdimenziós képet alkot. A gyógyászatban használják a test feltérképezésére, gamma-sugarakat kibocsátó izotópok bejuttatása után. Felépítése: szcintillációs detektorokból álló kétdimenziós tömb, melyek előtt kollimátor ("egy marék ólom szívószál") van. Ez azért kell, hogy a detektorok csak az adott szögből érkező gamma-sugarakat érzékeljék. Ha csak ennyiből állna a gamma-kamera, akkor a felbontása akkora lenne, mint a szcintillációs detektorok száma egy sorban × egy oszlopban. Viszont egy detektor nagy és drága - ezen probléma megoldására készült egy magyar találmány: a kollimátor és a detektorok közé egy üveglapot helyezve, az szétszórja a bejövő fényt, így a kollimátoron kereszüljutó gamma-sugarakat több, egymás melletti detektor is mérni tudja. Így egy felvillanás alkalmával a különböző detektorok által mért fényimpulzusok aránya a fényforrás pontos helyét reprezentálja. (A számításhoz elengedhetetlen, hogy előzőleg a gamma-kamerát ún. fantomokkal kalibráljuk.) A felbontást ezek után a kollimátor fogja meghatározni: minél kisebb a lyukméret, annál nagyobb lehet a felbontás, de annál nagyobb energiájú bemenő jel kell a működtetéséhez. POZITRON-EMISSZIÓS TOMOGRÁF (PET): olyan eszköz, mely egy testből jövő gammasugárzásról háromdimenziós képet alkot. A gyógyászatban használják a test feltérképezésére, pozitront kibocsátó izotópok bejuttatása után. Működésének alapelve: A kibocsátott pozitron azonnal elnyelődik, azaz a legközelebbi elektronnal (az antirészecskéjével) való találkozásakor egy-egy ellentétes irányú foton jön létre. Mindkettőt érzékeljük, és az érzékelések helye alapján kiszámítható a pozitron-emisszió helye. Felépítése: szcintillációs detektorokból álló gyűrűk (itt nincsenek kollimátorok). 16
----Megjegyzés: a tételhez ábrák tartoznak, melyek a wikipedia.org oldalról származnak. Megjegyzés: a PMT kifejezést szándékosan nem használtam kifejtés során, mert nem volt számomra egyértelmű, hogy csak az elektronsokszorozó csövet, vagy az egész szcintillációs detektort jelenti.
Scintillációs detektor
Gamma-kamera
17
Pet-detektorok
Pet – működés
18
Kollimátor
19
4. Távolságmérés elvei (Ultrahangos, lézeres, radaros)
Ultrahangos távolságmérés -
1. tétel, 4. oldal Ha T0 időben bocsátjuk ki az impulzust és T1 időben érkezik vissza a kibocsátóhoz, akkor a távolság egyszerűen meghatározható a szenzor és a tárgy között: D = 0,5 * C * (T1 - T0) ahol D a távolságot, C a hang sebességét jelöli.
-
A T1-T0 idő hosszúsága kiszámolható lehetne akár egy stopperórával is, ami a kibocsátás pillanatában van elindítva és a visszhang beérkezésének pillanatában van leállítva. Erre persze az ember képtelen volna, ám a mikrokontrollerek általában tartalmaznak beépített órát, számlálót, ami akár mikro- vagy nanoszekundumonként is inkrementálódhat, így lehetőséget nyújt, hogy nagyon rövid idő is mérhető legyen vele.
Gabonamérés: o Probléma: diffúz felület (mindenhonnan visszaverődhet) o UH terjedése jobb, mint az infráé
o
Lézeres távolságmérés -
-
A sugárzást visszaverő tetszőleges felület távolságát lehet mérni, nincs szükség külön reflektáló felületre. A lézer-impulzus terjedési idejének meghatározásával működik. Nagy távolságokat is lehet mérni kedvezőtlen, ipari körülmények között is. A mérési idő rövid, ez alkalmassá teszi mozgó tárgyakon végzendő mérésekre is. A módszer lényege, hogy egy fény impulzust, vagy egy szinuszosan modulált fényerejű nyalábot bocsátunk ki, mely a környezet adott pontjáról visszaverődik és visszajut az érzékelőbe. A távolsággal arányos mennyiséget az impulzus, vagy a szinuszosan modulált jel meghatározott állapotának, fázisának terjedési ideje jelenti. A
20
-
fázis-modulációs módszer a kibocsátott és visszavert jel fázisának összehasonlításán alapszik, és nem igényel nagyfelbontású időmérést. (Öszz. 2 csoport van, az első az előbb említett, a második csak irány kijelölésére szolgálókat foglal magába) http://epa.oszk.hu/00000/00025/00004/vogel.html
Rendőrségi alkalmazás: autók fotózása Míg a radar folyamatosan és össze-vissza szórja a hullámait, a lézer pontosan a kocsira irányul, és csak akkor ad ki jelet, ha a rendőr céloz, és egy kapcsolóval aktivizál. Ha egy hosszú egyenes szakaszon, sem előttünk, sem velünk szemben nem halad más gépjármű, akkor a detektor jelzése azt jelenti, hogy valószínűleg bennünket mérnek. Ha a közvetlenül előttünk haladóról vagy valamilyen tereptárgyról nem törik meg szerencsésen a jel, detektorunk nem jelez, 1 másodpercünk sincs arra, hogy lelassítsunk, emiatt elkerülhetetlen a büntetés.
Másik példa: Műholdak bemérése: A fotografikus észlelésekhez képest elõrelépést jelentettek a Föld felszínén létesített lézeres követõállomások, amelyek segítségével a mûhold pályájának az állomásról látható szakaszain az állomás és a mûhold közötti távolságot és/vagy irányt mérve a mûhold pályájának egy-egy pontját meghatározták. Lézeres távolságmérés: Satellite Laser Ranging, SLR http://www.gpsmagazin.hu/content/view/242/
Radaros A Radio detection and ranging (felkutatás és távolságmérés rádióhullámokkal) kifejezésből alkotott betűszó. A radar mesterséges 1mm-es hullámtartományú elektromágneses hullám rezgését használja fel tárgyak felkutatására, amelyek visszaverik a sugárzást. A tárgy helye annak az időnek a függvénye, amelyre a rezgésnek szüksége van ahhoz, hogy a tárgyat elérje és onnan visszatérjen az antennához. + 1. tétel, 6. oldal
21
5. CCD-k működése http://ccd.mcse.hu/ccdalap.html A CCD (Charge-coupled Device, azaz töltés-csatolt eszköz) a fényt digitális képpé alakító elektronikus eszköz, mely egymáshoz csatolt kondenzátorokból álló integrált áramkört tartalmaz. Külső áramkör segítségével minden kondenzátor képes átadni a töltését a szomszédjának, így kiolvasható a kép. A CCD-ket a digitális fényképezés és a csillagászat területén alkalmazzák. A csillagászatban részben fényességmérésre, optikai, és UVspektroszkópiára és nagysebességű technikáknál).
Részei: MOS tárolóegység o Egy ilyen kis tároló három alapvető részből áll: szennyezett félvezető alapréteg, szigetelő zóna (általában szilícium-dioxid), elektróda
o o A szilícium alapréteg vezetési tulajdonságát a tiszta Si kristály szennyezésével lehet befolyásolni. o Ha egymás mellé több elektródát helyezünk el, s megfelelően változtatjuk az ezekre kapcsolt feszültséget, úgy a töltéscsomag mozgathatóvá válik. o
CCD Chip: o MOS tárolóegységekből és az azokhoz kapcsolodó töltésléptető elektródákból helyezzünk most egymás mellé egy síkra több darabot.
o o Megvilágítja a chipet => kiolvasás órajelre ütemezve Feszültségérték kiolvasása Impulzus => cella töltése egyet ugrik jobbra (így a legutolsót tudom mindig kiolvasni) 22
Sorok száma = lábak száma o => CCD kamera
CCD kamera: CCD mátrix:
Mindig egy oszlop információja jön ki. - CCD mátrix hiba: ha a kamera egy pontjára lézerrel világítunk, a töltések egymásban mennek át („elkenődés” figyelhető meg)
-
Van egy érzékelési tartományuk PL. nap ha belevilágít, azt fekete foltnak látjuk, mert túlvezéreli a chipet CMOS kamera: nincs töltésátvitel, diszkrét félvezetőkből áll o Kis fogyasztás, de lassabb és gyenge a fényérzékenysége Szubpixeles technológia A kamerákban szabályozott visszacsatolás, erősítés van (AGC – Automatic Game Control) Színes kamera kalibrálása: (fehér fehér legyen, fekete fekete legyen; évente egyszer a CCD chipet automatikusan megnézni) Tartomány, amiben „látnak” a kamerák:
23
-
310-850: látható színkép tartomány szaggatott vonallal jelölt az a színtartomány, amit a kamera lát -> kicsit belelát abba a tartományba, amit mi nem látunk, (félvezetők karakterisztikája a piros felé tolódik) 450: zöld szín nagyobb hullámhossz => kisebb frekvencia
Monokróm éjjellátó:
A becsapódás hozza létre a képet, amit mi a lencse segítségével látunk.(???)
24
6. Képfelvevő csövek (Vidicon) működése. Vázlatos rajz a magyarázathoz. Megjegyzés: Órán elmondottakból, számomra nem derült ki a lényeg, ezért internetről szedtem le az anyagot. (http://mazsola.iit.uni-miskolc.hu/DATA/segedletek/kepfeld_multm/vargaz/digim-tools.htm)
A képérzékelés lényege: Az elsődleges fényforrás megvilágítja a digitalizálni kívánt objektumot. Az objektum a rá eső fény egy részét visszaveri ezért úgynevezett másodlagos fényforrássá válik. A visszavert fény információt szállít a felület alakjáról, színeiről illetve különböző jellemzőiről. A visszavert fény egy részét optikai eszközökkel leképezve jön létre a kép, melyet a képérzékelő eszköz érzékel, és pontról pontra letapogat.
A Vidicon felépítése
A képet megfelelő optikával egy fényérzékeny félvezető rétegre képzik le. A fotoelektromos hatás következtében ebben az egyes képelemek fényességével arányos elektromos töltés keletkezik, amitől a fényérzékeny réteg mögötti tároló réteg töltésmegosztás révén - feltöltődik, a képelemek világosságával arányosan. Ezt a töltésképet egy megfelelően vezérelt elektronsugár soronként letapogatja és a töltéskisülés hatására a tároló lemezhez csatlakozó ellenálláson a megvilágítással arányos feszültség jön létre.
25
Ezt az (analóg) elektromos képjelet (egyszerű) videojelnek nevezik. Ehhez legtöbbször hozzákeverik a kép- és a sorszinkron jelet, így áll elő az összetett videojel. Az OIRT szabvány szerint a képet 625 sorra bontják (ebből azonban csak 576 látható, a többi a képváltás idejére esik), a vízszintes/függőleges képarány 4:3, így egy sor 768 képpontból áll. A képet két félképből (páros, ill. páratlan sorszámú sorok) fésűsen egyesítik (váltósoros (interlaced) letapogatás). A képváltási frekvencia 25 Hz, így egy kép felvételére 40 ms jut. A fényérzékeny réteg fizikai tulajdonságainak változtatásával különböző kameratípusokat fejlesztettek ki. A színes kamerákban az optika a képet piros (R), zöld (G) és kék (B) színösszetevőre bontva képzi le a megfelelő színsávra érzékeny félvezetőrétegre, ennek megfelelően a tároló rétegen is egyszerre 3 töltéskép keletkezik. A színes videojelet 3 együttfutó, de egymástól függetlenül vezérelt elektronsugárral állítják elő.
26
7. Jelek jellemzői (analóg, majdnem digitális, digitális) Megjegyzés: Órán nem volt róla szó, az anyagot internetről szedtem
Analóg jelek és jellemzői: Az analóg jel egy folyamatosan változó jel idő és amplitúdó szerint egyaránt. Leginkább abban különbözik a digitális jeltől, hogy az apró ingadozásoknak, hullámzásoknak is van jelentésük. Az analóg jel a közvetítő eszköz valamilyen tulajdonságát használja ki a jel információtartalmának továbbításához. Például a barométer mutatójának forgása révén vagyunk képesek a megfelelő jel nyomásra vonatkozó információtartalmát megjeleníteni. Elektronikus értelemben a leginkább használt tulajdonság az, hogy a feszültségváltozást szorosan követi a frekvencia, az áramerősség és a töltés megváltozása. Bármely információ, amit egy analóg jel szállít, gyakran egy fizikai jelenség mérhető változásának kifejeződése. Ilyen például a hang, a fény, a hőmérséklet, a hely, a nyomás. Ennek megvalósításához a jel valamilyen jelátalakítón megy keresztül. Az analóg jelfeldolgozásnak a legnagyobb hátránya az, hogy minden rendszerben létrejönnek véletlenszerű változások, úgynevezett rendszerzajok. Amikor az analóg módon rögzített információt újra és újra lemásolják, vagy nagy távolságokra továbbítják, ezek a véletlenszerű, nem kontrollálható változások válnak uralkodóvá és jelentős mértékben torzítják az analóg jelet. Elektromos analóg jeleknél ezek az adatveszteségek csökkenthetők árnyékolással, jó minőségű összeköttetésekkel, és különböző kábeltípusokkal, mint például a koax kábel. A zaj hatására az analóg jel teljesen elveszhet, vagy visszaállíthatatlanul eltorzulhat. Ezért szokták az analóg jelet felerősíteni küldés előtt, hogy a fogadó rendszernél már gyengült részek is visszaállíthatóak legyenek. Ezen eljárás nagy problémája, hogy az erősítés során a jel mellett a zaj is felerősödik. Az analóg jelek továbbításának egy másik módszere a moduláció használata. Ezen eljárás során valamilyen alaphullám (például egy szinuszosan változó hordozó hullám) valamelyik tulajdonságát megváltoztatják. Az amplitudó-moduláció (AM) a forrásinformáció szerint változtatja (modulálja) az alaphullám amplitudóját. A frekvencia-moduláció (FM) az alaphullám frekvenciáját modulálja a forrásinformáció szerint.
27
Digitális jelek és jellemzőik: A digitális jel valamely változó jelenségnek, vagy fizikai mennyiségnek diszkrét (nem folytonos), megszámlálhatóan felaprózott, s így számokkal felírt értékein alapul. A digitális adat-átvivő jelek az elektronikus, vagy optikai impulzus két lehetséges értéke közül az egyiket vehetik fel. A logikai 1 (van impulzus) vagy 0 (nincs impulzus) értékeket. A digitális átvitel több fontos szempontból jobb az analóg átvitelnél. Elõször is nagyon kicsi a hibaaránya. Analóg áramkörök esetén erősítőket használnak a vonalon fellépõ csillapítások ellensúlyozására, azaz a jel regenerálására. Mivel a szükségképpen két irányban elhelyezett erősítők paraméterei folyamatosan változnak (öregedés, külső hőmérséklet, stb.) ezért ez soha nem lehet tökéletes. Mivel a hiba halmozódik, ezért a sok erősítőn átmenő jelek várhatóan komolyan torzulnak. Ezzel szemben a digitális jelek tökéletesen helyreállíthatók, hiszen két lehetséges értékük van, az 1 és a 0. A digitális jelek helyreállításakor nem lép fel halmozódó hiba. A digitális átvitel egy másik nagy előnye az, hogy egyetlen eszköz hatékonyabb kihasználását megengedve, különböző típusú adatok (hang, zene, normál adat, kép pl. televíziós kép vagy videotelefon stb.) kevert átvitelét teszi lehetővé. Majdnem digitális jelek: ???
28
8. Mintavételi törvény Megjegyzés: Molnár annyit mondott, hogy egy mondat…
Shannon-Nyquist nevéhez fűződik Tétel: A mintavétel frekvenciája legalább duplája kell, hogy legyen a jelben lévő legnagyobb frekvenciájú komponens frekvenciájának. http://itl7.elte.hu/html/jelfel/node27.htm -
29
9. A mérőhíd felépítése, működésének magyarázata
A mérőhíd felépítése: Adott 4 ellenállás, melynek értéke R. Ekkor a híd kiegyenlített, tehát az árammérőn nem folyik áram. Ha az R1 ellenállás érzékeny a környezetére (pl: hőmérsékletre) akkor a hőmérséklettől függően változik az értéke. Ez azt eredményezi, hogy a híd nem lesz kiegyenlítve és az árammérőn a hőmérsékleti értéknek megfelelő áram fog folyni. Tehát az áram függvényében jelenik meg a hőmérséklet.
Ennek a megoldásnak hibája, hogy nagyon érzékeny a hőre, ezért hőkompenzálni kell. Hőkompenzáció: Veszünk még egy ugyanolyan „érzékelős” ellenállást, amit elzárunk a külvilágtól. Ahogy változik a hőmérséklet, úgy változik az értéke, így hőkompnezál.
30
10. Optikai enkóderek működése (ábra és magyarázat, kis elmozdulások mérése nagyméretű szenzorokkal) Megoldás: Tárcsás vagy síklemezes elmozdulásmérés
1. Tárcsás: (régi egerek működése)
Működés: Ahogy forog a tárcsa, úgy generálódik az A és B impulussorozat Forgásirány meghatározása: Van 2 fototranzisztor. A tárcsa úgy van kialakítva, hogy forgásiránynak megfelelően vagy A vagy B fog előbb fényt kapni. Ebből következtethetünk az irányra Előnyök a potméterrel szemben: - „Végtelen” - Digitális jelet ad - Nem kopik Hátránya: - Kell egy referencia pont
31
2. Síklemezes:
-
Van 2 síklemez, melyek sűrűn vannak csíkozva (kb. 50%-ban átlátszó) 1. lemez áll, a 2. rá van szerelve arra, aminek az elmozdulását mérni akarjuk Amint megmozdul a tárgy, változik a dióda felől érkező fény erőssége a túloldalon. Ezt a fényt egy fotótranzisztor segítségével tudjuk mérni.
32
11. Az intelligens szenzorok általános felépítése (vázlatrajz és magyarázat az egyes részekhez). Az intelligens szenzorok által nyújtott szolgáltatások (pl. automatikus erősítésszabályozás távoli felügyeleti lehetőség, öndiagnosztika, stb). OLVASD EL A LÁBJEGYZETET!!!! 1
A mikroprocesszorok rohamos fejlődésével lehetőség nyílt arra, hogy a szenzorjainkat „okosabbá” tegyük. A fenti ábrán egy „intelligens” szenzor vázlatrajzát láthatjuk, 3 fő résszel: magával a szenzorral, egy erősítővel, és a szerkezet „agyával” a microkontrollerrel. A szenzorokba általában eleve beépítenek erősítőket, a kis intenzitású, gyenge jelek felerősítésére (1x-es erősítés), az impedancia illesztés miatt (3.). Ugyanis az erősítő (A), nagy impedanciájú (MΩ-os) bemenettel rendelkezik, ami miatt a kisebb impedanciájú részről érkező jelek jelentős része reflektálódna. A mikrokontroller szabályozza a szenzor működését, és általa a következő szolgáltatások valósíthatók meg: 1. ön-kalibráció: a szenzornak minden bekapcsolás előtt érdemes magát kalibrálnia. A kalibráció során az offszet és az erősítési hibákat kell kiküszöbölni. Ehhez rendelkezésünkre áll a föld (0V) és a felső mérési határ (referencia feszültség). 0-nál lévő hiba az offszet hiba, amelyet összeadással tudjuk megszüntetni. A referencia feszültségnél jelentkező erősítési hibát szorzással tudjuk megszüntetni. Fontos, hogy a két kalibrációs pont között lineárisnak kell lennie. Az önkalibráló kódot a mikrokontroller ROM-jában tároljuk.
1
Ezt a részt sok apró részinformáció alapján állítottam össze, és nem vagyok benne biztos, hogy nem írtam ordító nagy hülyeséget. Sajnos értelmes, elektronikus anyagot nem találtam hozzá. Ezért mindenki csak saját felelősségére tanulja meg innen.
33
2. ön-diagnosztika: a szenzor azon képessége, hogy felismerje a hibás működést vagy működésképtelenségét. 3. ön-szabályozás: ahhoz hogy a szenzorunkra ne legyenek hatással az esetleges méréshatár változások, képesnek kell lennie minél nagyobb tartománybeli érzékelésre. Ekkor viszont a mikrokontrollernek szabályoznia kell azt a tartományt, amelyet a szenzorunk mér.
4. programozhatóság, távmenedzselés: ebben az esetben a mikrokontrollerünket tudjuk „kívülről” programozni, így a szükséges változásokat szoftveresen is végre tudjuk hajtani. Bizonyos esetekben szükséges, vagy egyszerűen kényelmesebb, ha ez a felprogramozás nagy távolságból is elvégezhető (pl.: Űrszonda) Arról se feledkezzünk meg, hogy a mikrokontrollerben A/D konverter és I/O egység is van.
34
12. Jelek szűrésére, formázására alkalmazott eljárások ismertetése (átlagolás, határolás, medián szűrés, furier szűrés).
A különböző szenzorokkal történő mérések során időben diszkrét jeleket kell feldolgoznunk. Ezekből a jelekből az esetleges hibákat, mérési pontatlanságokat ki kell szűrnünk, illetve a legkülönfélébb okokból a jel formázására is szükség lehet. Az első és legkézenfekvőbb megoldás, hogy páratlan számú mérési eredményeket átlagolok. Ez a módszer eléggé rugalmatlan, mert egy-egy jelentősen eltérő érték (pl.: mérési hiba) nagyban befolyásolja az átlagot. Ezt javítandó elhagyhatom a legkisebb és a legnagyobb értékeket, majd úgy képzem az átlagot. Egy másik módszer, ha alsó és/vagy felső mérési határokat állapítok meg, és e határ alatt vagy felett nem veszem figyelembe az értékeket. A fent említett eljárások hibája, hogy a változásokat nehezen követik. Ezért ezeknél jobb módszer az úgynevezett csúszóablakos megoldás, amely során egy meghatározott nagyságú „ablak” átlagát számítom folyamatosan. A mérés során az új értékeket beléptetem az ablak jobb oldalán, míg az ablak baloldali értékét „eldobom”. Az ablak mérete minél nagyobb annál jobb a hiba-, zajtűrő képessége, viszont annál lassabban változik a szűrt jel.
A zaj szűrésére egy módszer a medián szűrés, mely során a rendelkezésre álló adatokat sorba rendezem, majd a legkisebb és a legnagyobb értékeket felülírom a középső elemmel. Fourier-szűrő: fogalmam sincs, de lehet, hogy ugyan az, mint a képeknél alkalmazott DCT (lásd későbbi tételek).
35
13. Szervomotorok felépítése, működése.[2] A szervók olyan eszközök, amelyek nemcsak magát az egyenáramú motort tartalmazzák, hanem a vezérlő elektronikát, a visszacsatolást, és egy fogaskerék rendszert is. Működési elv: A szervók tengelye (gyárilag) nem tud 360º fordulni, általában 45º (összesen 90º) vagy 90º (összesen 180º) tudnak fordulni jobbra és balra. Ezek a korlátozások mechanikailag vannak megvalósítva, a fogaskerekek egyikén van egy „fék” – fog amelyik nem engedi tovább fordulni a szervo tengelyét. A szervók vezérlése impulzusokkal történik (TTL kompatibilis jel 0/+5 V). A vezérlő vonalra adott impulzus hosszúságától függ a szervo tengelyének elfordulása. A vezérlő elektronika úgy van megvalósítva, hogy 20 milliszekundumonként ellenőrzi a vezérlő jel vonalat és a kapott impulzus hosszúságának függvényében vagy jobbra, vagy balra forgatja a tengelyt. Abban az esetben ha az impulzus hossza 1.5 ms a tengely változatlan helyzetben marad. Ha 1.5 ms-nál rövidebb impulzust adunk akkor a tengely balra fordul le ha hosszabbat akkor jobbra. A potenciométer mechanikusan kapcsolódik a fogaskerekekhez és fordul velük, így az ellenállas értéke változik a tengely forgásával. A szervóban levő elektronika az ellenállás értékéből fogja tudni, hogy a tengely milyen állapotban van (melyik irányba és mennyire van elfordulva).
2
2
Forrás: [2]
36
14. Képek jellemzői (fekete/fehér, bináris, szürkeárnyalatos, színes, színmélység, ismertebb képformátumok, veszteséges és nem veszteséges tömörítések, hisztogram, véletlen zajok, kontraszt). A digitális kép tárolása, megjelenítése, stb képelemenként, képpontonként, úgynevezett pixelenként történik. (a képpontokká alakított digitális kép a bittérkép vagy .bmp). Ezeket a pixeleket tipikusan egy szám típusú, kétdimenziós tömbben (mátrixban) tároljuk a memóriában. Minden pixelnek (ami ügye a kép legkisebb alkotóeleme) két fontos tulajdonsága van: a mátrixbeli pozíciója, és az értéke. Azt, hogy egy pixel milyen értékeket vehet fel, a kép tulajdonságai határozzák meg. A szín mélység azt jelenti, hogy a pixelek színét (ez a pixel értéke) hány biten ábrázoljuk. Így egy digitális kép lehet: 1. bináris: ekkor minden pixel két lehetséges értéket vehet fel (0/1), általában fekete/fehér színek megfelelői. 2. szürkeárnyalatos: ekkor minden pixelt 8 biten ábrázolunk, ami 256 lehetséges értéket jelent. Ezek az értékek a szürke szín egy-egy árnyalatát reprezentálják. 3. színes: 8 bit-től már képesek vagyunk „színesebb színek” 3 ábrázolására is. Mivel „a színérzékelés teljesen az agyunkban történik, a hullámhosszban nincs semmi 'színes' ”[1], ezért a színeket „színterek segítségével írhatjuk le”.[1] Az RGB a legismertebb színtér. Ebben az esetben három szín (Red, Green, Blue) keverésével állítjuk elő a többi színt (nem mindet) (további színtér: CMY, stb..). Az RGB esetében a 8 bitet az alábbi módon tudom a színtérnek megfeleltetni: Bit 07 06 05 04 03 02 01 00 Adat R R R G G G B B 15-16 bit: HighColor 24/32 bit: TrueColor Szokásos ábrázolására példa 24 (3X8) bit esetén: Kék szín = RGB(0,0,255) A kép felbontása: a képpontok száma. Tipikus mérőszámai: dots-per-inch (dpi) vagy a pixels-per-inch (ppi). A kép mérete (bájtban): Kép méret = (magasság x szélesség x színmélység) / 8 Egy 640x480-as, 24-bites RGB kép esetében: 640x480 = 307200 pixel, 307200x3 = 921600 byte Egy digitális képek tárolása nagyon hely igényes ezért azokat tömörítjük. Ezeknek az eljárásoknak két fő irányvonala létezik: a veszteséges és a veszteségmentes tömörítések. A veszteségmentes tömörítés esetében a tömörített képből előállítható az eredeti kép. Veszteségmentes tömörítési mód például a változó hosszúságú kódolás, amely során a gyakoribb értékekhez a rendelkezésre álló készletből rövid kódot, a ritkábban előfordulókhoz hosszabbat rendelünk, a kódolt eredmény tároló igénye az eredetinél kisebb lesz. (pl Huffmann - kódolás) Ismertebb ilyen formátumok: GIF, PNG, JPEG-LS, JPEG2000. Tipikus felhasználása olyan esetekben, ahol nem engedhető meg az adatvesztés: orvosi diagnosztika, űrkutatás. A veszteséges tömörítés során a kép veszít a minőségéből, cserébe viszont jelentősen csökken a fájl mérete. A legfontosabb JPEG-szabvány, a diszkrét cosinus-transzformáció egyik legjellegzetesebb alkalmazási módja: ekkor a kép transzformáltjából a gyors 3
Ezt nem tudtam szebben, jobban megfogalmazni. Remélem valakinek lesz egy jó ötlete kijavítani.
37
változásokért felelős nagyfrekvenciás tagokat (az emberi szem ezekre jóval kevésbé érzékeny) elhanyagolva jutunk kisebb tárterületet igénylő formához, anélkül, hogy a látvány érdemben romlana. A kódolás során a képet 8x8 pixelből álló blokkokra osztjuk, és ezt a 64 képpontot együtt transzformáljuk. A digitális képek tárolására és megjelenítésére alkalmazott módszereket csoportosíthatjuk úgy is, hogy raszteres, vagy vektorgrafikus. A raszter grafika esetében a képek képpontokból épülnek fel (az eddig említettek). Ezeknek közös jellemzőjük, hogy általában a fájl elején, a header részben tárolják a színmélységet, színpalettát, tömörítési módot és egyéb a tárolással kapcsolatos információt. A vektor grafika azt jelenti, hogy a képet vonalak, alakzatok és görbék sorozataként írjuk le, figyelembe véve, hogy továbbra is lehetnek mintával vagy színnel kitöltött területek. A vektor grafikát tartalmazó fájl úgy néz ki, mintha egy program fájlt vizsgálnánk. Angol parancs-szavakat és adatokat tartalmaz ASCII formátumban, ebből következően szabadon szerkeszthető valamilyen editorral. Legelterjedtebb vektor grafikus formátum a WMF 4 . Komoly előnye a raszter grafikával szemben, hogy a kép nagyítása során nem torzulnak a rajta lévő objektumok. A hisztogram „olyan grafikon, amely minden lehetséges szürkeárnyalathoz megadja a képen az adott árnyalatú pixelek számát. Ha normalizáljuk (minden értéket elosztunk a kép méretével), akkor az egyes pixelértékek előfordulási valószínűségét kapjuk”.[1]
Egy szürkeárnyalatos kép fényintenzitást rögzít. A rögzített intenzitás egy (x,y) pontban lényegében két összetevő szorzata: f(x,y)=r(x,y)i(x,y) a felület visszaverődési tulajdonsága: r(x,y) illetve a megvilágítás erőssége: i(x,y). Ha a megvilágítás egyenletes (vagyis i(x,y) konstans), akkor f(x,y) jól tükrözi a szegmentálandó felületek visszaverődési tulajdonságát (a hisztogram jól használható). Ha a megvilágítás nem egyenletes, akkor a f(x,y) torzítottan adja vissza r(x,y)-t (a hisztogramból nyert információ félrevezető lehet). A kontraszt a magas és az alacsony fényerő közötti különbség mértéke. A fényerõ módosítása a hisztogram eltolását jelenti, anélkül, hogy annak alakja megváltozna. A hisztogram-kiegyenlítés egy elterjedt módszer a gyenge kontrasztú képek javítására, ekkor az output hisztogram közel egyenletes eloszlást tükröz. A hisztogram-kiegyenlítés a szürkekép hisztogramjának módosítását jelenti annak érdekében, hogy az egyes szürkeségi tartományokba azonos darabszámú képpont essen. A képfeldolgozás esetén, egy kép jel/zaj viszonyát általában úgy definiálják, mint a pixel átlagértékének és a pixel szórás értékének a hányadosát. Ez a "kontraszt arány" és a "kontraszt/zaj viszony" méréseknél fontos.
4
Ha van MS Office telepítve a gépeteken, akkor tuti, hogy van egy rakat.
38
15. Képek szűrése (konvolúciós szűrők, morfológiai szűrők). Magyarázatok ábrákkal.[1] Konvolúció A konvolúciós képátalakító művelet során a képpontok szürkeségi szintjét a szomszédok figyelembe vételével módosítjuk az alábbi módon. Helyezzük egy m x m méretű konvolúciós mátrix (kernel, szűrő) középső elemét az input kép első pontjára (7.5-4. ábra), szorozzuk meg a kép minden, a mátrixszal lefedett pontját a mátrix megfelelő elemével, az eredményt normáljuk, végül helyettesítsük ezzel az értékkel az m x m szomszédság középső elemét (ez lesz az output szürkeségi szint a középső képpontnak megfelelő helyen). Ezt követően léptessük a mátrixot az input kép következő pontjára és így tovább.
7.5-4. ábra. A konvolúció mûvelete a) eredeti képmátrix részlete, b) konvolúciós mátrix (kernel)
Egyenlettel kifejezve:
Itt N a normalizációs konstans, amely gyakran a konvolúciós mátrix elemeinek összege, de általános esetben bármilyen nullától különböző érték lehet. A konvolúciós kernelekre gyakran a szűrő elnevezéssel hivatkozunk, ugyanis sok zajszűrő, vagyis átlagoló kernelt alkalmazunk a gyakorlatban. Az átlagolás, lágyítás, él kiemelés, élesítés. Az átlagolás és a lágyítás hasonló műveletek, az átlagolás során az egyes képpontok súlyozása azonos, egységnyi, míg lágyításnál a súlyozás biztosít lehetőséget a környezetből figyelembe veendő pontok megadására és hatásának számszerűsítésére. A kernel hatásának mértéke az átlagolt terület nagyságától, azaz a kernel méretétől is függ. Az él kiemelés
39
értelemszerűen az élek megkeresésére használatosak, függetlenül attól, hogy ez az él egy szemcsehatár, melyiknek mindkét oldalán azonos szemcse van, avagy második fázisú részecske kontúrja, eltérő fázisok között.
a) eredeti kép
b) kernel 7.5-5. ábra. Átlagolás, N=9
c) módosított kép
a) eredeti kép,
b) kernel, c) módosított kép 7.5-6. ábra. Lágyítás Gauss-típusú szûrõvel
a) eredeti kép
b) kernel c) módosított kép 7.5-7. ábra. Súlyozott-átlag kernel alkalmazása, N=3
40
Az él kiemelő kernelek a képpontok szürkeségi szintje közötti különbséget veszik figyelembe a kép egyes irányaiban: a 7.5-8. ábrán bemutatott kernel a képpont bal és jobb oldala közti különbséget számítja, így a függőleges éleket keresi meg. Az él két oldalán a szürkeségi szint negatív helyettesítési értékhez vezethet: ekkor az értékek abszolút értékét vehetjük figyelembe, vagy átskálázhatjuk a szürkeségi szintek értékeit úgy, hogy pl. 0-127 a negatív, 128-255 a pozitív értékeket tartalmazza.
a) eredeti kép
b) kernel 7.5-8. ábra. Függõleges él keresõ kernel
c) módosított kép
Egy másik érdekes él kiemelő kernel a Sobel-operátor (7.5-9. ábra), amely a vízszintes éleket keresi meg, de 45 fokonként körbeforgatható, így más irányokban is alkalmazható. Az egyes irányokban kapott eredmények összevetésével a maximumot meghatározva kivételesen jó él képhez juthatunk. Általánosan: azon kernelek, amelyek elemeinek összege 0, élkiemelõ kerneleknek tekinthetők, ugyanakkor a kapott eredmény nagyban függ az egyes elemek elhelyezkedésétől.
a) eredeti kép
b) kernel c) módosított kép 7.5-9. ábra. Sobel-típusú horizontális él keresõ kernel
Az élesítés nagyon szemléletes és tetszetős eredményt ad, bár az output gyakran zajosabbá válik, ami meglehetősen szűk korlátok közé szorítja ezen kernelek alkalmazhatóságát. A kernelek nagyon hasonlatosak az él kiemelésnél használatosakhoz, ekkor az elemek összege többnyire egy, ám ekkor a középső elem - az élesítés kívánt mértékétől függően – túlhangsúlyozott (7.5-10. ábra ).
41
a) eredeti kép
b) kernel 7.5-10. ábra. Élesítõ kernel
c) módosított kép
morfológiai szűrők Morfológiai transzformációk során az egyes képpontok szürkeségi szintjét ugyancsak szomszédaitól függően változtatjuk meg, a bináris képek esetén logikai műveletek, míg a szürkeképeknél "kisebb" / "nagyobb" relációk segítségével. A morfológiai transzformációk előnye, hogy a lényegtelen információ kiküszöbölése megbízható módon zajlik, szemben a konvolúcióval, ahol a látvány átalakítása többnyire - bár kevésbé hangsúlyosan - megőrzi a lényegtelen részleteket. A gyakorlat azt mutatja, amennyiben pontos és megismételhető mérések elvégzése a cél, a legtöbb képelemzési probléma során a morfológiai transzformáció biztosítja a legmegbízhatóbb eredményt. Meg kell jegyeznünk, hogy mindezek ellenére nincs olyan műveletsorozat, amely mindig kiemeli az objektumokat, azaz nem létezik általános érvényű eljárás. A módszer mindig a vizsgálat céljától, tárgyától, az előkészítés és a képalkotás módjától függ. Szerencsére. Hiszen így alkalmasan megválasztott módszerekkel más és más információk nyerhetők ugyanazon szerkezetről, még alaposabban jellemezve ezáltal magát az anyagot. Másrészt, bár lehetséges egy-egy próbatípushoz általános megoldást felállítani, mindig található olyan kép, amelyen az adott műveletsorozat nem alkalmazható. Így tehát a morfológiai transzformációk célja nem egyetlen általános képátalakító-technika kialakítása, hanem a széleskörű alkalmazhatóság. Az alábbiakban áttekintjük a leggyakrabban alkalmazott morfológiai transzformációkat. Az inferior (INF) és a superior (SUP) mûveletek eredménye két kép összehasonlításából adódik - értelemszerűen képpontonként történő összevetésükkel. Az INF ill. SUP művelet az adott helyen álló képpont output szürkeségi szintjének rendre a két input kép megfelelő képpontjainak szürkeségi szintje közül a kisebbiket ill. nagyobbikat rendeli. A leggyakoribb morfológiai transzformációk az erózió és a dilatáció. A figyelembe vett szomszédság méretét és alakját egy ún. szerkezeti elem (7.5-11. ábra), leggyakrabban egy 3x3-as négyzet jelöli ki. Így a szürkekép eróziója nem más, mint egy-egy pixel értékének helyettesítése az önmaga és nyolc szomszédja által alkotott csoport szürkeségi értékeinek minimumával, míg dilatáció során a maximumával. A morfológiai transzformációk általános jellemzője, hogy megfordíthatatlanok: egy erodált kép eredetijét nem kaphatjuk vissza inverz művelettel, a dilatációval. Ezt a tulajdonságot gyakran kihasználjuk komplex képek átalakításakor (opening, closing, stb.). Az erózió és a dilatáció más megközelítésben
42
komplementer műveletek: miközben a háttér erodálódik, az objektumok dilatációját figyelhetjük meg.
43
Felhasznált Irodalom [1] Ismeretlen: kepfeldog.pdf [2] Hobby servo, működés, módosítás, használat: http://www.szmt.org/node/230
44
16. A "Opening" és a "Closing" algoritmusok ismertetése, használatuknak eredménye, célja példákkal illusztrálva.
Bináris képből hogyan nyerünk információt?
Emberi látás a) A geometriai felbontóképesség a hullámhossz függvénye, amely zöld fény esetén maximumot mutat. A látható színtartomány széleihez közelebb esõ színek esetén ez a felbontóképesség romlik. b) A relatív fényérzékenység is a hullámhossz függvénye, amennyiben különbözõ hullámhosszúságú fényforrás ugyanolyan intenzitású fényt bocsát ki, a zöld fényforrást érzékeljük fényesebbnek. Itt is a vörös és a kék tartományban kisebb az érzékenység. c) Összetett alakzatok érzékelésekor törekszünk a folytonosságra, a d) 7.2-12. ábra a) képét egy négyszögvonalból és egy görbe szakaszból összetevõdõnek látjuk és nem három különbözõ geometriai idomnak. Keressük a zárt alakzatokat, a e) 7.2-12. ábra b) rajza nem egy folyamatos vonalnak látszik, hanem két zárt formának. Törekszünk a szimmetria felismerésére a f) 7.2-12. ábra c) képét nem W és M betûkbõl összetevõdõnek, hanem egy szimmetrikus vonalcsoportnak tekintjük. Képesek vagyunk az élek meghosszabbítására, így geometriai alakzatokat láthatunk ott, ahol azok a valóságban nem léteznek (7.2-13. ábra). Egymással érintkezõ sötét és világos képmezõ részletek határvonala mentén a sötétebb rész még sötétebbnek a világost még világosabbnak látjuk, ez az ún. Machféle jelenség (7.2-14. ábra).
45
3D látás: -
A két szem optikai tengelye egymástól 60-65 mm távolságban van. A térbeli látásnak az a lényege, hogy a fókuszban lévõ tárgy képe a látógödörbe vetül, míg az ettõl távolabb lévõ tárgy a retinának az egyik felére (nazális), míg a közeli pont a retina másik (temporális) részére (7.2-6. ábra). A tanulási folyamat során az agyunk elsajátította, hogy a retina nazális részén lévõ tárgyak a fixált ponttól távolabb vannak. Minél nagyobb a retinán leképzett tárgyrészletek közötti távolság, annál közelebbinek érzékeljük a fókuszban lévõ tárgyak környezetét.
Az emberi látást a következõ paraméterekkel jellemezhetjük: a) Geometriai felbontás. Az a legkisebb látószög, amely mellett sötét alapon lévõ két világos pont még éppen nem olvad egybe. Ennek nagysága függ a fény hullámhosszúságától, zöld fényben a legjobb a felbontás: 0,5 – 1,0 szögperc*. b) Fényintenzitás felbontás. Azt a fényerõsség intervallumot jelenti, amelyben a szemünk mûködni képes. Ez az intervallum hihetetlenül nagy, tudniillik a kétszeres
46
fényerõsség változás, csak természetes logaritmus kettõ-szeres fényérzet növekedést eredményez. Vagyis a százszoros fényerõsség változás csak 4,6 (ln 100) szoros fényérzet erõsödést hoz létre. c) Színfelbontás. A színárnyalatok elkülönítésének képessége. Errõl a késõbbiekben lesz szó. d) Idõbeni felbontás. A recehártyánkon megjelenõ képek nem tûnnek el azonnal, az 1/8 másodpercnél rövidebb ideig tartó képek összeolvadnak az érzékelésünkben. Így az 1/15 másodpercnél rövidebb idõre fel villanó képeket nem tudjuk elkülöníteni, ezt használjuk ki a televíziós képek továbbításakor, amikor másodpercenként 16-25 állóképet látunk, amit folyamatos mozgásként érzékelünk. * A kényelmes olvasás szemtávolságában » 250 [mm], ez az érték 0,07 – 0,15 [mm] pontok közötti távolságot jelent.
Optikai csalódások -
A mindennapi életben többször találkozunk olyan jelenséggel, amely elsõ látásra megtéveszt bennünket. Ezt nevezzük optikai csalódásnak*. Ilyen optikai csalódások: hosszúsági csalódások, iránycsalódások, nagyságbeli csalódások, távlati csalódás, valamint az ún. szétsugárzási jelenség és a többértelmûség. Ezekre mutatunk be példákat a következõkben. o Hosszúsági csalódások (7.2-15. ábra). A vonalszakaszok szemünk által érzékelt hosszúságát a vonalszakaszokra rajzolt osztás, a környezetben évõ más szakaszok hosszúsága vagy a nyilak dõlési iránya egyaránt befolyásolja. A vízszintes hasábokból álló négyszöget keskenyebbnek érzékeljük, mint a függõleges hasábokból összerakottat. A függõlegesen álló hasábokat a valóságosnál szélesebbnek látjuk. A ferde téglalap átlóit az iránytól függõ távolságúra becsüljük. o Alakváltozás (7.2-16. ábra). A tárgyak látszólagos alakját befolyásolja, hogy milyen irányú vonalak közé helyezzük. A Poggendorff-féle optikai csalódás az a jelenség, amikor egy vastagabb vonallal rajzolt geometriai idomba befutó ferde vonalak látszólag nem folyamatosan, hanem egy kicsit eltolódva folytatódnak. Ennek oka, hogy a szemünk a vastag vonalon kicsit tovább fut, így a vékonyabb vonal folyamatossága megszakad. Az egymással párhuzamosan futó vastagabb egyenesek a ferde vékonyabb vonalak hatására látszólag összetartanak. o Méret csalódások. Az azonos méretû köröket látszólag különbözõnek látjuk (7.2-17. ábra) attól függõen, hogy milyen környezetben helyezkednek el. A négyzetek mérete is megváltozhat, amint ellipszis darabokat rajzolunk a négyzetek végére (7.2-18. ábra). Ezeknek a jelenségeknek az a magyarázata, hogy a szemünk sosem mozdulatlan, hanem akkor is végez rezgéseket, mikor szándékunk szerint egy pontra nézünk. A különbözõ geometriai alakzatok hatására hol a szélen, hol a középpontban látunk, és így az eredeti formák módosulnak. o Kontraszthatás (7.2-19. ábra). A sötét háttérben megjelenõ világos mintákat mindig nagyobbnak látjuk, mint a világos alapon lévõ sötét mintát. Ezt a jelenséget világossági kontrasztnak nevezzük. Másik esetben a fekete-fehér vonalak alkotta rácsot nézve a keresztezõdésekben – a valóságban nem létezõ – szürke foltokat veszünk észre.
47
o Többértelmûség (7.2-20. ábra). Egy kép környezetét huzamosabb ideig figyelve hol az egyik, hol a másik részlet kerülhet elõtérbe, ami az összképben jelentõs változást okoz. Ha a tárgy vagy ábra kiemelkedik, a háttér vagy alap elmosódottá válik. Ilyen többértelmû kép a Rubin-ábra vagy a Necker-kocka.
48
Opening/Closing A képfeldolgozás története Elsõ generációs rendszerek Amikor létrejött a televízió a TV-kamerák segítségével lehetõvé vált a képek elektromos jelekké való átalakítása. Az automatikus képelemz rendszerek kialakulása gyakorlatilag ekkor kezdõdött. Az elsõ rendszere egy TV-kamerából és egy analóg feketedés mérõ mûszerbõl álltak A kvantitatív televíziós mikroszkóp (Quantitative Television Microscope), amelyet a Metals Research Ltd. fejlesztett ki (Underwood(1970)), nem volt képes egyedi objektumok mérésére, csupán arra szolgált, hogy meghatározza a teljes látótérben elõforduló sötét – világos területek arányát.
Kvantítatív televiziós mikroszkóp
A technológia további fejlesztésével ez a kvantitatív televíziós mikroszkóp alkalmassá vált objektumok elemzésére is. A mérés alapja az volt, hogy a TV vonalak hányszor metszettek bele ezekbe az objektumokba. Ezeknek az adatoknak az összegyûjtésével lehetett az objektumok darabszámát és kerületét meghatározni. Ezzel megnyílt az út a modern képelemzõ rendszerek kifejlesztéséhez. Persze ezen az úton még számos problémát kellett megoldani, mint például azt, hogy ha az objektum két vagy több nyúlvánnyal rendelkezett, akkor az elektronsugár az objektumba kétszer vagy háromszor metszett, és így a darabszám több volt a valóságosnál. 1968-ban Bausch & Lomb kidolgozta az elsõ képelemzõ rendszert, amely a fekete-fehér képet mikro-számítógép segítségével tárolta. Ebben az idõben a számítógépek memóriája még nem volt eléggé fejlett, ezért nem a teljes képet, hanem csak a szürke szintek átmeneteit (A) rögzítették a berendezésben. Ezzel a képi információk jelentõs tömörítését lehetett elérni, s a rendszer már alkalmas volt egyedi objektumok vizsgálatára is.
49
7.3-2. ábra. Képek tömörítése
Második generáció A Bausch & Lomb továbbfejlesztette rendszerét és létrejött a Quantimet 720, az elsõ teljesen digitális elven mûködõ képelemzõ. A berendezés a képet egyedi képpontok (pixel) formájában tárolta, minden egyes képpont 64 különbözõ szürkeségi szinttel rendelkezhetett. Ebben az idõben a számítógép memóriák még eléggé egyszerûek voltak (1969-70.), így a Quantimet alacsony frissítési sebességet használt (10 kép/másodperc). A hetvenes évek elején kezdtek megjelenni az egyre korszerûbb számítógépek, és így a képelemzõ rendszerek is tovább fejlõdtek, képesek voltak egyre több paraméter meghatározására, és az egyedi objektumok minél teljesebb jellemzésére. 1974-ben a LEITZ radikálisan megváltoztatta az addig alkalmazott technológiát, s létrehozta a LEITZ TAS rendszert. A berendezés teljesen új koncepció szerint épült fel, amelynek alapja az a matematikai morfológia volt, amelyet az Ecole de Mines de Paris munkatársai dolgoztak ki. Ekkor vezették be a képfeldolgozás legfontosabb alapmûveleteit: az eróziót, a dilatációt és a vázszerkezet elõállítását. Az erózió/dilatáció segítségével a képelemek (objektumok) méretét egy-egy képponttal csökkenteni/ bõvíteni lehet, míg a vázszerkezet elõállítása (szkeletonizáció) egy olyan sok lépésbõl álló eróziót, aminek a végeredménye az objektum egy képpont szélességû vázszerkezete (7.3-3. ábra). A mûveletek végrehajtásával illetve kombinációjával lehetõvé vált a képek még teljesebb elemzése.
50
7.3-3. ábra. Morfológiai mûveletek
Opening/closing kialakulása: -
morfológiai műveletek (Dilatáció, Erodálás) Tegyük fel, hogy bináris, fekete-fehér képünk van 1. Dilatáció (tágítás):
o o Probléma: ez C vagy O ??? o Hozzáadok pixeleket -
2. Majd Erodálás („lefogyasztás”)
o
51
Opening/closing: "Neighborhood" mûveletek. Az egyes pixeleken történô mûveletek figyelembe veszik a szomszédos pixelek tulajdonságait. Erózió: eltávolít olyan pixeleket, amelyek az elôtérben vannak, és áthelyezi ôket a háttérbe. A "klasszikus" erózió eltávolítja azokat a pixeleket, melyek a háttér részét képezô pixelekkel érintkeznek. Hatása: a képi objektum perifériájáról egy réteg pixelt eltávolít. Dilatáció: az erózió ellentéte. Olyan háttér-pixelt, mely a képi objektum pixeljeivel érintkezik, az elôtérbe hoz. Hatása: egy réteg pixel rakódik rá a képi objektum perifériájára. 3. Nyitás és zárás (opening és closing) Az erózió és a dilatáció kombinációi. Nyitás: erózió + dilatáció (a sorrend fontos!) Hatása: éppen érintkezô képi objektumok között megnyitja a teret. Zárás: dilatáció + erózió Hatása: izolált lyukakat, réseket bezár.
105. ábra.. Egymással érintkezô képi területek szétválasztása erózió/dilatáció segítségével. a. Eredeti kép. b. Két ciklus erózió. c. Négy ciklus. d. Hét ciklus. e. Négy ciklus dilatáció a d képen. f. Hét ciklus dilatáció. g. Kilenc ciklus dilatáció. h. Boole-féle AND operáció a g és a képek között.
Forrás: Orvosbiológiai fénymikroszkópia és digitális képanalízis (ifj. Kellermayer Miklós)
52
17. Képfeldolgozás (küszöbölés célja, megvalósításának lehetõségei) KÜSZÖBÖLÉS (TRESHOLDING), CÉLJA: egy képen az objektum elválasztása a háttértõl, további feldolgozás (pl. rendszámfelismerés, mintadetektálás) céljából. FELTÉTELEK: a küszöbölés a színárnyalat (intenzitás) alapján történik, ezért a módszer alkalmazhatóságának feltétele, hogy mind az objektum, mind a háttere homogén, de egymástól eltérõ intenzitású legyen. EREDMÉNY: a kép minden pixeléhez rendelt 1 vagy 0 érték, attól függõen, hogy a pixel része-e az objektumnak, vagy sem. Ennek megjelenítése általában 1 bites színmélységû, eredeti képpel azonos felbontású képen történik, amit szegmentált képnek nevezünk. MÓDSZER: választunk egy küszöbszámot (T), és a kép pixeleit ehhez az értékhez hasonlítjuk. A küszöbnél nagyobb intenzitású képpontok az objektum részei lesznek, a többi pixel az objektumon kívüli tartományt alkotja. LEHETÕSÉGEK KÜSZÖBÉRTÉK MEGHATÁROZÁSÁRA: 1. elõre rögzített érték; 2. adaptív eljárás segítségével, mely a küszöböt az input kép alapján számolja: a) globálisan (Isodata/Otsu algoritmus); b) lokálisan (Niblack-algoritmus). MEGJEGYZÉS: a küszöbölés a képfeldolgozás folyamatának egy lépése. Zajos kép esetén zajszûrést célszerû végezni elõtte, a küszöbölés során keletkezõ ghost-objektumokat pedig post-processing során, gradiens-keresés útján tüntethetjük el.
53
18. Képfeldolgozás (Adaptív küszöbölés célja, megvalósítása, Niblack algoritmus) ADAPTÍV KÜSZÖBÖLÉS, CÉLJA: manuálisan rögzített küszöbérték jól használható kontrollált környezetben, azonban a fényviszonyok változása, vagy a küszöbölendõ képeken az objektumok intenzitásának egyenetlensége problémát jelenthet. Ilyen esetekre találták ki az adaptív küszöbölést, melynek lényege, hogy a küszöbértéket minden képre automatikusan számítjuk ki, az adott kép hisztogramja alapján. ADAPTÍV ELJÁRÁSOK: 1. Isodata (Yanni)-algoritmus 2. Otsu-algoritmus 3. Niblack-algoritmus GLOBÁLIS KÜSZÖBÉRTÉK-SZÁMÍTÓ ALGORITMUSOK: az Isodata-algoritmus a küszöbértéket az objektum és a háttér intenzitásának középértéke közé állítja: T = (M + m) / 2, ahol M és m a két középérték. Az Otsu-algoritmus úgy állítja be a küszöbértéket, hogy az objektum és a háttér közötti variancia a lehetõ legnagyobb legyen. (A módszer feltételezi azt, hogy csak egyetlen szélsõérték van!) LOKÁLIS KÜSZÖBÖLÉS: a gyakorlatban elõfordulhat, hogy egy kép két felén az intenzitás annyira eltér (pl. egyenetlen megvilágítás vagy árnyékolás következtében), hogy a küszöbérték bármilyen megválasztásakor vagy a háttér lesz hibásan objektumnak, vagy az objektum hibásan háttérnek detektálva. Az objektum/háttér ilyenkor nem homogén, azonban a köztük lévõ kontraszt mindig megvan, az emberi szem ugyanis ez alapján tudja megkülönböztetni a kettõt egymástól. Ezt a helyzetet oldja fel a lokális küszöbölés, mely azt jelenti, hogy a küszöb nem a vizsgált kép egészére vonatkozik, hanem a képet részleteiben vizsgáljuk, és minden részre külön-külön számítjuk ki a küszöbértéket, egy adott küszöbérték-számító algoritmus alapján. NIBLACK-ALGORITMUS: a Niblack-algoritmus egy lokális küszöbérték-számító algoritmus. Adott (i,j) környezetre: T(i,j) = mû(i,j) + k × szigma(i,j) ; ahol mû(i,j) a környezeten belüli képpontok intenzitásának középértéke és szigma(i,j) az intenzitások szórása; k egy konstans, mellyel állítható, hogy mennyire vegyük figyelembe a szórást. (Általában |k| ~ 0.2 , világos objektumnál pozitív, sötétnél negatív.) Az (i,j) környezet méretétõl függ az algoritmus zajszûrõ képessége és a lokális részletek megõrzése.
54
19. Képfeldolgozás (szegmentálás megvalósításai, célja) SZEGMENTÁLÁS, CÉLJA: azonos tulajdonságú pixelek homogén régiókba történõ csoportosítása. Célja: felületleírás, alakfelismerés, képi adatbázisok, valamint sztereó látáskor az élek megfeleltetésével megvalósított 3D rekonstrukció. MEGVALÓSÍTÁSOK: 1. Küszöbölés (tresholding); 2. Határvonalak detektálása; 3. Homogén régiók detektálása. Homogenitás szempontjai lehetnek: a) szín, intenzitás; b) textúra; c) elmozdulás - mozgókép esetén. KÜSZÖBÖLÉS: a képpontoknak intenzitásuk alapján történõ besorolása az objektum vagy a háttér tartományába. Történhet globálisan vagy lokálisan választott küszöb alapján, a küszöbérték megválasztására is többféle algoritmus ismeretes. HATÁRVONALAK DETEKTÁLÁSA: határvonalak ott vannak, ahol a hirtelen intenzitásváltozás lép fel. Az élek felismerésére több algoritmus is alkalmas, melyek általában egy adott mátrixot használó konvolúciós szûrések. Különbözõ éldetektáló algoritmusok: Gradiens-módszer, Sobel-operátor, Laplace-operátor, LoG-operátor, DoG-operátor. Jobb zajszûrést érhetünk el, ha éldetektálás elõtt Gauss-simítást vagy utána küszöbölést végzünk, ez különösen fontos a zajérzékeny éldetektáló algoritmusokra. Létezik több lépésbõl álló éldetektáló algoritmus is (Canny-éldetektálás). HOMOGÉN RÉGIÓK DETEKTÁLÁSA: a szín alapján vett homogenitást szín-hisztogramok statisztikai elemzésével vizsgálhatjuk. Textúra alapján történõ detektálás során a textúra jellemzõit képezzük le különbözõ formákban: hisztogram, együttes elfordulási mátrix vagy textúra elemek eloszlása. Ezen jellemzõk alapján különböztethetõ meg két különbözõ textúra egymástól. Elmozdulás alapján történõ vizsgálat során az elmozdulás-vektorok nagyságának és irányának hasonlósága jelzi a homogén tartományt.
55
20. Képfeldolgozás (objektumok azonosítása, objektumok jellemzõi) GÉPI LÁTÁS SZINTJEI: három egymásra épülõ szintet különböztetünk meg. Az alacsony szintû feldolgozáshoz tartozik a képhez szervesen hozzátartozó tulajdonságok (pl. élek, textúra) meghatározása. A középsõ szinten az alsó szinten megkülönböztetett objektumok tulajdonságait vizsgáljuk, eredményül a képet alkotó objektumok jellemzését kapjuk (pl. felület, mozgás). A gépi látás felsõ szintje a jellemzõk alapján felismeri az objektumot, és értelmezi a képi eseményt. OBJEKTUM AZONOSÍTÁS: jelentheti az objektum megkülönböztetését a környezetétõl, ebben az esetben a kérdés visszavezethetõ a szegmentálás kérdéskörére; továbbá jelentheti a már elkülönített, kiszámított jellemzõkkel bíró objektum besorolását egy absztakt kategóriába (pl. "kicsi", "szürke", "gyors" --> "ez egy egér"). Itt a probléma már nem a képfeldolgozás szoros témakörébe tartozik. OBJEKTUM JELLEMZÕK: szín, intenzitás, textúra, elmozdulás, élek, felületek[, méret, alak]... Megjegyzés: ahogy a tétel kidolgozásából is látszik, nem volt számomra egyértelmű, hogy mire vonatkozik a kérdés, ezért bármilyen pontosítást, bővítést szívesen várok.
56