Fourier-analízis alkalmazása a digitális holográfiában Diplomamunka
Tóth Erzsébet Rita alkalmazott matematikus, matematika tanár szakos hallgató
Témavezetők: Dr. Orzó László Róbert, tudományos főmunkatárs MTA Számítástechnikai és Automatizálási Kutatóintézete Dr. Ambrus Gabriella, egyetemi adjunktus Matematikatanítási és Módszertani Központ Belső konzulens: Lócsi Levente, tanársegéd Informatikai Kar, Numerikus Analízis Tanszék
Eötvös Loránd Tudományegyetem Természettudományi Kar Budapest, 2013
Tartalomjegyzék 1. Bevezetés
3
2. A digitális holografikus mikroszkóp működése 2.1. A fény mint hullám . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. A fény terjedésének vizsgálata . . . . . . . . . . . . . . . . . . . . . .
5 5 8
2.2.1. A szögspektrum módszer . . . . . . . . . . . . . . . . . . . . . 9 2.2.2. A Fresnel-közelítés . . . . . . . . . . . . . . . . . . . . . . . . 11 2.3. Hologram készítése és rekonstrukciója . . . . . . . . . . . . . . . . . . 13 3. Fourier-analízis – áttekintés
17
3.1. Folytonos Fourier-transzformáció . . . . . . . . . . . . . . . . . . . . 17 3.2. Egy általánosítás – a frakcionális Fourier-transzformáció . . . . . . . . . . . . . . . . . 20 3.3. Diszkrét Fourier-transzformáció . . . . . . . . . . . . . . . . . . . . . 22 4. Mintavételezés 25 4.1. A mintavételezés hatása a frekvenciatérben . . . . . . . . . . . . . . . 25 4.1.1. Jelölések és alapvető összefüggések . . . . . . . . . . . . . . . 25 4.2. Nyquist-kritérium és szűrés . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2.1. A Nyquist-kritérium . . . . . . . . . . . . . . . . . . . . . . . 29 4.2.2. Szűrők és tartójuk . . . . . . . . . . . . . . . . . . . . . . . . 30 4.2.3. Az indikátorfüggvény mint szűrő . . . . . . . . . . . . . . . . 31 5. A Wigner-disztribúció
34
5.1. Meghatározás és alapvető tulajdonságok . . . . . . . . . . . . . . . . 34 5.2. Új mintavételi kritérium és alkalmazása . . . . . . . . . . . . . . . . . 37 5.3. Wigner-disztribúció a terjesztésekben . . . . . . . . . . . . . . . . . . 40
1
6. Wigner-disztribúció lencsés rendszerekben
45
6.1. Egylencsés optikai rendszerek . . . . . . . . . . . . . . . . . . . . . . 45 6.1.1. Érzékelő a fókuszpontban . . . . . . . . . . . . . . . . . . . . 45 6.1.2. Érzékelő a fókuszponton kívül . . . . . . . . . . . . . . . . . . 48 6.2. Afokális rendszer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6.3. Wigner-disztribúció és holográfia . . . . . . . . . . . . . . . . . . . . 50 6.3.1. Feltételek afokális nagyítású hologramrögzítés esetén . . . . . 50 6.3.2. A DHM paramétereinek vizsgálata . . . . . . . . . . . . . . . 52 7. Modellezési feladatok megoldása a GeoGebra program segítségével 55 7.1. Matematikai modellezés . . . . . . . . . . . . . . . . . . . . . . . . . 56 7.1.1. Modellezési feladatok, modellalkotás . . . . . . . . . . . . . . 56 7.1.2. Modellezési feladatok az oktatásban . . . . . . . . . . . . . . . 58 7.2. A dinamikus matematikai szoftverek szerepe az oktatásban . . . . . . 59 7.2.1. A vizuális és tárgyi reprezentációk fontossága . . . . . . . . . 59 7.2.2. A számítógép szerepe a külső reprezentációban . . . . . . . . . 60 7.2.3. A GeoGebra szoftver . . . . . . . . . . . . . . . . . . . . . . . 61 7.3. Mintafeladat: Sportrekordok . . . . . . . . . . . . . . . . . . . . . . . 62 7.3.1. Lehetséges megoldások . . . . . . . . . . . . . . . . . . . . . . 62 7.3.2. Értékelés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.4. Mintafeladat: Árnyjáték . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.4.1. Adatgyűjtés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.4.2. Lehetséges megoldások . . . . . . . . . . . . . . . . . . . . . . 72 7.4.3. Megoldás dinamikus feladatlap segítségével . . . . . . . . . . . 77 7.4.4. Feladatvariációk, szemléltetés és ellenőrzés . . . . . . . . . . . 79 7.4.5. Értékelés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 7.5. Összefoglalás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 Mellékletek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2
1. fejezet Bevezetés Az elmúlt év során az MTA–SZTAKI Celluláris Érzékelők és Optikai Hullámszámítógépek Laboratóriumában dolgozhattam, ahol digitális holografikus mikroszkópot (DHM) készítünk és alkalmazunk mikrobiológiai vizsgálatok automatizálására. A berendezés a holográfia elvei alapján működik. A holográfia születése Gábor Dénes magyar tudós nevéhez fűződik, aki 1947-ben elektronmikroszkóp javítására alkotta meg elméletét [1]. Azóta a tudomány számos területén felhasználták és továbbfejlesztették eredményeit. Számunkra azért hasznos a holográfia alkalmazása, mert általa megkerülhető a hagyományos mikroszkópok kis mélységélessége, azaz háromdimenziós térfogatot is rekonstruálhatunk. Ezzel hatékonyabbá válik a folyadékok vizsgálata, melyet például az ivóvíz minőségének ellenőrzése során tudunk felhasználni. A holografikus képalkotás két lépésben történik: először létrehozzuk a hologramot, majd megfelelő fénynyaláb segítségével rekonstruáljuk azt. Műszerünk további előnye, hogy a hologram rögzítése digitális szenzorral, és a rekonstrukció is a fényhullámok terjesztésének numerikus szimulációival történik. Ezzel szükségtelenné válnak a hagyományos előhívási technikák, és lehetővé válik közel valós idejű, automatizált mérések elvégzése. A digitális mérés azonban megkötöttségekkel is együttjár: az optikai rendszer és a kamera paraméterei korlátozzák az objektum leképezhető méretét és sávszélességét. Ezért azt tűztem ki célomul, hogy megismerjem a mikroszkóp képalkotó eljárását és az azt leíró matematikai algoritmusokat, a mintavételezés sajátosságait, és az ezekből adódó megszorító tényezőknek a figyelembevételével tervezzem meg, majd optimalizáljam a mintavételi eljárást. Segítségként a Fourier-analízis eszközeit és a Wigner-disztribúció fogalmát és tulajdonságait használtam fel. 3
Ezek alapján először röviden összefoglalom a DHM működését, a megértéshez szükséges holográfiai alapokat, a jelenség matematikai modelljét és az ezáltal indukált numerikus algoritmusokat. Dolgozatomban csak a célom szempontjából lényeges elméleti hátteret mutatom be, a téma részletes megismeréséhez pár szakirodalomban fellelhető forrást jelölök meg. A 3. fejezetben a Fourier-analízis felhasznált elemeit ismertetem tömören, majd a 4. fejezetben bemutatom a mintavételezés sajátosságait és az általa adódó korlátokat, melyek mind a térbeli, mind a frekvenciatartományt érintik. Az 5. fejezetben rátérek a Wigner-disztribúció és a Wigner-tartomány fogalmának ismertetésére, amelyek segítségével könnyen kezelhetővé válik a térbeli és frekvenciatérbeli paraméterek együttes vizsgálata. Bemutatom, hogy a fény terjedése során hogyan változik a Wigner-disztribúció tartója, majd a 6. fejezetben lencsés optikai rendszerekben vizsgálom meg a feltételek átalakulását. Végül a kapott feltételek alapján számolásokkal mutatom be a DHM felbontási tulajdonságait. A dolgozat utolsó fejezete egy pedagógiai témájú írás, a korábbi részekkel a modellalkotás vékony fonala kötheti össze. Ebben leírom a modellezési feladatok tulajdonságait, valamint a dinamikus matematikai szoftverek oktatásban betöltött lehetséges szerepét. Ezután két probléma kapcsán alkalmazom is a megszerzett ismereteimet. Diplomamunkámért köszönettel tartozom témavezetőmnek, Orzó Lászlónak, aki segített kiválasztani ezt a fizikában és matematikában egyaránt érdekes témát, átgondolni a koncepcionális kérdéseket, és kritikai érzékével hozzájárult, hogy mindkét tudományterület szempontjából precíz dolgozat születhessen. Köszönöm belső konzulensemnek, Lócsi Leventének, hogy nagy nyitottsággal és türelemmel várt bármilyen kérdéssel, legyen az technikai, matematikai vagy adminisztratív jellegű, és alapos hozzáállásával igényességre ösztönzött. Köszönet illeti tanári témavezetőmet, Ambrus Gabriellát, aki előrelátásával, a témában szerzett sok tapasztalatával, korrektségével és hatékony munkaszervezéssel járult hozzá, hogy megismerjem a modellezési feladatokat, és lelkesen kutassam a bennük rejlő számtalan lehetőséget. Köszönöm kollégámnak, Kiss Márton Zsoltnak fáradhatatlan segítségét, melyet a fizikai összefüggésekről való párbeszéddel és az ábrákkal kapcsolatban nyújtott. Végül köszönettel tartozom Koren Balázsnak a GeoGebra szoftver alkalmazásában és a feladatválasztásban nyújtott támogatásáért.
4
2. fejezet A digitális holografikus mikroszkóp működése Ebben a fejezetben a DHM működését mutatjuk be vázlatosan, ismertetve a legszükségesebb fizikai fogalmakat és összefüggéseket, beleértve a fény hullámtermészetét és azokat a matematikai eredményeket, amelyek a későbbiek megértésében fontos szerepet játszanak. Nem célunk a téma kimerítő tárgyalása, az érdeklődő olvasó bőséges szakirodalmat talál a fogalmak és összefüggések mélyebb megértéséhez. Az alábbiakban J. W. Goodman [2] és D. G. Voelz [3] műveit, valamint egy hasonló témájú, mérnöki szakdolgozatot [4] használok fel.
2.1.
A fény mint hullám
A holográfiában a fény hullámtermészetét használjuk ki. A fény elektromágneses rezgés, az elektromos és mágneses tér, illetve az áramok és töltések kölcsönhatását a Maxwell-egyenletek írják le. Bizonyos feltételek mellett, amelyek üres térben általában fennállnak, az egyenletek skaláris alakra egyszerűsíthetőek [2]. Ezzel az elektromos és mágneses komponensek viselkedése egymástól függetlenül is leírhatóvá válik, mindegyiknek az alábbi skalár hullámegyenletet kell kielégítenie: ∆u(P, t) −
n2 ∂ 2 u(P, t) = 0, c2 ∂t2
ahol • Ω ⊂ R3 nyílt tartomány; 5
(2.1)
• u : Ω × R+ → R az adott komponens, amely a P pozíciótól és a t időtől egyaránt függ;
• ∆ a Laplace-operátor, • n a közeg törésmutatója, • c pedig a fény sebessége vákuumban (c ≈ 3 · 108 m/s). Az egyenletnek megoldásai az alábbi monokromatikus hullámfüggvények: u(P, t) = A(P ) cos(2πνt − ϕ(P )),
(2.2)
ahol • A : Ω → R az amplitúdófüggvény, • ν a frekvencia, • ϕ : Ω → R pedig a fázisfüggvény. Ezekben a hullámokban csak egy frekvencia szerepel. A (2.1) differenciálegyenlet linearitása miatt a több frekvenciakomponensű hullámok felírhatóak (2.2) alakú függvények lineáris kombinációiként. Az Euler-formula segítségével (2.2) következő alakját kapjuk: u(P, t) = ℜ A(P )eiϕ(P ) e−i2πνt ,
(2.3)
ahol ℜ a valós rész képzését jelöli. A (2.3) egyenlet jobb oldalán az első két tényező a térerősség térbeli viszonyait jellemzi egy rögzített időpontban, az utolsó pedig az időbeli változást írja le. Ha feltesszük, hogy a hullám időben állandó, akkor ez az utolsó tényező egy rezgő fázistagot eredményez, amelytől eltekinthetünk. Legyen U(P ) := A(P )eiϕ(P ) ;
(2.4)
a továbbiakban tehát elég ezt a komplex hullámfüggvényt vizsgálnunk, mely minden pontban egy komplex szám exponenciális alakban, így könnyen látható hossza és szöge, azaz az amplitúdó és a fázis. A (2.4) alak segítségével kapjuk a homogén Helmholtz-egyenletet: ∆U + k 2 U = 0, 6
ahol • k = 2πn νc =
2π λ
a hullámszám,
• λ a hullámhossz. A fenti egyenlet megoldásai adják a hullámfüggvények időfüggetlen részét. Gyakran használjuk a hullámfront fogalmát is, amely azoknak az összefüggő pontoknak az összessége, melyeknek fázisa azonos. Az azonos fázisú hullámfrontokat szokás vizsgálni, azaz amelyek fáziskülönbsége n · 2π (n ∈ Z). 2.1.1. Példa. Monokromatikus komplex hullámfüggvény – síkhullám Legyen U(z) := Aeikz ,
(2.5)
ahol z a P pontba mutató helyvektor egy adott derékszögű koordinátarendszerben, k = k · (α; β; γ)T pedig a hullámszámvektor, ahol α, β és γ a különböző irányokba vett terjedési szögek koszinuszai, ezért teljesül k=
T p 2π · α; β; 1 − α2 − β 2 . λ
A (2.5) függvény valóban kielégíti a Helmholtz-egyenletet. Vizsgáljuk azokat a hullámfrontokat, melyek fázisa 2π vagy annak többszöröse, azaz arg(U(z)) = m · 2π. Ebből ekvivalens átalakításokkal a következőt kapjuk: kz = m · 2π − arg(A). Az egyenletet kielégítő z helyvektorok által meghatározott pontok k-ra merőleges, egymással párhuzamos síkokat adnak. A hullámfrontok távolsága 2π · |k|−1 , azaz éppen λ, vagyis hullámhossznyi. A hullám intenzitása állandó:
I(z) = A2 .
7
2.1.2. Példa. Monokromatikus komplex hullámfüggvény – gömbhullám Legyen U(z) :=
A ikr e , r
ahol r = |z|, k ∈ R.
Ez a függvény is kielégíti a Helmholtz-egyenletet. A hullámfrontok elhelyezkedését az előzőhöz hasonlóan számíthatjuk ki: r =m·
2π − const = mλ − const. k
Az így kapott pontok koncentrikus gömböket határoznak meg, melyek távolsága szintén hullámhossznyi. Az intenzitás:
|A|2 I(z) = 2 , r azaz a távolság növekedésével négyzetesen csökken.
2.2.
A fény terjedésének vizsgálata
A mikroszkópunk digitális volta miatt szükséges olyan módszerek használata, melyekkel a hullámfrontok terjedését numerikusan jól kezelhető, analitikus formában tudjuk megadni. Erre törekszünk ebben a fejezetben. Legyen adott egy (O, x, y, z) derékszögű koordinátarendszer. Tegyük fel, hogy a fény a z-tengellyel párhuzamosan terjed, és ismerjük az U függvény értékeit a z = 0 síkban, melyet jelöljön Σ1 (a koordinátarendszert választhatjuk ennek megfelelően). Vezessük be az U1 : Σ1 → C , U1 (x, y) := U(x, y, z0 ) függvényt; ekkor U1 lényegében
az U Σ1 -re való leszűkítése. Célunk egy olyan U2 függvény megadása, mely egy Σ1 gyel párhuzamos, attól z távolságra lévő Σ2 sík minden pontjához hozzárendeli a hullám pontbeli értékét. (Ld. 2.1 ábra.) Gyakorlati alkalmazásokban Σ1 az objektum síkja, Σ2 pedig a megfigyelési sík. Az alábbiakban az U2 függvény kiszámítására ismertetünk két módszert.
8
2.1. ábra. A fény terjedésének vizsgálata terjedési irányra merőleges síkokon. A Σ1 síkon ismert a hullámeloszlás, célunk ebből meghatározni a Σ2 síkbeli értékeket.
2.2.1.
A szögspektrum módszer
Vegyük az U függvény Fourier-transzformáltját a Σ1 síkon: A(νx , νy , 0) := (F U)(νx , νy , 0) =
ZZ
U1 (x, y) exp[−i2π(νx x + νy y)] dx dy.
(2.6)
R R
A (3.2) inverziós képlet alapján ekkor U1 előállítható az alábbi módon: U1 (x, y) =
ZZ
A(νx , νy , 0) exp[i2π(νx x + νy y)] dνx dνy .
(2.7)
R R
A (2.7) kifejezést tekinthetjük (2.5) alakú hullámok összegének, ahol az amplitúdót az A : R3 → C függvény határozza meg, a k hullámvektorra pedig fennáll: α = λνx ,
β = λνy .
A kapott paramétereket a (2.6) kifejezésbe helyettesítve megkapjuk az U1 mező szögspektrumát, azaz hogy az egyes irányokban milyen amplitúdójú hullámok terjednek tovább: A
α β , ,0 λ λ
=
ZZ
U1 (x, y) exp −i2π
R R
β α x+ y λ λ
dx dy.
Tehát U1 -et sikerült felírnunk síkhullámok összegeként. A Σ2 síkra ezek a síkhullámok terjednek tovább, ezért U2 felírható a következő alakban: U2 (x, y) =
ZZ
R R
A
β α β α β α , , z exp i2π x+ y d d . λ λ λ λ λ λ 9
Tehát az A függvény azon értékeit keressük, amelyek harmadik koordinátája z. Az U hullámfüggvény, ezért eleget tesz a Helmholtz-egyenletnek. Megmutatható, hogy ebből következik az alábbi összefüggés: ∂ A ∂z 2
α β , ,z λ λ
+
2π λ
2
2
2
(1 − α − β )A
α β , ,z λ λ
= 0.
Ennek a differenciálegyenletnek egy elemi megoldása az A
α β , ,z λ λ
α β 2π p = A , , 0 · exp i 1 − α2 − β 2 z = λ λ λ α β = A , , 0 · exp(ikz z) λ λ
függvény. Ez a képlet csak akkor értelmezhető a fenti módon, ha α2 + β 2 < 1. Ellenkező esetben a létrejött hullámokat evaneszcens hullámoknak nevezzük, amelyek intenzitása Σ1 -től távolodva exponenciálisan csökken, ezért most nem vesszük figyelembe őket. Tehát a Σ2 síkon létrejött eloszlást a következő képlet írja le: U2 (x, y) =
ZZ
R R
A
α β β α β α , , 0 · exp(ikz z) · exp i2π x+ y d d . λ λ λ λ λ λ
A kapott képlet az alábbi eljárást indukálja: 1. Fourier-transzformáljuk a Σ1 síkon ismert hullámeloszlást. Ezzel a jelet síkhullámok összegére bontjuk, megkapjuk a hullám szögspektrumát (angolul angular spectrum). 2. Beszorozzuk a kapott függvényt az exp(ikz z) függvénnyel, vagyis minden síkhullámon egy fáziseltolást végzünk. 3. Inverz Fourier-transzformációt hajtunk végre a kapott szorzaton, azaz a síkhullám komponenseket ismét összegezzük. A bemutatott eljárást szokás szögspektrum (vagy angular spectrum) módszernek nevezni. A Fourier-transzformáció kiszámítására több hatékony eljárást ismerünk, ezért is terjedt el ez az algoritmus az optikai alkalmazások és kutatások világában. Az alábbi ábrán MATLAB programmal készített szimulációs eredményeim láthatóak két egydimenziós példa esetén (2.2 ábra). Az első esetben a Σ1 síkon egy 10
nyílás, apertúra található, amelyet egyik oldalról egy egység amplitúdójú síkhullám világít meg. A második példában a fény egy rácson halad keresztül, amelynek minden nyílása szinuszos eloszlású. Mindkét kép az apertúra síkja utáni intenzitáseloszlást – illetve jobb ábrázolhatóság érdekében annak negyedik gyökét – mutatja. Jól látható, ahogy a síkhullám komponensek különböző irányokba szóródnak az apertúra után.
2.2. ábra. Egydimenziós jel terjedésének szimulációja a szögspektrum módszer segítségével. A hullámfront balról egy a) apertúrán, b) szinuszos eloszlású rácson halad keresztül.
2.2.2.
A Fresnel-közelítés
A fent leírt problémára másik megoldást is kaphatunk, ha alkalmazzuk a Greentételt a Helmholtz-egyenletet kielégítő tetszőleges U-ra. A tételben szereplő másik függvényként válasszunk egy olyan hozzárendelést, mely két gömbhullám összegét írja le. Ennek segítségével jutunk el az ún. Rayleigh–Sommerfeld diffrakciós formulához, amely a z ≫ λ feltétel mellett jó közelítést ad a Σ2 síkon létrejövő hullámeloszlásra: ZZ z exp(ikr) U2 (x, y) = U1 (ξ, η) dξ dη, (2.8) iλ r2 R R
r=
p
z 2 + (x − ξ)2 + (y − η)2 .
(2.9)
A formula levezetése megtalálható [2]-ben. A fenti összefüggést értelmezhetjük úgy, mintha a Σ1 sík minden (ξ, η) pontját egy pontforrásnak tekintenénk, amelyből U1 (ξ, η)-val arányos komplex amplitúdójú és adott fázisú gömbhullám indul ki, majd ezeket a hullámokat összegeznénk a Σ2 síkon. Ez éppen a Huygens–Fresnel-elv állítását fejezi ki. 11
A (2.9) kifejezésből z-t kiemelve a kapott tényezőre alkalmazhatjuk a √
1+b=1+
1 1 b − b2 + E(b) (0 < b < 1) 2 8
sorfejtést, ahol E(b) a hibatagot jelöli. Esetünkben b=
x−ξ z
2
+
y−η z
2
.
Tegyük fel, hogy paraxiális helyzetben vagyunk, azaz a 2.1 ábrán jelölt α terjedési szögek kicsik. Ez akkor teljesül, ha z elég nagy az apertúrához képest; legyen z3 ≫
π 2 (x − ξ)2 + (y − η)2 . 4λ max
Ekkor b2 elhanyagolható, így a következőre jutunk: "
r ≈z 1+
1 2
x−ξ z
2
+
1 2
y−η z
2 #
.
A (2.8) Rayleigh–Sommerfeld-formula exponenciális tényezőjében használjuk a kapott közelítést, a nevezőben pedig az r ≈ z összefüggést. Így megkapjuk a Fresnel-
közelítést:
eikz U2 (x, y) = iλz
ZZ
R R
k 2 2 dξ dη. (x − ξ) + (y − η) U1 (ξ, η) exp i 2z
(2.10)
Az integrál előtti exponenciális tényező egy konstans fázistolást eredményez, amelyet szokás az egyszerűség kedvéért elhagyni. Ezzel eljutunk a kétdimenziós Fresneltranszformált definíciójához, mely minden U1 függvényhez a (2.10) képlettel (exponenciális tényező nélkül) számított U2 függvényt rendeli. A Fresnel-közelítés felírható két függvény konvolúciójaként: U2 (x, y) = (U1 ∗ h)(x, y) =
ZZ
U1 (ξ, η)h(x − ξ, y − η) dξ dη,
R R
ahol ∗ a konvolúció műveletét jelenti, h : Σ1 → C,
1 ik 2 2 h(x, y) = exp (x + y ) iλz 2z 12
(2.11)
a rendszer impulzusválasz függvénye. Jelölje a Fourier-transzformációt F . Mivel
U1 , h ∈ L2 (Σ1 ), ezért a Fourier-analízisből ismert (3.1.10) konvolúciós tétel alapján a következőket kapjuk: U2 (x, y) = (U1 ∗ h)(x, y) = F −1 (F (U1 ) · F (h))(x, y) = F −1 (F (U1 ) · H)(x, y), (2.12) ahol H : R2 → C, H(νx , νy ) = F (h)(νx , νy ) = exp[−iπλz(νx2 + νy2 )].
(2.13)
a rendszer átviteli függvénye. Az optikai leképezés esetén is hasonló paraxiális közelítéseket alkalmaznak, ezért néha hasznos a Fresnel-transzformációt használni, mégha csak közelítés is. Láthattuk, hogy mindkét módszerben kiemelt szerep jut a Fourier-transzformációnak, ezért a Fourier-analízis mélyebb megismerésétől méltán várhatunk újabb eredményeket és hatékonyabb algoritmusokat. Emiatt a transzformáció tulajdonságait a következő fejezetben részletesebben tárgyaljuk.
2.3.
Hologram készítése és rekonstrukciója
A holográfia az interferencia jelenségén alapszik. Ennek kulcsa, hogy rögzítéskor az amplitúdók adódnak össze, amelyek komplexek. Így előfordulhat az is, hogy két fényhullám találkozásakor azok gyengítik vagy akár kioltják egymást. Tehát egy adott időpillanatban az összeg fáziskülönbség-függő. Mivel a fény frekvenciája nagyon nagy, ezért az intenzitásnak csak egy időintervallumon vett átlagát tudjuk rögzíteni. Ha a fázisok különbsége állandó, akkor a két hullám eredőjének átlagintenzitása is az, ezért egy ernyőn felfogva a sugarakat minden pontban ezt a jellemző intenzitásértéket láthatjuk. Ennek következtében egy csíkrendszer alakul ki, a kapott világos sávokat interferenciacsíkoknak nevezzük. Ezeket láthatjuk a 2.3 ábrán. Ezzel szemben ha a fáziskülönbség változó, minden pontban ugyanazt az átlagértéket kapjuk, ezért a keletkező kép egybefüggő, homogén. Tehát az interferenciakép kialakulásának feltétele az állandó fáziskülönbség. Ezt jellemzi a koherencia fogalma, ugyanis ha két hullám koherens, akkor fázisuk eltérése állandó, azaz - szemléletesen fogalmazva - a két hullám ”együtt mozog”. Ezek alapján az is érthetővé válik, hogy a koherencia fogalmát matematikailag a hullámfüggvények korreláltságával definiálják. 13
2.3. ábra. Fényhullámok interferenciája jellegzetes csíkrendszerrel. A holográfia fizikai megvalósításakor a leképezendő tárgyat lézerrel világítjuk meg. A lézerfény koherens fénynek tekinthető, ezzel lehetővé válik az interferencia létrejötte. Az objektumon szóródó hullám fázisa és amplitúdója is megváltozik, ezeknek a hullámoknak az összességét tárgynyalábnak nevezzük. Ehhez, még mielőtt elérné az érzékelőt, hozzáadjuk az eredeti megvilágító fényt, a referencianyalábot. A hologramot ennek a két nyalábnak az interferenciája hozza létre, a klasszikus holográfiában ezt egy fényérzékeny anyagon rögzítjük. Csak az intenzitáseloszlást tudjuk mérni, a rekonstrukció feladata lesz ebből helyreállítani a fázist is. Jelölje a tárgynyalábot és a referencianyalábot leíró függvényeket UT , UR : R3 → C . Az intenzitásuk az IT = |UT |2 ,
IR = |UR |2
összefüggéssel számítható ki. Ezek alapján a mért érték négyzetgyökét, azaz az eredő intenzitást a következő összefüggés adja: I = |UT + UR |2 = |UT |2 + |UR |2 + UT UR∗ + UT∗ UR = = IT + IR + UT UR∗ + UT∗ UR ,
ahol a
∗
(2.14)
jel a komplex konjugálást jelöli.
A helyreállítás során az elkészült hologramot egy rekonstruáló hullámmal világítjuk meg. Az interferenciakép rácsként szolgál ebben a folyamatban, a transzmisszió, 14
azaz a fényáteresztés mértéke minden pontban az ott rögzített intenzitás nagyságától függ. Jelölje U ezt a hullámot, ekkor a jelenséget a következő képlet írja le: IU = IT U + IR U + UT UR∗ U + UT∗ UR U.
(2.15)
A kapott összeg első két tagja eredményezi az ún. nulladrendű képet. UUT UR∗ a virtuális ikerképet, UUT∗ UR pedig a valós képet adja (ld. 2.4 ábra).
2.4. ábra. A holografikus képalkotás folyamata. a) A tárgy- és a referencinyaláb interferenciáját rögzítjük. b) Helyreállítás során a hologram rácsként hat a rekonstruáló fényhullámra. Létrejön a nulladrend, a valós kép és a virtuális kép. Ha a rekonstruáló hullám arányos a referenciahullámmal, azaz U = UR , akkor a következőt kapjuk: IUR = IT UR + IR UR + UT IR + UT∗ IR . Tehát ha a megvilágító fény amplitúdója, azaz abszolútérték négyzete 1, akkor a tárgyról torzításmentes képet kapunk vissza. Célunk lehet a tárgy nagyítása is, ekkor másfajta rekonstruáló hullámot kell használnunk. Digitális holográfiában a rögzítést egy digitális eszközzel, például CCD kamerával végezzük, a rekonstrukció pedig a fény terjesztésének numerikus szimulációjával történik. Ezek az eljárások már mintavételezést is tartalmaznak, azaz nem tudjuk a teljes jelet rögzíteni, csak bizonyos pontokban felvett, átlagolt értékeit. Ez határokat szab a kép helyreállításában. A mintavételi paraméterek optimális beállításával azonban jórészt kiküszöbölhetőek ezek a hatások. Többféle elrendezés ismeretes, mely lehetővé teszi a tárgynyaláb és a referencianyaláb összegzését. Az in-line elrendezés esetében (2.5 ábra) a két nyaláb nem válik szét, tengelyük egy egyenesre esik. A DHM-ben is ezt az elrendezést használ15
juk, mivel az általunk vizsgált objektumok – algák és férgek – ritkák, így az egy forrásból jövő fény egyszerre töltheti be mindkét nyaláb szerepét, tehát a rendszer könnyen megépíthető. Ezenkívül a kamera pixelmérete is nagyobb lehet, mert az interferencia csíkrendszer kisebb térfrekvenciájú, mint más összeállítás esetében. Az elrendezés hátránya, hogy a nulladrendű és az ikerképek egymáson helyezkednek el a rekonstruált képen, ezeket numerikusan szét kell választani.
2.5. ábra. Inline elrendezés hologram rögzítésére. Az objektumot megvilágító fény egyszerre tölti be a tárgy- és referencianyaláb szerepét. Rögzítés előtt a keletkezett hullámfrontot afokális lencserendszer segítségével felnagyítjuk. fokuszalast digitalisan lehet elvegezni ezert nagyobb az atvizsgalhato terfogat es akar lencse nelkul is lehet.. A holografikus mikroszkópia vívmánya, hogy a fókuszálást digitálisan lehet végezni, ezért nagyobb az átvizsgálható térfogat, ezenkívül akár lencsék nélkül is nyerhetünk nagyított képet a tárgyról, ezzel rugalmasabbá és olcsóbbá válik a kutatás folyamata. Mindehhez azonban szükséges a rendszer paramétereinek megfelelő beállítása, a mintavételezés alapos megtervezése; az ehhez szükséges számítások áttekintése, tervezése, optimalizálása volt a diplomamunkám feladata.
16
3. fejezet Fourier-analízis – áttekintés Ebben a fejezetben a Fourier-analízis témához kapcsolódó eredményeit mutatjuk be tömören. Definiáljuk a folytonos és a diszkrét Fourier-transzformáció fogalmát, és ismertetjük a későbbiekben felhasználni kívánt tulajdonságaikat. Bemutatjuk a frakcionális Fourier-transzformációt, végül pedig röviden kitérünk a transzformációkat megvalósító numerikus algoritmusokra. A fogalmakat és tételeket egydimenziós esetben fogalmazzuk meg, de hasonlóan következik az általánosítás több dimenzióra. A téma szemléletesebb és részletesebb megismeréséhez a szakirodalomban számos írás található, például [5] vagy [6].
3.1.
Folytonos Fourier-transzformáció
A Fourier-transzformáció definiálásához szükséges előbb megismernünk bizonyos speciális függvénytereket és tulajdonságaikat. 3.1.1. Definíció. Legyen Ω ⊆ Rn adott Lebesgue-mérhető halmaz, 1 ≤ p ≤ ∞. Legyen f : Ω → C Lebesgue-mérhető függvény, ekkor definiáljuk az
kf kLp :=
1/p Z |f |p ,
ha 1 ≤ p < ∞,
Ω inf{sup |f | : N ⊆ Ω nullmértékű}, ha p = ∞ Ω\N
Lp -normát. Az Lp (Ω) tér azon Lebesgue-mérhető függvényekből áll, melyekre kf kLp
véges, beleértve, hogy két függvényt azonosnak tekintünk, ha egy nullmértékű halmaz kivételével (azaz majdnem mindenütt) egyenlőek [7]. 17
3.1.2. Tétel (Riesz–Fischer). Az Lp (Ω) tér az k·kLp normával teljes, azaz Banachtér. Bizonyítás: Ld. [7].
3.1.3. Állítás. L2 (Ω) az hf, giL2 :=
Z
fg
Ω
skalárszorzattal Hilbert-tér. Bizonyítás: Ld. [7].
3.1.4. Állítás. Legyen p, q ∈ Z+ ∪ {∞}, 1 ≤ p < q ≤ ∞. Ekkor Lp (R) ⊂ Lq (R). Bizonyítás: Ld. [7]. Ezek után bevezethetjük az alábbi fogalmat: 3.1.5. Definíció. Az L1 (R) téren értelmezett f 7→ fˆ, ˆ := (F f )(x) := f(x)
Z
f (t)e−i2πxt dt
(3.1)
R
leképezést Fourier-transzformációnak, az fˆ: R → C függvényt az f Fourier-transzformáltjának nevezzük. Jelölje C0 (R) a valós számokon értelmezett, ±∞-ben eltűnő, folytonos függvények
halmazát. Ekkor k · kL∞ norma C0 (R)-en, és megegyezik a szuprémum-normával.
3.1.6. Állítás. A Fourier-transzformáció egy L1 (R) → C0 (R) korlátos, lineáris operátor, melyre kF f kL∞ ≤ kf kL1
(f ∈ L1 (R)).
Bizonyítás: Ld. [5].
Az operátor (3.1) alapján csak L1 (R)-beli függvényekre definiálható, azonban unitér módon kiterjeszthető L2 (R)-re is. Ekkor a transzformált szintén L2 (R)-beli. Legyen minden g ∈ L1 (R) esetén e (Fg)(t) :=
Z
g(x)ei2πxt dx.
R
18
(3.2)
3.1.7. Állítás. Legyen f olyan függvény, melyre f, fˆ ∈ L1 (R). Ekkor majdnem
minden x-re teljesülnek az alábbi egyenlőségek:
e f = F Ff, e f = FF
Bizonyítás: Ld. [5].
(Fef )(x) = (F f )(−x).
(3.3) (3.4)
Az állítás alapján az Fe operátort a Fourier-transzformáció inverzének nevezzük, és F −1 -nel jelöljük. Megjegyzés: A bevezetett fogalmakat érdemes fizikai szempontból is értelmezni. Az (3.2) összefüggésben g-t helyettesíthetjük az f függvény Fourier-transzformáltjával, fˆ-pal. Ekkor az integrandus egy olyan hullámot ír le, melynek amplitúdóját az fˆ függvény határozza meg, fázisa pedig 2πxt. Több dimenzióban ez éppen egy síkhullámnak felel meg. Ezeket összegezzük az inverz Fourier-transzformáció kiszámításakor. Tehát a Fourier-transzformáció valóban síkhullámok összegére bontja a jelet különböző t frekvenciák szerint. Ezért a Fourier-transzformáltak terét szokás frekvenciatérnek is nevezni. A későbbiekben hasznos lesz a (τa f )(x) := f (x + a) transzláció, (νa f )(x) := ei2πax moduláció és (δs f )(x) := f (sx)
dilatáció
operátorok ismerete, ahol x, y, a, s ∈ R, s 6= 0. A Fourier-transzformációval való kapcsolatukat a következő egyenletek írják le: 3.1.8. Állítás. F (τa f ) = νa (F f );
F (νa f ) = τ−a (F f ); 1 · δ 1 (F f ). F (δs f ) = |s| s Bizonyítás: Ld. [5].
(3.5) (3.6) (3.7)
Tehát a jel eltolása a frekvenciatérben fázisváltozást okoz és fordítva; a jel x-irányú összeszűkülése pedig a frekvenciát és az amplitúdót növeli. 19
Már az első fejezetben is láthattuk, hogy a konvolúció kitüntetett szerepet játszik az optikai alkalmazásokban. Következzen ennek a fogalomnak a precíz bevezetése. 3.1.9. Állítás. Bármely f, g ∈ L1 (R) esetén a következő integrál majdnem minden
x ∈ R pontban létezik és véges:
(f ∗ g)(x) :=
Z
f (t)g(x − t) dt.
R
Bizonyítás: Ld. [5].
Az így definiált f ∗ g ∈ L1 (R) függvényt az f és g konvolúciójának nevezzük. A konvolúcióképzés művelete asszociatív, kommutatív és összeadásra nézve disztributív. A 2. fejezetben már hivatkoztunk a következő fontos eredményre: 3.1.10. Tétel (Konvolúciós tétel). Minden f, g ∈ L1 (R) függvényre F (f ∗ g) = (F f ) · (F g). Bizonyítás: Ld. [5].
3.2.
(3.8)
Egy általánosítás – a frakcionális Fourier-transzformáció
Érdekes és hasznos általánosítást kaphatunk, ha észrevesszük a Fourier-transzformáció ciklikusságát, melyet a 3.1 ábrán szemléltetünk. Ezt a tulajdonságot annak köszönhetjük, hogy a Fourier-transzformáció és inverze nagy mértékben hasonlít egymáshoz: ugyanarra a függvényre alkalmazva a kapott függvények egymás tükörképei. A frakcionális Fourier-transzformációhoz az az ötlet vezethet el bennünket, hogy megpróbáljuk ezt a körkörösséget folytonossá tenni, azaz értelmezni az F α operátort
bármely α ∈ R esetén. A továbbiakban erre keresünk megfelelő matematikai alapot, segítségül hívva a csoportelmélet és a funkcionálanalízis eredményeit. A fogalom áttekintésében E. U. Condon [8], H. M. Ozaktas [9] és A. Stern [10] írásait vesszük alapul. Tehát a (3.4) egyenletből adódik, hogy F 4 f = f . Megállapíthatjuk, hogy F a
kompozícióképzés műveletével egy negyedrendű ciklikus operátorcsoportot generál, ezt jelölje GF . Ez a csoport izomorf a k · 90◦ -kal való forgatások által meghatározott 20
3.1. ábra. A Fourier-transzformáció által generált ciklikus csoport csoporttal (k ∈ Z). Megmutatható, hogy létezik olyan folytonos operátorcsoport,
melynek GF részcsoportja. Ennek elemeit frakcionális Fourier-transzformációknak nevezzük, melyeket a következő képlet definiál: (Fα f )(u) = C1
Z
R
2π π 2 2 (u + v ) exp −i uv dv, f (v) exp i tan φ sin φ
(3.9)
ahol α ∈ R \ Z, φ = α π2 , C1 pedig egy φ-től függő normalizáló konstans: π sgn(sin φ) φ | sin φ|1/2 . C1 = exp −i 4 2 Az α számot a transzformáció frakcionális rendjének nevezzük. A fenti képlet egész α esetén nem értelmezhető, ezekre az értékekre a Fouriertranszformáció illetve inverzének (3.1) és (3.2) meghatározása (és ezek többszörös alkalmazása) használható. Azonban érdemes egységes definíciót kialakítani, ennek módszerét itt csak vázlatosan ismertetjük. A (3.9) formulát kiterjesztjük egész α értékekre úgy, hogy a (3.1) meghatározással ekvivalens fogalmat kapjunk – habár csak disztribúció értelemben. Páros α esetén a (3.9) kifejezés határértékét vesszük, amely az integrandusban a delta-disztribúciót eredményezi. A disztribúcióelmélet segítségével megmutatható, hogy az f (x) illetve az f (−x) eredményt kapjuk, ahogy azt (3.4) alapján várjuk. Páratlan egész α esetén is vehetünk határértéket, amely segítségével éppen a folytonos Fourier-transzformációhoz illetve annak inverzéhez jutunk vissza. Tehát a kapott definíció valóban koherens az eddigi megállapításainkkal. A definícióban szereplő u argumentum nem térbeli elhelyezkedést határoz meg, és nem is frekvenciát, értelmezni valahol a kettő között tudjuk. A 4. fejezetben még
21
visszatérünk erre a kérdésre. A frakcionális Fourier-transzformáció additív operátor, azaz tetszőleges α és β valós számokra Fα+β = Fα ◦ Fβ = Fβ ◦ Fα , ahol ◦ a kompozícióképzést jelöli. A fogalom alkalmazására szintén a 4. fejezetben mutatunk példát.
3.3.
Diszkrét Fourier-transzformáció
Adatrögzítéskor lehetetlen valóban folytonos jelet nyernünk, ehelyett kis időintervallumonként rögzítünk egy-egy értéket. Az így kapott adatsor diszkrét, ezért a Fourier-transzformációval kapcsolatban kapott eddigi eredményeink is csak akkor használhatóak, ha átalakítjuk őket diszkrét függvényekre érvényes állításokká. Vegyünk tehát egy diszkrét halmazt: IM :=
m m = 0, 1, ..., M − 1 M
(M ∈ N+ ),
azaz a [0; 1) intervallum egy ekvidisztáns felbontását, és tekintsük az f : IM → C függvényt.
3.3.1. Definíció. Az M −1 1 X m −i2πn m M fˆM (n) := f e M m=0 M
(n ∈ Z)
(3.10)
képlet által meghatározott értékeket az f függvény diszkrét Fourier-együtthatóinak, az fˆM : Z → C függvényt pedig az f diszkrét Fourier-transzformáltjának nevezzük. 3.3.2. Állítás (Inverziós formula). Az f függvényt az IM halmazon egyértelműen meghatározzák diszkrét Fourier-együtthatói, azaz minden t ∈ IM esetén f (t) =
M −1 X
fˆM (l)ei2πtl .
l=0
Bizonyítás: Ld. [5].
A diszkrét Fourier-transzformált periodikus, ugyanis fˆM (n) = fˆM (M + n) (n ∈ Z), ezért megfelelő M darab értéke meghatározza, tehát elég például a n = 0, 1, ..., M −1, 22
vagy páros M esetén az n = −M/2, −M/2 + 1, ..., M/2 − 1 számokhoz tartozó értékeket figyelembe vennünk, a (3.10) definíciót pedig kiszámíthatjuk az előbbi helyett az utóbbi értékekkel is. A későbbiekben fontos szerepe lesz annak, hogy az inverz is 1 szerint periodikus. A transzláció, moduláció és dilatáció operátorokkal felírt (3.5)–(3.7) képletek diszkrét megfelelői ezúttal is érvényesek. Ehhez esetenként szükséges a diszkrét Fourier-transzformáltat nem egész értékekre is értelmeznünk. Gyakorlati alkalmazásokban azonos időközönként nyerünk M számú adatot, majd az előbb említett operátorokkal áttranszformálhatjuk az időintervallumot a [0; 1) intervallumra, ezzel a fent vázolt modellt kapjuk. Az IM halmaz a modulo 1 összeadás műveletével ciklikus csoportot alkot. Ebben definiálhatjuk a kivonás műveletét, mint az említett összeadás inverzét. A konvolúció folytonos függvények esetében felírt definíciója a következőképpen módosul: M −1 m 1 X m f ·g x− , (f ∗ g)(x) := M m=0 M M
ahol f, g : IM → C függvények, x ∈ IM tetszőleges, a g függvény argumentumában pedig a kivonás a fent bevezetett, ciklikus csoportbeli művelet. Mind f -re, mind fˆM -re tekinthetünk úgy, mint RM -beli vektorokra. Ezzel a diszkrét Fourier-transzformációt egyszerű mátrixszorzásként is felírhatjuk a következő módon:
1 fˆM = FM · f, M
(3.11)
m
ahol (FM )nm = e−i2πn M . Mivel a mátrix oszlopai ortogonálisak, az inverz diszkrét −1 T mátrix segítségével szintén gyorsan számolFourier-transzformáció az FM = FM ható, O(M 2 ) számítási idő alatt. Több algoritmus született, amely felgyorsítja a transzformációt. A legismertebb az FFT algoritmusként emlegetett gyors Fourier-transzformáció (Fast Fourier Transform), mely O(M log M) időben ér véget. Az eljárás kulcsa abban rejlik, hogy visszavezeti a feladatot két M/2 méretű alfeladatra, majd ezt a lépést iterálja, amíg FM – ideális esetben – 2 × 2-es mátrixokra bomlik. A konstrukcióból adódik, hogy az FFT algoritmus akkor a leghatékonyabb, ha M kettőhatvány, illetve az eljárás optimalizálható más prímhatványok esetében is. Az algoritmust sok más területen is alkalmazzák, például nagy számok szorzatának kiszámítására. Léteznek más algoritmusok is, melyek arra a feltevésre épülnek, hogy a jel vala23
milyen speciális tulajdonsággal rendelkezik. Frekvenciatérben ritka jelekre számos eljárás született, például az SFFT (Sparse Fast Fourier Transform) algoritmus, √ mely akár O(log M Mk log M ) idő alatt adhat eredményt, ahol k a jel szignifikáns Fourier-együtthatóinak maximális száma [11]. A ritka jelek mintavételezése a manapság közkedvelt kutatási területek egyike, elmélete a Compressed Sensing témakörébe tartozik. (Ld. [12].) Egyes eljárások azt a tényt is figyelembe veszik, hogy sokszor a mérőműszer pontatlansága vagy egyéb körülmények miatt nem sikerül azonos időközönként mintákat venni. Az erre az esetre alkalmazható nem egyenletes gyors Fourier-transzformációnak (Nonuniform Fast Fourier Transform – NUFFT) is több változata létezik, a jel visszaállíthatóságára pedig precíz elméleti megalapozást találhatunk a szakirodalomban, például [13]-ban vagy [14]-ben.
24
4. fejezet Mintavételezés Ahogy azt az előző fejezetekben már említettük, a valóságban méréseinkkel diszkrét adatsort kapunk, és azzal dolgozunk tovább. Ez a gyakorlati adottság új kérdést vet fel: hány diszkrét értékre van szükségünk ahhoz, hogy azokból az eredeti jel egyértelműen helyreállítható legyen? A most következő fejezetben erre a kérdésre keressük a választ, azaz a mintavételezés paramétereit elemezzük. Megvizsgáljuk, hogy a minták száma és elrendezése hogyan befolyásolja a frekvenciatérben kapott értékeket, majd a Nyquist-kritérium segítségével feltételt adunk sávkorlátozott jelek mintavételezésére. Végül bemutatjuk a végtelen sávszélességű jelek feldolgozásában elterjedt alapvető módszereket és azok sajátosságait. Az összefüggéseket egy dimenzióban vezetjük le, a kapott eredmények megfelelői hasonlóképpen adódnak több dimenzió esetében is.
4.1.
A mintavételezés hatása a frekvenciatérben
A mintavételezési paraméterek igen szemléletes bevezetését találjuk D. Voelz Fourieroptikai kézikönyvében [3]. Az alábbiakban röviden összefoglaljuk az erre vonatkozó jelöléseket és ismereteket.
4.1.1.
Jelölések és alapvető összefüggések
Vegyük tehát a vizsgált jelet leíró függvényt. A mérések során csak a jel intenzitását, tehát a függvény abszolútérték négyzetét tudjuk rögzíteni, ezt jelölje f ∈ L1 (R). Az f függvényt egy adott (véges) szakaszon figyeljük meg, ennek hosszát jelölje L ∈ R . A koordinátatengelyt válasszuk úgy, hogy ez a mért szakasz az − L2 ; L2 intervallumra 25
essen. Tegyük fel, hogy a jel tartója egy Bx ∈ R+ hosszú intervallum; ekkor magától értetődő feltétel, hogy L ≥ Bx teljesüljön. Az egyenletesen vett minták számát jelölje M (M ∈ N páros), a mintavételezési intervallum hossza – azaz két minta közötti távolság – ebben az esetben
∆x :=
L . M
A továbbiakban használjuk az [a; b] := {a; a + 1; a + 2; . . . ; b − 1; b}
(a, b ∈ Z)
jelölést, valamint hasonló definícióval az [a; b); (a; b] és (a; b) szimbólumokat. Az xm := m ∆x x
∈
ILM
M M m∈ − ; 2 2
!
, azaz
(4.1)
L L L := − ; − + ∆x; . . . ; − ∆x 2 2 2
(4.2)
helyeken veszünk mintát a jelből, tehát az f függvény ILM -re való leszűkítésével L dolgozunk tovább, ezt jelölje fM . A frekvenciák meghatározásához diszkrét Fourier-transzformációt alkalmazunk L a mintavételezés során kapott adatokra, azaz fM -re. A (3.10) definícióhoz képest az a különbség, hogy a transzformációt ezúttal nem egy egység, hanem egy L hosszú intervallum értékeire végezzük el. Ezért az 1 M
L = ∆x M
→
helyettesítést alkalmazva (3.10)-ből a következő alakot nyerjük: M −1 1 X m −i2πn m M f e M m=0 M
∆x
→
M −1 X
f (m ∆x) e−i2πnm ∆x
m=0
(n ∈ Z).
A kapott kifejezést értelmezhetjük úgy, hogy a diszkrét Fourier-transzformált értékeit a frekvenciatartomány n νn := M ∆x
M M n∈ − ; 2 2 26
helyein állítjuk elő. Ezek alapján a frekvenciatartományban a mintavételezési távolság
1 1 = , M ∆x L a vizsgálható frekvenciatartomány hossza pedig ∆ν :=
Lν :=
− M2 −1 1 M 1 1 1 − + = − + = . M ∆x M ∆x L M ∆x M ∆x L ∆x M 2
(4.3)
(4.4)
Jelölje Bν ∈ R+ 0 ∪ {∞} a jel sávszélességét, azaz a legnagyobb és a legkisebb frekven-
ciakomponensének különbségét. Ekkor nyilvánvaló feltétel, hogy teljesüljön Lν ≥ Bν . A véges sávszélességű függvényeket sávkorlátozottaknak nevezzük.
4.1. ábra. Mintavételi paraméterek az (a) térbeli és a (b) frekvenciatartományban. A 4.1 ábrán láthatóak a mintavételezési paraméterek jelölései és a köztük lévő alapvető összefüggések. Amennyiben a frekvenciák sűrűbb mintavételezése a célunk, (4.3) alapján a térbeli tartományban mintavételezett területet kell nagyobbra vennünk. Ezt az összefüggést használja fel az ún. zero-padding módszer, mely szerint a mintavételezett területet nullákkal vesszük körül, és ezzel növeljük meg L-et. Így azonban – állandó ∆x esetén – nő a térbeli minták száma is, a szükséges tárhely nagyságával együtt. Másfelől a (4.4) kifejezés szerint minél nagyobb frekvenciatartományt szeretnénk rekonstruálni, annál kisebb mintavételi távolsággal kell dolgoznunk a térben. Jól kifejezi ezt a sajátságot az alias-hatás jelensége. A 4.2 ábrán [6] a [0; 1] intervallumon értelmezett f (x) := cos(3·2πx) és g(x) := cos(5·2πx) függvények grafikonja látható, a mintavételezési pontok az I8 halmaz elemei. A minták alapján mindig a kisebb frekvenciájú függvényt – a példánkban f -et – rekonstruáljuk. A magasabb frekvenciájú g függvényt csak akkor kaphatjuk meg, ha sűrűbben mintavételezzük a jelet, és ezzel 27
egyértelművé tesszük a két frekvencia közötti különbséget. A mintavételi távolság csökkentésével tehát az alias-hatást tudjuk mérsékelni.
4.2. ábra. Az alias hatás jelensége. Mintavételezés esetén bizonyos határnál nagyobb frekvenciájú jelek nem rekonstruálhatóak, hanem kisebb frekvenciákon jelennek meg. Tegyük fel, hogy L = Bx és ∆x = Bν−1 . Ez esetben a szükséges minták száma L = Bx · Bν , ∆x
(4.5)
azaz éppen a jel tartója szorozva a sávszélességgel. A kapott skalárt a jel tér– sávszélesség szorzatának (space-bandwidth product [15]) nevezzük, az angolszász terminológia szerint SBP-vel jelöljük. A mennyiség tehát a szükséges mintavételi pontok minimális számára utal. Az SBP másik definícióját a Wigner-disztribúcióról szóló következő fejezetben ismertetjük. Fontos tulajdonsága a mintavételi folyamatnak, hogy a (3.10) diszkrét Fouriertranszformált periodikus volta miatt a mintavételezett jel a frekvenciatérben periodikus lesz, függetlenül attól, hogy eredeti analitikus megfelelője periodikus frekvenciaspektrumot eredményez-e vagy sem. Ha visszatranszformáljuk a jelet helyreállítás céljából, ismét periodizálunk, ezzel tehát az eredeti jel periodikus változatát kapjuk meg. A spektrumban a periódusok széle egybeeshet és összeadódhat, jóval nagyobb értékeket eredményezve, mint az analitikus megoldás esetén (ld. 4.3 ábra). A jelenség tulajdonképpen a már említett alias-hatásnak, vagyis az alulmintavételezett frekvenciáknak köszönhető. Holográfiai alkalmazásainkban L a leképezett szakasz hosszával egyenlő, mely tartalmazza a vizsgált objektumot; Lν az érzékelő kamera nagyságát jelöli, ∆x és ∆ν pedig a tárgy- és képegyenesen (vagy -síkban) lévő pixelek méretét, melyek a felbontást határozzák meg. M a tárgyegyenesen vett pixelszám.
28
4.3. ábra. a) Egy jel és b) Fourier-transzformáltjának viselkedése mintavételezés során. A folytonos vonal az analitikus, a szaggatott vonal a periodikus változatot jelöli, míg a pontok a mintákat.
4.2.
Nyquist-kritérium és szűrés
Az előzőekben láthattuk, hogy a mintavételi paraméterek között milyen összefüggések állnak fenn. A továbbiakban azt kutatjuk, hogy hogyan tervezzük meg a mintavételi eljárást úgy, hogy a megfigyelt jelet megfelelőképpen tudjuk rekonstruálni. Ehhez kapcsolódóan ismertetjük a sávkorlátozott jelekre alkalmazható Nyquistkritériumot, majd a végtelen sávszélességű jelek esetében bemutatjuk a szűrők szerepét. Az alfejezet alapjául Voelz eddig felhasznált írásán [3] kívül A. Gotchev és L. Onural írása [16] szolgál.
4.2.1.
A Nyquist-kritérium
A legismertebb mintavételezési tételt C. E. Shannon publikálta 1949-ben [17]. V. A. Kotelnikov 1933-ban nyugati kollégáitól függetlenül szintén közölte ezt az eredményt [18], azonban az orosz mérnök értekezése csak akkor vált ismertté, mikor 2000-ben angolra fordították. Következzen az általuk megfogalmazott ún. Nyquist-kritérium. 29
4.2.1. Tétel (Nyquist-kritérium). Legyen f ∈ L2 (R) olyan valós értékű függ-
vény, melynek Bν sávszélessége véges. Ekkor f egyértelműen rekonstruálható ∆x távolsággal egyenletesen vett mintáiból, ha teljesül az alábbi feltétel:
∆x ≤
1 . 2Bν
Bizonyítás: Ld. [17, 18]. A
1 2∆x értéket Nyquist-frekvenciának nevezzük. A tétel alapján ez a legmagasabb frekvencia, amely ∆x mintavételi távolság esetén helyreállítható. Eredményünk összeegyeztetνN :=
hető a fentebb levezetett (4.4) kifejezéssel. Ha nem teljesül a kritérium, akkor a magasabb frekvenciák az alacsonyabb frekvenciákon jelentkeznek, és a már ismertetett alias-hatás torzítja a jelünket.
4.2.2.
Szűrők és tartójuk
A Nyquist-kritérium csak sávkorlátozott jelekre ad használható feltételt, ez esetben ∆x alkalmas megválasztásával a vizsgált objektum teljes frekvenciaspektruma megkapható. Azonban a valóságban a véges kiterjedésű jelek sávszélessége mindig végtelen, a kritérium pedig ebben az esetben végtelenül kicsi mintavételezési távolságot kíván, ami nyilván nem teljesíthető. Ezért a jelet aluláteresztő szűrővel transzformáljuk, azaz a Fourier-transzformáltját egy véges tartójú függvénnyel szorozzuk. Ennek köszönhetően a jel egy bizonyos korlátnál magasabb frekvenciái eltűnnek. A korlát és a szűrő megválasztására több példát is találhatunk. A szögspektrum módszer esetén is figyelembe kell venni a fent leírt körülményeket, az átviteli függvény szűréséhez Matsushima és Shimobaba adott korlátot [19]. Az általuk levezetett határ z terjesztési távolság, λ hullámhossz és rögzített ∆ν esetén a következő: 1 . |ν| ≤ [(2∆ν z)2 + 1]1/2 λ Tehát az exp(ikz z) függvényt leszűkítjük a kapott feltétel által meghatározott intervallumra, és ezzel a véges tartójú függvénnyel folytatjuk a szögspektrum algoritmust.
30
Vegyünk egy általánosabb esetet. Legyen g ∈ L2 (R), ekkor az ET :=
Z
|g|2
(4.6)
R
értéket a g függvény totális teljesítményspektrumának nevezzük [3]. A szűrő tartóját aszerint is meghatározhatjuk, hogy a Fourier-transzformált totális teljesítményspektrumának hány százalékát szeretnénk megtartani – a [3] által javasolt érték 98%. Ezzel megkapjuk a függvény effektív sávszélességét, Bν′ -t, mely tartalmazza a szignifikáns frekvenciaértékeket. Ezután a Nyquist-kritérium figyelembe vételével, Bν helyett Bν′ -vel számolva megtervezhetjük a mintavételezési eljárást. A megfelelő tartó kiválasztása után eldönthetjük, milyen függvénnyel kívánjuk szűrni a jelet. A legegyszerűbb szűrők az alábbiak: 1. s(x) := χ[−a;a] a [−a; a] intervallum indikátorfüggvénye; ( 1 − |x|, ha |x| ≤ 1, 2. s(x) := 0, ha |x| > 1 (x ∈ R) az ún. „háztető-függvény”; 3. s(x) := exp(−πx2 ) (x ∈ R) a Gauss-görbe. Az első példában a függvény frekvenciatartományának végeit egyszerűen „levágjuk”, általában szakadási helyeket okozva; a másik kettő esetben a folytonosság érdekében fokozatosan tesszük nullává a frekvenciakomponenseket (ld. 4.4 ábra). A szűrők alkalmazása tehát egyfelől adatveszteséggel jár, másfelől azonban sokszor elhagyhatatlan egy hatékony mintavételezési eljárás megtervezéséhez.
4.2.3.
Az indikátorfüggvény mint szűrő
Gyakran találkozunk a fenti felsorolásból a legegyszerűbb, első esettel, ezért vizsgáljuk meg az indikátorfüggvényt mint szúrőt. Legyen s : R → R, s(x) := χ[− 1 ; 1 ]. 2 2
Ekkor a szinusz-függvény páratlanságát felhasználva a következőt kapjuk: (F
−1
1 sin π 2t 1 t 1 sin −π 2t = · = · sinc . s)(t) = sˆ(−t) = · t t 2 2 2 2 −π 2 π2 31
(4.7)
4.4. ábra. a) A jel a Fourier-tartományban. b) Az alkalmazott szűrők. c) A függvény szűrés utáni képe. A Fourier-transzformáltra vonatkozó (3.1.10) konvolúciós tétel alapján tehát elmondható, hogy a (4.7) szűrő alkalmazása a térbeli tartományban sinc-interpolációt eredményez. Matematikailag strukturáltabb képet kapunk, ha vektorterekben gondoljuk át a fenti eredményt [16]. Könnyen belátható, hogy az L2 (R)-beli, valós értékű, sávkorlátozott függvények a pontonkénti összeadás és a valós számmal vett szorzás műveletével vektorteret alkotnak. Jelöljük ezt a vektorteret az angol ’band-limited function’ elnevezés után BLF -fel. Gotchev összefoglaló műve [16] szerint minden f ∈ BLF előáll a következő alakban: f (x) =
X
m∈Z
cm sinc(x − m) ((cm ) ∈ l2 (R)),
ahol l (R) azoknak a (cm ) valós sorozatoknak a halmaza, melyekre 2
(4.8)
P
m∈Z
|cm |
2
1/2
véges. Ebből következik, hogy a sinc-függvény egész számmal vett eltoltjai bázist alkotnak BLF -ben. Az s Fourier-transzformáltja alapján megállapítottuk, hogy a szűrő alkalmazása sinc-interpolációt eredményez a térbeli tartományban. Összekötve ezt az eredményt a fenti állításokkal arra jutunk, hogy ezzel a módszerrel ortogonális projekciót haj32
tunk végre BLF -re, azaz az approximációs hibát – legkisebb négyzetes eltérés értelmében – ez az eljárás minimalizálja. A sinc függvény által generált bázis helyett más eltolásinvariáns bázist is alkalmazhatunk, sőt, a módszert Riesz-bázisokkal általánosítva wavelet-, frame- és spline-terek is segítségünkre lehetnek. A módszerekről és digitális holográfiai alkalmazásukról átfogó képet ad Gotchev és Onural már említett összefoglalója [16].
33
5. fejezet A Wigner-disztribúció Mintavételezés során a térbeli és a frekvenciatartományban a paraméterek szorosan összefüggnek, egymást korlátozzák, és sokszor nehézséget jelent, hogy együttes vizsgálatuk, ábrázolásuk a két teret összekötő Fourier-transzformáció műveletével lehetséges. A Wigner által 1932-ben bevezetett disztribúció [20] ezt a folyamatot egyszerűsíti, segítségével áttekinthetőbbé válik a paraméterek egymással való kölcsönhatása. Ez az egyszerűbb fogalom teszi lehetővé, hogy a Nyquist-kritériumhoz képest kevésbé szigorú, általánosabb feltételt adjunk a mintavételezés megtervezéséhez. Az új kritérium alapján növelhetjük a mintavételi intervallum hosszát, egyúttal csökkenthetjük a minták számát és a szükséges tárhelyet, és a számításokat is kisebb adatsoron kell elvégeznünk. Az alábbiakban ismertetjük a Wigner-disztribúció fogalmát és az új mintavételezési kritériumot. Ezután megvizsgáljuk, hogy hogyan hat a terjesztés és a lencsék használata a disztribúció tartójára, végül pedig a hologram ikerképeinek fedéséről is ejtünk pár szót. D. G. Voelz már említett írásán [3] kívül Adrien Stern és Bahram Javidi cikkei [10, 21, 22, 23] lesznek segítségünkre.
5.1.
Meghatározás és alapvető tulajdonságok
5.1.1. Definíció. Tetszőleges f ∈ L2 (R) esetén a Wf : R × R → C , Wf (x, ν) :=
Z
R
x′ x′ ∗ f x− exp(−i2πx′ ν) dx′ f x+ 2 2
függvényt az f Wigner-disztribúciójának nevezzük. 34
(5.1)
A disztribúció elnevezés ebben az esetben az angol „eloszlás” (distribution) szóhoz köthető, noha a fogalom nem egy valószínűségi eloszlást ad meg, és nem azonos a Wigner-eloszlással. Nem összetévesztendő a magyar terminológiában megszokott disztribúció fogalmával sem, mely a függvények általánosításaként bevezetett folytonos, lineáris funkcionálokat jelöli. A szóhasználat szemléletes megértését szolgálják a következő állítások. 5.1.2. Állítás. Jelölje F az f függvény Fourier-transzformáltját. Ekkor ZZ
Wf (x, ν) dx dν =
R R
Z
2
|f (x)| dx =
R
Z
|F (ν)|2 dν.
R
Bizonyítás: Ld. [24].
5.1.3. Állítás. A Wigner-disztribúció valós értékű függvény. Bizonyítás: Az (5.1) definícióból következik, hogy Wf∗ = Wf , tehát valóban igaz az állítás. Az (5.1) képlet egy függvény Fourier-transzformáltjával egyenlő: x′ x′ ∗ f x− (ν), Wf (x, ν) = F f x + 2 2
(5.2)
ahol x az átalakítás során egy fix paraméter. A transzformálandó függvény az f x pont körüli viselkedését írja le, tehát a Wigner-disztribúció az intenzitás lokális tulajdonságait fejezi ki. Az (5.1.2) állításban szereplő kifejezések a fizikában fontos jelentéssel bírnak: a jelet leíró függvény abszolútérték négyzetének integrálásával állapítjuk meg az összenergiát. Ezek alapján elmondható, hogy a Wigner-disztribúció a jel lokális energiaeloszlását adja meg. Egészen pontosan Wf (x, ν) értéke az x ponton áthaladó, ν frekvenciájú hullám amplitúdójával egyenlő – ezzel összhangban áll, hogy értékei valós számok [25]. 5.1.4. Állítás. Wf (x, ν) = WF (ν, −x). Bizonyítás: Az (5.2) képletet alakítjuk tovább. Felhasználva a transzláció és dilatáció operátorokra felírt (3.5) és (3.7) összefüggéseket, valamint a (3.1.10) konvolúciós
35
tételt a következőket kapjuk: i h io n h ∗ (ν) = F τx δ 1 f ∗ F τx δ− 1 f 2
2
= {[2νx δ2 F ] ∗ [2νx δ−2 F (f ∗)]} (ν) =
= {[2νx δ2 F ] ∗ [2νx δ−2 δ−1 F ∗ ]} (ν) = Z = 4 F (2t)F ∗ (2ν − 2t) exp [i2πx(2t − 2ν + 2t)] dt. R
Alkalmazzuk a ν ′ := 4u − 2ν helyettesítést:
Z
R
F
ν′ ν+ 2
ν′ F ν− exp(i2πxν ′ ) dν ′ = WF (ν, −x). 2 ∗
Ezzel beláttuk az állítást.
Látható, hogy a Wigner-disztribúció egyszerre veszi figyelembe a térbeli és a frekvenciatartományt, és átmenetet ad a jel és Fourier-transzformáltja között. A Wigner-disztribúció tartója megegyezik azon R × R -beli pontok halmazával, melyeken a jel vagy a Fourier-transzformáltja nem nulla. Ebből a tulajdonságból ered a (4.5) összefüggéssel definiált tér-sávszélesség szorzat másik meghatározása, mely szerint SBP-vel jelöljük az f és F függvények tartójának direkt szorzatát. Eszerint a tér-sávszélesség szorzat egy R × R -beli alakzat, mely tartalmazza a Wignerdisztribúció tartóját. Emlékeztetünk rá, hogy amint azt már a mintavételezésről szóló fejezetben is megmutattuk, a tartó valójában nem lehet mindkét tengely mentén véges. Vizsgálatainkban továbbra is véges tárgyakat elemzünk, amelyek effektív sávszélességét vesszük figyelembe. Az előző fejezetből azt a tulajdonságot is átörökíthetjük, hogy a mintavételezett f függvény Wigner-disztribúciójának tartóját úgy kell tekintenünk, mintha mindkét irányban periodikus lenne. Ugyanis a diszkrét Fourier-transzformáció a disztribúció előállítása során a frekvenciatengely irányában készít másolatokat a tartóról, a jel helyreállításakor az inverz eljárás pedig a térbeli tengely mentén (ld. 5.1 ábra). Hagyományos értelemben vett disztribúcióelmélet segítségével belátható, hogy a frekvenciatartományban két másolat középtengelye között (2 ∆x)−1 a távolság [26], ezért a Nyquist-kritérium teljesítésével elérhető, hogy a másolatok ne fedjék egymást a Wigner-tartományban. Ekkor szűrő alkalmazásával helyreállítható a jel, ellenkező esetben pedig az alias-hatást figyelhetjük meg. 36
5.1. ábra. Mintavételezett jel a Wigner-tartományban. A tér-sávszélesség szorzat a diszkrét Dourier-transzformáció következtében periodikus. A fenti meggondolások során sikerült a Wigner-disztribúciót beillesztenünk eddigi elméletünkbe, és megkapnunk az eddig is használt Nyquist-kritériumot. Ezután azt vizsgáljuk, hogy a korábbiakhoz képest milyen más előnyöket nyújt az új fogalom használata.
5.2.
Új mintavételi kritérium és alkalmazása
Következzen a bevezetőben ígért, enyhébb mintavételi kritérium megfogalmazása. Ennek kulcsa egy új fogalomban rejlik. 5.2.1. Definíció. Az f függvény lokális sávszélessége egy x0 pontban a ν 7→ Wf (x0 , ν) függvény tartójának hossza. Jelölése: Bν (x0 ). Egy példát szemléltet az 5.2 a ábra. Az 5.2 b ábrán láthatóak az SBP frekvenciatengely irányában vett másolatai is, amelyek nem fedik egymást, noha távolságuk kisebb, mint az f függvény sávszélessége. Vezessük be a következő jelölést: MLB(f ) := max{Bν (x0 )}, x0 ∈R
tehát MLB(f ) az f függvény maximális lokális sávszélessége (maximum local bandwidth). Az 5.2 b ábra alapján a fedés elkerülésének az a feltétele, hogy az eltolódás MLB(f )-nél nagyobb legyen. Megfogalmazhatjuk tehát a következő tételt: 5.2.2. Tétel. Egy jel rekonstruálható mintáiból, ha a ∆x mintavételi távolságra
37
5.2. ábra. a) Egy jel lokális sávszélessége a Wigner-tartományban. b) Az SBP mintavételezés után. A teljes szaggatott vonallal határolt rész helyreállítható, bár nem teljesül a Nyquist-kritérium. teljesül az alábbi összefüggés: ∆x ≤
1 . MLB(f )
Bizonyítás: Ld. [10].
(5.3)
MLB(f ) = Bν esetén a tétel állítása a Nyquist-kritériummal azonos. Ellenkező esetben azonban az új feltétel szerint akár jóval kevesebb mintából is helyreállíthatjuk a vizsgált jelet. Látható, hogy minél kisebb a maximális lokális sávszélesség, annál kedvezőbb helyzetben vagyunk a mintavételezés megtervezésénél. Ezért egyes esetekben érdemes vizsgálat előtt a jelet úgy transzformálnunk, hogy csökkenjen az MLB. Elsőként a nagyítás operátorát vizsgálhatjuk, mely a következő hozzárendeléssel írható le: f (x) → g(x) := f (ax).
(5.4)
5.2.3. Állítás. A (5.4) transzformáció hatása az f függvény Wigner-disztribúciójára a következő:
Bizonyítás: Triviális.
ν Wg (x, ν) = Wf ax, . a
38
(5.5)
A Wigner-tartományban a nagyítás tehát a térbeli tengely mentén újraskálázza az értékeket (ld. 5.3 b ábra).
5.3. ábra. a) A Wigner-disztribúció tartója és annak változása b) nagyítás, c) Fourier-transzformáció és d) frakcionális Fourier-transzformáció során. A Fourier-transzformáció és a Wigner-disztribúció kapcsolatát már felírtuk a (5.1.4) állításban. Ezek alapján a Wigner-tartományban 90 fokos elforgatást tapasztalhatunk (ld. 5.3 c ábra). Ahogy azt a Fourier-analízisről szóló bevezetőnkben már említettük, a Fourier-transzformáció egy negyedrendű ciklikus csoportot generál, mely izomorf a k · 90 fokos elforgatások csoportjával. Láthatjuk, hogy ez az izomor-
fia a Wigner-tartományban igen szemléletesen is megjelenik. A csoport folytonos megfelelőjét a frakcionális Fourier-transzformációk bevezetésével kaptuk meg. Ez a kiegészítés most új értelmet nyer a következő állításban. 5.2.4. Állítás. Az (3.9) képlettel definiált α-rendű g := Fα f frakcionális Fouriertranszformáltra teljesül: Wg (x, ν) = Wf (x cos φ − ν sin φ, ν cos φ + x sin φ), ahol φ := α · π2 .
Bizonyítás: Ld. [27].
Az állítás alapján a frakcionális Fourier-transzformáció éppen a Wigner-disztribúció φ fokos elforgatását eredményezi (ld. 5.3 d ábra). Ezzel a derékszögű elforgatások csoportja valóban folytonossá válik. Az 5.4 ábrán egy kétdimenziós alkalmazást láthatunk, amely az (5.2.4) állítás nyújtotta lehetőséget aknázza ki. Térbeli tengely használata helyett az idő változásával figyeljük meg a jelet. A függvényben zajt láthatunk, amelyet nem tudunk úgy szűrni, hogy a jel számunkra lényeges része megmaradjon. A frakcionális Fouriertranszformáció segítségével azonban úgy forgathatjuk a tartót, hogy a szűrés lehetővé váljon, majd inverz transzformációval visszakaphatjuk a zaj nélküli jelet. 39
5.4. ábra. A Frakcionális Fourier-transzformáció alkalmazása.1 A példa alapján látható, hogy eredményeink nemcsak a mintavételezésben, hanem a jelfeldolgozás más területein is hasznosíthatóak. Azonban fontos megjegyeznünk, hogy a fenti előkészítő transzformációknak ára van: a térbeli tartományban – azaz az x-tengely mentén – megnő a jel tartója, és ezzel együtt nő a szükséges minták száma is. Egyensúlyt kell tehát találni abban, hogy milyen mértékben alakítjuk át a jelet a mintavételezés előtt.
5.3.
Wigner-disztribúció a terjesztésekben
A következőkben három helyzetben fogjuk vizsgálni a Wigner-disztribúció tartóját. Elsőként a vizsgált objektum által meghatározott jel eredeti SBP-jét vázoljuk, majd ugyanezt a továbbterjedés után, végül a mintákból rekonstruált függvény térsávszélesség szorzatát figyeljük meg. Az objektum nagyságát és sávszélességét jelölje rendre Bx és Bν ; a tárgynyaláb hullámfrontjának átmérőjét az érzékelőnél Hx és Hν , a rekonstruált tér- és sávszélességet pedig Bx′ és Bν′ . A mintavételezési eljárással rögzíthető tér- és sávszélesség legyen rendre Sx és Sν (az angol ’sampling’ szóból), ezeket az értékeket az érzékelő nagysága és pixelmérete határozza meg. (Ld.: 5.5 ábra.) 1
Forrás: http://en.wikipedia.org/wiki/Fractional_Fourier_transform. Letöltés ideje: 2013. december 18.
40
Vizsgálataink előtt fontos megjegyeznünk, hogy a [21] és [23] cikkek ún. on-line elrendezést használnak, mely némiképp különbözik a mikroszkópunk in-line elrendezésétől. Ebben a rendszerben a referencia- és a tárgynyaláb más úton jut el az érzékelőhöz, de úthosszuk azonos, és végül egy tengelyen jutnak el az érzékelőhöz, így a mintavételezést nem befolyásolják. Ezért az on-line rendszer esetében kapott eredmények in-line esetben is helytállóak, amit [21]-ben a szerzők is kihasználnak. Térjünk rá tehát a terjesztések vizsgálatára. Ahogy azt a 2. fejezetben leírtuk, a fény terjedését a szögspektrum módszerrel modellezhetjük. Azt is bemutattuk, hogy a Fresnel-közelítéssel kapott eredményeink paraxiális esetben megegyeznek a szögspektrum módszerrel kapcsolatos állításokkal. Ezért most a Wigner-disztribúcióval kapcsolatban a Fresnel-transzformált egydimenziós változatával dolgozunk: fz (x) :=
r
1 iλz
Z
R
i h π 2 f (ξ) exp i (x − ξ) dξ. λz
(5.6)
Tehát az (5.6) egyenlet adja meg az f függvény által leírt jel komplex amplitúdóeloszlását z távolságra való terjedés után. 5.3.1. Állítás. Wfz (x, ν) = Wf (x − λzν, ν).
(5.7)
Bizonyítás: Legyen Fz := F fz a Fresnel-transzformált Fourier-transzformáltja. A (2.11)–(2.13) képletek alapján Fz a következő alakban írható fel: Fz (ν) =
(
f∗
"r
π 1 exp i x2 iλz λz
#)
(ν) = F (ν) exp(−iπλzν 2 ).
A kapott összefüggéssel alkalmazhatjuk az (5.1.4) állítást: Wfz (x, ν) = WFz (ν, −x) =
Z
R
ν′ ν′ ∗ Fz ν − exp(i2πxν ′ ) dν ′ = Fz ν + 2 2
41
Z
" 2 # ν′ ν′ exp −iπλz ν + · = F ν+ 2 2 R " # ′ 2 ′ ν ν exp iπλz ν − exp(i2πxν ′ ) dν ′ = ·F ∗ ν − 2 2 Z ν′ ν′ ∗ = F ν− exp[i2πν ′ (x − λzν)] dν ′ = F ν+ 2 2 R
= Wf (x − λzν, ν). Ezzel az állítást beláttuk.
Az (5.7) képlet alapján a terjedés során a Wigner-disztribúció tartója x-irányban széthúzódik (ld. 5.5 a–b ábra). Nevezzük ezt az átalakítást pozitív irányú nyírásnak. A jel tehát ilyen állapotban éri el az érzékelőt, amellyel mintát veszünk belőle. Ennek hatására a Wigner-tartománynak csak egy Sx × Sν nagyságú szeletét vizsgál-
juk, az obejtum ide leképződött részét tudjuk helyreállítani. A rekonstrukció során „visszaterjesztjük” a mért jelet, azaz a Fresnel-transzformációt alkalmazzuk −z paraméterrel, ami az SBP-t negatív irányú nyírással alakítja át. A folyamatot az 5.5
ábra szemlélteti, amelyen a Wigner-disztribúció tartója látható a különböző lépésekben. Kétféle mintavételi konstrukciót is ábrázoltunk, az egyik alkalmasan beállított paraméterekkel a teljes jelből vesz mintákat, a második azonban levágja egy-egy részét mindkét irányban. Bármely optikai rendszer mintavételezési feltételei két szempontból adódnak. Az első elvárás, hogy a mintavételezett tartomány tartalmazza a teljes jelet. A második a már ismertetett (5.3) kritérium a frekvencia-tengely mentén megjelenő másolatokkal kapcsolatban. Képletekkel megfogalmazva: H x ≤ Sx , H ν ≤ Sν , 1 . MLB(fz ) ≤ ∆x
(5.8) (5.9) (5.10)
Esetünkben látható, hogy teljesül Hν = Bν és Sν = ∆x−1 , valamint a nyírás szögé-
42
5.5. ábra. a) A Wigner-disztribúció tartója és b) annak változása a továbbterjedés után. c) A mintavételezés hatása alkalmas paraméterekkel, illetve d) a feltételnél kisebb nagyságú kamerával. e) A rosszul mintavételezett jel helyreállítható és elvesztett része. nek tangensét vizsgálva felírhatóak a következő egyenlőségek is: Hx = Bx + λzBν , Bx MLB(fz ) = . λz Ezek alapján az (5.8)–(5.10) feltételek a következő alakot öltik: Bx ≤
λz , ∆x
Bν ≤ min
(5.11) 1 Sx − Bx ; ∆x λz
.
(5.12)
Tehát a z távolságra terjedő jel mintavételezési eljárásában ezeket a feltételeket kell figyelembe vennünk. A mintavételezés tér-sávszélesség szorzatát – mint számot – jelölje SBPS . Ez 43
a szám a mintavételi pontok szükséges számát adja meg, amely tulajdonképpen az érzékelő pixelszámával egyenlő. A kapott feltételeket felhasználva a következő kritérium adódik: SBPS = Sx Sν ≥ Hx Hν = SBP0 + λzBx2 , ahol SBP0 a tárgy tér-sávszélesség szorzata. Ezzel sikerült egyszerűen kifejeznünk a kamera méretét a terjedés hatékony vizsgálatához. Láthatjuk, hogy a Wigner-disztribúció hatékony eszköz az optikai rendszerek mintavételi paramétereinek beállítására. Segítségével szemléletesen vizsgálható együttesen a térbeli és a frekvenciatartomány, s ezzel leegyszerűsödik az elrendezések megtervezése, optimalizálása.
44
6. fejezet Wigner-disztribúció lencsés rendszerekben Az előző fejezetben bemutattuk a Wigner-disztribúció fogalmát, és megvizsgáltuk, hogyan alkalmazható a fény terjedésének leírásában. Az alábbiakban áttekintjük, hogyan alakítják át a tér-sávszélesség szorzatot azok az optikai rendszerek, amelyekben lencse is található. Kitérünk a hologram valós és virtuális képének problematikájára is, végül pedig eredményeink felhasználásával bemutatom a DHM felbontási tulajdonságait. Forrásaink ezúttal is Stern és Javidi cikkei [21, 23]. A lencserendszerek mikroszkópban betöltött szerepéről bővebben [28]-ban olvashatunk.
6.1.
Egylencsés optikai rendszerek
Fényterjedés mintavételezése során a legkisebb tanulmányozható részlet ∆x nagyságú. Ha ennél nagyobb felbontás a célunk, akkor az (5.11)–(5.12) feltételek kielégítéséhez szükséges lencsével nagyítani az objektumot. Az alábbi eljárásokban rekonstruálást – azaz „visszaterjesztést” – nem végzünk.
6.1.1.
Érzékelő a fókuszpontban
Vegyünk tehát egy f oc ∈ R fókusztávolságú lencsét, és legyenek z1 , z2 olyan pozitív valós számok, melyekre teljesül:
1 1 1 + = . z1 z2 f oc
45
(6.1)
Ha az objektum a lencsétől z1 távolságra helyezkedik el, akkor képe a lencsétől z2 távolságra keletkezik. Esetünkben, vagyis amikor a kép a lencse túloldalára esik, a kép fordított állású, nagyított másolatát kapjuk. A lencse nagyítása: N=
z2 . z1
(6.2)
A képlet alapján a nagyítás mértéke a lencsétől vett távolság függvényében változik; a lencse bal oldalán, az objektumtérben lévő négyzetet a leképezés a 6.1 a ábrán látható, trapézszerű alakzatba viszi át.
6.1. ábra. a) Egylencsés optikai rendszer. A nagyítás mértéke a lencsétől távolodva négyzetesen nő, ezért az objektumtérben található négyzet képe trapézszerű. b) Afokális rendszer. A két lencse speciális elhelyezkedése biztosítja az állandó nagyítást, ezért a négyzet képe egy téglalap. A horizontális nagyítás mértéke a laterális négyzetével egyenlő. Legyen az objektum illetve a kép és a lencse távolsága a fenti (6.1) azonosságot kielégítő z1 és z2 . Ekkor a szenzoron észlelt komplex amplitúdóeloszlást a következő képlet fejezi ki:
fl (x) := λz1 exp i
π x 2 . x f − λNf oc N
6.1.1. Állítás. Wfl (x, ν) =
λ2 z12 N
x x · Wf − , −Nν − . N λN f oc
46
(6.3)
Bizonyítás: Csak vázlatosan bizonyítjuk az állítást.
Z
x′ x′ ∗ fl x − exp(−i2πx′ ν) dx′ = Wfl (x, ν) = fl x + 2 2 R " Z 2 # x′ x + x′ /2 π x+ f − · = λz1 exp i λN f oc 2 N R " 2 # π x − x′ /2 x′ ∗ ·λz1 exp −i x− f − · exp(−i2πx′ ν) dx′ = λN f oc 2 N Z x x π x′ /N x′ /N 2 2 ∗ ′ ′ = λ z1 f − − f − + exp i 2xx − i2πx ν dx′ . N 2 N 2 λN f oc R
Az α := −x′ /N helyettesítést alkalmazva adódik az állítás.
A (6.3) kifejezés szerint a lencse használata az (x, ν) →
ν x −Nx, − + N λ f oc
koordinátatranszformációval jár együtt. Ez skálázza és tükrözi mindkét tengelyt, valamint a frekvenciatengellyel párhuzamosan pozitív irányú nyírást eredményez. A keletkezett SBP-t a 6.2 b ábra szemlélteti.
6.2. ábra. a) A Wigner-disztribúció tartója és b) annak változása lencsével való leképezés során. c) A helyesen mintavételezett SBP.
47
A rendszer adatai a következők: Hx = NBx , Bx Bν + , Hν = N λ f oc Bν . MLB(fl ) = N Az (5.8)–(5.10) feltételekbe helyettesítve a fenti egyenlőségeket a következő kritériumokat nyerjük a helyreállíthatóságra: Sx , N ∆x Bx N . min 1; 1 − ≤ ∆x λ f oc
Bx ≤
(6.4)
Bν
(6.5)
Látható, hogy bár az objektum méreteire szigorúbb feltételt kaptunk a lencse nélküli leképezéshez képest, a rekonstruálható sávszélesség lencse használatával akár Nszeresére is növekedhet. Ha a legkisebb megjeleníteni kívánt részlet mérete δ, azaz a legmagasabb frekvencia 1/δ, akkor (6.5) alapján olyan lencsét kell választanunk, amelynek nagyítására érvényesül: N≥
∆x . δ min{1, 1 − ∆Bx /(λ f oc)}
A rendszer tér-sávszélesség szorzatát – mint számot – a következőképpen határozzuk meg: Bx2 SBPS = Sx Sν ≥ Hx Hν = SBP0 + N . λ f oc
6.1.2.
Érzékelő a fókuszponton kívül
Eddigi kutatásaink speciális helyzetben érvényesek, amikor az érzékelő abban a pontban helyezkedik el, ahová az objektum képe fókuszálódik. Általában azonban ez a feltétel nem teljesül, a kamera ettől a ponttól egy d távolságra rögzíti a jelet. Ekkor a lencse által végzett transzformáció után még tovább terjed a hullámfront, a Fresnelközelítést z = d paraméterrel alkalmazhatjuk. A korábban leírtak szerint ez az x-tengellyel párhuzamos nyírást okoz, ezért a 6.2 ábrán látható Wigner-tartományt a 6.3 ábrán látható módon alakítja tovább. A terjedés - amint azt már az előző fejezetben láttuk - nem befolyásolja a tárgynyaláb hullámfrontjának sávszélességet, 48
6.3. ábra. A Wigner-disztribúció tartójának változása lencsével való leképezés és továbbterjedés során. ezért a (6.5) feltétel változatlan marad. A térszélesség változása a 6.3. ábra alapján könnyen kiszámítható, az alábbi módon növekszik: Hx = NBx + λdHν . Ezzel a következő feltételhez jutunk: Bx Bν ≤ Sx + NBx + λd N λ f oc B Sx − λd N ν . Bx ≤ d N + f oc
Feltéve, hogy az optikai eljárás során nem sérül a sávszélesség, azaz Hν = Bν , a (6.5) feltételnél szigorúbb kritériumot kapunk: Bx ≤
Sx − λdBν . N
A rendszert jellemző SBP-re a következő összefüggés írható fel: B2 SBPS ≥ SBP0 + N x + λd λ f oc
6.2.
Bν Bx + N λ f oc
2
.
Afokális rendszer
Ahogy azt már bemutattuk, az egylencsés rendszerek nagyítása változik a lencsétől mért távolsággal, s ez a tulajdonság bonyolulttá teszi a további számításokat. Ezért mikroszkópunkban kétlencsés afokális rendszert alkalmazunk, mielőtt az objektumról hologramot készítenénk. Legyen a két lencse fókusztávolsága f oc1 és f oc2 . Az afokális rendszer kulcsa abban rejlik, hogy a két lencse távolsága f oc1 +f oc2 . Emiatt 49
az első lencsére érkező párhuzamos fénynyalábok a második lencséről szintén párhuzamosan távoznak, ezzel biztosítva, hogy a nagyítás mértéke állandó, a kép pedig egyenes állású legyen. A 6.1 b ábrán látható, hogy az objektumtérben lévő négyzetet a rendszer egy téglalapra képezi le. A laterális nagyítás a fókusztávolságok arányával egyenlő, míg a horizontális ennek a négyzete: N=
f oc2 , f oc1
NH = N 2 .
A Wigner-tartomány viselkedését vizsgálhatnánk úgy, hogy az egy lencsére kapott eredményeinket továbbtranszformáljuk egy újabb lencsével. Azonban az afokális rendszer tulajdonságait ismerve a számítások lényegesen leegyszerűsíthetőek. Mivel tulajdonképpen egy nagyítást végzünk, ezért használható a már bemutatott (5.5) képlet. A paraméterek változása N mértékű nagyítás mellett a következő: Hx = NBx , Bν , Hν = N MLB(g) = NBν . A kritériumok a következőképpen változnak: Sx , N N . ≤ ∆x
Bx ≤
(6.6)
Bν
(6.7)
A tér-sávszélességszorzat nem változik az eredetihez képest, ezért az érzékelő pixelszámára a következő feltétel ad eligazítást: SBPS ≥ SBP0 .
6.3. 6.3.1.
Wigner-disztribúció és holográfia Feltételek afokális nagyítású hologramrögzítés esetén
Hologram készítése során tehát afokális rendszerrel nagyítjuk N-szeresére a nyalábot, majd a hullámfront továbbterjed a képsíktól a kameráig, z távolságra. A rekonstruálás során −z paraméterrel végzünk „visszaterjesztést”, ezzel a nagyított ké50
pet kapjuk meg. A referencianyalábtól a mintavétel megtervezésénél eltekinthetünk, hiszen nem befolyásolja a tér- és sávszélességet. A kritériumokat tehát a (6.6)–(6.7) és az (5.11)–(5.11) feltételek figyelembevételével nyerjük: λz , N∆x 1 Sx − NBx ≤ N · min . ; ∆x λz
Bx ≤
(6.8)
Bν
(6.9)
A (2.15) képlettel megmutattuk, hogy hologram rekonstruálása során az objektum képén kívül nulladrendű és ikerkép is keletkezik. Ahogy már a DHM működésének leírásában is említettük, az ikerkép in-line hologram esetén fedi a valós képet. Ezt a jelenséget vizsgáljuk a Wigner-disztribúció fényében [21]. Hologram rögzítésénél a (2.14) kifejezéssel megadott intenzitást mérjük. A nulladrend intenzitása nagyságrenddel kisebb, mint a valós és virtuális képé, a referenciahullám pedig nem modulált, ezért elég az utóbbi kettőt vizsgálnunk. A két képnek megfelelő tag egymás konjugáltja: UT UR∗ = (UT∗ UR )∗ . Ezért a jel Wigner-disztribúciójához hozzáadódik annak konjugáltja is – amely az ikerkép disztribúciója –, a keletkezett SBP az x.a ábrán látotthoz hasonló. Rekonstruálás során az inverz Fresnel-transzformáció a már bemutatott negatív irányú nyírást végzi el a tartományon, ezúttal mindkét komponensen. Ezt szemlélteti az x.b ábra. Jelöljük az átfedett rész maximális abszolútértékű frekvenciáját νK -val. Ismeretes, hogy a kép és konjugált kép által bezárt szög tangense (2λz)−1 ; az ábra alapján ezért fennál: NBx νK = . 2λz Tehát az ikerkép az ennél alacsonyabb frekvenciák helyreállításában okoz problémát, a magasabb frekvenciák a mintavételi feltételek betartása mellett rekonstruálhatóak. A rekonstruálhatóság mértéke kifejezhető a teljes tér-sávszélesség szorzat és a közösen fedett terület hányadosával: NBx Bν′ SBPS = = min SBPK NBx νK
2λz ;2 2 N Bx ∆x
Sx −1 NBx
.
(6.10)
Minél nagyobb a (6.10) hányados, annál inkább elhanyagolható az ikerkép által
51
okozott torzítás. Megjegyzés: A fenti meggondolások alapján a diszkrét wavelet-transzformációk hatékonyabbá tehetik az algoritmust, mintha a Fourier-transzformációt használjuk. Ezek a leképezések ugyanis olyan összetevőkre bontják a jelet, amelyben minél nagyobb egy frekvencia, annál több összetevő képviseli. A magas frekvenciákat tehát helyre tudjuk állítani, és éppen ezek hordozzák az objektum éléről, körvonalairól az információt. Az algák azonosíthatóak alakjukról, ezért a fenti elrendezés hatékony eljárást eredményez felismerésükre.
6.3.2.
A DHM paramétereinek vizsgálata
Digitális holografikus mikroszkópunk leképezési tulajdonságait vizsgáljuk a kapott feltételek alapján. A fenti eredmények most mindkét dimenzió változóira érvényesek. A berendezés paramétereit a 6.1 táblázatban foglaljuk össze. A vizsgált objektum Megvilágító fény hullámhossza:
λ = 0, 68 µm
Afokális rendszer nagyítása:
N =5
Képsík–kamera távolság:
z változó
Kamera pixelszáma:
Mx × My = 1920 × 1382
Kamera pixelmérete:
∆x = ∆y = 3, 5 µm
Kamera mérete:
Sx ×Sy = 6, 72×4, 837 mm2
6.1. táblázat. A DHM paraméterei. Ezúttal vörös fényt használunk a képalkotáshoz. milliméterben vett oldalhosszait jelölje Bx , By , a sávszélességét hasonlóan Bνx , Bνy . Számításainkat milliméterben végezzük. Az (6.8)–(6.8) kritériumokba helyettesítve az adatokat a következő összefüggé-
52
seket kapjuk Bx , By és z értékei között: Bx , By ≤ 38, 857 · z mm, 6, 72 − 5 · Bx , Bνx ≤ min 1428, 57; 6, 8 · 10−4 · z 4, 84 − 5 · Bx Bνy ≤ min 1428, 57; . 6, 8 · 10−4 · z
(6.11) (6.12) (6.13)
A DHM alkalmazása során nehézkes kimérni a tárgy és a kamera távolságát, ezért most a helyreállítás szimulációja helyett – amely az általunk felvett hologramok esetében igényelné ezt az adatot is – inkább arra törekszünk, hogy meghatározzuk a terjesztési távolságot a kívánt tér- és sávszélesség eléréséhez. Tegyük fel, hogy a vizsgált objektum méretei – a kamera méreteivel arányosan – Bx = 1 mm,
By = 1 ·
4, 84 = 0, 72 mm. 6, 72
Célunk az 1 mikrométeres felbontás elérése, azaz hogy Bνx és Bνy felső korlátja legalább 1000 1/mm legyen. A (6.12) – (6.13) feltételek a konkrét értékekkel a következő alakot öltik: Bνx Bνy
2529, 41 , ≤ min 1428, 57; z 1823, 53 ≤ min 1428, 57; . z
A terjesztési távolság alkalmas megválasztásával a minimum a második tag lesz; a feltételek tehát: 1, 77 mm ≤ z ≤ 2, 53 mm,
1, 28 mm ≤ z ≤ 1, 83 mm,
azaz összegezve: 1, 77 mm ≤ z ≤ 1, 83 mm. A beállított és kapott paraméterek eleget tesznek a (6.11) feltételnek is. Tehát 1 mikrométeres felbontás eléréséhez egy elég szűk, 60 mikronos terjesztési tartományban vehetjük fel a hologramot. Ugyanakkor ha a kívánt felbontást 1,1 mikrométerre növeljük, akkor – hasonló számítások alapján – már az 1, 77 mm ≤ z ≤
2, 02 mm tartományt kapjuk, amely 0,25 milliméter széles. A vizsgálható tartomány változását a kívánt felbontás függvényében a 6.4 ábra grafikonján láthatjuk. 53
6.4. ábra. A terjesztési távolság (mm) tartománya a kívánt felbontás függvényében.
54
7. fejezet Modellezési feladatok megoldása a GeoGebra program segítségével Nap mint nap találkozhatunk olyan jelenségekkel, problémákkal, amelyek megértéséhez, megoldásához valamilyen struktúrában kell gondolkodnunk – a modellezési feladatok átszövik életünket. Napjainkban nem sokan állnak meg, hogy igényesen átgondoljanak egy ilyen helyzetet, hiszen túl bonyolultnak tűnik, ezért általában másra hagyják a megoldás megkeresését. Pedig a szükséges gondolkodási mód, a megoldási technika jórészt tanulható, a matematika eszközeivel fejleszthető és leírható. Egész életünkben szükségünk van a matematikára, ha nem is mindig a szimbolikus, absztrakt formában, azonban a matematikai gondolkodás mindenképpen elengedhetetlen ahhoz, hogy magabiztos és hatékony tagjai legyünk a mai kor társadalmának (Ambrus G., 2012 [29]). Ez motivált abban a célkitűzésben, hogy mélyebb betekintést szerezzek a modellezési feladatok témájába, és felhívjam a figyelmet fontosságukra. Mivel a technika egyre inkább a mai valóságunk velejárója, egyúttal azt is vizsgálom, hogy a technikai újítások milyen szerepet tölthetnek be a valós kérdések megválaszolásában, és hogyan egészíthetik ki a hagyományos szemléltető- és megoldási eszközöket. Végül a megismert elméleti összefüggéseket és saját észrevételeimet konkrét feladatokban is kipróbálom, hogy a gyakorlati megvalósulása során felmerülő ötletekkel finomítsam és kiegészítsem őket.
55
7.1. 7.1.1.
Matematikai modellezés Modellezési feladatok, modellalkotás
A körülöttünk zajló eseményeket, felmerülő problémákat sokszor modellalkotással a leghatékonyabb elemezni. A modell illetve a modellezés folyamatával kapcsolatban többféle elképzelés létezik. Az egyik megközelítés szerint „a modell elméleti séma általános matematikai formában, amelynek tanulmányozása megkönnyíti az adott jelenség, szituáció megértését és vizsgálatát” (Ambrus G., 2012 [29]). Máshol „a modellalkotás vagy modellezés során valamilyen - többnyire matematikán kívüli - problémát vagy kérdést oldunk meg úgy, hogy matematikán belüli kontextusba helyezzük” (Greefrath, 2007 [30]). Mindkét meghatározás eszközként jelöli meg a matematikát, és a valóság jobb megértését tűzi ki célul. Ezenkívül azonban léteznek olyan modellezési lehetőségek is, melyek éppen a matematika megértését segítik. Elterjedt például a negatív számokkal végzett összeadás és kivonás megértésének segítéséhez az a modell, melyben egy kisautót mozgatunk a számegyenesen és a helyét vizsgáljuk előrehaladás illetve tolatás során.
7.1. ábra. A modellezés folyamata A modellezési folyamatot a fenti meghatározások értelmében legegyszerűbben a 7.1. ábra segítségével írhatjuk le (Blum, 2010 [31], idézi: Tóth, 2010 [32]). Egy valós életből származó problémából indulunk ki. Ebből kiemeljük a valóban lényeges és vizsgálandó illetve figyelembe vett elemeket, majd struktúrát építünk köréjük; ezzel létre jön a matematikai probléma. Ekkor már a matematika nyelvén gondolkodhatunk a szituációról, matematikai értelemben is megfogalmazhatjuk a célunkat, a kérdéseinket, amelyekre választ várunk, és ezeket a válaszokat szintén matematikai 56
úton, általános matematikai eszközökkel kaphatjuk meg. Ezután a kapott eredményt értelmezzük, azaz visszaültetjük a valóságba, majd a valós eredményünkre reflektálnunk, összevetjük a tényleges szituációval. Ha az eredmény nem elfogadható, mert nem összeegyeztethető a valósággal, vagy esetleg tovább tudjuk vagy akarjuk finomítani, akkor a fenti lépések megismétlésével javíthatunk rajta. Ezért nincs jelezve az ábrán a folyamatból való kilépés. Tehát a modellezés egy ciklikus folyamat, mely során a valóságot egyre pontosabban leíró rendszert kaphatunk. Katja Maaß felsorolja a modellezési feladatok általános tulajdonságait (Maaß, 2007 [33]). Elsőként azt emeli ki, hogy nyitottak, azaz a kiindulási és a célállapot, illetve a megoldási mód közül legalább az egyik nem egyértelműen meghatározott. Következésképpen több szempontból és több módszerrel is érdemes megvizsgálnunk az adott szituációt, és a körülményektől és különböző nézőpontoktól függően több megoldás is elfogadható lehet. A modellezési feladatok második fontos tulajdonsága, hogy komplexek, azaz általában többféle matematikai és nem matematikai ismeret és eljárás szükséges a megoldásukhoz. Ezenkívül valós helyzetre irányulnak. Általában azonban csak valóságközeliek, hiszen bármennyire pontosan is igyekszünk modellezni, a valóság mégis más, összetettebb lesz, nem tudjuk teljes egészében leírni. Lényeges követelmény, hogy autentikusak legyenek, ami azt jelenti, hogy az adott korosztály számára megfeleljenek mind témájuk, mind a megoldásukhoz elvárt ismeretek és gondolkodási mód szempontjából. Végül problémaközpontúak, azaz megoldásukhoz számos akadályt kell leküzdeni, és – természetesen – az említett modellezési folyamat végrehajtásával megoldhatók. A modellezési feladatok többféleképpen csoportosíthatók, például a nyitottság mértéke vagy a feladat célja szerint. Bár a célt sem lehet minden esetben egyértelműen meghatározni, eszerint a szempont szerint megkülönböztetünk leíró, előíró, előrejelző és magyarázó feladatokat. Dolgozatomban az utóbbi kettőre mutatok példát. Az előrejelző feladatok célja, hogy a modell segítségével meg tudjunk jósolni valamit. Ebbe a típusba tartozik a magasugrási világcsúcsokról szóló feladat. A magyarázó feladatok célja a (jobb) megértés elérése, ide sorolható az árnyjátékot feldolgozó feladat. A modellezési feladatok tulajdonságairól bővebb leírás található Ambrus Gabriella feladatgyűjteményében (Ambrus G., 2012 [29]).
57
7.1.2.
Modellezési feladatok az oktatásban
A 14-18 éves korosztály képviselői különösen fogékonyak, ezért igen fontos, hogy ebben a korban minél több olyan jelenséggel, szituációval és ismerettel találkozzanak a tanulók, amelyek későbbi életüket is meghatározzák. A modellezési feladatok számos ilyen témát feldolgozhatnak, ezenkívül – ahogy azt már a fejezet elején megindokoltam – a problémamegoldásra is tanítanak, ami szintén hasznos a hétköznapokban. A Nemzeti Alaptanterv már a 7. osztálytól kiemelt szerepet tulajdonít a modellezésnek, de egyszerű modellezési feladatok már korábban is alkalmazhatók. A NAT 2012 szerint: „A matematikai kompetencia azt jelenti, hogy felismerjük az alapvető matematikai elveket és törvényszerűségeket a hétköznapi helyzetekben, elősegítve a problémák megoldását a mindennapokban, otthon és a munkahelyen. . . . A tanulók matematikai fejlődése és a tanulási folyamat során alapvető, hogy ki tudják választani és alkalmazni tudják a természeti és társadalmi jelenségekhez illeszkedő modelleket, gondolkodásmódokat (. . . ), módszereket (. . . ), leírásokat. Ugyanakkor fontos a modellek érvényességi körének és gyakorlati alkalmazhatóságának eldöntését segítő készségek kialakítása, valamint az ezeket megalapozó képességek fejlesztése.” (Nemzeti Alaptanterv, 10654. és 10688. oldal [34].) Tehát a modellezési feladatok kihangsúlyozott szerephez kell, hogy jussanak a közoktatásban, nemcsak valóságközeli voltuk miatt, hanem azért is, mert a modellalkotás ciklikus jellege megtanít a valóságra való állandó reflektálásra, a világ működéséről alkotott elképzeléseink megítélésére. További fontos célja a modellezési feladatoknak a matematikatanulás iránti motiváció növelése. Valamint, ami a motivációval is kapcsolatos, ilyen feladatok alkalmazásával a matematika kézzel foghatóvá, jobban érthetővé válik, az absztrakt struktúrák, eljárások célja és hasznossága pedig közvetlenül is megnyilvánul. Vonzó témák és reprezentációs eszközök megválasztásával a motiváció még tovább fokozható, bár nem cél mindig ezekre törekedni. Kiemelt szerephez juthatnak a modellezés során a dinamikus matematikai szoftverek, amelyek – azon kívül, hogy vizuálisan vonzóbb környezetet biztosítanak – leegyszerűsítik és árnyaltabbá teszik a szemléltetést, és akár a megoldást is. Fontos szempont az is, hogy egyes esetekben sok érdekes nézőpontot nélkülük csak nehezen vizsgálhatnánk meg. Munkaszervezés szempontjából Siller és társai szerint jó megoldás lehet csoportmunkával kezdeni a modellezési folyamatot (Siller et al., 2013 [35]). Ez nemcsak a hatékonyságot növeli, hanem ilyen módon fejlődnek a diákok kommunikációs kompetenciái is, hiszen a csoportnak meg kell vitatnia a felmerült ötleteket, és ki kell 58
jelölnie a legmegfelelőbb megoldási utat. Lényeges a rendszeres tanári visszajelzés, amelyben minden alkalommal ösztönözhetjük a csoportokat a modell valósággal való összevetésére. A feladatok nyitottsága lényeges tényező, az ezzel járó szabadságot érdemes meghagyni a tanulóknak, hiszen elősegíti az önállóságuk kialakulását. Ha hiányzó adatokat kell begyűjteniük a csoportoknak, megtanulhatják a könyvtár vagy az internet alkalmas használatát; ha erre nincs idő, akkor pedig egy mappában vagy más formában gyűjthetünk össze számukra valamennyi fontosabb információt, amelyre szükségük lehet, ebből a modellezés során ők kereshetik ki a számukra hasznosakat. Digitális segédanyagokat is készíthetünk, erre kiválóan alkalmas például a GeoGebra dinamikus feladatlapja. Szükséges biztosítani a megfelelő technikát vizuális reprezentációk – táblázatok, grafikonok, dinamikus ábrák – létrehozására is.
7.2.
A dinamikus matematikai szoftverek szerepe az oktatásban
7.2.1.
A vizuális és tárgyi reprezentációk fontossága
A matematikában absztrakt fogalmakkal, elvekkel és összefüggésekkel próbáljuk általánosan leírni a jelenségeket. A fogalmak hatékony használatához, az összefüggések megértéséhez és kommunikációjához szükséges ezeket valamilyen módon reprezentálnunk. A reprezentációk fajtáiról, szerepéről Ambrus András írt részletes összefoglalót (Ambrus A., 2008 [36]). Hivatkozik a pszichológia tudományára, amely két fő típust különböztet meg, a külső és a belső reprezentációkat. A külső reprezentációkhoz tartoznak a szimbolikus, azaz a beszélt illetve írott nyelvhez tartozó elemek; a vizuális vagy képi elemek; és a tárgyi, materiális megjelenítések. Egy külső reprezentációhoz több belső reprezentáció is tartozhat, és fordítva. A belső reprezentációk között kapcsolat van, az ezekből a kapcsolatokból álló háló teszi lehetővé az egyik ismeretről a másikra való áttérést. A megértés azt jelenti, hogy az adott elv, fogalom, koncepció a belső reprezentációs hálózatunk részévé válik. A külső-belső reprezentációk hatnak egymásra, így a belsők közötti kapcsolatot szimulálhatjuk a külsők közötti kapcsolatokkal, az egyik kialakulása segíti a másikét. Ezért fontos a külső reprezentációk megfelelő, tudatos alkalmazása. Minél többféle külső reprezentációval találkozunk, annál árnyaltabbá válik a belső reprezentációnk. Ez az egyik oka annak, hogy mindhárom reprezentációs formát érdemes használnunk, nem emelhetjük ki pusztán az egyiket közülük. Ezenkívül 59
egyetlen reprezentáció alkalmazása olykor hiányos vagy hibás eredményre vezethet. Mind diákként, mind tanárként szerzett tapasztalataim alapján azt gondolom, hogy a mai magyar közoktatásban a leghangsúlyosabb szerepet a szimbolikus reprezentációk kapják. Véleményem szerint ezek valóban hasznosak, és általános eszközöket nyújtanak a problémák megoldására, eközben azonban nehéz csupán rajtuk keresztül érzékelni a matematika és a valóság kapcsolatát és elsajátítani a matematika hétköznapi használatát. A nemzetközi és hazai vizsgálatok szerint is „túl korán és túl gyorsan absztrahálunk” (Ambrus A., 2008 [36]). Tehát érdemes hangsúlyozni a vizuális és tárgyi reprezentációk fontosságát. Többek között memóriánk tulajdonságai miatt is célszerű az alkalmazásuk, ugyanis sok információt sűrítenek össze, könnyebben megjegyezhetőek, és címkékként szolgálhatnak egy-egy gondolkodási folyamathoz. Agyunk aszimmetrikus működésű, és máshol kódolja a képi, konkrét, mint a szóbeli és absztrakt információkat. Minél konkrétabb egy reprezentáció, annál több lehetőség van erre a duális kódolásra, és ezzel együtt az ismeretek előhívására is (Vásárhelyi, 2006 [37]). Lényeges felhasználni őket a részletes, árnyalt fogalomképzet kialakításában is. Ezenkívül, mivel a képi és tárgyi eszközök tárháza szinte kimeríthetetlen forrás, más-más reprezentáció alkalmazásával az egyének közötti különbségeket jobban figyelembe tudjuk venni, sőt, javunkra fordíthatjuk azokat. Tehát a vizuális és materiális reprezentációk olyan funkciókat töltenek be, amelyeket a szimbolikus önmagában nem képes, ezért egy új fogalom vagy egy koncepció megértéséhez a három formát egyaránt célszerű alkalmaznunk.
7.2.2.
A számítógép szerepe a külső reprezentációban
A Nemzeti Alaptanterv szerint: „Természeti és társadalmi környezetünk megértéséhez modelleket alkotunk, e modelleket pedig számítógéppel is létrehozhatjuk és vizsgálhatjuk. Adatstruktúrákkal dolgozunk, tevékenységsorozatokat, kommunikációs és információkeresési folyamatokat tervezünk. Cél, hogy a tanulók elsajátítsák a számítógépes problémamegoldás tervezésének és megvalósításának módszereit.” (Nemzeti Alaptanterv, 10816. oldal [34].) Tehát a dokumentum alapján a közoktatás alapvető feladatai közé tartozik, hogy megismertesse a tanulókkal a modellek digitális megoldási formáit. Szakdolgozatomban a dinamikus matematikai szoftverek közül az ingyenesen is letölthető GeoGebra programot használom fel modellezési feladatok szemléltetésére és megoldására. A számítógépes programok egy része – első ránézésre – a vizuális rep60
rezentációt teszi egyszerűbbé, színesebbé és vonzóbbá. Használatukkal az elterjedt szimbolikus reprezentációk mellé adhatunk újabb képi megjelenítéseket. Azonban nem csupán vizuális szemléltetőeszközök, előnyük főképp abban rejlik, hogy hidat alkothatnak a különböző reprezentációs módok között. Könnyebb megértenünk ezt az összekötő szerepet egy példán keresztül. Vásárhelyi Éva írja le azt az iskolai kísérletet, mely során a diákok a CAD3D program segítségével tanulmányozták a kocka hálóit, darabolását (Vásárhelyi, 1999 [38]). Korábbi tanórák alapján feltételezte pár kockaháló előzetes ismeretét, a szoftver abban segített, hogy ezt a tárgyi reprezentációt felidézzék, majd konkrét átalakításokat végezzenek a hálón a szoftver segítségével. Így a programot nemcsak szemléltetéshez, hanem a megoldáshoz is használták, összekapcsolva a feladatmegoldás során a háromféle reprezentációs formát.
7.2.3.
A GeoGebra szoftver
A GeoGebra első változatát 2002-ben készítette diplomamunkája részeként Markus Hohenwater. Azóta egyre bővül a fejlesztők köre, megalapult a Nemzetközi GeoGebra Intézet (International GeoGebra Institute), a programot már 60 nyelvre – legalább részben – lefordították, s a szoftver internetes oldalán és a GeoGebraTubeon többezer felhasználó teszi közzé ötleteit, GeoGebrával készített munkáit, s csatlakozik a program fejlesztéséhez és népszerűsítéséhez. Mindezt nagyban elősegíti, hogy a szoftver nyílt forráskódú és ingyenes, hivatkozással szabadon felhasználható. A GeoGebra egy dinamikus matematikai szoftver, amellyel egyaránt lehet geometriai objektumokat, szerkesztési folyamatokat, függvényeket és diagramokat ábrázolni, valamint azok algebrai reprezentációját megadni, átalakítani és vizsgálni. Ebből a kettős szerepből alakult ki az elnevezése, és ez teszi annyira alkalmassá a külső reprezentációk közötti híd szerep betöltésére is. A létrehozott objektumok dinamikusan változtathatóak. A szoftver letölthető a www.geogebra.org oldalról, használata elsajátítható a http://wiki.geogebra.org/en/Manual:Book linken található kézikönyvből. A következő két mintafeladatban a szoftvert több célból is fogom használni. Gyakran a tanári felkészülést támogató eszközként tűnik fel, hiszen ”láthatatlanul” kiszámítja az eredményt, és a paraméterek változtatásával gyorsan frissíti azokat. Természetesen a diákok számára is munkakörnyezetet biztosít, ennek lehetőségeit a legtöbb megoldási mód végén megemlítem. A vizualizációval a modell megértését szintén elősegíti, egyes esetekben pedig pusztán szemléltetőeszközként is szerepel. 61
7.3.
Mintafeladat: Sportrekordok
A feladat: Tanulmányozd a magasugrási világrekordokat, és gondold meg, milyen eredmény várható 2015-re. Állításodat modell segítségével indokold! Számítási módszered alapján mennyi lesz a rekord 2050-ben?1
7.2. ábra. Magasugrási világcsúcsok Feltűnő, hogy 1993. utáni adat nem áll rendelkezésünkre. Az interneten utánanézve láthatjuk, hogy azóta nem is született új világcsúcs. Ennek okára a modellek megalkotása során visszatérek. A lehetséges megoldásokat korosztályok szerinti sorrendbe rendezem. Minden pontban először a megoldás menetét írom le, majd a grafikus módszerek esetén a GeoGebra segítségével számítom ki az eredményt. Ezután röviden értékelem a módszert. További modellezési irányokat is kijelölök, melyek sorát sokáig lehetne még folytatni.
7.3.1.
Lehetséges megoldások
7-8. osztály 1. megoldás: 1993-tól 2015-ig 22 év telik el, ezért vehetjük az 1993. előtti 22 év növekedését, azaz 1
Ambrus Gabriella „Titanic a Balatonon és más modellezési feladatok matematikából” c. feladatgyűjteményének „Sportrekordok” c. feladata alapján [29].
62
az 1971-es adatot, amely épp rendelkezésünkre áll: 2, 45 − 2, 29 = 0, 16 2, 45 + 0, 16 = 2, 61 m. 1993-tól 2050-ig 57 év telik el. Ezért az 1936-os adatot vesszük figyelembe, ami szintén épp rendelkezésünkre áll: 2, 45 − 2, 07 = 0, 38
2, 5 + 0, 38 = 2, 83 m. Ezek alapján 2015-ben 2,61 méteres, 2050-ben 2,83 méteres magasugrási világrekord
várható. Megjegyzések: Ehhez a modellhez szükségünk volt arra, hogy 1971-ben és 1936-ban is valóban született világcsúcs, ezek nélkül az adatok nélkül ezt a megoldási módot nem használhatnánk. Ezenkívül nem valószínű, hogy a rekord változását ez a két felhasznált adat teljesen leírja, a többi adatot is érdemes lenne számításba vennünk. Ezért további megoldásokat kereshetünk. A 7.2. ábra adataiból okulva azt is kijelenthetjük, hogy nem feltétlenül születik ilyen rekord 2015-ben vagy 2050-ben, előfordulhat, hogy ez az érték kimarad a csúcsok közül, és csak egy évekkel későbbi rekord fog megvalósulni. Ugyanez elmondható az összes többi megoldásnál is. Az ehhez hasonló észrevételeket fontos megbeszélni a tanulókkal is, az is előfordulhat, hogy ők maguk javasolnak ilyen meggondolásokat. 2. megoldás: Vehetjük az eddigi évi növekedések átlagát, melyet az össznövekedés és az eltelt évek számának hányadosaként számíthatunk ki: (2, 45 − 2, 00)/(1993 − 1912) = 0, 0056 m.
Feltételezhetjük ezt a növekedési ütemet 2015-ig illetve 2050-ig: (2015 − 1993) · 0, 0056 = 0, 1232 2, 45 + 0, 1232 = 2, 5732 m (2050 − 1993) · 0, 0056 = 0, 3192 2, 45 + 0, 3192 = 2, 7692 m. Tehát ezzel a modellel 2,57 illetve 2,76 méteres világcsúcsot tudunk jósolni. Megjegyzések: A valóságban is elképzelhető eredményeket kaptunk. Mindkét megoldási út már 6. osztálytól végiggondolható. Fiatalabb korosztálynál érdemes esetleg kevesebb adattal számolni, például a táblázat utolsó 10-15 sorával. Azonban ekkor az első megoldási ötlet nem mindig működik. Felmerülhet, hogy számoljunk más középértékekkel, például vehetnénk az évi növe63
kedés leggyakoribb értékét (móduszát) vagy mediánját – 8. osztályban már ismerősek lehetnek ezek a fogalmak. Ezt azonban akkor tudnánk megtenni, ha két rekord között egyenlő idő telne el, azaz a növekmények ugyanannyi idő alatt adódnának. Végiggondolva a világcsúcsok alakulását azt várjuk, hogy egyre nehezebb lesz megdönteni az aktuális értéket – erre utalhat az is, hogy 1993 óta nem született új rekord. Tehát valószínűbb az a tendencia – legalábbis jelenlegi tudásunk szerint –, hogy az egyes világcsúcsok közötti növekmény egyre kisebb lesz, míg végül eléri az emberi teljesítőképesség felső határát. Megoldásunkat érdemes a fentiek alapján is átgondolni. 3. megoldás: Jelenlegi ismereteink szerint beiktathatunk egy felső korlátot, amit elérve kijelentjük, hogy több rekord nem születhet. Legyen ez a határ 280 cm, ekkor az 1. megoldásban kapott eredményünket módosítanunk kell, 2050-re csak 280 cm-es világcsúcsot jósolhatunk, amely már korábban megszületett. A 2. megoldással kapott értékeket nem befolyásolja ez a korlát. Megjegyzések: A határ megállapításáról több írás született, de egyik általam talált forrás sem közöl konkrét adatot.2 Idősebb korosztályban a diákok megpróbálhatnak meghatározni egy korlátot, de ehhez inkább fizikai, mint matematikai ismeretek szükségesek, így szakdolgozatomban ezt nem részletezem. Így összeköthetjük a modellalkotást más tantárgyakkal is, ezzel lehetővé téve akár projektmunka készítését. Ebben az életkorban inkább csak gyakorlati tapasztalatok alapján jelölhetünk ki egy maximumot. A felhasznált érték pusztán egy elképzelés a lábjegyzetben megjelölt forrás megfontolásai alapján. A megoldást átalakíthatjuk úgy, hogy a növekmény valamilyen szabály alapján egyre kisebb, végül pedig elhanyagolható legyen, ezzel figyelembe véve a fokozatosságot is. Erre a módosításra a grafikonokkal adott modellek között térek ki. 9-10. osztály 4. megoldás: Használhatunk grafikont is a megoldáshoz. Az adatokat a jobb ábrázolhatóság érdekében átváltottam méterről centiméterre. Vonalzóval behúzhatunk egy egyenest, amely véleményünk szerint legjobban leírja az adatok viselkedését: 2
Egy példa található Tasnádi P., Juhász A. és Horváth G. Fizika körülöttünk c. művében [39].
64
7.3. ábra. Az adatok grafikonon ábrázolva és egy lehetséges megoldás egyenese. • Összeköthetjük az első és az utolsó pontot egy egyenessel; • kereshetünk olyan egyenest, amelyre a legtöbb pont illeszkedik; • adhatunk megoldást heurisztikus módon is. A kérdés a kapott egyenes 2015 illetve 2050 abszcisszájú pontjainak második koordinátája. GeoGebra használata esetén könnyebb a grafikon elkészítése, és a megoldásunk gyorsabban javítható. Ezenkívül rendelkezésünkre állnak görbeillesztési parancsok, melyek matematikai háttere ugyan meghaladja a középiskolai szintet, de mégis egyszerű őket szemléletesen elmagyarázni. Én a szoftver segítségével számítottam ki megoldásomat, mely az eredeti, hosszabb adatsorral számolva 256 illetve 278 centiméter. Az átlagos hiba 2,07 cm. (Ld.: lin_regr_osszesadat.ggb, 7.3. ábra.) Megjegyzések: A kapott megoldások elképzelhetőek a valóságban is. Hasonlítanak az 1-2. megoldásokkal kapott eredményekhez, ezt azzal magyarázhatjuk, hogy mindegyik megközelítés lineáris. Azonban itt is eszünkbe juthatnak a 2. megoldás végén leírt megfontolásaink: nem valószínű, hogy lineáris modellel az adatok valósághű leírását kapjuk.
65
A különböző korosztályoknál eltérő lehet ennek a modellnek az alkalmazása. A grafikon elkészítésénél ügyelni kell a léptékek és a két tengely metszéspontjának alkalmas megválasztására. Ez fiatalabb korosztályban még nehézségeket okozhat, azonban ha megkapják az ábrázolt adatokat tartalmazó grafikont - papíron vagy htmlváltozatban -, akkor már számukra is ajánlható ez a megoldási mód. Egy GeoGebra feladatlap éppen ezt teszi lehetővé. Általános iskolában elegendő lehet kevesebb adatot figyelembe venni. Középiskolában dolgozhatunk közvetlenül a szoftverrel is. A kapott egyenest akkor is megmutathatjuk egy tanári számítógépen, ha a tanulók másképp oldják meg a feladatot. A grafikon pontjainak mozgatásával, pontok elhagyásával, vagy újak berajzolásával további észrevételeket tehetünk a regressziós egyenes tulajdonságairól. 5. megoldás: Bár már korábban is megismerkednek a diákok többféle függvénnyel, a modellkészítésben való alkalmazásukat mégis inkább középiskolában javaslom. Az egyik legismertebb függvény a másodfokú, próbáljuk meg ezt felhasználni. Ebben az esetben GeoGebra alkalmazása nélkül már nehézkes lenne eredményre jutnunk. A megoldáshoz egy dinamikus feladatlapot készíthetünk, amelyen például csúszkák segítségével változtathatóak a görbe paraméterei. A görbeillesztési paranccsal kapott megoldás 270 illetve 315 centiméter, az átlagos hiba 1,43 cm. (Ld.: masodfoku_illesztes.ggb.) Megjegyzés: A GeoGebrában adhatunk magasabb fokú polinomközelítést is. Ezt a diákok a GörbeillesztésPolinom paranccsal elvégezhetik a szoftverben, vagy vizsgálhatják az eredményeket egy dinamikus munkalapon is, ahol a polinom fokszáma állítható. (Ld.: polinom_illesztes.ggb.) 6. megoldás: Ahogy már a 3. megoldásban utaltam rá, korlátos függvény használatával egy felső határt építhetünk be a modellünkbe. Például az f (x) = − x1 függvény {x ∈ R, x > 0} értelmezési tartományon vett részét transzformálhatjuk megfelelően tovább, és az eddigi grafikonok végére illeszthetjük egy szeletét. Én a parabolaillesztést dolgoztam át, a kapott eredményeim szerint 2015-ben 255 cm, 2050-ben 261 cm lesz a rekord. (Ld.: masodfoku_illesztes_hatarral.ggb, 7.4. ábra). Megjegyzések: A megoldásként kapott érték kisebb, mint az eddigiek, tehát valóban a kívánt módon javítottuk a modellünket. Minden más grafikon is tovább módosítható ezzel a kiegészítéssel, a megoldás pedig még inkább szubjektív, mint eddig. Más felülről korlátos függvényt is használhatunk. 66
7.4. ábra. Egy megoldás felső korlát beiktatásával. Érdemes a továbbiakban az ábrázolt pontok tendenciája szerint folytatnunk a gondolatsorunkat. A hosszabb adatsort feldolgozó grafikonon láthatjuk, hogy a 20. század első felében lassabb volt a növekedés, 1960 körül nagy ugrást figyelhetünk meg, majd ismét növekedést, amelynek üteme egy idő után egyre inkább lelassul, és 1993 óta nem is született új rekord. Ennek okát több dologban fedezhetjük fel. A század elején, az olimpiák újrakezdésével még inkább a sportszellem volt a meghatározó, míg később egyre hangsúlyosabbá vált a minél nagyobb teljesítmény elérése. A negyvenes években megjelentek a kémiai eljárásokkal elkészített, szintetikus táplálékkiegészítők3 , melyek közül sokat legálisan is szedhetnek a sportolók. Más körülmények is változhattak – például az átlagos testmagasság, az életszínvonal –, amelyeket nem látunk tisztán. Ezek a változások adhatnak magyarázatot az ötvenes-hatvanas években megfigyelt nagy ugrásokra. Az újítások okozta teljesítménynövekedést egy bizonyos idő alatt maximálisan kihasználták a magasugrók, ezért nem tapasztalunk látványos javulást az adatsor végén. Nem tudhatjuk, hogy a jövőben hogyan alakulnak a körülmények, feltételek. Az emberi teljesítménynek is vannak határai, de szervezetünk átalakulásával hosszú évezredek alatt ezek is változhatnak. 3
Forrás: http://www.vegetarianus.hu/ujsagok/veghirl/26/tapkieg.html
67
A fentiek alapján olyan modellt alakíthatunk ki, mely szakaszokból áll. Az egyes szakaszok elején még lassú a növekedés, majd egyre gyorsabbá válik. Miután a sportolók kiaknázták a változásokban rejlő lehetőségeket, a görbe megint lassabban növekszik, míg elér egyfajta ”maximumot”, amely után a következő szakasz kezdetéig szinte stagnál az érték. Amint a körülmények megint változnak, újabb szakasz indul. Adhatnak megoldást a fenti megfontolások szerint már a 9-10. osztályos tanulók is, én most egy idősebbekkel feldolgozható modellt mutatok be. 11-12. osztály Mielőtt sor kerülne a szakaszokból álló modell ismertetésére, a 9-10. osztályban elért többi eredményt is szeretném ebben a korosztályban továbbgondolni. A középiskolában tanult függvények közül – GeoGebra segítségével – felhasználható a növekedési modellhez a négyzetgyök, a szinusz, az exponenciális és a logaritmus függvény grafikonja is (az első akár már 9-10. osztályban). Azonban az ábrázolt pontokat szemlélve arra a következtetésre juthatunk, hogy egyik függvénytípus görbéje sem írja le az adatok viselkedését. Erre utal az is, hogy mind az exponenciális, mind a logaritmus függvény esetében kapott megoldás közel lineáris (ld.: exp_illesztes.ggb és log_illesztes.ggb, 7.5. ábra). Meglepő eredményt kapunk a szinuszfüggvény ese-
7.5. ábra. Az adatokat legkisebb négyzetes hibával közelítő exponenciális egyenes. 68
tén, ugyanis az ábrázolt adatokat a program egy fél periódussal közelíti, az így kapott átlagos hiba pedig 1,43 cm, ami az eddigi legjobb eredmények között van (ld.: sin_illesztes.ggb). A függvény periodikussága miatt nyilván nem fogadható el ez a közelítés, azonban felhasználhatjuk az eredményt a szakaszos modellünk elkészítéséhez. 7. megoldás: Modellezhetjük az egyes szakaszokat egy-egy megfelelőképpen transzformált szinusz-függvény fél periódusával. Így több, egymáshoz képest eltolt hullám fogja alkotni a grafikont. Ehhez a modellhez is készíthetünk dinamikus feladatlapot, amelyben például az első, adott szakaszt a GeoGebra GörbeillesztésSin parancsával előállíthatjuk, a második szakasz megszerkesztését pedig a tanulókra bízzuk, esetleg csúszkák elhelyezésével segíthetjük őket. (Alapul szolgálhat a feladatlaphoz a sin_illesztes_tobbszakasz.ggb nevű fájl, ld.: 7.6. ábra.) A 2012-re és 2050-re kapott világcsúcsok rendre 262 és 278 cm.
7.6. ábra. Két szinusz függvény segítségével megvalósított szakaszos modell. Megjegyzés: Több megoldás is elképzelhető a valóságban, érdemes pár változatot elkészíteni a diákokkal, hogy erre felhívjuk a figyelmet. A minta alapján szerkeszthető több szakaszt modellező feladatlap is. 69
7.3.2.
Értékelés
A fenti feladatot több szinten is meg lehet oldani, ezért a matematikában gyengébb teljesítményt nyújtók is aktívan részt tudnak venni a munkában, és a jobban teljesítők számára is számos érdekességet rejt. Szintén ennek a tulajdonságának köszönhető, hogy többféle korosztálynak is feladható. Számos megoldási utat találhatunk, az elterjedtebb szimbolikus lehetőségtől az összetettebb modellekig, ezért a feladat jól alkalmazható olyan tanulócsoportnál is, akik még nem, vagy csak kevés modellezési illetve nyitott feladatmegoldási tapasztalattal rendelkeznek. A zárt feladatok esetében megszokott „egy feladat – egy eredmény” megközelítéssel szemben itt nyilvánvalóan látszik, hogy ez a megközelítés miért nem működik mindig, ezzel hat az egysíkú feladatmegközelítéssel szemben. A több megoldás fejleszti a kreativitást is. Kiemelt szerep jut a megoldások többségében a vizuális reprezentációnak; ezzel is alátámasztottam a 7.2. alfejezetben leírtakat. A GeoGebra feladatlapok használatával a tanár egészen a háttérbe húzódhat, a velük végzett egyéni munka növelheti a diákok önállóságát. Azonban minden esetben érdemes összevetni egymással a különböző ötleteket, és a kapott eredményeket közösen értékelni. Mindezt végezhetjük tanulócsoportokban is. A tanár szerepe ideális esetben tehát végig a megfigyelés, koordináció vagy a reflexió nyújtása.
7.4.
Mintafeladat: Árnyjáték
A feladat: 2013-ban Nagy-Britannia leghíresebb tehetségkutató versenyén egy magyar csapat is részt vett. A nézőtér felé, a színpad elejére egy vásznat feszítettek ki, amelyen árnyékukkal jelenítettek meg történeteket. Különleges játékukkal olyannyira elkápráztatták a közönséget, hogy megnyerték a műsort. A képen egyik előadásukból láthatsz egy jelenetet. A sírokat is egy-egy táncos formázza, ahogy az édesanyát és kislányát is. Hogyan helyezkedhetnek el a vászon mögött az előadók? Mekkora lehet a valóságban a két szereplő kezének távolsága?
7.4.1.
Adatgyűjtés
Mielőtt hozzálátnánk a megoldáshoz, a szituáció paramétereit gyűjtjük össze, hiszen a fenti szövegben semmilyen pontos értéket nem találunk. Legfontosabb azt végig70
7.7. ábra. A vizsgált jelenet4 gondolni, hogy mely információkra van szükségünk a kérdések megválaszolásához. Utána megkísérelhetjük ezeket számszerűen kifejezni, de dolgozhatunk velük mint paraméterekkel is. Szükséges adatok lehetnek: • az előadók testmagassága – több internetes forrás szerint a nők átlagmagassága 164 cm. Feltételezzük, hogy az anyát és a lányt játszó színész magassága is ennyi;
• a sírokat megjelenítő személyek magassága az elfoglalt pozícióban. A videófelvétel alapján a szereplők térdelnek és előrehajolnak. Méréseket végeztem több ismerősömről ilyen helyzetben, átlagosan 54 cm-es magasság jött ki; • a vászon méretei – a kisfilm elején látszik, hogy körülbelül 3,5m x 5,5 m-es vásznat keresünk (pl. 0:03-nál a magasságot, 0:04-nél a szélességet figyelhetjük meg, amit összevethetünk a szereplők magasságával.) Interneten rákerestem vetítővászont forgalmazó cégek honlapjára, és kapható 316x416, 300x500, 375x500, 391x516 (cm x cm) méretű vászon; ezekből én a 375 cm x 500 cmeset tartom legvalószínűbbnek. A rögzítéshez szükség van még minden oldalon egy-egy keskeny sávra, illetve a kép sem tölti ki teljesen a rendelkezésre álló területet. Ezért tegyük fel, hogy a hasznos felület 335 cm x 460 cm-es; • a megvilágító fényforrás és a vászon távolsága. Ezt később adjuk meg, vagy paraméterként kezeljük; 4
Forrás: https://www.youtube.com/watch?v=phGyJyp3MBg.
71
• a fény terjedésének szöge. A világhálón böngészve 60, 100, 120 és 140 fokban szóró reflektorokat találtam;
• arányok a képen: képszerkesztő program segítségével is megmérhető, vagy akár vonalzóval. A nagy női alak magassága a képen a vászon magasságának kb. 0,9-szerese, a fenti adatokkal számolva 301,5 cm. A kisebb alak magassága a vászon magasságának kb. 0.53-szorosa, azaz 177.55 cm. A sírok 0.3; 0.26 és 0,22-szeresét foglalják el a magasságnak, átlaguk 0,26. Ez 87,1 cm-nek felel meg. Számolhatunk 302; 178 és 87 cm-rel. Továbbá feltesszük, hogy a fényforrás pontszerű, a vászont vízszintesen középen világítja meg, és a földön helyezkedik el.
7.4.2.
Lehetséges megoldások
A modellekben csak az anya- és a lány-szereplő elhelyezkedését vizsgálom, a sírokat megjelenítő táncosok helyzete hasonlóan hozzátehető minden esethez. A megoldásokat aszerint csoportosítom, hogy melyik korosztálynál várhatóak már el. Minden pontban először a megoldás menetét írom le, kiszámítom az eredményt és értékelem azt. Ezután utalok arra, hogy a GeoGebra milyen szerepet tud betölteni az adott modell megalkotásában. 7-8. osztály 1. megoldás: Készíthetünk egy ábrát, amely a színpadon a fényforrást, az anyát és a lányt megjelenítő táncost, valamint a vásznat ábrázolja oldalnézetből (ld. 7.8. ábra). Ennél a korosztálynál csak ezt a nézetet vizsgálom. Könnyen látható, hogy a lenti elrendezés vezet jó eredményhez, azaz amikor a lány áll közelebb a vászonhoz. Az ismert adatok az anya és a lány magassága, valamint a 7.8. ábra jelöléseit használva a Va Lv és Va Av szakaszok hossza, vagyis az árnyékok magassága. A fényforrást jelölje F , ekkor a kérdés az F Aa , F La és F Va szakaszok hossza. A 7.8. ábrát meg is szerkeszthetjük, a megoldást pedig méréssel adhatjuk meg. Az F Va távolságtól függően több ábrát készíthetünk. Az adatokat méretarányosan ábrázoljuk. A fényforrás és a vászon távolságát 500 cm-nek választottam, ehhez huszonötszörös kicsinyítést alkalmaztam. Az ábrán kapott hosszúságok: 72
7.8. ábra. A két főszereplő elhelyezkedése a színpadon - oldalnézet F Va = 500 : 25 = 20 cm; Aa Af = La Lf = 164 : 25 ≈ 6, 6 cm; Va Vf = 335 : 25 ≈ 13, 4 cm; Va Lv = 178 : 25 ≈ 7, 1 cm; Va Av = 302 : 25 ≈ 12, 1 cm.
Elsőként a fényforrást, a színpadot és a vásznat szerkesztjük meg, majd a vásznon megjelöljük az árnyékok kívánt nagyságát. Ezután felvesszük az Av és Lv pontokat, és összekötjük őket az F ponttal. Húzunk egy F Va -val párhuzamos egyenest, mely a valóságban a vetítővásznat 164 cm magasan metszené (ez a két színész magassága). Az ábránkon ez a távolság 6,6 cm-nek felel meg. Az említett F Va -al párhuzamos egyenes F Av illetve F Lv egyenessel alkotott metszéspontjaiként megkapjuk az Af és Lf pontokat, és velük együtt a két táncos helyét is. A keresett adatokat vonalzóval végzett mérésből, a kicsinyítési arányt figyelembe véve számoljuk ki. Megjegyzések: A megoldáshoz az egyenes arányosság ismerete, valamint merőleges és párhuzamos egyenesek szerkesztése szükséges, ezért már 7-8. osztályban is elvégezhető. A kicsinyítések, a szerkesztési és mérési hibák miatt a számítotthoz képest pontatlanabb eredményt kaphatunk. A megoldáshoz ebben az életkorban még több-kevesebb segítség kell, ennek meghatározása a tanár feladata. Érdemes a szerkesztést papíron és GeoGebra segítségével is elvégezni, különböző kiindulási adatokkal dolgozva többször is. Ezzel többféle elfogadható illetve nem megfelelő anya–lány elhelyezéseket adhatnak meg a tanulók, és egyúttal jó gyakorlási lehetőség is. A GeoGebra eszközeivel a szerkesztés gyorsabbá, az adatok felvétele és a mérések pontosabbá tehetőek. A tanulók itt közvetlenül a szoftverrel is dolgozhatnak. 73
9-10. osztály 2. megoldás: A 7.8. ábrán hasonló derékszögű háromszögeket találunk: F Va Av ∼ F Aa Af , és F Va Lv ∼ F La Lf . Ha felírjuk a megfelelő oldalhosszak hányadosát, csak a keresett szakaszok arányát kapjuk meg: Va Av 302 Va Lv 178 F Va F Va = = = = F Aa Aa Af 164 F La La Lf 164 F Aa 178 ⇒ = = 0, 59. F La 302 A konkrét megoldáshoz szükségünk van még egy adatra. Mivel az előadás során a fényforrás és a vászon távolsága feltehetően állandó, ezt az értéket érdemes beállítani úgy, hogy az elrendezés ténylegesen megvalósítható legyen; rögzítsük például 500 cm-nek. Ekkor a fenti arányok alapján: F La = 500 ·
164 ≈ 460, 7 cm F Aa = 0, 59 · F La = 0, 59 · 460, 7 ≈ 271, 8 cm 178 ⇒ F La − F Aa = 460, 7 − 271, 8 = 188, 9 cm.
Tehát a két szereplő távolsága ebben az esetben körülbelül 189 cm. Fényforrás-vászon távolsága (cm) 300 350 400 450 500 600 700 800 900
Fényforrás-anya távolsága (cm) 163 190 217 244 272 326 380 434 489
Fényforrás-lány távolsága (cm) 276 322 369 415 461 553 645 737 829
Szereplők távolsága (cm) 113 132 151 170 189 227 265 303 340
7.1. táblázat. Pár lehetséges érték a fényforrás, a szereplők és a vászon közötti távolságra.
74
Megjegyzések: Több elrendezést is javasolhatnak a diákok, mindegyiket egy-egy számítással alátámasztva. Pár megoldást tartalmaz a 7.1. táblázat. A kapott eredmények értékelésénél szempontjaink közé tartozhat például, hogy legyen a táncosoknak elég helyük a koreográfiához. Ennek elérésében segíthet az a könnyen látható összefüggés, hogy minél messzebb van a fényforrás a vászontól, annál nagyobb a szereplők távolsága. Azonban egyre nehezebb lehet a mozdulatok összehangolása is, a kettő között kell egyensúlyt találnunk. A színpad hosszáról is lehetnek feltételezéseink, fent ezért csak 8 méteres fény-vászon távolságra számoltam ki a kérdéses értékeket. Ehhez a megoldáshoz dinamikus feladatlapot is készítettem GeoGebra segítségével, melyet a többi modell ismertetése után mutatok be. 3. megoldás: Figyelembe vehetjük a fény terjedési szögét is. Ez a szempont akkor fontos, ha valamilyen okból lényeges, hogy a fényforrás ne világítson a vászon fölé. Mivel feltettük, hogy a fényforrás a földön helyezkedik el, a szög felével kell dolgoznunk; ezt jelöljük α-val. A megvilágító eszköz és a vászon távolsága itt már nem szabadon választható paraméter, hanem rögzített, és az F Va Vf háromszögből számítható ki: F Va =
Va Vf tan(α)
A 60, 100, 120 és 140 fokos terjedési szögekre az eredmény rendre 580,2; 281,1; 193,4 és 121,9 cm. Innen az 1. megoldás alapján egyértelműen megkapjuk a két színész távolságát is, melyek rendre 219,5; 106,3; 73,2 és 46,1 cm . Megjegyzések: A valóságban mindegyik eredmény elképzelhető; bár érdemes meggondolni, hogy kisebb távolságok esetén a sírok bevonásával túl zsúfolttá válhat a színpad, illetve a fényforrás felé történő elmozdulások a képen látványos nagyítással járnak. Nagy értékek esetén viszont talán nehezebb összehangolni a különböző szereplők mozdulatait. Ehhez a megoldáshoz hegyesszögek szögfüggvényének kiszámítása is szükséges, ezért ezt a modellt csak 9. osztálytól használjuk. GeoGebra segítségével szögfüggvények ismerete nélkül is adhatunk elrendezéseket, így a feladat megoldható általános iskolában is. (Ld.: Arnyek_oldalnezet_szogalapjan.ggb.) Az eddigi megoldások értelmezésénél lényeges kiemelnünk, hogy a fenti számítások csupán az egyik irányban mért távolságot adják meg. Azonban ha a szereplők csak hosszanti irányban távolodnak el egymástól, oldalirányban nem, azaz egymás 75
mögött állnak, és a fényforrás is éppen mögöttük helyezkedik el, akkor a kívánt képet nem is tudjuk megjeleníteni. A modellt finomíthatjuk azzal az ötlettel, hogy ebben az elrendezésben csak a fényforrás helyzetét változtatjuk; kérdés, hogy ezzel megkaphatjuk-e a 7.7. ábrán látott jelenetet. A másik lehetőség, hogy a színészeket egymáshoz képest oldalirányban is eltoljuk. Erre készítünk modellt a következő megoldásban. 4. megoldás: Az 1-3. megoldásokat mind kiegészíthetjük egy felülnézeti kép vizsgálatával. A lány képe a vászon közepén van, ezért az ő helye a fenti eredményeink alapján egyértelműen meghatározott. Az eddig kapott adatok szerint az anya egy szakasz valamely pontján állhat (ld. 7.9. ábra), ezt kell kjelölnünk úgy, hogy a kezek árnyéka összeérjen, a feladatleírásban lévő képhez hasonlóan. Tanulókon vagy ismerős felnőtteken
7.9. ábra. Felülnézeti kép a színpadról. Eddigi számításaink alapján az anyát megjelenítő szereplő a piros szakasz valamely pontján helyezkedhet el. végzett mérésekkel megállapíthatjuk, hogy az adott pozícióban kinyújtott kezek vízszintesen milyen messzire távolodnak el általában a testtől. Ezután az oldalnézettel analóg módon folytathatjuk számításainkat. Saját méréseim alapján az anya-szereplő kezének eltávolodását a valóságban átlagosan 50 cm-nek, a lányét 38 cm-nek veszem. A fényforrás és a vászon távolságát 580 cm-nek választva, az adatokat az 1. megoldás alapján kiszámítottam és a 7.10. ábrán összegeztem. Csak a színpad fele látszik, hiszen az anyát megjelenítő szereplő a nézőtér felől nézve a lány bal oldalán helyezkedik el. Először kiszámítjuk F L1 hosszát a Pitagorasz-tétel segítségével az F L1 L2 derékszögű háromszögben, majd megállapítjuk F A2 hosszát az F A2 A3 és F L1 L2 háromszögek hasonlóságából. 76
7.10. ábra. Felülnézeti kép a színpad feléről az 1. megoldás alapján kiszámított adatokkal. Ebből a két adatból már könnyen megkapható az eredmény. F L1 =
√
536 · 315 ≈ 316 cm 535 ⇒ A2 L1 = 536 − 316 = 220 cm.
5352 + 382 ≈ 536 cm
F A2 =
Tehát a két szereplő távolsága 220 cm. Megjegyzések: Az eredmény elképzelhető elrendezést ad. A többi F Va értékre a számításokat hasonlóan végezzük, illetve a 2. és 3. módszereket is alkalmazhatjuk az adatok kiszámolásához. GeoGebrában készíthetünk a megoldáshoz dinamikus feladatlapot, vagy középiskolában a tanulók is megalkothatják a szoftver segítségével a saját ábrájukat, megoldásukat. A fájlban az anyát jelölő pontok mozgathatóak, ahogy a fényforrás távolsága is. Az ábra ennek megfelelően, magától módosul.
7.4.3.
Megoldás dinamikus feladatlap segítségével
Mint már említettem, az 1. megoldáshoz GeoGebra segítségével dinamikus feladatlapot is készítettem (ld.: 1-4. melléklet és feladatlap1.html). Az első oldalon a feladat szövegét és a képet láthatják a diákok. A második lapon lényegében a 7.8. ábra található, amelyen szabadon változtatható a szereplők és a vászon magassága, a színpad hossza és a szereplők elhelyezkedése. Ennek célja, hogy több megoldást is adjanak a tanulók. Végül a harmadik oldalon ugyanezzel az ábrával dolgozhatnak, 77
de a szoftver már az adatokat is megjeleníti, és a valóságban is elképzelhető értékeket kell beállítaniuk. A többi paramétert konkrétan beállítva kiszámíthatják a szereplők fényforrástól vett távolságát, ehhez segítséget is kaphatnak két lépésben. Először ahhoz kaphatnak ötletet, hogy hogyan álljanak neki a feladatnak – egy jelölőnégyzetre kattintva felhívjuk a figyelmüket a háromszögek hasonlóságára. Ha a tanult elméleti háttérrel tisztában van a tanuló, akkor ezután nagy eséllyel végig tudja számolni a feladatot. Ha elakadna, egy másik jelölőnégyzettel a hasonlóságból adódó képlet is megjelenik, illetve ebből kifejezve az az összefüggés, amelybe behelyettesítve az adatokat kiszámítható az anya fényforrástól mért távolsága. Egy újabb kattintással ellenőrizhetik eredményüket. A lapokat szabadon váltogathatják, az instrukciókat pedig a munkafelület fölött olvashatják el. A feladatlapot önálló munkavégzésre, egy tanórára terveztem. Az egész munkafolyamat – beleértve a számítógépes munka előkészítését és a feladatmegoldást is legfeljebb 30 perc alatt elvégezhető, így a tanóra végén marad idő a tapasztalatok és a javasolt ötletek megbeszélésére is. Fontos felhívni a figyelmet arra, hogy több megoldást is elfogadhatunk, illetve hogy az oldalirányú elmozdulás figyelembe vételével szükséges még pontosítani az eredményt. Következő tanórán javaslom ennek az elvégzését, akár a fizikai megjelenítéssel. Legfőbb szempontjaim közé tartozott a feladatlap összeállítása során, hogy a munkalap világos, áttekinthető és könnyen megérthető legyen. Ehhez a GeoGebra honlapjáról letölthető kézikönyv tanácsait vettem alapul (Hohenwarter, 2013 [40]). Mind a szöveg, mind a munkafelület ráfér egyszerre a képernyőre, ezzel az egész feladat egyszerre látható. A magyarázatok rövidek, tömörek, és igyekeztem őket közvetlen stílusban megfogalmazni. Egy oldalon csak kevés kérdést tettem fel, hogy ezzel is kompaktabb és világosabb legyen a feladatlap. A munkafelület elkészítése során használt segédalakzatokat, amelyek a diák számára jelentéktelenek, elrejtettem. A látható objektumok mind változtathatóak valamilyen módon, ettől válik interaktívvá a feladatlap. Az összetartozó alakzatokat – az anyához illetve a lányhoz tartozó szakaszokat, méreteket, pontokat – azonos színnel jelöltem. Az alakzatok módosításával, a modell vonzó megjelenítésével és a számítások, képletek megadásával összekapcsolódik a feladatmegoldás során a képi és a szimbolikus reprezentáció. Emellett azonban szükséges megemlíteni, hogy a számítógéppel való munkavégzés nem pótolhatja a valóságos megjelenítés élményét és előnyeit, és szükséges a kapott eredményeket valamilyen módon visszaültetni a valóságba, ellenőrizni őket. 78
7.4.4.
Feladatvariációk, szemléltetés és ellenőrzés
További feladatvariációkat nyerhetünk, ha feltesszük, hogy a két szereplő magassága eltérő, vagy megpróbáljuk a sírokat megjelenítő táncosokat is elhelyezni a színpadon, esetleg a fényforrást nem a földön helyezzük el. Az utóbbi esetet visszavezethetjük derékszögű háromszög alkalmazására, a fentiekhez hasonlóan, vagy akár alkalmazhatjuk a szinusz- vagy koszinusztételt is. A diákok megválaszolhatják azt a kérdést is, hogy ezzel a módosítással vajon közelebb állhatnak-e egymáshoz a táncosok. A paraméterek változtatásával a középpontos hasonlóság tanítása is előkészíthető, a transzformáció vizsgálható vagy ismételhető. Alternatív modellezési formát adhat, ha megpróbáljuk saját magunk rekonstruálni a kiválasztott képet, ezzel áttérve a materiális reprezentációra. Akár egy rajzot is a falra vetíthetünk írásvetítő vagy nagyobb fényerejű lámpa segítségével, amelyen az általunk valósnak gondolt elrendezés látható. Ekkor szükséges számolásokat végeznünk a valóság és a rajz közötti aránnyal kapcsolatban. Még izgalmasabb, ha élő szereplőkkel, az osztály tanulóival mutatjuk be a szituációt. Ez a módszer alkalmas arra, hogy a modell elkészítése nélkül is találjunk megoldást, illetve arra is, hogy az elkészített modell(jeinke)t ellenőrizzük a valóságban. Ilyen módon sokkal jobban érzékelhetővé válnak a konstrukció során felmerülő problémák: mekkora terem szükséges az előadáshoz? Milyen fényerő elég az árnyékok kialakításához? Mennyire látszanak a testmagasságbeli különbségek? Egyúttal gyorsabban vizsgálható, hogy egy-egy változtatás a koncepciónkon hogyan alakítja át a képet. Az utóbbi megoldási mód azért is ajánlott, mert a modellezés folyamata csak akkor válik teljessé, amikor a matematikai eredményt értelmezzük és ellenőrizzük a valóságban. Enélkül nem lehetünk biztosak a modellünk helyességében. Mivel nem állt rendelkezésemre elég nagy terem az eredményeim ellenőrzésére, ezért egy makettel – mint a modell valóságközeli modelljével – próbáltam ki a 4. megoldásban adott elrendezést (ld. 5. melléklet). A valósághoz mérve húszsszoros kicsinyítéssel dolgoztam, így jelöltem be a színészek általam kiszámított helyzetét. A kívánt képet akkor kaptam, ha az anya-figurát 1 milliméterrel közelebb toltam, ez a valóságban 2 cm-es eltérést jelent, amely egy táncos előadás során nem sok. Igaz, hogy a makettkészítés közben is adódhattak pontatlanságok, és a kicsinyítés is elsimítja az apró hibákat, de a ”vásznon” létrejött kép alapján elmondható, hogy modellem alapvetően elfogadható (ld.: 7.11. ábra).
79
7.11. ábra. Az ellenőrzéshez készített makett (a) felül- illetve (b) oldalnézetből; (c) a maketten kapott árnykép.
7.4.5.
Értékelés
A fenti feladat – amint azt láthattuk – már 7-8. osztályban megoldható bizonyos módszerekkel, a GeoGebra feladatlapok felhasználásával pedig akár még ennél fiatalabb tanulók is adhatnak szemléletes megoldást. A valóságban történő megjelenítéssel akár alsó tagozatban is maradandó élményt nyújthatunk a diákoknak a modellezési feladatokkal kapcsolatban. A körültekintő, precízebb 4. modell alkalmazását azonban csak középiskolában ajánlom. A modellek megalkotásához nem árt némi jártasság modellezési feladatokban, hiszen az adatok hiánya, a térbeli feladat két dimenzióra való leszűkítése zavarba ejtő lehet tapasztalatlan diákok számára. A fizikai megjelenítés talán természetesebb és kevesebb modellezési előismeretet igényel, játékos és szemléletes volta miatt felhasználható a modellezési feladatok népszerűsítésére, megismertetésére. A különböző modellek ebben az esetben elsősorban nem azt szemléltetik, hogy milyen sokféle úton juthatunk el a megoldásig, sokkal inkább egymást kiegészítik és tökéletesítik. Ezzel a modellezés körkörös folyamatát tapasztalhatják meg a diákok. 80
A tanári szerepvállalás többféle is lehet. A fizikai megjelenítésnél teljesen a háttérbe húzódhatunk, pusztán a reflexió és olykor a munkafolyamat továbblendítése lehet a feladatunk. A síkmetszetek elkészítésében azonban - főként fiatalabb korosztály esetében - ez a hátulról támogató funkció egészen az irányítóig változhat. Modellezésben tapasztalatlan tanulókat érdemes lépcsőnként bevezetni az effajta feladatmegoldásba, míg képesek nem lesznek egyedül végiggondolni a teljes modellezési ciklust; ezért ettől a körülménytől függően fokozatosan adhatjuk át a koordinációt. A munkaszervezés lehet csoportos, főképp az adatok összegyűjtésekor illetve a valóságban történő megjelenítésnél. A többi megoldási módszer esetében a páros vagy az önálló munka is ajánlott. Láthatjuk, hogy milyen bonyolult egy ilyen árnykép összeállítása. A koreográfus valószínűleg persze nem matematikai eszközökkel tervezte meg az egész előadást, segítségére lehetett a fizikai megvalósítás, melynek során nyilvánvalóan felhasználta árnyképes előadások során szerzett korábbi tapasztalatait is. Sejthetjük azt is, hogy a színpadon előzetesen segédvonalakat ragasztanak fel. Azonban a kivitelezés során a táncosoknak mindenképpen nagyon pontosnak kell lenniük, hogy a kívánt kép jelenjen meg a vásznon, pár centiméter eltérés már megbonthatja a kompozíciót.
7.5.
Összefoglalás
Munkámban röviden bemutattam a modellezési feladatok tulajdonságait, megismertem a különböző külső reprezentációk jelenlegi és lehetséges szerepét a tanulásban, és ismereteimet próbára tehettem gyakorlati feladatok megoldásával. Egyre világosabbá vált a modellezési feladatoknak az a vonzó tulajdonsága, hogy a tanulókat önállóságra és a csoportokban megnyilvánuló képességeik fejlesztésére ösztönözhetik, ezzel a modern pedagógia céljait szolgálják és valósítják meg a diákok számára élvezhető módon. Munkámban nehézségként éltem meg, hogy a modellezési folyamatot számos apró részlet gazdagítja, melyeket mind figyelembe kell venni az egyre pontosabb megoldás elkészítéséhez, és olykor nem könnyű ennyi szempontot strukturáltan kezelni. Másszóval szokatlan volt, hogy ezek a feladatok nem biztosítanak olyan letisztult környezetet, mint a hagyományos matematika feladatok. Másfelől azonban az összetettség szükséges velejárója annak, hogy ténylegesen a valóságról gondolkodjunk, és arra adjunk logikus magyarázatot; ez pedig elég kárpótlást nyújtott a fáradalmakért. Törekedtem a GeoGebra program segítségével bemutatni, hogy a dinamikus ma81
tematikai szoftverek hogyan segíthetik a valóság megismerését; ennek mértéke számomra is meglepetést okozott. Fontos tapasztalat számomra, hogy ezek az eszközök milyen változatos szerepet tölthetnek be az oktatásban: a tanári felkészülés támogatásától kezdve az egyszerű szemléltetésen és a szimbolikus megoldások színesítésén keresztül egészen az új, használatuk nélkül nehezen kivitelezhető megoldásokig terjed ez a skála. Remélem, hogy a magyar közoktatás egyre inkább felfedezi a modellezésben és a segédszoftverekben rejlő lehetőségeket, és segítségükkel egyre több diák értheti meg, milyen fontos a matematikai gondolkodás a mindennapi életben, ezáltal pedig a matematika visszanyerheti a közgondolkodásban az őt megillető helyet.
82
Mellékletek
1. melléklet: Az Árnyjáték c. mintafeladathoz készített dinamikus feladatlap első oldala, mely a feladat leírását tartalmazza. A ’Következő’ gomb megnyomásával léphetünk a második oldalra.
83
2. melléklet: A feladatlap második oldala. A teli körrel jelölt pontok mozgathatóak. Az előző és az utolsó oldalra a ’Vissza’ és a ’Következő’ gomb segítségével juthatnak.
84
3. melléklet: A feladatlap harmadik oldala. A pontok mozgatásával arányosan módosulnak az adatok is. Az Ötlet jelölőnégyzet kipipálásával megjelenik az egyik lehetséges megoldás kezdőgondolata. Az alapösszefüggés a Segítség jelölőnégyzettel jön elő. A Megoldás négyzetre kattintva a szoftver megjeleníti az anya és a lány fénytávolságtól vett távolságát.
85
4. melléklet: A jelölőnégyzetek használata. Az Ötlet, a Segítség és a Megoldás négyzetek kipipálásával megjelenő szövegek és adatok is láthatóak.
86
Irodalomjegyzék [1] Dennis Gabor. A new microscopic principle. Nature, 161(4098):777–778, 1948. [2] Joseph W. Goodman and Steven C. Gustafson, Reviewer. Introduction to fourier optics, second edition. Optical Engineering, 35(5):1513–1513, 1996. [3] David George Voelz. Computational fourier optics: a matlab tutorial. SPIE, 2011. [4] Kiss Márton Zsolt. Színes digitális holografikus mikroszkóp tervezése, előállítása és felhasználása élővizek mikrobiológiai összetételének meghatározására. Master’s thesis, Budapesti Műszaki és Gazdaságtudományi Egyetem, Gépészmérnöki Kar, 2010. [5] Schipp Ferenc. Fourier-analízis. ELTE, Numerikus Analízis Tanszék, Egyetemi jegyzet, 2006. [6] Lócsi Levente. Ortogonális rendszerek szerinti gyors fourier-transzformációk és alkalmazásaik. Master’s thesis, Eötvös Loránd Tudományegyetem, Informatikai Kar, 2008. [7] Karátson János. Numerikus funkcionálanalízis. ELTE, Alkalmazott Analízis és Számításmatematikai Tanszék, Egyetemi jegyzet, 2010. [8] E. U. Condon. Immersion of the fourier transform in a continuous group of functional transformations. Proceedings of the National Academy of Sciences of the United States of America, 23(3):158, 1937. [9] Haldun M. Ozaktas, M. Alper Kutay, and David Mendlovic. Introduction to the fractional fourier transform and its applications. volume 106 of Advances in Imaging and Electron Physics, pages 239 – 291. Elsevier, 1999.
87
[10] Adrian Stern and Bahram Javidi. Sampling in the light of wigner distribution. J. Opt. Soc. Am. A, 21(3):360–366, Mar 2004. [11] Haitham Hassanieh, Piotr Indyk, Dina Katabi, and Eric Price. Simple and practical algorithm for sparse fourier transform. In Proceedings of the TwentyThird Annual ACM-SIAM Symposium on Discrete Algorithms, SODA ’12, pages 1183–1194. SIAM, 2012. [12] Justin Romberg. Imaging via compressive sampling. Signal Processing Magazine, IEEE, 25(2):14–20, 2008. [13] Pina Marziliano. Sampling innovations. PhD thesis, ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE, 2002. [14] Jens Keiner, Stefan Kunis, and Daniel Potts. Nfft 3.0-tutorial. Chemnitz University of Technology, Department of Mathematics, Chemnitz, Germany. [15] Adolf W. Lohmann, Rainer G. Dorsch, David Mendlovic, Zeev Zalevsky, and Carlos Ferreira. Space-bandwidth product of optical signals and systems. J. Opt. Soc. Am. A, 13(3):470–473, Mar 1996. [16] Atanas Gotchev and Levent Onural. A survey on sampling and quantization in diffraction and holography. In Workshop on Spectral Methods and Multirate Signal Processing, SMMSP, pages 179–190, 2006. [17] C.E. Shannon. Communication in the presence of noise. Proceedings of the IRE, 37(1):10–21, 1949. [18] Vladimir Aleksandrovich Kotelnikov.
On the transmission capacity of the
’ether’ and of cables in electrical communications. In Proceedings of the first All-Union Conference on the technological reconstruction of the communications sector and the development of low-current engineering. Moscow, 1933. [19] Kyoji Matsushima and Tomoyoshi Shimobaba. Band-limited angular spectrum method for numerical simulation of free-space propagation in far and near fields. Opt. Express, 17(22):19662–19673, Oct 2009. [20] Eugene Wigner. On the quantum correction for thermodynamic equilibrium. Physical Review, 40(5):749, 1932.
88
[21] Adrian Stern and Bahram Javidi. Improved-resolution digital holography using the generalized sampling theorem for locally band-limited fields. J. Opt. Soc. Am. A, 23(5):1227–1235, May 2006. [22] Adrian Stern and Bahram Javidi. Theoretical analysis of three-dimensional imaging and recognition of micro-organisms with a single-exposure on-line holographic microscope. J. Opt. Soc. Am. A, 24(1):163–168, Jan 2007. [23] Adrian Stern and Bahram Javidi. Space-bandwidth conditions for efficient phase-shifting digital holographic microscopy. J. Opt. Soc. Am. A, 25(3):736– 741, Mar 2008. [24] Daniele Paolo Scarpazza. A brief introduction to the wigner distribution. Dipartimento di Elettronica e Informazione, Politecnico di Milano, 2003. [25] Martin J Bastiaans. Application of the wigner distribution function in optics, 1997. [26] Adrian Stern and Bahram Javidi. Sampling in the light of wigner distribution: errata. J. Opt. Soc. Am. A, 21(10):2038–2038, Oct 2004. [27] Adolf W. Lohmann. Image rotation, wigner rotation, and the fractional fourier transform. J. Opt. Soc. Am. A, 10(10):2181–2186, Oct 1993. [28] Szabolcs Tőkés and László Orzó. Afocal digital holographic microscopy and its advantages, 2012. [29] Ambrus Gabriella. Titanic a Balatonon és más modellezési feladatok matematikából középiskolásoknak. Műszaki Könyvkiadó, 2012. ISBN 978-963-16-4555-2. [30] Gilbert Greefrath. Modellieren lernen mit offenen realitätsnahen aufgaben, 2006. [31] Werner Blum. Kann mathematisches modellieren selbständig gelernt werden? ergebnisse aus der lehr-/lernforschung, 2010. [32] Tóth Bettina. Modellezési feladatok a matematikában. Master’s thesis, Eötvös Loránd Tudományegyetem, Természettudományi Kar, 2010. Témavezető: Ambrus Gabriella.
89
[33] Katja Maaß. Mathematisches Modellieren: Aufgaben für die Sekundarstufe I. Cornelsen-Scriptor, Berlin, 2008. [34] Nemzeti alaptanterv. Magyar Közlöny, 2012. 66. sz., 10635–10847. p. [35] Hans-Stefan Siller, Sandra Reichenberger, and Christina Gassner. Endlich am ziel! Praxis der Mathematik in der Schule, 55(4):35–40, 2013. [36] Ambrus András.
A konkrét és vizuális reprezentációk használatá-
nak szükségessége az iskolai matematikaoktatásban, 2007. http://dl.dropboxusercontent.com/u/100162898/ambrus/aarepr.pdf.
Forrás:
Letöltés dátuma: 2013. október 30. [37] Vásárhelyi Éva. Fogalomalkotás és reprezentációk. http://dl.dropboxusercontent.com/u/100162898/vasar/repr.pdf.
Forrás:
Letöltés dátuma: 2013. október 30., 2006. [38] Vásárhelyi Éva. Paralleler einsatz von traditionellen anschauungsmitteln und computeranimationen als strategie für problemlösen. Creativity and Mathematics Education (Tagungsband), Münster, pages 270–273, 1999. [39] Tasnádi Péter, Juhász András, and Horváth Gábor. Fizika körülöttünk. Múzsák Kiadó Reál Szerkesztősége, Budapest, 1994. ISBN 963-564-5325. [40] Judith Hohenwarter and Markus et al. Hohenwarter. Introduction to geogebra. Forrás: http://www.geogebra.org/book/intro-en.pdf Letöltés dátuma: 2013. augusztus 10.
90