1
1.
GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
Görbe illesztés a legkisebb négyzetek módszerével
Az el®z® gyakorlaton megismerkedtünk a korrelációs együttható fogalmával és számítási módjával. A korrelációs együttható számszer¶ információt ad arra, hogy két változó közötti kapcsolat mennyire lineáris. Viszont pusztán a korrelációs együttható ismerete nem ad választ arra a kérdésre, hogyan húzzuk be a közelít® egyenest a pontjaink közé. Csupán arra ad információt, hogy ez az egyenes mennyire jól írja le a kapcsolatot. A megoldás a regresszió, vagyis görbeillesztés. A görbe illesztésére több módszer is létezi pl: Kiválasztott pontok módszere, Közepek módszere, Legkisebb négyzetek (LN) módszere, Wald módszer. Most egyenl®re a legkisebb négyzetek módszerével foglalkozunk, de a gyakorlat végén a Wald módszerre is csinálunk példát. A LN módszere nem csak lineáris illesztésre jó, de el®ször csak erre csináljuk meg mert így lesz kerek egész a korrelációs együtthatóval. Egy Y = aX +b alakú egyenest szeretnénk illeszteni az (Xi , Yi ) mérési eredményeinkre. Cél az a és b paraméterek meghatározása. A módszer lényege az illesztett egyenes és a pontok közötti távolságok összegének minimalizálása. El®ször nézzük meg, hogy egy adott Xi helyen mi a mért Yi értéke és az illesztett egyenes Xi helyen felvett aXi + b értéke közötti távolság:
ei = Yi − aXi − b. ei az elemi hiba. Ezeket a hibákat minden pontban négyzetre emelve és összegezve kapjuk az összes négyzetes hibát, amit F -el jelölünk: F (a, b) =
X (Yi − aXi − b)2 .
Vegyük észre, hogy F csak a-nak és b-nek a függvénye. Az összes hiba összege akkor lesz minimális, ha F minimális. Ezt a minimumhelyet a és b szerinti parciális deriválással kaphatjuk meg:
X ∂F =2 (Yi − aXi − b)(−Xi ) = 0, ∂a X ∂F =2 (Yi − aXi − b)(−1) = 0. ∂b Egyszer¶sítünk 2-vel és a negatív el®jelekkel, és felbontjuk a zárójelet:
X
X X Yi Xi − a Xi2 − b Xi = 0, X X X Yi − a Xi − b 1 = 0.
Ez egy 2 egyenletb®l álló lineáris egyenletrendszer. Ezt kell megoldani a-ra és b-re.
1
1.1
Els® Feladat
1
GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
A második egyenletb®l a b konstans kifejezhet®, a
P
1-re gyeljünk:
X Yi − a Xi , P P Yi − a Xi b= , N b = Y − aX.
bN =
X
Ez az eredmény jelzi, hogy az egyenes átmegy a súlyponton. Ezt helyettesítsük be a fels® egyenletbe:
X X X Xi + aX Xi = 0, Yi Xi − a Xi2 − Y X X X X a X Xi − Xi2 = Y Xi − Yi Xi , P P Y Xi − Yi Xi . a= P P X Xi − Xi2
X
Ezek után illesszünk az el®z® gyakorlaton megadott Sz¶rések száma-Tüd®asztmások száma feladat pontjaira egy egyenest.
1.1.
Els® Feladat
Az el®z® gyakorlaton a Tüd®asztma (X ) - Sz¶rések száma(Y ) adatoknak a korrelációs együtthatóját számítottuk ki. Illesszük rá a pontokra a közelít® egyenest.
Megoldás:
• Számoljuk ki az egyes átalgértékeket X és Y . Ezeket célszer¶ az egyes oszlopok alján elhelyezni. • Majd minden összegnek hozzunk létre új oszlopot: Xi (már létezik), Yi · Xi és Xi2 értékeket. • Számoljuk ki a szummákat az egyes oszlopk aljára. • Végül a képleteket felhasználva számoljuk ki az egyenes paramétereit. Értelemszer¶en az a paramétert tudjuk el®ször kiszámolni és utána a b-t. • Az eredményt könnyen tudjuk ellen®rizni az Excel segítségével. Ehhez el®ször ábrázoljuk a pontjainkat egy diagrammban. A szokásos PontXY típust használjuk. Ha ez kész van akkor jelöljük ki a pontokat majd:
Jobb gomb, Trendvonal felvétele, Típus fülön: ∗ Lineáris (ez alapértelmezett).
Egyebek fülön:
∗ Egyenlet látszik a diagrammon kipipálni, ∗ R-négyzet értéke látszik a diagrammon kipipálni. Görbe illesztéshez az Excel-ben jelöljük ki azt a ponthalmazt amire illeszteni szeretnénk, majd a jobb gomb hatására lenyíló menüben válasszuk a Trendvonal felvétele menüpontot. A Töd®asztma-Dohányfogyasztás részt mindenki próbálja meg saját maga megcsinálni. 2
1.2
Második Feladat (Determinációs 1 GÖRBE ILLESZTÉS együttható)A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
1.1.1. Az Excel görbe illesztési lehet®ségei Az el®z® példa kapcsán megtanultuk, hogyan lehet Excel-ben ponthalmazra görbét illeszteni. Most röviden nézzük át milyen lehet®ségeink vannak: Lineáris =⇒ y = a · x + b, Logaritmikus =⇒ y = a · ln(x) + b, Polinomiális =⇒ y = a · xn + b · xn−1 + . . . , (A fokszám maximuma 6) Hatvány =⇒ y = a · xb , Exponenciális =⇒ y = a · ebx ,
1.2.
Második Feladat (Determinációs együttható)
Most vizsgáljunk meg egy olyan esetet, ahol a függvényillesztést nem lehet excel segítségével elvégezni. Ebben az esetben az illesztés "jóságát" nem tudjuk excel determinációs együtthatójával és/vagy a korrelációs együtthatóval megvizsgálni, hanem a determinációs együtthatót magunknak kell számolni:
E1 − E2 , E1 X X (yi − yˆi )2 , E1 = (yi − y)2 , E2 = R2 =
ahol yˆi = f (xi ) a illesztett függvény helyettesítési értéke az xi helyen. Az illesztés akkor "jó", ha R2 értéke közel van 1-hez. A második feladatban adott pontokra egy ya = ax és egy yb = bx2 alakú függvényt kell illeszteni és a determinációs együttható segítségével eldönteni, hogy melyik illesztés a jobb.
Megoldás: • Els® lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Így ránézésre már lesz képünk az eredményr®l. • Vezessük le az a és b képletét a LN módszerével. A levezetést mell®zve a képletek: P P 2 xi yi x yi a = P 2 , b = P i4 . xi xi • Hozzunk létre külön oszlopokat az összes szummának, azaz, az xi yi , x2i , x2i yi és x4i -nek. Az oszlopok végére számoljuk ki az összegeket. • Számoljuk ki az a és b együtthatókat tetsz®leges helyekre. • Miel®tt továbbmegyünk a determinációs együttható számítására, számoljuk ki a yˆ értékeket két újabb oszlopba (yˆa , yˆb ). • Az így kapott függvény értékeket is ábrázoljuk a diagramban. Gyakoroljuk az újabb görbék hozzáadását már meglév® diagramhoz (Adatok kijelölése, Hozzáadás, ...). A kapott görbéket formázzuk meg, kijelölés után: adatsor formázása. A jelöl®ket tüntessük el (Jelöl® beállításai), a vonal legyen folytonos és különböz® szín¶ (Vonal színe). 3
1.3
Harmadik feladat (Polinomok 1 GÖRBEillesztése) ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
• Most már ránézésre is biztosan el tudjuk dönteni, hogy melyik illesztés a jobb, de hogy számszer¶sítsük a dolgot számoljuk most már ki a determinációs együtthatót. Ehhez számoljuk ki az E1 a, E2 a, E1 b és E2 b értékeket további négy oszlopba. (Az E1 a és E1 b gyakorlatilag ugyanaz!) • Számoljuk ki és hasonlítsuk össze a determinációs együtthatókat, Ra2 és Rb2 értékeket. • A feladatot az a esetben le is tudjuk ellen®rizni. Illesszünk trendvonalat a mérési pontokra (Jobb gomb, Trendvonal felvétele, Metszéspont: 0, 0, Egyenlet látszik, R2 látszik.)
1.3.
Harmadik feladat (Polinomok illesztése)
El®adáson szó volt arról, hogy a gyakorlatban legtöbbször valamilyen polinomot illesztünk a pontjainkra. Ha ilyen feladatot szeretnénk megcsinálni az egyik legkézenfekv®bb kérdés, hogy milyen fokszámú polinomot illesszünk a pontjainkra. Lássunk most egy olyan példát ahol a pontokra tipikusan valamilyen polinom illeszthet®.
Megoldás: • Els® lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Fontos, hogy a Bruttó hazai termék függvényében ábrázoljuk az Elítéltek számát. • Ezután tetsz®leges helyre hozzunk létere egy táblázatot az alábbi formában: N
R2
1 2 3 4 5 6 Az N jelenti az illeszteni kívánt polinom fokszámát, R2 pedig az Excel által kiszámolt determinációs együtthatót. Megjegyzés: Az egyes fokszám az egyenest jelenti, tehát el®ször nem polinomot, hanem egyenest kell illeszteni, és ennek az R2 -ét kell az N=1-hez beírni!!
• Az el®z® feladatban ismertetett módon illesszünk különböz® fokszámú polinomokat a pontjainkra, és töltsük ki a táblázatunkat. A maximálisan illeszthet® polinom fokszám 6. • Végül ábrázoljuk az R2 -et a polinom fokszám (N) függvényében. És döntsük el melyik fokszámot érdemes alkalmazni.
1.4.
Negyedik feladat (Wald módszer)
Ebben a feladatban a Wald módszert fogjuk alkalmazni egy olyan adatsorra, ahol az adatok valamelyik változó szerint határozottan szétválnak és két különálló csoportot alkotnak. Az adatsor Ausztráliában él® nyúl (X ) és róka Y populációt mutatja. Nézzük meg, hogy van-e lineáris kapcsolat 4
1.5
Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
az állatok mennyisége között. Ha van akkor a Wald módszer segítségével illesszünk egyenest az adatokra.
Megoldás: • Számoljuk ki a korrelációs együttható négyzetét a beépített KORREL függvénnyel. Látható, hogy az adatok között van lineáris kapcsolat. (A28:="R2"; B28:=KORREL...) • Mivel a Wald módszernél két különálló halmazra kell bontanunk az adatsor, el®ször ábrázoljuk az adatokat pontXY diagramban. Látható, hogy az adatok az X változó szerint válnak szét természetszer¶leg. A határt vehetjük a kb 200000-es értéknél. Ami ennél kisebb az az 1-es, ami nagyobb az a 2-es csoportba fog tartozni. (A28:="Elválaszt"; B28:=200000) • Csináljuk meg a szétválasztást. Hozzunk létre plusz négy oszlopot a két halmaz adatainak (X1, Y 1, X2 és Y 2). A szétválasztást a HA függvény segítségével végezzük el úgy, hogy mind az X és az Y változóra alkalmazható legyen. 1-es blokk: C2:=HA($A2<$B$29;A2;"") végighúzni a C2:D25-ös tartományon. 2-es blokk: E2:=HA($A2>$B$29;A2;"") végighúzni a E2:F25-ös tartományon. • Számoljuk ki az oszlopok aljára az átlagokat. • Az átlagok segítségével az Y = aX + b alakú egyenes együtthatói: Y¯2 − Y¯1 a= ¯ ¯1 , X2 − X
¯1 b = Y¯1 − aX
vagy
¯2. b = Y¯2 − aX
• Az illesztett függvény ábrázolásához egy új oszlopban számoljuk az illesztett függvény értékeket az Xi helyeken, azaz, Fi = aXi + b. A meglév® diagramhoz adjuk hozzá az Fi − Xi függvényt. A jelöl®ket tüntessük el, a vonal legyen folytonos és mondjuk piros. • Illesszünk a pontokra lineáris trendvonalat és hasonlítsuk össze a kapott eredményekkel. Az egyenlet és az R2 látszódjon a diagramon. Látható, hogy a két egyenes kissé eltér egymástól.
1.5.
Ötödik feladat - LNM
A letöltött táblázat utolsó munkalapján megtaláljuk a kiindulási adatokat. A pontok egy dugattyús szivattyú dugattyújának pozícióját mutatják. A pozíció id®beli változását általánosan a következ® függvény írja le: x (t) = a sin (ωt + φ) + b A hajtó motor fordulatszáma ismert (n = 102 fordulat/perc), amib®l az ω szögsebesség számolható (ω = 2πn/60 = 10.68 rad/s). Továbbá azt is tudjuk, hogy a mintavétel kezdetén az alsó holtponton állt a dugattyú, így φ = 0 is feltételezhet®. Ezekkel a leíró függvény:
x (t) = a sin (10,68 · t) + b
Feladat: Határozzuk meg a lökethosszt (a) illetve a pozíció középértékét (b). Megoldás: Els® lépésként ábrázoljuk a pontjainkat diagramban (Id®-Pozíció). Majd ezután alkalmazzuk a legkisebb négyzetek módszerét:
xi = a · sin (10,68 · ti ) + b, 5
1.5
Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
ei = a · sin (10,68 · ti ) + b − xi , F =
X (a · sin (10,68 · ti ) + b − xi )2 ,
X ∂F =2 (a · sin (10,68 · ti ) + b − xi )(sin (10,68 · ti )) = 0 ∂a X ∂F =2 (a · sin (10,68 · ti ) + b − xi )(1) = 0, ∂b Elvégezve az egyszer¶sítéseket: X X X a sin2 (10,68 · ti ) + b sin (10,68 · ti ) = xi sin (10,68 · ti ) X X a sin (10,68 · ti ) + b · n = xi Az egyenletrendszer megoldására a manuális út: 1. második egyenletb®l kifejezzük b-t, 2. azt visszahelyettesítjük az els® egyenletbe, 3. azt megoldjuk a-ra, 4. a kapott a értéket visszahelyettesítjük b-be Vagy, használhatjuk az Excel-t is az egyenletrendszer megoldására: 1. összerakjuk a lineáris egyenletrendszer mátrixát és jobboldali vektorát: c1 c2 a d1 · = c3 c4 b d2
P 2 P P Most P c1 = sin (10,68 · ti ), c2 = c3 = sin (10,68 · ti ), c4 = n, d1 = xi · sin (10,68 · ti ) és d2 = xi . Tegyük pl a C mátrix értékeit K11:L12 cellákba és a d vektor értékeit a P11:P12 cellákba; ehhez pár új oszlopot ki kell számolni (sin (10,68 · ti ), sin2 (10,68 · ti ), xi ·sin (10,68 · ti )) 2. excel-el invertáljuk a mátrixot
• jelöljük ki a K15:L16 cellákat • írjuk be: =INVERZ.MÁTRIX(K11:L12) • nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 3. számoljuk ki a megoldást:
a b
= C −1 · d
• jelöljük ki P15:P16 a cellákat • írjuk be: =MSZORZAT(K15:L16;P11:P12) • nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 6
1.5
Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL
• címkézzük a cellákat. Ellen®rzés végett számoljuk ki pár helyen a függvényértékünket és ábrázoljuk ugyanabban a diagramban ahol a mérési pontokat:
• Hozzunk létre valahol két oszlopot az alábbi formában: t
x
0 0,02 0,04 0,06
... 2 Írjunk az t oszlop els® két sorbába 0-át és 0, 02-ot, majd húzzuk le egészen 2-ig. Ezekben a pontokban szeretnénk kiszámolni az illesztett görbe értékeit. Az x oszlop els® sorába számoljuk ki az a · sin (10,68 · t) + b értéket. Az a és b értékeit tartalmazó cellákat xáljuk le. Ezután a cellát húzzuk le az oszlop aljáig.
• Ábrázoljuk az összetartozó t-x értékpárokat a mérési pontok diagramjában:
Jelöljük ki a mérési pontokat, Jobb gomb, Forrásadat, Adatsorok fülön Hozzáadás Adjuk meg az ábrázolni kívánt pontokat.
• Formázzuk meg a pontsorunkat:
Jelöljük ki az új pontokat, Jobb gomb, Adatsorok formázása, A Mintázat fülön állítsuk be jelölöket összeköt® vonalat feketére, és kapcsoljuk ki a jelöl®ket. A vonalvastagság tetsz®leges lehet.
Látható hogy a saját magunk által illesztett görbe viszonylag jól közelíti a mérési pontokat.
7