1. Görbe illesztés a legkisebb négyzetek módszerével

1

1.

GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL

Görbe illesztés a legkisebb négyzetek módszerével

Az el®z® gyakorlaton megismerkedtünk a korrelációs együttható fogalmával és számítási módjával. A korrelációs együttható számszer¶ információt ad arra, hogy két változó közötti kapcsolat mennyire lineáris. Viszont pusztán a korrelációs együttható ismerete nem ad választ arra a kérdésre, hogyan húzzuk be a közelít® egyenest a pontjaink közé. Csupán arra ad információt, hogy ez az egyenes mennyire jól írja le a kapcsolatot. A megoldás a regresszió, vagyis görbeillesztés. A görbe illesztésére több módszer is létezi pl: Kiválasztott pontok módszere, Közepek módszere, Legkisebb négyzetek (LN) módszere, Wald módszer. Most egyenl®re a legkisebb négyzetek módszerével foglalkozunk, de a gyakorlat végén a Wald módszerre is csinálunk példát. A LN módszere nem csak lineáris illesztésre jó, de el®ször csak erre csináljuk meg mert így lesz kerek egész a korrelációs együtthatóval. Egy Y = aX +b alakú egyenest szeretnénk illeszteni az (Xi , Yi ) mérési eredményeinkre. Cél az a és b paraméterek meghatározása. A módszer lényege az illesztett egyenes és a pontok közötti távolságok összegének minimalizálása. El®ször nézzük meg, hogy egy adott Xi helyen mi a mért Yi értéke és az illesztett egyenes Xi helyen felvett aXi + b értéke közötti távolság:

ei = Yi − aXi − b. ei az elemi hiba. Ezeket a hibákat minden pontban négyzetre emelve és összegezve kapjuk az összes négyzetes hibát, amit F -el jelölünk: F (a, b) =

X (Yi − aXi − b)2 .

Vegyük észre, hogy F csak a-nak és b-nek a függvénye. Az összes hiba összege akkor lesz minimális, ha F minimális. Ezt a minimumhelyet a és b szerinti parciális deriválással kaphatjuk meg:

X ∂F =2 (Yi − aXi − b)(−Xi ) = 0, ∂a X ∂F =2 (Yi − aXi − b)(−1) = 0. ∂b Egyszer¶sítünk 2-vel és a negatív el®jelekkel, és felbontjuk a zárójelet:

X

X X Yi Xi − a Xi2 − b Xi = 0, X X X Yi − a Xi − b 1 = 0.

Ez egy 2 egyenletb®l álló lineáris egyenletrendszer. Ezt kell megoldani a-ra és b-re.

1

1.1

Els® Feladat

1

GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL

A második egyenletb®l a b konstans kifejezhet®, a

P

1-re gyeljünk:

X Yi − a Xi , P P Yi − a Xi b= , N b = Y − aX.

bN =

X

Ez az eredmény jelzi, hogy az egyenes átmegy a súlyponton. Ezt helyettesítsük be a fels® egyenletbe:

X X X Xi + aX Xi = 0, Yi Xi − a Xi2 − Y X X X X a X Xi − Xi2 = Y Xi − Yi Xi , P P Y Xi − Yi Xi . a= P P X Xi − Xi2

X

Ezek után illesszünk az el®z® gyakorlaton megadott Sz¶rések száma-Tüd®asztmások száma feladat pontjaira egy egyenest.

1.1.

Els® Feladat

Az el®z® gyakorlaton a Tüd®asztma (X ) - Sz¶rések száma(Y ) adatoknak a korrelációs együtthatóját számítottuk ki. Illesszük rá a pontokra a közelít® egyenest.

Megoldás:

• Számoljuk ki az egyes átalgértékeket X és Y . Ezeket célszer¶ az egyes oszlopok alján elhelyezni. • Majd minden összegnek hozzunk létre új oszlopot: Xi (már létezik), Yi · Xi és Xi2 értékeket. • Számoljuk ki a szummákat az egyes oszlopk aljára. • Végül a képleteket felhasználva számoljuk ki az egyenes paramétereit. Értelemszer¶en az a paramétert tudjuk el®ször kiszámolni és utána a b-t. • Az eredményt könnyen tudjuk ellen®rizni az Excel segítségével. Ehhez el®ször ábrázoljuk a pontjainkat egy diagrammban. A szokásos PontXY típust használjuk. Ha ez kész van akkor jelöljük ki a pontokat majd:

Jobb gomb, Trendvonal felvétele, Típus fülön: ∗ Lineáris (ez alapértelmezett).

Egyebek fülön:

∗ Egyenlet látszik a diagrammon kipipálni, ∗ R-négyzet értéke látszik a diagrammon kipipálni. Görbe illesztéshez az Excel-ben jelöljük ki azt a ponthalmazt amire illeszteni szeretnénk, majd a jobb gomb hatására lenyíló menüben válasszuk a Trendvonal felvétele menüpontot. A Töd®asztma-Dohányfogyasztás részt mindenki próbálja meg saját maga megcsinálni. 2

1.2

Második Feladat (Determinációs 1 GÖRBE ILLESZTÉS együttható)A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL

1.1.1. Az Excel görbe illesztési lehet®ségei Az el®z® példa kapcsán megtanultuk, hogyan lehet Excel-ben ponthalmazra görbét illeszteni. Most röviden nézzük át milyen lehet®ségeink vannak: Lineáris =⇒ y = a · x + b, Logaritmikus =⇒ y = a · ln(x) + b, Polinomiális =⇒ y = a · xn + b · xn−1 + . . . , (A fokszám maximuma 6) Hatvány =⇒ y = a · xb , Exponenciális =⇒ y = a · ebx ,

1.2.

Második Feladat (Determinációs együttható)

Most vizsgáljunk meg egy olyan esetet, ahol a függvényillesztést nem lehet excel segítségével elvégezni. Ebben az esetben az illesztés "jóságát" nem tudjuk excel determinációs együtthatójával és/vagy a korrelációs együtthatóval megvizsgálni, hanem a determinációs együtthatót magunknak kell számolni:

E1 − E2 , E1 X X (yi − yî )2 , E1 = (yi − y)2 , E2 = R2 =

ahol yî = f (xi ) a illesztett függvény helyettesítési értéke az xi helyen. Az illesztés akkor "jó", ha R2 értéke közel van 1-hez. A második feladatban adott pontokra egy ya = ax és egy yb = bx2 alakú függvényt kell illeszteni és a determinációs együttható segítségével eldönteni, hogy melyik illesztés a jobb.

Megoldás: • Els® lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Így ránézésre már lesz képünk az eredményr®l. • Vezessük le az a és b képletét a LN módszerével. A levezetést mell®zve a képletek: P P 2 xi yi x yi a = P 2 , b = P i4 . xi xi • Hozzunk létre külön oszlopokat az összes szummának, azaz, az xi yi , x2i , x2i yi és x4i -nek. Az oszlopok végére számoljuk ki az összegeket. • Számoljuk ki az a és b együtthatókat tetsz®leges helyekre. • Miel®tt továbbmegyünk a determinációs együttható számítására, számoljuk ki a yˆ értékeket két újabb oszlopba (yâ , yˆb ). • Az így kapott függvény értékeket is ábrázoljuk a diagramban. Gyakoroljuk az újabb görbék hozzáadását már meglév® diagramhoz (Adatok kijelölése, Hozzáadás, ...). A kapott görbéket formázzuk meg, kijelölés után: adatsor formázása. A jelöl®ket tüntessük el (Jelöl® beállításai), a vonal legyen folytonos és különböz® szín¶ (Vonal színe). 3

1.3

Harmadik feladat (Polinomok 1 GÖRBEillesztése) ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL

• Most már ránézésre is biztosan el tudjuk dönteni, hogy melyik illesztés a jobb, de hogy számszer¶sítsük a dolgot számoljuk most már ki a determinációs együtthatót. Ehhez számoljuk ki az E1 a, E2 a, E1 b és E2 b értékeket további négy oszlopba. (Az E1 a és E1 b gyakorlatilag ugyanaz!) • Számoljuk ki és hasonlítsuk össze a determinációs együtthatókat, Ra2 és Rb2 értékeket. • A feladatot az a esetben le is tudjuk ellen®rizni. Illesszünk trendvonalat a mérési pontokra (Jobb gomb, Trendvonal felvétele, Metszéspont: 0, 0, Egyenlet látszik, R2 látszik.)

1.3.

Harmadik feladat (Polinomok illesztése)

El®adáson szó volt arról, hogy a gyakorlatban legtöbbször valamilyen polinomot illesztünk a pontjainkra. Ha ilyen feladatot szeretnénk megcsinálni az egyik legkézenfekv®bb kérdés, hogy milyen fokszámú polinomot illesszünk a pontjainkra. Lássunk most egy olyan példát ahol a pontokra tipikusan valamilyen polinom illeszthet®.

Megoldás: • Els® lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Fontos, hogy a Bruttó hazai termék függvényében ábrázoljuk az Elítéltek számát. • Ezután tetsz®leges helyre hozzunk létere egy táblázatot az alábbi formában: N

R2

1 2 3 4 5 6 Az N jelenti az illeszteni kívánt polinom fokszámát, R2 pedig az Excel által kiszámolt determinációs együtthatót. Megjegyzés: Az egyes fokszám az egyenest jelenti, tehát el®ször nem polinomot, hanem egyenest kell illeszteni, és ennek az R2 -ét kell az N=1-hez beírni!!

• Az el®z® feladatban ismertetett módon illesszünk különböz® fokszámú polinomokat a pontjainkra, és töltsük ki a táblázatunkat. A maximálisan illeszthet® polinom fokszám 6. • Végül ábrázoljuk az R2 -et a polinom fokszám (N) függvényében. És döntsük el melyik fokszámot érdemes alkalmazni.

1.4.

Negyedik feladat (Wald módszer)

Ebben a feladatban a Wald módszert fogjuk alkalmazni egy olyan adatsorra, ahol az adatok valamelyik változó szerint határozottan szétválnak és két különálló csoportot alkotnak. Az adatsor Ausztráliában él® nyúl (X ) és róka Y populációt mutatja. Nézzük meg, hogy van-e lineáris kapcsolat 4

1.5

Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL

az állatok mennyisége között. Ha van akkor a Wald módszer segítségével illesszünk egyenest az adatokra.

Megoldás: • Számoljuk ki a korrelációs együttható négyzetét a beépített KORREL függvénnyel. Látható, hogy az adatok között van lineáris kapcsolat. (A28:="R2"; B28:=KORREL...) • Mivel a Wald módszernél két különálló halmazra kell bontanunk az adatsor, el®ször ábrázoljuk az adatokat pontXY diagramban. Látható, hogy az adatok az X változó szerint válnak szét természetszer¶leg. A határt vehetjük a kb 200000-es értéknél. Ami ennél kisebb az az 1-es, ami nagyobb az a 2-es csoportba fog tartozni. (A28:="Elválaszt"; B28:=200000) • Csináljuk meg a szétválasztást. Hozzunk létre plusz négy oszlopot a két halmaz adatainak (X1, Y 1, X2 és Y 2). A szétválasztást a HA függvény segítségével végezzük el úgy, hogy mind az X és az Y változóra alkalmazható legyen. 1-es blokk: C2:=HA($A2<$B$29;A2;"") végighúzni a C2:D25-ös tartományon. 2-es blokk: E2:=HA($A2>$B$29;A2;"") végighúzni a E2:F25-ös tartományon. • Számoljuk ki az oszlopok aljára az átlagokat. • Az átlagok segítségével az Y = aX + b alakú egyenes együtthatói: Y¯2 − Y¯1 a= ¯ ¯1 , X2 − X

¯1 b = Y¯1 − aX

vagy

¯2. b = Y¯2 − aX

• Az illesztett függvény ábrázolásához egy új oszlopban számoljuk az illesztett függvény értékeket az Xi helyeken, azaz, Fi = aXi + b. A meglév® diagramhoz adjuk hozzá az Fi − Xi függvényt. A jelöl®ket tüntessük el, a vonal legyen folytonos és mondjuk piros. • Illesszünk a pontokra lineáris trendvonalat és hasonlítsuk össze a kapott eredményekkel. Az egyenlet és az R2 látszódjon a diagramon. Látható, hogy a két egyenes kissé eltér egymástól.

1.5.

Ötödik feladat - LNM

A letöltött táblázat utolsó munkalapján megtaláljuk a kiindulási adatokat. A pontok egy dugattyús szivattyú dugattyújának pozícióját mutatják. A pozíció id®beli változását általánosan a következ® függvény írja le: x (t) = a sin (ωt + φ) + b A hajtó motor fordulatszáma ismert (n = 102 fordulat/perc), amib®l az ω szögsebesség számolható (ω = 2πn/60 = 10.68 rad/s). Továbbá azt is tudjuk, hogy a mintavétel kezdetén az alsó holtponton állt a dugattyú, így φ = 0 is feltételezhet®. Ezekkel a leíró függvény:

x (t) = a sin (10,68 · t) + b

Feladat: Határozzuk meg a lökethosszt (a) illetve a pozíció középértékét (b). Megoldás: Els® lépésként ábrázoljuk a pontjainkat diagramban (Id®-Pozíció). Majd ezután alkalmazzuk a legkisebb négyzetek módszerét:

xi = a · sin (10,68 · ti ) + b, 5

1.5


ei = a · sin (10,68 · ti ) + b − xi , F =

X (a · sin (10,68 · ti ) + b − xi )2 ,

X ∂F =2 (a · sin (10,68 · ti ) + b − xi )(sin (10,68 · ti )) = 0 ∂a X ∂F =2 (a · sin (10,68 · ti ) + b − xi )(1) = 0, ∂b Elvégezve az egyszer¶sítéseket: X X X a sin2 (10,68 · ti ) + b sin (10,68 · ti ) = xi sin (10,68 · ti ) X X a sin (10,68 · ti ) + b · n = xi Az egyenletrendszer megoldására a manuális út: 1. második egyenletb®l kifejezzük b-t, 2. azt visszahelyettesítjük az els® egyenletbe, 3. azt megoldjuk a-ra, 4. a kapott a értéket visszahelyettesítjük b-be Vagy, használhatjuk az Excel-t is az egyenletrendszer megoldására: 1. összerakjuk a lineáris egyenletrendszer mátrixát és jobboldali vektorát: c1 c2 a d1 · = c3 c4 b d2

P 2 P P Most P c1 = sin (10,68 · ti ), c2 = c3 = sin (10,68 · ti ), c4 = n, d1 = xi · sin (10,68 · ti ) és d2 = xi . Tegyük pl a C mátrix értékeit K11:L12 cellákba és a d vektor értékeit a P11:P12 cellákba; ehhez pár új oszlopot ki kell számolni (sin (10,68 · ti ), sin2 (10,68 · ti ), xi ·sin (10,68 · ti )) 2. excel-el invertáljuk a mátrixot

• jelöljük ki a K15:L16 cellákat • írjuk be: =INVERZ.MÁTRIX(K11:L12) • nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 3. számoljuk ki a megoldást:

a b

= C −1 · d

• jelöljük ki P15:P16 a cellákat • írjuk be: =MSZORZAT(K15:L16;P11:P12) • nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 6

1.5


• címkézzük a cellákat. Ellen®rzés végett számoljuk ki pár helyen a függvényértékünket és ábrázoljuk ugyanabban a diagramban ahol a mérési pontokat:

• Hozzunk létre valahol két oszlopot az alábbi formában: t

x

0 0,02 0,04 0,06

... 2 Írjunk az t oszlop els® két sorbába 0-át és 0, 02-ot, majd húzzuk le egészen 2-ig. Ezekben a pontokban szeretnénk kiszámolni az illesztett görbe értékeit. Az x oszlop els® sorába számoljuk ki az a · sin (10,68 · t) + b értéket. Az a és b értékeit tartalmazó cellákat xáljuk le. Ezután a cellát húzzuk le az oszlop aljáig.

• Ábrázoljuk az összetartozó t-x értékpárokat a mérési pontok diagramjában:

Jelöljük ki a mérési pontokat, Jobb gomb, Forrásadat, Adatsorok fülön Hozzáadás Adjuk meg az ábrázolni kívánt pontokat.

• Formázzuk meg a pontsorunkat:

Jelöljük ki az új pontokat, Jobb gomb, Adatsorok formázása, A Mintázat fülön állítsuk be jelölöket összeköt® vonalat feketére, és kapcsoljuk ki a jelöl®ket. A vonalvastagság tetsz®leges lehet.

Látható hogy a saját magunk által illesztett görbe viszonylag jól közelíti a mérési pontokat.

7

1. Görbe illesztés a legkisebb négyzetek módszerével

Recommend Documents