Mintavé Mintavétel fogalmai
STATISZTIKA MTB60057 2. Elő Előadá adás Elő Előadó adó: Dr. Huzsvai Lá László szló egyetemi docens
A mintavé mintavételt meg kell tervezni A sokasá sokaság elemei: X1, X2…XN…, lehet véges és vé végtelen Mintaelemek: x1, x2…xn, mindig vé véges Véletlen minta = a minta elemek vé véletlen kivá kiválasztá lasztása Kivá Kiválasztá lasztási ará arány :
n N
Mintavé Mintavételi hiba Abbó Abból adó adódik, hogy nem a teljes sokasá sokaságot figyeljü figyeljük meg. A sokasá sokaság heterogé heterogén.
Statisztikai adatgyű adatgyűjté jtés Részleges adatfelvétel
Kísérletek (ellenőrzött)
Véletlen mintavétel
Véletlen mintavé mintavétel 1. Homogé Homogén sokasá sokaság eseté esetén FAE: fü független azonos eloszlá eloszlású minta EV: egyszerű egyszerű véletlen minta
2. Heterogé Heterogén sokasá sokaság eseté esetén R: ré rétegzett mintavé mintavétel Cs: Cs: csoportos (egylé (egylépcső pcsős) mintavé mintavétel TL: tö többlé bblépcső pcsős mintavé mintavétel
Teljes körű (cenzus)
Reprezentatív megfigyelés
Nem véletlen mintavétel
Nem vé véletlenen alapuló alapuló kivá kiválasztá lasztás 1. 2. 3. 4. 5. 6.
Szisztematikus Kvó Kvótás Hólabda Koncentrá Koncentrált Önké nkényes Egyé Egyéb
1
A kí kísérlet tulajdonsá tulajdonságai 1. Jó kísérlet Kezelé Kezeléshatá shatások Véletlen hiba
2. Rossz kí kísérlet
Reprezentatí Reprezentatív minta tulajdonsá tulajdonságai 1. Tükrö krözi az alapsokasá alapsokaság jellemző jellemzőit (lehet általá ltalánosí nosítani) 2. Csak a mintavé mintavételi hibá hibát tartalmazza 3. Meghatá Meghatározható rozható a mintavé mintavételi hiba nagysá nagysága
Kezelé Kezeléshatá shatások Szisztematikus hiba Véletlen hiba
NEM reprezentatí reprezentatív minta tulajdonsá tulajdonságai 1. Nem lehet belő belőle általá ltalánosí nosítani 2. A mintavé mintavételi hiba mellett szisztematikus hibá hibát is tartalmaz 3. A levont kö következteté vetkeztetések kizá kizárólag a megfigyelt egyedekre vonatkoznak
Véletlen minta elő előállí llítása 1. 2. 3. 4. 5.
Véletlen szá szám generá generátor Pszeudó Pszeudó véletlen szá szám generá generátor Rnd() Rnd() fü függvé ggvény Excel Vé Vél() fü függvé ggvénye 0 ≤ x <1 VÉL()*(b L()*(b-a)+a
Véletlen mintavé mintavétel, szisztematikus hiba 1.Minden 1.Minden elem egymá egymástó stól fü függetlenü ggetlenül és azonos való valószí színűséggel kerü kerül a mintá mintába (vé (véletlen szá számok) 2.El őnye: a belő 2.Elő belőle szá származtatott statisztikai mutató mutatók csak a vé véletlen elté eltérést mutatjá mutatják az alapsokasá alapsokaság mutató mutatójához ké képest 3.Szelekci ó szisztematikus hiba 3.Szelekció 4.Reprezentativit ás 4.Reprezentativitá
Statisztikai becslé becslés 1. Valamely paramé paraméter ismeretlen (felté (feltételezett) té tényleges érté rtékének közelí zelítő megadá megadása egy statisztikai függvé ggvénnyel. Elvileg bá bármelyik statisztikai fü függvé ggvény tekinthető tekinthető becslé becslésnek, való valójában csak azokat haszná használjuk, amelyeknek megvannak a jó becslé becslés legfontosabb tulajdonsá tulajdonságai
2
A jó jó becslé becslés krité kritériumai 1. Torzí Torzítatlansá tatlanság (vá (várható rható érté rték) 2. Pontossá Pontosság (szó (szórás) 3. Konzisztencia
n → ∞, paraméter → igazi érték
Torzí Torzítatlan és konzisztens becslé becslés 1. Olyan becslé becslés, amelynek vá várható rható érté rtéke az igazi paramé paraméter (torzí (torzítatlan) 2. Olyan becslé becslés, amely a minta n elemszá elemszámának nö növekedé vekedésével (n (n → ∞) a paramé é ter igazi é rté é k é hez konvergá param rt konvergál sztochasztikusan (erő (erős konzisztencia eseté esetén 1 való valószí színűséggel)
Pontos és torzí torzítatlan becslé becslés
Pontos és torzí torzított becslé becslés
Pontatlan és torzí torzítatlan becslé becslés
Pontatlan és torzí torzított becslé becslés
3
Mi az adatbá adatbázis
Adatbá Adatbázis tervezé tervezés
1. Egy té témakö makör vagy cé cél kö köré csoportosuló csoportosuló informá információ ció. 2. Jó tervezé tervezés = haté hatékony adattá adattárolá rolás és kinyeré kinyerés 3. Célorientá lorientált adatbá adatbázisok
1. Milyen informá információ ciót akarunk kinyerni? 2. Milyen elkü elkülönülő tématerü materületeken kell tárolni az adatokat? 3. Hogyan kapcsoló kapcsolódnak ezek egymá egymáshoz? 4. Az egyes terü területeken belü belül milyen adatokat kell tá tárolni?
Mi az adat? 1. Minden informá információ ció, amit tá tárolni kell. − − − − −
szá szám szö szöveg dátum hang kép, stb.
A mé mérté rtékegysé kegységek tö többszö bbszörösei 1. kilokilo-
k
103
2. megamega-
M
106
3. gigagiga-
G
109
4. teratera-
T
1012
5. petapeta-
P
1015
6. exaexa-
E
1018 SI (Systém International d’Unités)
Adatbá Adatbázis felé felépítése
Tábla
1.T 1.Tábla (table (table)) Ismé Ismérv, tulajdonsá tulajdonság, vá változó ltozó, Mező Mező (field) Megfigyelé é si egysé é g, szubjektum, Rekord Megfigyel egys (record) record) Oszlop = vá változó ltozó Sor = megfigyelé megfigyelési egysé egység
4
A jó jó adatbá adatbázis (krité (kritériumok) 1. 1. minden mező mezőnek egyedi neve van 2. a mező mezők elemi informá információ ciót tartalmazzanak ID
Év
Hely
A jó jó adatbá adatbázis (krité (kritériumok) 2. 3. nem lehet ké két egyforma sora 4. a sorok és oszlopok sorrendje tetsző tetszőleges
Tömeg Hosszú Hosszúság
ID 1 2 3 4 5
Év
A jó jó adatbá adatbázis (krité (kritériumok) 3. 5. ne tartalmazzon szá származtatott, kiszá kiszámított adatot (redundancia) 6. egy mező mező megvá megváltoztatá ltoztatása nem hathat ki má más mező mezőkre ID 1 2 3 4 5
Év
Nettó Nettó ÁFA
ID Kérdé rdés
1
Hol?
Hely
Válasz1
Válasz2
Válasz3
Válasz4
Helyes
Itt
Ott
Amott
Emitt
2
Bruttó Bruttó
7. minden szü szüksé kséges adatot tartalmaz 8. van első elsődleges kulcsa Év
Tömeg Hosszú Hosszúság
Rossz adatbá adatbázis
A jó jó adatbá adatbázis (krité (kritériumok) 4.
ID 1 2 3 4 5
Hely
Tömeg Hosszú Hosszúság
Gyakorlat adatbá adatbázisa Év 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000
Régió Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Alföld Dél-Dunántúl Dél-Dunántúl
Árucikk Kenyér Paradicsom Csirkemell Sertéscomb Marhahús Trapista sajt Császár szalonna Szendvics sonka Őrölt kávé Kaliforniai paprika Banán Kenyér Paradicsom
Forgalom (kg/év) 142 088 138 054 26 247 39 867 13 018 13 786 12 872 11 138 195 139 411 2 825 102 441 99 530
Ár Önköltség Terv_Forgalom (Ft/kg) (Ft/kg) (kg/év) 103 124 158 849 183 190 123 771 960 823 25 106 1132 998 41 399 1247 987 13 349 1059 866 12 294 497 491 12 123 817 625 12 273 770 631 167 412 285 135 508 237 190 2 459 138 145 91 610 157 156 107 229
5
Sorba rendezé rendezés 1. Az adatmá adatmátrix sorai csö csökkenő kkenő vagy növekvő vekvő sorrendbe rendezhető rendezhetők. 2. Meg kell hatá határozni az első elsődleges kulcsot, ami szerint a rendezé rendezés törté rténjen 3. Egymá Egymásba ágyazott rendezé rendezés: első elsődleges, má másodlagos, harmadlagos stb. kulcs szerint.
Aggregá Aggregálás 1. Valamilyen ismé ismérv, csoportké csoportképző pző változó ltozó vagy vá változó ltozók szerint kü különbö nböző algoritmusok (szá (számítások) szerint tömöríthetjü thetjük az adatokat 2. Algoritmusok: átlag, összeg, szó szórás, stb. 3. Az aggregá aggregált adatok tová további elemzé elemzése
Adatbá Adatbázis bő bővítése 1. Új megfigyelé megfigyelésekkel Felté Feltétel: a ké két adatbá adatbázisban a vá változó ltozók nevei, tí típusa, stb. tö tökéletesen egyezzenek
2. Új vá változó ltozókkal Felté Feltétel: a ké két adatbá adatbázisban legalá legalább egy azonos vá változó ltozó szerepeljen, ami a kulcsvá kulcsváltozó ltozó, kapcsoló kapcsoló mező mező szerepé szerepét tölti be
Szű Szűrés 1. Eseteket vá választhatunk ki az adatbá adatbázisbó zisból. Né Négy lehető lehetőség kö közül választhatunk: Minden eset ré részt vegyen az analí analízisben. Ha valamilyen felté feltétel teljesü teljesül (if (if then) then) Véletlen minta az esetekbő esetekből Kijelö Kijelölhetjü lhetjük az esetek bizonyos tartomá tartományá nyát, az első első és utolsó utolsó eset megjelö megjelölésével Haszná Használhatunk szű szűrő változó ltozót
2. Mi legyen a ki nem vá választott esetek sorsa? Lehet megjelö megjelölni és tö törölni őket az adatbá adatbázisbó zisból.
Transzponá Transzponálás 1. Az adatmá adatmátrix sorainak és oszlopainak felcseré felcserélése, ezzel az esetek és vá változó ltozók szerepei is felcseré felcserélődnek. A ré régi vá változó ltozók nevei a legelső legelső új vá változó ltozó esetei lesznek, a többi új vá változó ltozó neve case_1, case_2, … stb. lesznek. 2. Nagy jelentő jelentősége van a tö többvá bbváltozó ltozós statisztikai eljá eljárásokná soknál az Q és RR-technika alkalmazá alkalmazásakor
Fontosabb statisztikai adatbá adatbázisok Magyar Statisztikai Évkö vkönyv Magyar Statisztikai Zsebkö Zsebkönyv Gazdasá Gazdaságstatisztikai Évkö vkönyv (1990(1990-től) Élelmiszeripari Statisztikai Zsebkö Zsebkönyv Külkereskedelmi Statisztikai Évkö vkönyv Magyarorszá Magyarország Demográ Demográfiai évkö vkönyv Ipari és építőipari statisztikai évkö vkönyv Mező Mezőgazdasá gazdasági statisztikai évkö vkönyv Terü Területi statisztikai évkö vkönyv Nemzetkö Nemzetközi Statisztikai Évkö vkönyv FAO Trade Yearbook FAO Production Yearbook EUROSTAT kiadvá kiadványok
6
Jelentő Jelentősebb kiadvá kiadványok Legfrissebb adatok A KSH gyorsjelenté gyorsjelentések Statisztikai havi kö közlemé zlemények Statisztikai Szemle Gazdasá Gazdaság és Statisztika Terü Területi Statisztika Demográ Demográfia Módszertani Fü Füzetek
ELŐ ELŐADÁ ADÁS Felhaszná Felhasznált forrá forrásai 1. Lothar Sachs.: Statisztikai mó módszerek. Mező Mezőgazdasá gazdasági Kiadó Kiadó, Budapest, 1985. 2. Bará Baráth Cs.Cs.-né. - Ittzé Ittzés A. - Ugró Ugrósdy Gy.: Gy.: 1996. Biometria: Biometria: mó módszertan és a MINITAB programcsomag alkalmazá alkalmazása. Mező Mezőgazda Kiadó Kiadó, Budapest 3. G.U. Yule – M.G. Kendall: Kendall: Bevezeté Bevezetés a statisztika elmé elméleté letébe. Kö Közgazdasá zgazdasági és Jogi könyvkiadó nyvkiadó, Budapest. 1964. 4. Svá Sváb J.: Biometriai módszerek a kutatá kutatásban. Mező Mezőgazdasá gazdasági Kiadó Kiadó, Budapest, 1973. (má (második, átdolgozott, bő bővített kiadá kiadás)
Merre forog?
7