´ UCEN ˇ ´I TECHNICKE ´ V BRNE ˇ VYSOKE BRNO UNIVERSITY OF TECHNOLOGY
ˇ YRSTV ´ ´I FAKULTA STROJN´IHO INZEN ´ USTAV MATEMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE OF MATHEMATICS
´ VAZBY CHARAKTERISTIKY STATISTICKE DEPENDENCE MEASURES
´ RSK ˇ A ´ PRACE ´ BAKALA BACHELOR’S THESIS ´ AUTOR PRACE AUTHOR
RADEK JANDA
´ VEDOUC´I PRACE SUPERVISOR
doc. RNDr. Jaroslav Mich´alek, CSc.
BRNO 2012
Vysoké učení technické v Brně, Fakulta strojního inženýrství Ústav matematiky Akademický rok: 2011/2012
ZADÁNÍ BAKALÁŘSKÉ PRÁCE student(ka): Radek Janda který/která studuje v bakalářském studijním programu obor: Matematické inženýrství (3901R021) Ředitel ústavu Vám v souladu se zákonem č.111/1998 o vysokých školách a se Studijním a zkušebním řádem VUT v Brně určuje následující téma bakalářské práce: Charakteristiky statistické vazby v anglickém jazyce: Dependence Measures Stručná charakteristika problematiky úkolu: V práci uveďte přehled charakteristik statistické vazby pro různé typy měřených dat. Jednotlivé míry porovnejte na simulovaných datech nebo je použijte ke zpracování reálných datových souborů. Cíle bakalářské práce: Prehled měr statistické vazby pro různé typy měřených dat. Porovnání jednotlivých měr pomocí simulací nebo jejich vlastnosti demonstrovat na zpracování reálných dat.
Seznam odborné literatury: Agresti A.: Categorical Data Analysis. New York. Wiley. 1990 Agresti A.: Analysis of Ordinal Categorical Data. New York. Wiley. 1984 Anděl J.: Statistické metody, MATFYZPRESS, 1993 Časopisecká literatura - česká a anglická podle doporučení školitele
Vedoucí bakalářské práce: doc. RNDr. Jaroslav Michálek, CSc. Termín odevzdání bakalářské práce je stanoven časovým plánem akademického roku 2011/2012. V Brně, dne 19.11.2010 L.S.
_______________________________ prof. RNDr. Josef Šlapal, CSc. Ředitel ústavu
_______________________________ prof. RNDr. Miroslav Doupovec, CSc., dr. h. c. Děkan fakulty
Abstrakt Tato bakal´aˇrsk´a pr´ace se zab´ yv´a charakteristikami statistick´e vazby mezi n´ahodn´ ymi veliˇcinami a jejich praktick´ ym vyuˇzit´ım v pr˚ umyslu. Teoretick´a ˇca´st je zamˇeˇrena na v´ yˇcet a popis statistick´ ych vazeb. D´ale je zde pops´an statistick´ y software Statistica, kter´ y umoˇzn ˇuje ˇradu uveden´ ych charakteristik poˇc´ıtat. Na jednoduch´ ych pˇr´ıkladech je uveden zp˚ usob pouˇzit´ı statistick´ ych vazeb. Praktick´a ˇc´ast se zamˇeˇruje na statistickou anal´ yzu pr˚ umyslov´ ych re´aln´ ych dat s vyuˇzit´ım znalost´ı z teoretick´e ˇc´asti bakal´aˇrsk´e pr´ace.
Abstract This thesis focuses on characteristics of the dependence measures among random quantities, as well as its use in industry. The theoretical part focuses on examples of the characteristics used. Furthermore, the software Statistica is described here, for its possibilities of implementing such characteristics. On simple examples, the use of dependence measures is shown. In the practical part, the thesis focuses on statistical analysis of real industrial data, whilst implementing the theory mentioned above.
kl´ıˇ cov´ a slova Statistick´a data, nomin´aln´ı promˇenn´e, ordin´aln´ı promˇenn´e, kvantitativn´ı promˇenn´e, kvalitativn´ı promˇenn´e, statistick´a vazba, korelace, korelaˇcn´ı koeficient, Statistica.
key words Statistic data, nominal variables, ordinal variables, quantitative variables, qualitative variables, dependence measures, correlation, correlation coefficient, Statistica.
JANDA, R.: Charakteristiky statistick´e vazby, Brno, Vysok´e uˇcen´ı technick´e v Brnˇe, Fakulta strojn´ıho inˇzen´ yrstv´ı, 2012 (33 stran). Vedouc´ı bakal´aˇrsk´e pr´ace doc. RNDr. Jaroslav Mich´alek, CSc.
Prohlaˇsuji, ˇze jsem bakal´aˇrskou pr´aci Charakteristiky statistick´e vazby vypracoval samostatnˇe pod veden´ım doc. RNDr. Jaroslava Mich´alka, CSc. s pouˇzit´ım materi´al˚ u uveden´ ych v seznamu literatury.
Radek Janda
Dˇekuji sv´emu ˇskoliteli doc. RNDr. Jaroslavu Mich´alkovi, CSc. za ˇcetn´e rady a pˇripom´ınky pˇri veden´ı m´e bakal´aˇrsk´e pr´ace. D´ale bych chtˇel podˇekovat TSC Daˇcice, zkuˇsebnˇe spoleˇcnosti TRW, za poskytnut´ı dat ke zpracov´an´ı.
Radek Janda
Obsah ´ 1 Uvod
8
2 Statistick´ a data
9
3 Z´ akladn´ı statistick´ e vazby 3.1 Statistick´e vazby pro dvˇe promˇenn´e 3.1.1 Kvantitativn´ı promˇenn´e . . 3.1.2 Nomin´aln´ı promˇenn´e . . . . 3.1.3 Ordin´aln´ı promˇenn´e . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
11 11 11 13 14
4 Statistick´ y software 16 4.1 Statistica 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 5 Uk´ azka aplikace statistick´ ych vazeb
19
6 Aplikace statistick´ ych vazeb v pr˚ umyslu 6.1 Sezn´amen´ı s technick´ ym prostˇred´ım . . . . . . . . . . . . . . . 6.2 Pnut´ı ve ˇsroubu . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Uveden´ı do probl´emu . . . . . . . . . . . . . . . . . . . 6.2.2 Popis experimentu . . . . . . . . . . . . . . . . . . . . 6.2.3 Zpracov´an´ı dat . . . . . . . . . . . . . . . . . . . . . . 6.2.4 Statistick´e vyhodnocen´ı . . . . . . . . . . . . . . . . . 6.2.5 Technick´e vyhodnocen´ı, jeho vyuˇzit´ı a dalˇs´ı zpracov´an´ı 6.3 Volba volantu a airbagu . . . . . . . . . . . . . . . . . . . . . 6.3.1 Uveden´ı do probl´emu . . . . . . . . . . . . . . . . . . . 6.3.2 Popis experimentu . . . . . . . . . . . . . . . . . . . . 6.3.3 Zpracov´an´ı dat, vyhodnocen´ı v´ ysledku a jeho vyuˇzit´ı . 6.4 S´ıla potˇrebn´a k manipulaci se sloupkem v axi´aln´ım smˇeru . . . 6.4.1 Uveden´ı do probl´emu . . . . . . . . . . . . . . . . . . . 6.4.2 Popis experimentu . . . . . . . . . . . . . . . . . . . . 6.4.3 Zpracov´an´ı dat . . . . . . . . . . . . . . . . . . . . . .
21 21 23 23 24 26 27 27 28 28 28 29 29 29 29 31
7 Z´ avˇ er
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
32
7
1
´ Uvod
S vyuˇzit´ım statistick´ ych anal´ yz se v dneˇsn´ı dobˇe setk´av´ame v kaˇzd´em pr˚ umyslov´em odvˇetv´ı.V t´eto pr´aci se lze bl´ıˇze sezn´amit s tˇemito anal´ yzami a jejich praktick´ ym vyuˇzit´ım. Hlavn´ım c´ılem t´eto pr´ace je charakterizovat statistickou vazbu a pˇredv´est jejich vyuˇzit´ı pˇri zpracov´an´ı re´aln´ ych dat. Tuto pr´aci m˚ uˇzeme rozˇclenit na dvˇe hlavn´ı ˇca´sti, z nichˇz prvn´ı ˇca´st je teoretick´a pˇr´ıprava k ˇc´asti druh´e. Druh´a kapitola se zab´ yv´a statistick´ ymi daty. Vysvˇetluje se zde, co jsou to statistick´a data a jak je z´ısk´av´ame. Hlavn´ım bodem kapitoly je rozdˇelen´ı dat do skupin podle jejich vlastnost´ı. Tˇret´ı kapitola pojedn´av´a o statistick´e vazbˇe, tento pojem je zde vysvˇetlen. Budeme se zde zab´ yvat z´akladn´ımi statistick´ ymi vazbami a jejich ˇclenˇen´ım do skupin v z´avislosti na tom, s jak´ ymi typy dat pracuj´ı. Ve ˇctvrt´e kapitole bude pˇredstaven a pops´an jeden ze statistick´ ych softwar˚ u. V´ ypoˇcet teoretick´ ych pˇr´ıklad˚ u a zpracov´an´ı dat bude proveden pomoc´ı statistick´eho softwaru Statistica. V n´asleduj´ıc´ı, p´at´e, kapitole budou statistick´e vazby aplikov´any na jednoduch´ ych pˇr´ıkladech. Pˇri jejich v´ ypoˇctech bude pouˇzit jiˇz pˇredstaven´ y software Statistica. ˇ a kapitola se bude zab´ Sest´ yvat zpracov´an´ım re´aln´ ych dat. Tato data byla z´ısk´ana z testov´an´ı funkˇcn´ıch ˇca´st´ı ˇr´ıdic´ıho syst´emu automobilu ve zkuˇsebnˇe TSCD v Daˇcic´ıch, jedin´e zkuˇsebnˇe t´eto spoleˇcnosti u n´as. Jedn´a se pˇr´ımo o testy prov´adˇen´e na prototypu, kter´ y bude uveden na trh v nejbliˇzˇs´ı dobˇe. Mˇeˇren´ı, zpracov´an´ı a vyhodnocov´an´ı dat, kter´e jsou pops´any v t´eto bakal´aˇrsk´e pr´aci, byly vyuˇzity ke koneˇcn´e realizaci cel´eho projektu.
8
2
Statistick´ a data
Datov´e soubory, statisticky zpracovateln´e, se poˇrizuj´ı mˇeˇren´ım, pozorov´an´ım nebo jin´ ym zjiˇst’ov´an´ım hodnot sledovan´ ych ukazatel˚ u na vybran´ ych prvc´ıch dan´e mnoˇziny. Tyto prvky naz´ yv´ame statistick´e jednotky, a mnoˇzinu, kterou tvoˇr´ı, a kter´a je pˇredmˇetem naˇseho pozorov´an´ı, naz´ yv´ame statistick´ y soubor. Tento soubor je vymezen z vˇecn´eho, prostorov´eho a ˇcasov´eho hlediska. Ukazatel, kter´ y na prvc´ıch ze statistick´eho souboru mˇeˇr´ıme nebo pozorujeme, se naz´ yv´a statistick´ y znak X. Moˇzn´e hodnoty statistick´eho znaku se naz´ yvaj´ı varianty nebo obmˇeny znaku a tvoˇr´ı mnoˇzinu, kterou oznaˇc´ıme M . Znak X je moˇzn´e charakterizovat jako n´ahodnou veliˇcinu a potom mnoˇzina M je oznaˇcena jako obor hodnot n´ahodn´e veliˇciny X. Podle toho, jak´e m´a tato mnoˇzina M vlastnosti, m˚ uˇzeme jiˇz znaky dˇelit. Pokud je mnoˇzina M koneˇcn´a nebo spoˇcetn´a (jej´ı prvky m˚ uˇzeme uspoˇra´dat do posloupnosti), mluv´ıme o diskr´etn´ım znaku. Pokud je mnoˇzina variant diskr´etn´ıho znaku X koneˇcn´a, pak ji oznaˇc´ıme MX = {x[1] , x[2] , . . . , x[r] }, kde ˇc´ıslo r je poˇcet variant diskr´etn´ıho znaku X. V pˇr´ıpadˇe, ˇze mnoˇzina M je tvoˇrena intervalem, pak statistick´ y znak nazveme spojit´ ym. Jin´e rozdˇelen´ı statistick´ ych znak˚ u dostaneme, budeme-li se zab´ yvat stupnˇem jejich ˇ ıslo n kvantifikace. Vezmˇeme statistick´ y soubor, kter´ y obsahuje n statistick´ ych jednotek. C´ nazveme rozsahem statistick´eho souboru. Hodnoty, oznaˇcen´e x1 , x2 , . . . , xn , jsou hodnoty znaku X zjiˇstˇen´e na jednotliv´ ych statistick´ ych jednotk´ach. Podle obsahov´e kvantifikace hodnot znaku se pak znaky rozdˇeluj´ı do skupin. a) Nomin´ aln´ı znaky Tyto znaky pˇripouˇstˇej´ı mezi hodnotami statistick´ ych znak˚ u x1 , x2 , . . . , xn pouze relaci rovnosti, o dvou variant´ach nomin´aln´ıho znaku m˚ uˇzeme pouze konstatovat, ˇze ˇ ıslo pˇriˇrazen´e variantˇe znaku nereprezentuje skuteˇcnou jsou bud’ stejn´e nebo r˚ uzn´e. C´ hodnotu, ale je pouh´ ym oznaˇcen´ım varianty znaku. Pˇr´ıkladem nomin´aln´ıho znaku m˚ uˇze b´ yt odpovˇed’ v dotazn´ıku, barva oˇc´ı, typ profese atd. Nomin´aln´ı znak nab´ yvaj´ıc´ı pouze dvou hodnot se naz´ yv´a alternativn´ı, v opaˇcn´em pˇr´ıpadˇe mluv´ıme o znaku mnoˇzn´em. b) Ordin´ aln´ı znaky Tyto znaky pˇripouˇstˇej´ı kromˇe relace rovnosti i relaci uspoˇra´d´an´ı, m˚ uˇzeme konstatovat, ˇze varianta x[i] < x[j] nebo (x[i] > x[j] ). Uspoˇra´d´an´ım vyj´adˇr´ıme vˇetˇs´ı nebo menˇs´ı intenzitu popisovan´e vlastnosti. Pˇr´ıklad ordin´aln´ıho znaku: ˇskoln´ı klasifikace, r˚ uzn´a bodov´an´ı atd. c) Kardin´ aln´ı znaky Tyto znaky pˇripouˇstˇej´ı obsahovou interpretaci jak relac´ı rovnosti a uspoˇr´ad´an´ı, tak operac´ı souˇctu x[1] + x[2] a rozd´ılu x[1] − x[2] . Tyto znaky se d´ale ˇclen´ı do dvou podskupin.
9
• Pomˇ erov´ e znaky Znaky pˇripouˇstˇej´ı nav´ıc obsahovou interpretaci operace pod´ılu. Stejn´ y pomˇer mezi jednou dvojic´ı hodnot a jinou dvoj´ıc´ı hodnot vyjadˇruje i stejn´ y pod´ıl ve zkouman´em statistick´em souboru. Spoleˇcn´ y rys pomˇerov´ ych znak˚ u je, ˇze pomˇerov´ y znak m´a pˇrirozen´ y poˇc´atek, ke kter´emu jsou vztahov´an´ y vˇsechny dalˇs´ı hodnoty znaku. Pˇr´ıklady pomˇerov´ ych znak˚ u: hmotnost osob v kg, d´elka mˇeˇren´a v cm atd. • Intervalov´ e znaky Je to pˇr´ıpad znak˚ u, kdy operace pod´ılu nem´a smysl, tud´ıˇz se jedn´a o kardin´aln´ı znaky bez operace pod´ılu. Spoleˇcn´ ym znakem intervalov´ ych znak˚ u je to, ˇze nula byla stanovena umˇele, pouhou konvenc´ı. Pˇr´ıklady intervalov´ ych znak˚ u: kalend´aˇrn´ı syst´em, mˇeˇren´ı teploty ve stupn´ıch Celsia atd. V nˇekter´ ych monografi´ıch (napˇr. [3]) b´ yvaj´ı nomin´aln´ı a ordin´aln´ı znaky souhrnnˇe pojmenov´any jako znaky kvalitativn´ı a znaky kardin´aln´ı jako kvantitativn´ı znaky.
10
3
Z´ akladn´ı statistick´ e vazby
Statistickou vazbou mezi dvˇema znaky se rozum´ı popis vz´ajemn´eho vztahu. Pozorujeme, zda hodnoty jednoho znaku, kter´e pˇri experimentu pozorujeme, jsou v´az´any na hodnoty druh´eho znaku. Pokud hodnoty jednoho znaku nejsou v´az´any na hodnoty znaku druh´eho, jedn´a se o nulovou vazbu a mezi znaky nen´ı z´avislost. Velikost statistick´e vazby je ˇc´ıselnˇe charakterizov´ana. Poˇrad´ı pˇrehledu vybran´ ych mˇer statistick´ ych vazeb je uvedeno podle [1].
3.1
Statistick´ e vazby pro dvˇ e promˇ enn´ e
Charakteristika statistick´e vazby se zav´ad´ı podle typu znak˚ u, kter´e jsou zkoum´any. 3.1.1
Kvantitativn´ı promˇ enn´ e
Necht’ (X1 , Y1 ), . . . , (Xn , Yn ) jsou nez´avisl´e pozorovan´e hodnoty n´ahodn´eho vektoru (X, Y ) Pro tyto hodnoty se uˇz´ıv´a tˇechto koeficient˚ u: a) Pearson˚ uv korelaˇ cn´ı koeficient n P
R= s
(Xi − X)(Yi − Y )
i=1 n P
n P (Xi − X)2 (Yj − Y )2
i=1
kde X =
n P i=1
Xi a Y =
n P
,
R ∈ h−1, 1i ,
(3.1)
j=1
Yi .
i=1
Pomoc´ı tohoto koeficientu se urˇcuje line´arn´ı z´avislost mezi znaky X a Y . Pokud se R bl´ıˇz´ı k ±1, pak je mezi znaky X a Y line´arn´ı z´avislost. Podle hodnot R m˚ uˇzeme urˇcit velikost line´arn´ı z´avislosti mezi znaky X a Y . V´ ysledn´e hodnoty se mohou d´ale testovat na statistickou v´ yznamnost. Je urˇcena hladina statistick´e v´ yznamnosti α = 0, 05, kter´a m˚ uˇze b´ yt povaˇzov´ana za hranici v´ yznamnosti. Statistickou v´ yznamnost koeficientu R se testuje T testem √ R n−2 T = √ , (3.2) 1 − R2 kde T m´a Studentovo t rozdˇelen´ı o n − 2 stupn´ıch volnosti. Tedy T ∼ t(n − 2). V´ ysledek je platn´ y za pˇredpokladu, ˇze jde o v´ ybˇer z dvourozmˇern´eho norm´aln´ıho rozdˇelen´ı. V´ ysledek se porovn´av´a s kvantily t1− α2 (n − 2). Pokud |T | ≥ t1− α2 (n − 2), pak vypoˇcten´a hodnota R je statisticky v´ yznamn´a.
11
b) Spearman˚ uv poˇ radov´ y korelaˇ cn´ı koeficient (Xi , Yi ), i = 1, 2, . . . , n je n pozorov´an´ı veliˇcin X a Y . X(1) , X(2) , . . . , X(n) jsou uspoˇra´dan´e X-ov´e hodnoty. Pak r = (r1 , . . . , rn ) je vektor poˇrad´ı, kde ri je poˇrad´ı Xi ve v´ ybˇeru. Stejn´ y je postup s hodnotami Y . Poloˇzme n P 6 (ri − si )2 , RS ∈ h−1, 1i (3.3) RS = 1 − i=1 2 n(n − 1) Pak RS naz´ yv´ame Spearman˚ uv poˇradov´ y korelaˇcn´ı koeficient. Pokud se hodnota RS bl´ıˇz´ı k 0, mezi znaky X a Y nen´ı z´avislost . Stanovme hypot´ezy a zda jsou v´ ysledn´e hodnoty v´ yznamn´e : • H0 : mezi X a Y neexistuje z´avislost • H1 : mezi X a Y existuje z´avislost Zvol´ıme hladinu v´ yznamnosti α = 0, 05 a testujeme statistickou v´ yznamnost pomoc´ı T testu √ RS n − 2 T = p (3.4) 1 − RS2 kde T m´a Studentovo t rozdˇelen´ı o n − 2 stupn´ıch volnosti. Tedy T ∼ t(n − 2). V´ ysledek se porovn´av´a s kvantily t1− α2 (n − 2). Pokud |T | ≥ t1− α2 (n − 2), pak vypoˇcten´a hodnota RS je statisticky v´ yznamn´a. D´ale urˇc´ıme, kter´e hypot´ezy zam´ıtneme. • H0 a H1 : je-li |T | ≥ t1− α2 zam´ıt´ame H0 ve prospˇech H1 je-li |T | < t1− α2 nem´ame d˚ uvod H0 zam´ıtnout c) Kendall˚ uv korelaˇ cn´ı koeficient V´ ypoˇcet tohoto koeficientu vych´az´ı z poˇrad´ı hodnot znak˚ u. Podobnˇe jako v pˇr´ıpadˇe Speamanova korelaˇcn´ıho koecientu zavedeme vektory poˇrad´ı r1 , . . . , rn a s1 , . . . , sn a poloˇzme n X 1 sign (ri − rj )(si − sj ), τ= n(n − 1) i6=j i,j=1
kde
−1 0 sign x = 1
pro
x<0
pro
x=0
pro
x > 0.
Pak τ nazveme Kendall˚ uv korelaˇcn´ı koeficient.
12
τ ∈ h−1, 1i
(3.5)
d) Kolmogorov˚ uv distribuˇ cn´ı deviaˇ cn´ı koeficient (X1 , Y1 ), . . . , (Xn , Yn ) jsou nez´avisl´e pozorovan´e hodnoty n´ahodn´eho vektoru (X, Y ). Zavedeny v´ ybˇerov´e distribuˇcn´ı funkce pro 1. v´ ybˇer, 2. v´ ybˇer a sdruˇzenou v´ ybˇerovou distribuˇcn´ı funkci: n P I[Xi ≤x] F1n (x) = n1 F2n (y) =
1 n
Fn (x, y) =
i=1 n P
I[Yi ≤y] i=1 n P 1 I[Xi ≤x,[Yi ≤y] , n i=1
kde IA je indik´ator jevu A, kter´ y nab´ yv´a hodnot ( 0 pokud jev A nenastane IA = 1 pokud jev A nastane . dK = 4 sup |Fn (x, y) − F1n (x)F2n (y)| dK ∈ h−1, 1i
(3.6)
1≤x,y≤n
Koeficient dK vyjadˇruje odchylku od nez´avislosti. Je to univerz´aln´ı koeficient, ale nen´ı ˇcasto pouˇz´ıvan´ y. Pˇri jeho pouˇzit´ı se doporuˇcuje n velk´e (n > 30). 3.1.2
Nomin´ aln´ı promˇ enn´ e
Pˇredpokl´adejme, ˇze r je poˇcet variant X a s je poˇcet variant znaku Y . Poˇr´ıd´ıme n´ahodn´ y v´ ybˇer rozsahu n znaku (X, Y ). Oznaˇcme nij ˇcetnost jevu, kdy X = X[i] a Y = Y[j] , i = 1, . . . , r a j = 1, . . . , s. Zjiˇstˇen´e hodnoty uspoˇr´ad´ame do tabulky, kter´a se naz´ yv´a kontingenˇcn´ı: P
X/Y X[1] X[2] .. .
Y[1] n11 n21 .. .
Y[2] n12 n22 .. .
... ... ... .. .
Y[s] n1s n2s .. .
n10 n20 .. .
X[r] P
nr1 n01
nr2 n02
... ...
nrs n0s
nr0 n
Pak zavedeme chi-kvadratickou statistiku χ2 =
r X c X (nij − eij )2 , e ij i=1 j=1
n n
(3.7)
kde eij = i0n 0j , i = 1, . . . , r a j = 1, . . . , s je oˇcek´avan´a ˇcetnost tˇr´ıdy i, j. Oˇcek´avan´a ˇcetnost eij je ˇcetnost, kdy znak X = X[i] a znak Y = Y[i] . Testujeme hypot´ezu H0 : znaky jsou nez´avisl´e oproti hypot´eze H1 : znaky nejsou nez´avisl´e. V´ yslednou hodnotu χ2 porovn´av´ame s kvantily rozdˇelen´ı χ2α ((r − 1)(s − 1)). Pokud 2 χ20 > χ2α ((r − 1)(s − 1)) pak hypot´ezu H0 zam´ıt´ame. 2 Test je asymptotick´ y a je platn´ y za pˇredpokladu, ˇze oˇcek´avan´e ˇcetnosti jsou alespoˇ n 5. N´asleduj´ıc´ı statistick´e vazby vych´azej´ı ze statistiky χ2 . 13
a) Koeficient ϕ Koeficient vych´az´ı z kontingenˇcn´ı tabulky. Je definov´an r χ2 , ϕ≥0 ϕ= n
(3.8)
K 0 bl´ıˇz´ıc´ı se ϕ znaˇc´ı nez´avislost. Horn´ı hranice z´avis´ı na r a s. Pro tabulku 2×2 se ϕ rovn´a Pearsonovu koeficientu dvou znak˚ u. V tomto pˇr´ıpadˇe je ϕ bodov´ y biseriov´ y korelaˇcn´ı koeficient a ϕ ∈ h−1, 1i. b) Cram´ erovo V Koeficient vych´az´ı z kontingenˇcn´ı tabulky. Je definov´an s χ2 , V ∈ h−1, 1i V = n min(r − 1, c − 1)
(3.9)
Pro tabulky vˇetˇs´ı neˇz 2×2, z toho vypl´ yv´a, ˇze pro tabulky 2×2 dostaneme rovnost ϕ = V . V bl´ıˇz´ıc´ı se k nule znaˇc´ı nez´avislost , pokud se bl´ıˇz´ı k 1 znaˇc´ı to silnou z´avislost. Nejv´ıce doporuˇcovan´a statistick´a vazba. c) Kontingenˇ cn´ı koeficient (Pearsonovo C) Koeficient vych´az´ı z kontingenˇcn´ı tabulky. Je definov´an s χ2 , C ∈ h−1, 1i C= χ2 + n
(3.10)
Maxim´aln´ı hodnota C z´avis´ı na r a s. 3.1.3
Ordin´ aln´ı promˇ enn´ e
Pˇredpokl´adejme, ˇze znaky X a Y jsou ordin´aln´ı, uspoˇr´ad´ame je (napˇr. od nejniˇzˇs´ı po nejvˇetˇs´ı) podle hodnot znaku X nebo znaku Y . Mˇejme dvojice pozorov´an´ı (Xi , Yj ) a (Xk , Yl ). Vol´ıme P a Q, kter´e jsou definovan´e: • P = poˇcet dvojic pozorov´an´ı (Xi , Yj ) a (Xk , Yl ), pro kter´e plat´ı bud’ Xi > Xk a Yj > Yl nebo Xi < Xk a Yj < Yl (shodn´e p´ary) • Q = poˇcet dvojic pozorov´an´ı (Xi , Yj ) a (Xk , Yl ), pro kter´e plat´ı bud’ Xi > Xk a Yj < Yl nebo Xi < Xk a Yj > Yl (neshodn´e p´ary) • TX = poˇcet dvojic pozorov´an´ı (Xi , Yj ) a (Xk , Yl ), pro kter´e plat´ı Xi = Xk (v´azan´e ve znaku X, poˇcet p´ar˚ u, kdy X m´a stejn´e hodnoty) • TY = poˇcet dvojic pozorov´an´ı (Xi , Yj ) a (Xk , Yl ), pro kter´e plat´ı Yj = Yl (v´azan´e ve znaku Y, poˇcet p´ar˚ u, kdy Y m´a stejn´e hodnoty)
14
a) Goodman-Kruskal˚ uv koeficient γ γ=
P −Q , P +Q
h−1, 1i
(3.11)
Pokud se γ bl´ıˇz´ı k 0, znaky X a Y jsou nez´avisl´e. Naopak γ bl´ıˇz´ıc´ı se k 1 nebo -1 znaˇc´ı silnou z´avislost. b) Kendallovo τb 2(P − Q) , τb = p (P + Q + TX )(P + Q + TY )
Tb ∈ h−1, 1i
(3.12)
Koeficient v´ ykladem podobn´ y Goodman-Kruskalovu γ. Nejv´ıce doporuˇcovan´ y a uˇz´ıvan´ y koeficient. c) Kendallovo (Stewartsovo) τc τc =
2 min(r, c)(P − Q) , n2 [min(r, c) − 1]
τc ∈ h−1, 1i
(3.13)
Interpretace podobn´a Goodman-Kruskalovu γ. d) Sommerovo d dXY =
P −Q P + Q + TX
(3.14)
dY X =
P −Q , P + Q − TY
(3.15)
−1 ≤ dXY , dY X ≤ 1 Asymetrick´e koeficienty pˇredpokl´adaj´ıc´ı jednosmˇernou z´avislost. Interpretaˇcnˇe podobn´e Goodman-Krusklovu γ. Jelikoˇz jsou poˇrad´ı hodnot znak˚ u dobˇre definovan´e, m˚ uˇzeme pouˇz´ıt tak´e: e) Spearman˚ uv poˇ radov´ y korelaˇ cn´ı koeficient RS (3.3) f ) Kendall˚ uv poˇ radov´ y korelaˇ cn´ı koeficient τ (3.5)
Praktick´ ym uˇzit´ım tˇechto koeficient˚ u na pˇr´ıkladech se bude zab´ yvat kapitola 5. V´ ypoˇcet koeficient˚ u bude proveden pomoc´ı softwaru Statistica. Tento software bude pˇredstaven v n´asleduj´ıc´ı kapitole.
15
4
Statistick´ y software
S pouˇz´ıv´an´ım poˇc´ıtaˇc˚ u se dnes setk´av´ame v kaˇzd´em technick´em oboru. Nicm´enˇe kaˇzd´ y obor je specifick´ y a je doporuˇcen´e, ˇci dokonce nutn´e, uˇz´ıvat specializovan´ y software. V t´eto kapitole se budeme zab´ yvat statistick´ ym matematick´ ym softwarem Statistica 10. Tento software si pˇribl´ıˇz´ıme, protoˇze jej vyuˇzijeme v n´asleduj´ıc´ıch kapitol´ach.
4.1
Statistica 10
Statistica je program produkovan´ y firmou Statsoft, kter´ y obsahuje prostˇredky pro spr´avu dat, jejich anal´ yzu a vizualizaci. Nab´ız´ı ˇsirok´ y v´ ybˇer z´akladn´ıch i pokroˇcilejˇs´ıch technik pro statistick´e zpracov´an´ı dat. Vyuˇzit´ı nach´az´ı hlavnˇe v podnik´an´ı, vˇedˇe a pˇri inˇzen´ yrsk´ ych aplikac´ıch. V t´eto kapitole si uk´aˇzeme, jak naˇc´ıst data do programu, a pˇredvedeme postup, jak spoˇc´ıtat jednotliv´e korelaˇcn´ı koeficienty. • Naˇ cten´ı souboru s daty Po spuˇstˇen´ı programu n´as program Statistica uv´ıt´a a nab´ıdne n´am typy soubor˚ u, se kter´ ymi m˚ uˇzeme pracovat. Zde zvol´ıme moˇznost otevˇr´ıt seˇsit Excel, jelikoˇz data, kter´a budeme d´ale pouˇz´ıvat, m´ame v excelovsk´em souboru. Najdeme si n´ami vybran´ y soubor a zvol´ıme otevˇr´ıt. V dalˇs´ım kroku zvol´ıme moˇznost otevˇr´ıt jako pracovn´ı seˇsit Excelu. T´ım jsme nahr´ali soubor do programu a m˚ uˇzeme s n´ım d´ale pracovat.
• Pˇ riˇ razen´ı dat do promˇ enn´ ych Abychom mohli pokroˇcit k test˚ um, mus´ıme si data pˇriˇradit do promˇenn´ ych, se kter´ ymi potom program pracuje. To udˇel´ame tak, ˇze si zvol´ıme v horn´ı liˇstˇe moˇznost Statistiky.
16
Zde v nab´ıdce vybereme statistiku, kterou jsme se rozhodli pouˇz´ıt. D´ale vybereme sloupce a ˇr´adky, kter´e pˇriˇrad´ıme do promˇenn´ ych, kter´e potom pouˇz´ıv´ame pˇri v´ ypoˇctech.
• V´ ypoˇ cty Po vytvoˇren´ı promˇenn´ ych se m˚ uˇze pˇrikroˇcit k samotn´ ym v´ ypoˇct˚ um. Pro pˇr´ıpad dˇr´ıve uveden´ ych statistick´ ych vazeb se budeme zab´ yvat hlavnˇe moˇznost´ı Z´akladn´ı statistiky a Neparametrick´a statistika. • Z´akladn´ı statistiky Zde je pro n´as nejd˚ uleˇzitˇejˇs´ı moˇznost Korelaˇcn´ı matice, kde v´ ybˇerem moˇznosti Korelace spoˇc´ıt´ame Pearsonovo R.
17
• Neparametrick´a statistika
V nab´ıdce neparametrick´e statistiky m˚ uˇzeme zadat v´ ypoˇcet korelac´ı, m´ame na v´ ybˇer ze Spearmanova R, Gama nebo Kendallova tau.
18
5
Uk´ azka aplikace statistick´ ych vazeb
S praktick´ ym vyuˇzit´ım statistick´ ych vazeb se setk´av´ame v mnoha oblastech. V t´eto kapitole si uk´aˇzeme jejich aplikaci na typov´ ych pˇr´ıkladech ˇcerpan´ ych z [4] .
• Realizace vytyˇ cen´ ych z´ amˇ er˚ u V panelov´e studii vybavov´an´ı dom´acnost´ı byl zjiˇst’ov´an z´amˇer t´ ykaj´ıc´ı se koupˇe pˇredmˇetu (napˇr. lednice) bˇehem pˇr´ıˇst´ıch dvan´acti mˇes´ıc˚ u a po jednom roce byla zjiˇst’ov´ana realizace koupˇe tohoto pˇredmˇetu. V tabulce jsou uvedeny ˇcetnosti v´ yskytu jednotliv´ ych znak˚ u. Realizace Z´amˇer Koup´ı Nekoup´ı
Koupil Nekoupil 61 14
12 78
Tabulka zjiˇstˇen´ych u ´daj˚ u V´ ypoˇcet korelace mezi tˇemito jevy provedeme v softwaru Statistica. V´ ypoˇcet provedeme podle vztahu 3.1. Z´ısk´av´ame hodnotu Pearsonova korelaˇcn´ıho koeficientu R = 0, 682. V´ ysledek otestujeme na statistickou v´ yznamnost pomoc´ı T testu. α Z tabulek jsme z´ıskali t1− 2 (n − 2) = 1, 975 a vypoˇc´ıtali jsme T = 11, 91. Tedy T ≥ t1− α2 a z definice v kapitole 2 vypl´ yv´a, ˇze v´ ysledek je statisticky v´ yznamn´ y. • Studijn´ı v´ ysledky uˇ cn ˇ˚ u pˇ ri navˇ stˇ evov´ an´ı z´ ajmov´ ych krouˇ zk˚ u V jedn´e intern´atn´ı uˇcn ˇovsk´e ˇskole byla zjiˇstˇena souvislost mezi dobr´ ymi v´ ysledky studia a aktivn´ı prac´ı v z´ajmov´em krouˇzku. V tabulce jsou uvedeny ˇcetnosti v´ yskytu jednotliv´ ych znak˚ u. Aktivita Studium Pr˚ umˇern´e a ˇspatn´e Dobr´e
Aktivn´ı Neaktivn´ı 92 17
10 33
Tabulka zjiˇstˇen´ych u ´daj˚ u Korelaˇcn´ı koeficient je vypoˇc´ıt´an opˇet pomoc´ı softwaru Statistica. Vyuˇzijeme vztahu 3.1. Spoˇcten´a hodnota Pearsonova koeficientu je R = 0, 586. V´ ysledek otestujeme na statistickou v´ yznamnost pomoc´ı T testu. Z tabulek jsme z´ıskali t1− α2 (n − 2) = 1, 976 a vypoˇc´ıtali jsme T = 8, 86. Tedy T ≥ t1− α2 a z definice v kapitole 2 vypl´ yv´a, ˇze v´ ysledek je statisticky v´ yznamn´ y.
19
• Z´ ajem o urˇ cit´ y poˇ rad pˇ ri sledov´ an´ı televizi Pˇri studiu chov´an´ı televizn´ıch div´ak˚ u a jejich z´ajm˚ u byla sledov´ana statistick´a souvislost mezi frekvenc´ı sledov´an´ı TV a urˇcit´eho televizn´ıho poˇradu. ˇ Cetnosti v´ yskytu jednotliv´ ych znak˚ u jsou uvedeny v tabulce.
Poˇrad sleduji TV sleduji Jen obˇcas 1-2x t´ ydnˇe Skoro dennˇe Kaˇzd´ y den
V˚ ubec nesleduji 3 6 78 59
Jen obˇcas 1-2x t´ ydnˇe Skoro dennˇe Kaˇzd´ y den 2 1 52 33
4 4 87 88
10 12 202 184
6 8 126 156
Tabulka zjiˇstˇen´ych u ´daj˚ u V´ ypoˇcet statistick´e vazby provedeme softwarem Statisticka podle vztahu 3.11. Program n´am spoˇc´ıtal hodnotu Goodman-Kruskalova koefientu γ = 0, 12 . Statistick´ y z´avˇer zn´ı: mezi frekvenc´ı sledov´an´ı televize a frekvenc´ı sledov´an´ı urˇcit´eho poˇradu je mal´a z´avislost. Tud´ıˇz sledov´an´ı tohoto poˇradu nevypl´ yv´a z intenzity sledov´an´ı televize. • Z´ avislost platov´ e tˇ r´ıdy na vzdˇ el´ an´ı oper´ ator˚ u Pr˚ uzkumem v tov´arnˇe jsme z´ıskali u ´daje o platov´em ohodnocen´ı pracovn´ık˚ uau ´daje o jejich dosaˇzen´em vzdˇel´an´ı. Tyto promˇenn´e statisticky zpracujeme. Rozhodneme, zda m´a dosaˇzen´e vzdˇel´an´ı vliv na platov´e ohodnocen´ı pracovn´ıka. Platov´a tˇr´ıda Dosaˇzen´e vzdˇel´an´ı Z´akladn´ı Stˇredn´ı s vyuˇcen´ım Stˇredn´ı s maturitou Vysokoˇskolsk´e s bakal´aˇrsk´ ym titulem Vysokoˇskolsk´e s magistersk´ ym titulem
E
D
C
B
A
4 16 7 5 0
17 13 7 1 5 4 1 0 3 2 1 2 3 3 1 14 1 7 12 12
Tabulka zjiˇstˇen´ych u ´daj˚ u Pro stanoven´ı statistick´e vazby m˚ uˇzeme pouˇz´ıt napˇr´ıklad Speaman˚ uv poˇradov´ y koeficient RS (3.3). V´ ypoˇcet provedeme softwarovˇe pomoc´ı programu Statistica. Z´ısk´ame v´ ysledek Spearmanova koefientu RS = 0, 44. V´ ysledek otestujeme na statistickou v´ yznamnost T testem (3.4). Z tabulek jsme z´ıskali t1− α2 (n − 2) = 1, 978 a vypoˇc´ıtali jsme T = 5, 78. Tedy T ≥ t1− α2 a z definice v kapitole 2 vypl´ yv´a, ˇze v´ ysledek je statisticky v´ yznamn´ y. Dalˇs´ı pouˇzit´ı koeficient˚ u bude pˇredvedeno v n´asleduj´ıc´ı kapitole.
20
6
Aplikace statistick´ ych vazeb v pr˚ umyslu
V t´eto ˇca´sti bakal´aˇrsk´e pr´ace se sezn´am´ıme s vyuˇzit´ım statistiky v pr˚ umyslu a uk´aˇzeme si pouˇzit´ı vybran´e m´ıry statistick´e vazby. Konkr´etnˇeji, jak se vyuˇz´ıv´a statistika v Technical Support Center Daˇcice (zkr´acenˇe TSCD), zkuˇsebnˇe firmy TRW se s´ıdlem v Daˇcic´ıch. Sezn´am´ıme se se zjednoduˇsen´ ym technologick´ ym postupem. Bude zde pops´ano, jak´a data z´ısk´ame mˇeˇren´ım a jak tyto data vyhodnot´ıme. D´ale zde bude uvedeno, jak´e z´avˇery lze z tˇechto statistick´ ych v´ ysledk˚ u vyvodit. Pod´ıv´ame se na tyto v´ ysledky z technick´eho hlediska a uvedeme je v praxi. V t´eto kapitole bude uvedeno, jak se tyto statistick´e v´ ysledky prom´ıtaj´ı do jednoho z hlavn´ıch test˚ u prov´adˇen´ ych v TSCD. V r´amci zachov´an´ı technologick´eho a marketingov´eho ,,know-how”nebude v t´eto bakal´aˇrsk´e pr´aci uveden n´azev z´akazn´ıka ani podrobn´e technick´e postupy.
6.1
Sezn´ amen´ı s technick´ ym prostˇ red´ım
Bude se jednat o pouˇzit´ı statistiky pˇri ˇreˇsen´ı aktu´aln´ıho technick´eho probl´emu. Pˇri vytv´aˇren´ı funkˇcn´ıho prototypov´eho sloupku pomoc´ı urˇcit´eho testu doch´az´ı ˇcasto ke zmˇenˇe funkˇcn´ıch ˇca´st´ı nebo jejich parametr˚ u. Naˇs´ım pˇrednostn´ım u ´kolem je statisticky zpracovat z´avislosti mezi jednotliv´ ymi zmˇenami a v´ ysledky, popˇr´ıpadˇe jak se obmˇena parametr˚ u jednotliv´ ych funkˇcn´ıch ˇca´st´ı prom´ıtne do zmˇeny parametr˚ u jin´ ych ˇca´st´ı. Tyto zmˇeny se pr˚ ubˇeˇznˇe testuj´ı dalˇs´ımi testy. Z TSCD jsme z´ıskali data z mˇeˇren´ı funkˇcn´ıho prototypu sloupku ˇr´ızen´ı do automobilu, kter´ y se v nejbliˇzˇs´ı dobˇe dostane do s´eriov´e v´ yroby. • Sloupek ˇ r´ızen´ı Je to ˇca´st ˇr´ıdic´ı soustavy automobilu, na kter´e je um´ıstˇen volant a kter´a je pˇres Ishaft spojena s hydraulicky nebo elektricky posilovan´ ym ˇr´ızen´ım. Sestavu si rozdˇel´ıme na dvˇe ˇca´sti - sloupek a gearbox s ECU. Pro n´as je d˚ uleˇzit´ y hlavnˇe samotn´ y sloupek, kter´ y lze zjednoduˇsenˇe d´ale rozdˇelit na vnitˇrn´ı trubku (Inner column tube - ICT), vnˇejˇs´ı trubku (Outer column tube - OCT) a hlavn´ı braketu. Dalˇs´ı v´ yznamn´e ˇc´asti jsou: p´aka, z´amek, spindl, vnitˇrn´ı shaft, vaˇcka.
Obr´azek 1: Sloupek ˇr´ızen´ı
21
Tento sloupek je nastaviteln´ y ve dvou os´ach, mluv´ıme tedy o double sloupku. Sloupek je z´aroveˇ n jeden z bezpeˇcnostn´ıch prvk˚ u v autˇe. Pˇri nehodˇe se ICT zasouv´a a uvolˇ nuje t´ım m´ısto tˇelu ˇridiˇce, kter´e nar´aˇz´ı do airbagu a volantu. Zde z´aleˇz´ı na s´ıle, kterou sv´ır´a OCT ICT. • Body block test Jedn´a se o jeden z nejd˚ uleˇzitˇejˇs´ıch test˚ u, kter´e se na sloupku prov´adˇej´ı. Testuje se pˇredevˇs´ım bezpeˇcnostn´ı str´anka sloupku. Sloupek je upevnˇen v r´amu, pˇriˇsroubov´an k bari´eˇre a je osazen volantem s airbagem. Pˇredem urˇcenou rychlost´ı nar´aˇz´ı figur´ına na vystˇrelen´ y airbag a tlaˇc´ı na volant i se sloupkem. T´ım se testuje se schopnost sloupku ,,uhnout”ˇridiˇcovˇe tˇelu, to znamen´a, ˇze se sloupek mus´ı zasunout do nejkrajnˇejˇs´ı polohy. Zatlaˇcen´ım sloupku se sniˇzuje riziko zlomen´ı kost´ı, napˇr. ˇridiˇcov´ ych ˇzeber. Pˇri tomto testu je z´asadn´ı pˇresn´e nastaven´ı a pˇr´ıprava, protoˇze je jedn´ım z d˚ uleˇzit´ ych test˚ u, po kter´ ych vznikaj´ı rozhodnut´ı o tom, jak´ ym smˇerem se bude ub´ırat n´asledn´ y v´ yvoj sloupku, a sebemenˇs´ı odchylka a nepˇresnost m˚ uˇze v´est k finanˇcn´ım ztr´at´am.
Obr´azek 2: Body block test
Z´akazn´ık pˇresnˇe definuje nastaven´ı testu, napˇr. u ´hel n´aklonu, rychlost let´ıc´ı figur´ıny, jak´ y volant a airbag se pˇri testu pouˇzij´ı. Na u ´spˇeˇsnost testu m´a vliv mnoho faktor˚ u. Pro statistick´e vyhodnocov´an´ı si uvedeme nˇekolik z nich: • Pnut´ı ve ˇsroubu (Bolt tension) Je to s´ıla, kterou sv´ır´a vnˇejˇs´ı trubka vnitˇrn´ı. Nejdˇr´ıve mus´ıme ovˇeˇrit, zda m˚ uˇzeme testovat podle tohoto parametru. D´ale otestujeme z´avislost bolt tensionu na v´ ysledku testu. 22
• Volba typu volantu Testujeme dva typy volant˚ u. Statisticky vyhodnocujeme vliv zvolen´eho typu na v´ ysledku testov´an´ı. • Velikost s´ıly nutn´e k posunut´ı sloupku v axi´aln´ım smˇeru (Reach force) Na tuto s´ılu m´a vliv troje tˇren´ı: tˇren´ı mezi vnˇejˇs´ı a vnitˇrn´ı trubkou, tˇren´ı mezi spindlem a vnitˇrn´ım shaftem a tˇren´ı mezi vnˇejˇs´ı trubkou a braketou. Zamˇeˇr´ıme se pouze na velikost s´ıly pro zasunut´ı sloupku. Urˇc´ıme z´avislost mezi touto silou a silou p˚ usob´ıc´ı pouze pˇri zasouv´an´ı spindlu a vnitˇrn´ım shaftem, tzv. insertion force.
6.2 6.2.1
Pnut´ı ve ˇ sroubu Uveden´ı do probl´ emu
Zasouv´an´ı ICT do OCT ovlivˇ nuje tˇren´ı, kter´e je pˇr´ımo u ´mˇern´e s´ıle, kterou sv´ır´a OCT ICT. Tuto s´ılu m˚ uˇzeme urˇcitˇe dvˇema zp˚ usoby: pˇr´ım´ ym a nepˇr´ım´ ym. Nepˇr´ım´ y zp˚ usob je urˇcen´ı momentu, kter´ y je potˇreba k zamˇcen´ı p´aky. Z tohoto momentu vypoˇc´ıt´ame pomoc´ı vztahu M = F × l, kde l je d´elka p´aky, s´ılu potˇrebnou k zamˇcen´ı p´aky, tzv. s´ılu na p´ace. Ve v´ yrobˇe se sloupek nastavuje pr´avˇe podle s´ıly na p´aku. Pˇri urˇcov´an´ı t´eto s´ıly ale p˚ usob´ı negativn´ı veliˇciny, kter´e mohou stanoven´ı t´eto s´ıly znehodnotit, nejv´ıce tˇren´ı ve vaˇcce p´aky. Tomuto negativn´ımu p˚ usoben´ı se vyhneme, pokud zvol´ıme pˇr´ımou metodu. Pomoc´ı t´eto metody urˇc´ıme pˇr´ımo s´ılu sevˇren´ı FCLAM P .
Obr´azek 3: N´akres p˚ usob´ıc´ıch sil
Tato s´ıla se urˇcuje pomoc´ı senzoru, kter´ y je pˇri zamˇcen´ı stlaˇcen. Tak z´ısk´ame s´ılu sevˇren´ı, aniˇz by zde p˚ usobila jak´akoliv neˇza´douc´ı veliˇcina, jako je napˇr. tˇren´ı. Pro dalˇs´ı pouˇzit´ı tuto s´ılu oznaˇc´ıme jako pnut´ı ve ˇsroubu. Aby se mohly sloupky na testy nastavovat pouze podle pnut´ı, je nutn´e otestovat a statisticky vyhodnotit, zda je toto pnut´ı ve vazbˇe se silou na p´ace, podle kter´e se budou sloupky nastavovat ve v´ yrobˇe. Provedeme tedy nˇekolik mˇeˇren´ı, kter´e statisticky zpracujeme a vyhodnot´ıme. 23
6.2.2
Popis experimentu
Sloupek upevn´ıme do r´amu a tuto soustavu pˇripevn´ıme na stroj AME. Sloupek nastav´ıme do polohy MID/MID, tzn. do stˇredu v axi´aln´ım a radi´aln´ım smˇeru. Nastav´ıme p´akov´ y aktu´ator, hlavnˇe jeho souosost se ˇsroubem, abychom data nezkreslili ˇspatnˇe nastavenou d´elkou p´aky. Danou s´ılu na p´aku nastav´ıme utaˇzen´ım matice. Jelikoˇz m´ame pˇredem dan´e hodnoty s´ıly, mus´ıme kaˇzdou hodnotu co nejpˇresnˇeji nastavit. Postupujeme tak, ˇze ut´ahneme matici a potom p´aku zamkneme a odemkneme. T´ım zjist´ıme s´ılu na p´ace.
Obr´azek 4: Stroj AME s upevnˇen´ ym sloupkem
Abychom p´aku prohl´asili za nastavenou, mus´ı se hodnota s´ıly tˇrikr´at zopakovat, pˇriˇcemˇz povolen´e odchylky se mus´ı vej´ıt do rozmez´ı jednoho newtona. Tˇret´ı hodnotu bereme jako koneˇcnou. Pˇri odeˇcten´ı tˇret´ı hodnoty z poˇc´ıtaˇce z´aroveˇ n odeˇcteme hodnotu pnut´ı z mˇeˇr´ıc´ıho pˇr´ıstroje Kistler. kter´ y je propojen se sn´ımaˇcem na ˇsroubu. Z´ıskan´e hodnoty zaznamen´ame do tabulky. 24
Obr´azek 5: Upraven´ y mˇeˇric´ı ˇsroub se sn´ımaˇcem
Nastaven´ a s´ıla Namˇ eˇ ren´ e [N ] 26,64 42,05 40,4 56,43 55,71 58,16 35,45 57,29 36,57 36,2 54,44 34,08 34,28 36,13 35,54 58,42 34,14 63,9 84,6 35,4 34,7
pnut´ı [kN ] 1,58 2,65 2,65 2,64 2,68 2,68 1,56 2,63 1,55 1,55 2,65 1,59 1,53 1,59 1,57 2,66 1,56 3 3,96 1,58 1,48
Tabulka namˇeˇren´ych hodnot
25
Obr´azek 6: Mˇeˇr´ıc´ı pˇr´ıstroj Kistler
6.2.3
Zpracov´ an´ı dat
Nyn´ı data zpracujeme. V tabulkov´ ych hodnot´ach lze vypozorovat jist´e nesrovnalosti. Pro n´azornˇejˇs´ı pˇrestavu vytvoˇr´ıme graf.
Obr´azek 7: Graf z´avislosti pnut´ı na s´ıle
Na grafu jsou vidˇet odchylky. Mus´ıme vyˇsetˇrit, proˇc se liˇs´ı tyto tˇri hodnoty. Zpˇetn´ ym vyˇsetˇren´ım pr˚ ubˇehu mˇeˇren´ı jsme zjistili, ˇze byl ˇspatnˇe nastaven p´akov´ y aktu´ator a namˇeˇren´e hodnoty byly zkresleny ˇspatnou d´elkou p´aky. Tyto hodnoty jsou pro n´as nen´ahodnou chybou, proto je odstran´ıme a vytvoˇr´ıme nov´ y graf. Na nov´em grafu je vidˇet, jak jsou data line´arnˇe z´avisl´a. Tuto z´avislost vyj´adˇr´ıme korelaˇcn´ım koeficientem spoˇcten´ ym pomoc´ı programu Statistica. Vyuˇzijeme vztahu pro Pearson˚ uv korelaˇcn´ı koeficient (3.1). V´ ysledn´a hodnota je R = 0, 994. V´ ysledek otestujeme na statistickou v´ yznamnost pomoc´ı T testu (3.2). 26
Obr´azek 8: Graf z´avislosti pnut´ı na s´ıle bez odchylek
Z tabulek jsme pro hladinu v´ yznamnosti α = 0, 05 z´ıskali hodnotu t1− α2 (n−2) = 2, 120, yv´a, ˇze v´ ypoˇctem hodnotu T = 36, 35. Tedy T ≥ t1− α2 a z definice v kapitole 2 vypl´ v´ ysledek je statisticky v´ yznamn´ y. 6.2.4
Statistick´ e vyhodnocen´ı
Z v´ ysledn´e hodnoty vypl´ yv´a, ˇze mezi hodnotami pnut´ı a s´ıly je siln´a kladn´a z´avislost. To znamen´a, ˇze pokud zv´ yˇs´ıme s´ılu na p´aku utaˇzen´ım matice, zv´ yˇs´ı se t´ım i pnut´ı ve ˇsroubu. Naopak sn´ıˇzen´ım pnut´ı sn´ıˇz´ıme i s´ılu potˇrebnou k zamknut´ı p´aky.
6.2.5
Technick´ e vyhodnocen´ı, jeho vyuˇ zit´ı a dalˇ s´ı zpracov´ an´ı
Potvrzen´ım z´avislosti mezi tˇemito veliˇcinami se m˚ uˇze zmˇenit postup sestavov´an´ı sloupk˚ u na testy. Jeden z hlavn´ıch pˇr´ınos˚ u zmˇeny testovac´ıho procesu je urychlen´ı, protoˇze nastaven´ı p´aky podle pnut´ı je o pozn´an´ı rychlejˇs´ı. D´ale testujeme pouze omezen´ y poˇcet hodnot pnut´ı. Urˇcen´ım testovac´ıch hodnot a stanoven´ım toleranc´ı pˇri jejich nastavov´an´ı z´aroveˇ n urˇcujeme intervaly nastavovan´e s´ıly potˇrebn´e k zamknut´ı sloupku. Tyto intervaly se vyuˇzij´ı pozdˇeji v s´eriov´e v´ yrobˇe. N´asleduje testov´an´ı, na jak´e hodnoty je ide´aln´ı sloupek nastavit, aby se v automobilu pˇri nehodˇe zachoval tak, jak m´a. Pro testov´an´ı vol´ıme pouze dvˇe hodnoty, vˇetˇs´ı a menˇs´ı. Otestujeme, zda m´a velikost pnut´ı vliv na v´ ysledek testu. Vytvoˇr´ıme si tabulku z´ıskan´ ych hodnot. Pnut´ı V´ ysledek testu Kladn´ y Z´aporn´ y
Mal´e Velk´e 8 1
Tabulka hodnot 27
47 9
Pro v´ ypoˇcet z´avislosti pouˇzijeme vztah pro v´ ypoˇcet koeficientu ϕ (3.8). V´ ysledek ϕ = −0, 047 n´am podle uveden´e definice v kapitole 2 ˇr´ık´a, ˇze mezi nastaven´ ym pnut´ım a v´ ysledkem testu nen´ı z´avislost. Pro dalˇs´ı testov´an´ı tedy vol´ıme nastaven´ı niˇzˇs´ı hodnoty pnut´ı.
6.3 6.3.1
Volba volantu a airbagu Uveden´ı do probl´ emu
Z´akazn´ık definuje nastaven´ı testu, tedy i pouˇzit´ı testovac´ıho volantu s airbagem. Na zaˇc´atku seri´alu test˚ u se pouˇz´ıvaly testovac´ı volanty, kter´e byly prim´arnˇe urˇceny pro jin´e typy sloupk˚ u. Protoˇze se vyv´ıjel nov´ y typ sloupku, urˇcily se pro testov´an´ı jiˇz odzkouˇsen´e volanty. Pro v´ yvoj nov´eho sloupku bylo ale nutn´e vyvinout nov´ y typ volantu. Pˇri body block testu se vyuˇz´ıv´a stˇr´ıdavˇe nov´ y i odzkouˇsen´ y typ volantu. Po nˇekolika proveden´ ych testech jsme z´ıskali v´ ysledky a naˇs´ım u ´kolem je zjistit, zda pouˇzit´ y volant m´a vliv na v´ ysledek testu. 6.3.2
Popis experimentu
Pro z´ısk´an´ı dat je nutn´e test pˇripravit. Zamˇeˇrme se pˇredevˇs´ım na volant, na kter´em velmi z´aleˇz´ı, protoˇze se k nˇemu vztahuje nastaven´ı geometrie testu. Nastaven´ı polohy sloupku se totiˇz urˇc´ı podle spodn´ı hrany volantu. Samozˇrejmost´ı je pouˇzit´ı odpov´ıdaj´ıc´ıho airbagu, kter´ y designovˇe odpov´ıd´a volantu. Zde m´ame na v´ ybˇer z jedno nebo dvoukan´alov´ ych airbag˚ u. Ty se liˇs´ı zp˚ usobem nafukov´an´ı vzduchov´eho pytle, kdy prvn´ı obsahuj´ı pouze jednu patronu, kter´a vybouchnut´ım nafoukne pytel zplodinami, kter´e postupnˇe unikaj´ı otvory v pytli. Druh´ y typ, dvoukan´alov´e, obsahuj´ı patrony dvˇe, kdy druh´a patrona vybuchuje se zpoˇzdˇen´ım, t´ım p´adem dofukuje pytel.
Obr´azek 9: Airbag a volant ze sestavy 1
Obr´azek 10: Airbag a volant ze sestavy 2
28
Vybereme tedy volant dle zad´an´ı a po skonˇcen´ı nˇekolika test˚ u statisticky zpracujeme v´ ysledky. 6.3.3
Zpracov´ an´ı dat, vyhodnocen´ı v´ ysledku a jeho vyuˇ zit´ı
Ze z´ıskan´ ych dat utvoˇr´ıme tabulku. Jelikoˇz nesm´ıme uv´est pˇresn´e technologick´e postupy a nastaven´ı, oznaˇc´ıme volanty a airbagy jako Sestava 1 a Sestava 2. Sestava V´ ysledek testu Kladn´ y Z´aporn´ y
1 2 9 1 2 5
Tabulka hodnot Pro v´ ypoˇcet pouˇzijeme Cram´erovo V a to ze vztahu 3.9. Z´ıskali jsme v´ ysledek V = 0, 63. To znamen´a, ˇze mus´ıme uv´aˇzit, jak´ y volant na test pouˇzijeme. Z hodnot vypl´ yv´a, ˇze pˇri pouˇzit´ı sestavy 2 je test ne´ uspˇeˇsn´ y ˇcastˇeji. Je tedy d˚ uleˇzit´e zjistit, proˇc je sestava 2 m´enˇe pouˇziteln´a. Z vide´ı jsme vypozorovali, ˇze sklon volantu a airbagu zp˚ usobuje to, ˇze pytel je po vystˇrelen´ı pˇr´ıliˇs vysoko a figur´ına do nˇej nar´aˇz´ı ve v´ yˇsce jej´ı hlavy. To zp˚ usobuje, ˇze energie n´arazu nep˚ usob´ı pˇr´ımo na sloupek, ale je rozloˇzena na boˇcn´ı s´ıly. Tento probl´em jsme prozat´ım vyˇreˇsili drobnou u ´pravou airbagu, kter´ y jsme na urˇcit´ ych m´ıstech naˇr´ızli, abychom usmˇernili rozvinut´ı pytle.
6.4 6.4.1
S´ıla potˇ rebn´ a k manipulaci se sloupkem v axi´ aln´ım smˇ eru Uveden´ı do probl´ emu
Jelikoˇz mluv´ıme o sloupku nastaviteln´em ve dvou os´ach, mus´ıme tak´e odzkouˇset, jakou silou mus´ı bˇeˇzn´ y uˇzivatel tlaˇcit, aby si nastavil volant ve smˇeru dopˇredu a dozadu. Tato s´ıla mus´ı pˇrekonat tˇren´ı, kter´e je mezi vnˇejˇs´ı a vnitˇrn´ı trubkou, d´ale tˇren´ı vznikaj´ıc´ı pˇri zasouv´an´ı vnitˇrn´ıho shaftu do spindlu a tˇren´ı p˚ usob´ıc´ı mezi vnˇejˇs´ı trubkou a braketou. Tuto s´ılu porovn´ame se silou jednoho ze tˇr´ı parametr˚ u, a to silou, kterou namˇeˇr´ıme pˇri zasouv´an´ı vnitˇrn´ıho shaftu do spindlu. 6.4.2
Popis experimentu
Nejprve namˇeˇr´ıme Reach force. Tuto s´ılu mˇeˇr´ıme na stroji AME, stejnˇe jako s´ılu na p´ace. Zde je d˚ uleˇzit´e, aby byl sloupek upevnˇen v horizont´aln´ı poloze. D´ale je d˚ uleˇzit´e, aby bylo na sloupku pˇripevnˇeno z´avaˇz´ı, kter´e p˚ usob´ı v tˇeˇziˇsti volantu, kdyby byl na sloupku pˇriˇsroubov´an. D´ale strojovˇe sloupek vysouv´ame a zasouv´ame a mˇeˇr´ıme s´ılu, kter´a je k tomu potˇreba. Jako v´ yslednou s´ılu bereme nejvyˇsˇs´ı namˇeˇrenou hodnotu. K urˇcen´ı vazby potˇrebujeme namˇeˇrit Insertion force. Tu namˇeˇr´ıme na jin´em stroji, na Inovˇe TSM 10. Gearbox upevn´ıme do pˇr´ıpravku, na vnitˇrn´ı shaft nasuneme spind, tedy sloupek bez vnˇejˇs´ı trubky a brakety. Insertion force mˇeˇr´ıme v obou smˇerech. Jako v´ yslednou hodnotu bereme nejvˇetˇs´ı namˇeˇrenou s´ılu. 29
Obr´azek 11: Stroj AME
Obr´azek 12: INOVA TSM 10 s pˇripraven´ ym testovac´ım d´ılem
30
6.4.3
Zpracov´ an´ı dat
Z´ıskan´e hodnoty zaznamen´ame do tabulky. Reach force Insertion force [N ] [N ] 95 13,14 114 29,5 88 22,93 112 27,84 78 23,69 67 16,79 85 43,47 93 23,65 72 14,82 71 9,79 61 6,29 62 19,16 58 19,16 72 11,6 77 9,79 83 5,09 70 4,51 67 6,85 112 15,23 68 14,34 58 9,79 72 13,47 65 7,46 77 6,58 72 12,16 Tabulka namˇeˇren´ych hodnot Protoˇze se jedn´a o kvantitativn´ı znaky, pouˇzijeme pro statistick´e vyhodnocen´ı Spearmano RS (3.3) a Kendallovo τ (3.5). Po v´ ypoˇctu programem Statistica jsme z´ıskali v´ ysledn´e RS = 0, 44 a τ = 0, 29. V´ ysledek RS otestujeme na statistickou v´ yznamnost pomoc´ı T testu (3.4). Z tabulek jsme pro hladinu v´ yznamnosti α = 0, 05 z´ıskali hodnotu t1− α2 (n − 2) = 2, 07, v´ ypoˇctem hodnotu T = 2, 35. Tedy T ≥ t1− α2 a z definice v kapitole 2 vypl´ yv´a, ˇze v´ ysledek je statisticky v´ yznamn´ y. Z v´ ysledk˚ u tedy plyne, ˇze pˇri mˇeˇren´ı Reach force mus´ı existovat dalˇs´ı vlivy, kter´e toto mˇeˇren´ı v´ yraznˇe ovlivˇ nuj´ı, napˇr´ıklad tˇren´ı mezi braketou a vnˇejˇs´ı trubkou. Proto m˚ uˇze b´ yt statistick´e vyhodnocen´ı nejednoznaˇcn´e.
31
7
Z´ avˇ er
C´ılem t´eto pr´ace byla charakterizace statistick´ ych vazeb a uk´azka jejich vyuˇzit´ı v pr˚ umyslu. V prvn´ı ˇca´sti bakal´aˇrsk´e pr´ace byly statistick´e vazby pˇredstaveny a pops´any. V n´asleduj´ıc´ı ˇctvrt´e kapitole byl uveden statistick´ y software Statistica 10, kter´ y byl pouˇzit k v´ ypoˇct˚ um v dalˇs´ıch kapitol´ach. V posledn´ı kapitole je tato pr´ace zamˇeˇrena na aplikaci statistick´e vazby v pr˚ umyslu, na jej´ım vyuˇzit´ı pˇri stanovov´an´ı koneˇcn´ ych v´ ysledk˚ u, kdy spr´avn´a interpretace v´ ysledn´e hodnoty vede ke spr´avn´emu postupu. Statistickou z´avislost lze pouˇz´ıt i pˇri zjiˇstˇen´ı neodpov´ıdaj´ıc´ıch hodnot, kdy pˇri grafick´em zn´azornˇen´ı lze urˇcit, o jak´e hodnoty se jedn´a a zamˇeˇrit se na jejich v´ yklad a pˇr´ıpadnˇe jejich odstranˇen´ı. Data, kter´a jsou v t´eto pr´aci zpracov´av´ana, jsou z´ısk´an´a z projektu, kter´ y svou rozs´ahlost´ı patˇr´ı k jedn´e z nejvˇetˇs´ıch zak´azek TRW. Pˇri t´eto bakal´aˇrsk´e pr´aci jsem si vyzkouˇsel, jak z´ıskat v´ ysledky test˚ u, na nichˇz jsem se bud’ pod´ılel nebo je s´am prov´adˇel. Pˇri zpracov´an´ı v´ ysledk˚ u jsem se mohl spolehnout na vlastn´ı znalosti z pˇredchoz´ıch kapitol a mohl tak statistick´e vyhodnocen´ı prov´est s´am. Co se t´ yˇce technick´eho vyhodnocen´ı, byl jsem pˇr´ıtomen rozhodov´an´ı o v´ yznamu statistick´ ych v´ ysledk˚ u a n´asledn´em postupu, takˇze i tyto informace jsou z´ısk´any z n´aleˇzit´ ych zdroj˚ u.
32
Reference ˇ zula, I.: Measuring dependence, Sborn´ık refer´at˚ [1] Zeˇ u: Hartmann, J., Mich´alek, J.: Bio´ UZ, ´ Brno, 2006. metrick´e metody a modely v souˇcasn´e vˇedˇe a v´yzkumu, UKZ [2] Mich´alek, J.: Pravdˇepodobnost a statistika, preprint, Brno, 2006. [3] Bud´ıkov´a, M., Kr´alov´a, M., Maroˇs, B.: Pr˚ uvodce z´akladn´ımi statistick´ymi metodami , Grada, Praha, 2010. ˇ ak, J., Reh´ ˇ akov´a, B.: Anal´yza kategorizovan´ych dat v sociologii, Academia, Praha, [4] Reh´ 1986.
33