Využití logistické regrese pro hodnocení omaku Vladimír Bajzík
Úvod Jedním z primárních projevů textilií je omak. Jedná se o pocit, který vyvolá textilie při kontaktu s pokožkou. Je to integrální psychofyzikální vlastnost, jejíž hodnocení je obtížné. Vedle sady tzv. primárních vlastností ze kterých se hodnocení omaku skládá hraje také důležitou roli hodnotitel – jeho zkušenosti s hodnocením, psychické rozpoložení, zda se jedná o muže či ženu atd. Proto existuje snaha nahradit subjektivní hodnocení omaku objektivním, založeném na měření mechanických vlastností spojených s omakem, nezávislým na hodnotitelích. Nejrozšířenějším systémem, který se používá pro predikci je systém KES, který se velmi často také používá jako komparační metoda při vývoji nových postupů. Při hodnocení subjektivního omaku se nejčastěji používá stupnicová metoda. Princip spočívá v zařazování individuálních textilií do zvolené subjektivní stupnice - ordinální škály (např. 1-velmi špatný, 2-špatný, 3-dostačující, 4-průměrný, 5-dobrý, 6 - velmi dobrý, 7 – znamenitý). Je-li užití textilií exaktně specifikováno (např. pánské večerní oblekovky) je možné použít např. i tří stupňovou bodovou škálu (0 – horší omak, 1 – průměrný omak, 2 – lepší omak), popř. dvoustupňovou škálu (0 – špatný omak, 1 – dobrý omak). Data získaná subjektivním hodnocením omaku (zde celkový omak – THV) patří do ordinální škály, proto lze pro nalezení vztahu mezi THV a fyzikálně-mechanickými vlastnostmi a následnou predikci použít některý vícerozměrné techniky statistické analýzy dat jako jsou diskriminační analýza a logistická regrese.
1. Systém KES Systém KES je sada 4 přístrojů, které měří 15 charakteristik rozdělených do 5 skupin (tahové, smykové, ohybové, objemové, povrchové) v rozsazích simulující běžné namáhání oděvních textilií
při nošení. Systém KES byl vytvořen pro objektivní hodnocení omaku textilií, zejména tkanin. Umožňuje objektivně odhadnout celkové pocity většiny lidí při jejich přímém kontaktu s textilií. Šestnáctou charakteristikou, která se používá při predikci omaku je plošná hmotnost. Pro predikci omaku se používá těchto charakteristik: 1) Tahové charakteristiky: 1. LT – Linearita, WT - deformační energie, RT - pružnost 2) Ohybové charakteristiky: B - tuhost v ohybu na jednotku délky, HB - Moment hystereze na jednotku délky 3) Smykové charakteristiky: G - tuhost ve smyku, 2HG -hystereze při úhlu smyku φ =0,5°, 2HG5 - hystereze při úhlu smyku φ =5° 4) Objemové charakteristiky: LC: linearita, WC -energie potřebná ke stlačení, RC - pružnost 5) Povrchové charakteristiky: MIU - koeficient tření, MMD průměrná odchylka MIU, SMD - geometrická drsnost. 6) Geometrické charakteristiky: T – tloušťka, W – plošná hmotnost. Výpočet predikce probíhá ve 2 krocích. Nejprve se hodnoty standardizují a vypočtou se tzv. predikované primární složky omaku Yj 16
Y j = C 0 j + ∑ C ij i =1
Xi − Xi
σi
kde Xi je i-tá charakteristika nebo její desítkový logaritmus, X i a σi je průměr a směrodatná odchylka i-té charakteristiky, C0i a Cij regresní koeficienty i-té charakteristiky a j-tého primárního omaku. Hodnoty parametrů X i , σi, C0i a Cij se volí podle účelu použití textilií. Ve druhém kroku se vypočte objektivní hodnota celkového omaku (THV)
⎡ ⎛ Y j − M j1 ⎞ ⎛ Y j2 − M j 2 ⎞⎤ ⎟⎥ ⎟ + C ′j 2 ⎜ THV = C 0′ + ∑ ⎢C ′j1 ⎜ ⎜ σ′ ⎟ ⎜ σ ′j 2 ⎟⎥ j =1 ⎢ j 1 ⎠ ⎝ ⎠⎦ ⎣ ⎝ ’ ’ ’ kde C0 , Cj1 , Cj2 jsou regresní koeficienty, Mj1, Mj2, σj1, σj2 jsou 3
průměry a směrodatné odchylky Y a Y2 a opět se volí podle účelu použití textilie. Pro konstrukci predikční rovnice byla použita stepwise regrese. V navrženém regresním modelu je použito 16 měřených charakteristik mezi kterými existují korelace.
2. Logistická regrese Logistická regrese byla vyvinuta jako alternativní metoda k metodě nejmenších čtverců pro případ, kdy závisle proměnná y je binární. V současné době ji však lze používat obecně pro závisle proměnnou pocházející z nominální nebo ordinální škály. Dá se použít i jako alternativa ke klasifikaci, kdy nejsou splněny předpoklady vícerozměrného normálního rozdělení. V případě binární proměnné logistická regrese předikuje pravděpodobnost dané události, která se buď stala (y=1) nebo nestala (y=0). Pro vytvoření vazební podmínky se používá logitová transformace, která vede k sigmoidálnímu vztahu mezi y a xi . Při predikci pomocí logistické regrese situace nastala v případě, že pravděpodobnost predikované události je větší 0,5, je-li menší událost nenastala. Při řešení logistické regrese se odhadují regresní koeficienty βi (i=1,2,…p) pomocí logitové transformace
⎛ π ( x) ⎞ ⎟⎟ = b0 + b1 x1 + b2 x 2 + ..... + b p x p , ln⎜⎜ ⎝ 1 − π ( x) ⎠ kde π(x) je pravděpodobnost, že situace nastala a 1- π(x) vyjadřuje pravděpodobnost, že situace nenastala, bi jsou odhady regresních koeficientů βi. 3. Experimentální část Pro konstrukci predikčního modelu pomocí logistické regrese bylo použito 49 tkanin pro pánské oblekovky. Každá tkanina byla subjektivně hodnocena pomocí panelu 20 respondentů pro potřeby logistické regrese do 2 třídy. První třída omak je špatný (y=0), druhá třída omak je dobrý (y=1). Výsledné zařazení textilie do dané třídy, bylo provedeno na základě převážného zařazení do třídy, tj. většina hodnotitelů hodnotila známkou 1, tkanina byla zařazena do druhé třídy (textilie má dobrý omak). Když hodnotila většina hodnotitelů známkou 0, byla textilie zařazena do první třídy (textilie má špatný omak). Objektivní hodnocení omaku bylo realizováno na systému KES, tj. u každé tkaniny bylo proměřeno 16 vlastností. Pomocí průzkumové analýzy dat, korelační matice a variability v datech bylo následně vytipováno 10 vlastností pro tvorbu predikční rovnice. Mezi
vytypovanými vlastnostmi byly WT, RT, B, G, 2HG, 2HG5, WC, MIU, MMD, SMD. Při konstrukci regresního modelu se testuje jednak významnost regresních koeficientů bi, jednak významnost jednotlivých proměnných xi pro predikci y. Pro testování významnosti regresních koeficientů bi lze použít Waldovo textační kriterium. 2
Wa , i
⎛ b ⎞ = ⎜⎜ i ⎟⎟ , ⎝ s (bi ) ⎠
které má rozdělení χ2 s jedním stupněm volnosti. I když určit příspěvek jednotlivých proměnných v regresi, jelikož závisí na příspěvcích ostatních proměnných lze stanovit parciální korelaci Ri mezi jednotlivými závisle proměnnými a nezávisle proměnnou.
Ri = ±
Wa.i − 2df , − 2 ln L( 0 )
kde df je počet stupňů volnosti, který se týká počtu odhadovaných parametrů. L(0) je pravděpodobnost základního logistického modelu, který obsahuje pouze absolutní člen.
4. Výsledky Vzorky byly rozděleny do dvou skupin. První skupinu tvořilo 42 textilií a byly použity pro tvorbu modelu, druhá skupina, tj. 7 kusů bylo použito pro ověření funkčnosti nalezeného modelu. Výsledky konstrukce regresního modelu ukazují, že regresní koeficienty jsou většinou nad hladinou významnosti α=0,1. Největší vliv na THV mají proměnné WT, RT, B a SMD. Následující Tabulka II ukazuje počet správně a špatně zařazených objektů.
Proměnná
χ2
spočtená hladina významnosti
regresní koef.
odhad
Waldova statistika
spočtená hladina významnosti
Tabulka I. Odhady koeficientů a vliv jednotlivých proměnných
WT RT B G 2HG 2HG5 WC MIU MMD SMD
13,49 7,61 11,58 1,76 0,43 0,12 1,09 0,00042 0,046 13,01
0,0002 0,0058 0,0007 0,1843 0,5106 0,7248 0,2976 0,9836 0,8294 0,0003
b0 b1 b2 b3 B4 b5 b6 b7 b8 b9 b10
-29,53 -1,31 0,39 25,72 18,60 1,00 -5,47 42,81 74,06 224,8 -2,592
0,9753 1,5792 1,5934 0,3177 0,7882 0,0051 0,1937 1,4013 0,2601 1,7931 2,7495
0,3234 0,2089 0,2068 0,573 0,3747 0,9432 0,6599 0,2365 0,6101 0,1806 0,0973
Tabulka II. Klasifikace objektů – tvorba modelu Naměřené hodnoty omaku
Třída 1 Třída 2
Predikované hodnoty omaku
Třída 1 13 2
Třída 2 2 25
Procento správně zařazených objektů 86,67 92,59
Tabulka III. Klasifikace objektů – ověření modelu Naměřené hodnoty omaku
Třída 1 Třída 2
Predikované hodnoty omaku
Třída 1 2 0
Třída 2 0 5
Procento správně zařazených objektů 100 100
Tabulka IV. Přehled modelu stupně volnosti χ2 spočtená hladina významnosti 10 49,13 0,0000 Z Tabulky II. a Obr. 1. Je zřejmé, že došlo k celkem uspokojivému proložení funkce daty. Těsnost proložení D=77,69% (obdoba R2 u lineární regrese). Hlubší analýza provedená s porovnáním výsledků ze subjektivního hodnocení omaku ukazuje, že většina textilií, které jsou modelem špatně fitovány jsou současně nejednoznačně zařazeny subjektivně. Tabulka III ukazuje, že ověřované textilie byly zařazeny všechny dobře. To ukazuje na dobrou účinnost modelu. Výsledky v tabulce IV. Ukazují, že model jako celek je na hladině významnosti α=0,05 statisticky významný.
Obr.1. Proložení modelu a rezidua.
Závěr V případě, že při hodnocení omaku je zapotřebí rozhodnout zda je omak dobrý nebo špatný, tj. je-li chápán jako binární proměnná, lze logistickou regresi považovat za vhodnou metodu pro konstrukci predikční rovnice.
Literatura [1] Bajzík, Vladimír. Predikce subjektivního hodnocení omaku pomocí vícerozměrných statistických metod. In Zajištění kvality analytických výsledků:Sborník přednášek ze semináře v Komorní Lhotce. 1. vydání. Český Těšín : 2 Theta. 2007. s. 94101. ISBN 80-86380-32-7 [2] Kawabata, Sueo. The Standardization and Analysis of Fabric Hand. 2nd. ed., The Textile Machinery Society of Japan, Osaka 1982 [3] Meloun, Milan; Miltký Jiří. Statistická analýza experimentálních dat. 1. vydání. Praha: Academia. 2004. ISBN 80-200-1254-0 Adresa autora: Ing. Vladimír Bajzík, Technická univerzita v Liberci, Fakulta textilní, Katedra textilních materiálů, Hálkova 6, 46117 Liberec. e-mail: Vladimí
[email protected] Tato práce byla vytvořena v rámci projektu MŠMT 1M06047 - CQR