VŠB – Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
BIOSTATISTIKA Zadání 11 JMÉNO STUDENTKY/STUDENTA: OSOBNÍ ČÍSLO: JMÉNO CVIČÍCÍ/CVIČÍCÍHO:
DATUM ODEVZDÁNÍ DOMÁCÍ ÚKOL 1: DOMÁCÍ ÚKOL 2: DOMÁCÍ ÚKOL 3: DOMÁCÍ ÚKOL 4: CELKEM:
---------------------
Ostrava, AR 2015/2016
HODNOCENÍ
Osobní číslo studentky/studenta:
Číslo zadání: 11
Popis datového souboru V datovém souboru endoprotezy_11.xlsx se nachází údaje o bolesti pacientů po totální endoprotéze kyčelního, kolenního nebo ramenního kloubu během nultého a prvního pooperačního dne. Bolest pacientů byla zaznamenávána pomocí škály VAS (Visual Analog Scale), každý pacient v pravidelných intervalech zaznamenával, jakou právě cítí bolest na škále od 0 do 10, kde 0 je žádná bolest a 10 maximální možná bolest. V datovém souboru je pro každého pacienta uveden průměr hodnot bolesti zaznamenaných během nultého pooperačního dne a průměr hodnot bolesti zaznamenaných během prvního pooperačního dne. Dále je uvedeno, kterou ze tří typů operací pacient absolvoval, a zda se jedná o muže nebo ženu.
Obecné pokyny:
Portfolio domácích úkolů budete odevzdávat postupně. Tj. nejdříve odevzdáte titulní stránku + úkol 1, následně doplníte úkol 2, atd. Jednotlivé domácí úkoly odevzdávejte vždy v termínu, který určil váš cvičící. Domácí úkoly zpracujte dle obecně známých typografických pravidel. Všechny tabulky i obrázky musí být opatřeny titulkem. Do domácích úkolů nevkládejte tabulky a obrázky, na něž se v doprovodném textu nebudete odkazovat. Bude-li to potřeba, citujte zdroje dle mezinárodně platné citační normy ČSN ISO 690.
Osobní číslo studentky/studenta:
Číslo zadání: 11
Úkol 1 a) Prezentujte strukturu datového souboru podle pohlaví pacienta (muž / žena) a podle typu endoprotézy (kyčelní kloub / kolenní kloub / ramenní kloub). Uveďte tabulku sdružených četností a výsledky vhodným způsobem vizualizujte.
b) Srovnejte na základě explorační analýzy hodnoty bolesti pacientů po absolvování jednotlivých typů operací (endoprotéza kyčelního / kolenního / ramenního kloubu) během nultého pooperačního dne. Data prezentujte graficky (histogram, vícenásobný krabicový graf) a doplňte následující tabulky a text. Tab. 1: Výběrové charakteristiky průměrné bolesti podle VAS u mužů a žen po totálních endoprotézách kloubů dolních končetin
Míra bolesti Kyčelní kloub
Kolenní kloub
Ramenní kloub
počet pacientů Míry polohy minimum dolní kvartil medián průměr horní kvartil maximum Míry variability směrodatná odchylka variační koeficient (%) Míry šikmosti a špičatosti šikmost špičatost Identifikace odlehlých pozorování - vnitřní hradby dolní mez horní mez
po odstranění odlehlých pozorování Kyčelní Kolenní Ramenní kloub kloub kloub
Osobní číslo studentky/studenta:
Číslo zadání: 11
Grafická prezentace sledovaného statistického znaku (vícenásobný krabicový graf + histogramy, resp. odhady hustoty pravděpodobnosti):
Průměrná bolest pacientů během 0. pooperačního dne po totálních endoprotézách Byly analyzovány záznamy o průměrné bolesti u ………… pacientů (………… po endoprotéze kyčelního kloubu, ………… kolenního kloubu a ………… ramenního kloubu) během nultého pooperačního dne (viz Tab. 1). Kyčelní kloub – bolest během 0. pooperačního dne Míra bolesti (vyjádřena indexem VAS) pacientů po endoprotézách kyčelního kloubu se pohybovala v rozmezí od ……………… do ………………. Hodnoty ležící mimo interval od ……………… do ……………… byly identifikovány jako odlehlá pozorování a příslušní pacienti byli z dalšího zpracování vyřazeni. Níže uvedené výsledky tedy pocházejí z analýzy datového souboru o rozsahu ……………… pacientů. Průměr míry bolesti byl ……………… a směrodatná odchylka ………………. U poloviny pacientů byla hodnota bolesti nižší než ………………. (Podrobněji: U čtvrtiny pacientů byla hodnota bolesti nižší než ………………, u čtvrtiny pacientů vyšší než ……………….) Vzhledem k hodnotě variačního koeficientu (……….%) lze / nelze analyzovaný soubor považovat za homogenní. Ověření normality míry bolesti u pacientů po endoprotézách kyčelních kloubů během 0. pooperačního dne na základě explorační analýzy Na základě grafického zobrazení (viz ………………) a výběrové šikmosti a špičatosti (viz Tab. 1, výběrová šikmost i špičatost leží / neleží v intervalu 〈−2; 2〉) lze / nelze předpokládat, že bolest pacientů po endoprotézách kyčelních kloubů má normální rozdělení. Dle pravidla 3𝜎 / Čebyševovy nerovnosti lze tedy očekávat, že u 95% / více než 75% pacientů bude během 0. pooperačního dne míra bolesti v rozmezí ……………… až ……………….
Osobní číslo studentky/studenta:
Číslo zadání: 11
Úkol 2 Srovnejte změnu bolesti mezi 0. a 1. pooperačním dnem u pacientů po endoprotézách kyčelních a kolenních kloubů. a) Změnu bolesti u obou skupin pacientů vhodným způsobem graficky prezentujte.
b) Určete 95% intervalové odhady střední změny bolesti (resp. mediánu změny bolesti) pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušných intervalových odhadů.)
Osobní číslo studentky/studenta:
Číslo zadání: 11
c) Čistým testem významnosti ověřte, zda je pozorovaný průměrný nárůst bolesti statisticky významný na hladině významnosti 5%. Test proveďte pro obě skupiny pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.)
d) Pokud je to možno, určete 95% intervalový odhad rozdílu středních hodnot nárůstů bolesti srovnávaných skupin pacientů. (Nezapomeňte na empirické i exaktní ověření předpokladů pro použití příslušného intervalového odhadu.)
e) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) nárůstů bolesti u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. (Nezapomeňte na empirické i exaktní ověření předpokladů vybraného testu.)
Osobní číslo studentky/studenta:
Číslo zadání: 11
Úkol 3 Srovnejte míru bolesti pacientů během 0. pooperačního dne po endoprotézách kyčelních, kolenních a ramenních kloubů pomocí exaktních metod statistické indukce. Využijte výsledků získaných v úkolu 1. a) Ověřte normalitu bolesti u všech tří skupin pacientů (empiricky i exaktně).
b) Ověřte homoskedasticitu (shodu rozptylů) bolesti u všech tří skupin pacientů (empiricky i exaktně).
c) Určete 95% intervalové odhady střední hodnoty (resp. mediánu) bolesti u srovnávaných skupin pacientů. (Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.)
Osobní číslo studentky/studenta:
Číslo zadání: 11
d) Čistým testem významnosti ověřte, zda je pozorovaný rozdíl středních hodnot (resp. mediánů) bolesti u srovnávaných skupin pacientů statisticky významný na hladině významnosti 5%. Pokud ano, zjistěte, zda lze některé skupiny pacientů označit (z hlediska bolesti během 0. pooperačního dne) za homogenní. (Nezapomeňte na ověření předpokladů pro použití zvoleného testu.)
Osobní číslo studentky/studenta:
Číslo zadání: 11
Úkol 4 Analyzujte závislost mezi pohlavím pacientů a typem absolvované operace. a) Ověřte, zda existuje závislost mezi pohlavím pacienta a typem absolvované operace (endoprotéza kyčelního / kolenního / ramenního kloubu) pomocí Chí-kvadrát testu nezávislosti. Nezapomeňte ověřit předpoklady pro použití testu.
b) Pomocí vhodné asociační tabulky prezentujte vliv pohlaví pacienta na skutečnost, jestli absolvoval endoprotézu kloubu dolní končetiny (kyčelní nebo kolenní) nebo kloubu horní končetiny (ramenní). Tabulku doplňte o řádkové relativní četnosti.
c) Analyzovanou závislost prezentujte pomocí vhodného grafu.
d) Určete alespoň jednu míru kontingence. Na základě posouzení vizualizace analyzované závislosti a nalezené míry kontingence posuďte míru analyzované závislosti.
Osobní číslo studentky/studenta:
Číslo zadání: 11
e) Určete šanci, že pacient absolvoval operaci kloubu dolní končetiny, v případě, že se jedná o ženu, i v případě, že se jedná o muže. (Komentujte.)
f)
Určete relativní šanci, že pacient absolvoval operaci kloubu dolní končetiny, jestliže se jedná o ženu (včetně 95% intervalového odhadu). Na základě svého zjištění určete, zda lze vliv pohlaví pacienta považovat za statisticky významný na hladině významnosti 5%.
g) Vybereme náhodného pacienta. Určete riziko, že je po operaci kloubu horní končetiny (včetně 95% intervalového odhadu) v případě, že je náhodně vybraným pacientem žena i v případě, že je náhodně vybraným pacientem muž. Nezapomeňte na ověření předpokladů pro použití příslušných intervalových odhadů.
h) Vybereme opět náhodného pacienta. Určete relativní riziko, že je po operaci kloubu horní končetiny (včetně 95% intervalového odhadu) v případě, že je náhodně vybraným pacientem žena.
Osobní číslo studentky/studenta:
Číslo zadání: 11
Jak identifikovat, zda jsou v datech odlehlá pozorování? Emiprické posouzení:
použití vnitřních (vnějších) hradeb, resp. 𝑧 − 𝑠𝑜𝑢ř𝑎𝑑𝑛𝑖𝑐𝑒, resp. 𝑚𝑒𝑑𝑖á𝑛𝑜𝑣á 𝑠𝑜𝑢ř𝑎𝑑𝑛𝑖𝑐𝑒, vizuální posouzení krabicového grafu.
Exaktní posouzení:
Grubbsův test (parametrický test - vyžaduje normalitu dat) Deanův - Dixonův test (neparametrický test)
Jak naložit s odlehlými hodnotami by měl definovat hlavně zadavatel analýzy (expert na danou problematiku).
Jak ověřit normalitu dat? Emiprické posouzení:
vizuální posouzení histogramu, vizuální posouzení grafu odhadu hustoty pravděpodobnosti, Q-Q graf, P-P graf, posouzení výběrové šikmosti a výběrové špičatosti.
Exaktní posouzení:
testy normality (např. Shapirův – Wilkův test, Andersonův-Darlingův test, Lillieforsův test, …)
Jak ověřit homoskedasticitu (shodu rozptylů)? Emiprické posouzení:
poměr největší a nejmenší směrodatné odchylky, vizuální posouzení krabicového grafu.
Exaktní posouzení:
F – test (parametrický dvouvýběrový test), Bartlettův test (parametrický vícevýběrový test), Leveneův test (neparametrický test).