STUDIUM SOUVISLOSTÍ MEZI ÚSPĚŠNOSTÍ STUDIA MEDICÍNY, ZNÁMKAMI STUDENTŮ NA STŘEDNÍ ŠKOLE A VÝSLEDKY PŘIJÍMACÍCH ZKOUŠEK1 Čestmír Štuka, Petr Šimeček Anotace Studie analyzuje úspěšnost studentů přijatých v letech 1994–1997 na 1. lékařskou fakultu UK. Ukazuje, že počet bodů získaných u přijímacích zkoušek je nepříliš dobrým prediktorem úspěšnosti studia, a navrhuje, jak přijímací řízení zefektivnit využitím znalosti známek ze střední školy. Klíčová slova prediktory absolvování studia medicíny, logistická regrese, ROC křivky Cílem naší studie bylo zhodnocení vlivu jednotlivých faktorů známých v době přijetí studenta na vysokou školu na úspěšnost (=úspěšné dokončení) studia medicíny . Při stanovení metodiky jsme se inspirovali předchozími pracemi Kožený et al. (2001) a Stránský, Štefanová (1998). Výše zmíněné práce studovaly pouze vzájemnou souvislost po dvojicích veličin, tedy obvykle nějakým způsobem kvantifikovanou závislost úspěšnosti a jednoho z faktorů. Interpretace takovýchto výsledků může být snadno zavádějící, viz známý příklad průkazné korelace mezi porodností a čapí populací v daném regionu z Disman (2002). V této studii ukazujeme, že samotný počet bodů u přijímacích zkoušek je nepříliš dobrým prediktorem úspěšnosti, a s využitím logistické regrese analyzujeme, co jsou skutečné předpoklady úspěšného absolvování studia medicíny. Naše závěry by mohly být užitečné například při racionalizaci přijímacího řízení. Práce je rozdělena do čtyř kapitol: V první kapitole se věnujeme popisu a přípravě dat. Druhá kapitola shrnuje použité metody. Ve třetí kapitole jsou uvedeny a ve čtvrté kapitole spolu s diskuzí interpretovány dosažené výsledky. Veškeré statistické analýzy byly provedeny ve volně dostupném prostředí R 2.1.1, grafy ROC křivek jsou nakresleny v SPSS.
1. Popis dat Data pochází od 673 českých a slovenských studentů2, jež započali magisterské studium všeobecného lékařství nebo stomatologie na 1. lékařské fakultě Univerzity Karlovy v letech 1994–1997 a toto 1 2
Tato práce byla podpořena z grantu GA ČR 201/05/H007. Pokud je autorům známo, jedná se o nejrozsáhlejší studii prediktorů úspěšnosti studia medicíny v ČR.
studium do roku 2005 ať již úspěšně či neúspěšně zakončili. Sedm (1%) studentů, jež mají studium přerušeno či stále ještě studují, není do studie zahrnuto. Pakliže studenti započali studium v tomto období vícekrát, je započítán pouze jejich první pokus. Navíc bylo ze studie vyřazeno 46 (7%) jedinců, o nichž nemáme dostupné všechny potřebné údaje, neboť se neúčastnili všech částí přijímací zkoušky (4 jedinci), údaje o jejich středoškolském studium jsou zjevně neadekvátní (9 jedinců) nebo na jejich přihlášce ke studiu chybějí známky z některých předmětů (33 jedinců). Vybraná populace se tedy skládá z 626 studentů, z nichž 463 (74%) studium úspěšně absolvovalo a 163 (26%) studia zanechalo. Z úspěšných studentů 341 ukončilo studium v řádném termínu (6 let), zatímco 122 jich potřebovalo dobu delší. Sledovanými atributy jsou pohlaví, typ středoškolského vzdělání (gymnaziální/jiné), počet bodů na jednotlivých částech přijímacích zkoušek (biologie, chemie, fyzika), průměrné známky za středoškolské studium z matematiky, fyziky, chemie, biologie a českého jazyka a průměrné známky z jednotlivých ročníků. Z těchto údajů byl dále dopočten součet bodů za přijímací zkoušky celkově, průměr z průměrů za jednotlivé ročníky a rozdíl průměrů v posledním a prvním ročníku střední školy zrcadlící zlepšení či zhoršení žáka během studia. Popisné statistiky jsou uvedeny v příloze. Před tím, než přistoupíme k samotné analýze, podívejme se podrobněji na jednotlivé faktory a vztahy mezi nimi. Pokud aplikuje podle Johnson, Wichern (2002) shlukovou analýzu nebo biplot na výsledky přijímacích zkoušek a známky ze střední školy (Obrázek 1), zjistíme, že jednotlivé části přijímacích zkoušek souvisejí více spolu navzájem než se středoškolskými známkami z odpovídajících předmětů. Zdá se tedy, že známky na vysvědčení nesou informaci do značné míry odlišnou od výsledků přijímacích zkoušek. 0.5
1.0
2 1 0 -1
*
-2
*
-3
BODY.B
BODY.CH
BODY.F
SS.B
SS.CH
SS.CJ
SS.F
SS.M
*
+ + * ** + + + ++ BODY.B BODY.CH + + ++ + + BODY.F +* * + * +++ + + + * + + * ++++++*++ * + ++ + +* * + + + + * + + + +++*++ + + + + + * * + * + +* + *++++++* *+++ +++++++ + + +++ *+ **++ +++ + ++ + + ++++++++*+++* * +*+ * *+*+* + + + ++ ++*+++ +* +++++ + + ** SS.CJ * * *+ +*+ ++**+* ++*+ ++*++ + * ++ + ++**++ + +SS.CH SS.M SS.F SS.B + +*+++ ++ +++++++ * + +++ +++ +++ + ++ * +* + * + +*+ ++++++ ++** *+*+**+*++ ++ + * + * *+ *++*++ + *+ + ++ ++*+ ++ ++ + * * ++ *+++ +* ++ * ++ *+ + +++ + + * + * + * + + + + ++ ++ + + *+ + + * ++ + + + + +* +*+*++++++++++* +++*+ +++++++++*++++*++++ +*+++ +++ + *+*++ ++++*+ +++ * +++ ++++* ++*+ * + *** +*++ ++++ +++ + ++ * + * ** * *+ + ++++++* + +++*+ *++*++++++*+++*++*+ + ++ ++ + ++* **+ *+ + +++++* +++++++++ +++* *+*+ ++ + + * * ++ + +++ ++++ * * * *++ ++*+* ++* + +++ *++++* * +* * +* + * ++ * * + +* +*+ * * *+ + *+ * + ++ * * +** ++ * * * * * + absolvoval * *+
* neabsolvoval
-4
Comp.2
35 30 25 20 15
Vzdalenost
*
*
-4
-3
-2
-1
0
1
2
Comp.1
Obr. 1: Dendrogram shlukové analýzy (Eukl. vzdálenost, úplné spoj.) a biplot
1.0
0.0
0.5
-0.5
0.0
Biplot
-1.0
-0.5
40
-1.5
-1.5 -1.0
Dendrogram
2. Přehled použitých metod Nejprve se budeme ve shodě s předchozími pracemi zabývat předpovědí úspěšnosti studia na základě jediného faktoru. K hodnocení jsme zvolili absolutní hodnotu Kruskalova gamma koeficientu (viz Agresti (2002), str.58). Tento koeficient nabývá hodnot z intervalu [–1,1] a lze jej do jisté míry považovat za neparametrickou obdobu Pearsonova korelačního koeficientu: pakliže by všichni úspěšní studenti měli hodnotu zkoumaného faktoru vyšší (resp. nižší) než neúspěšní, byla by jeho hodnota 1 (resp. –1). Naopak pro kritéria s úspěchem studia nesouvisející by jeho hodnota měla být blízko 0. Podrobněji schopnost predikce vyšetříme pomocí tzv. ROC křivky, viz např. Zvárová (1998), tj. grafu, kde na osu x nanášíme podíl ze studentů neschopných dokončit studium, jež by byli přijati, a na osu y nanášíme podíl ze studentů schopných absolvovat, jež by byli přijati, při měnící se hraniční mezi klasifikace podle daného kritéria. Křivka tedy začíná v bodě [0,0] (nepřijmeme nikoho) a míří do bodu [1,1] (přijmeme všechny). Plochu pod ROC křivkou (AUC) lze interpretovat jako ukazatel kvality prediktoru. Výše uvedené metody nevypovídají nic o tom, jaké atributy zvolit, když se nechceme při predikci omezovat jen na jeden faktor. Kupříkladu to, že středoškolská známka z matematiky je dobrým prediktorem úspěšného studia, nevypovídá nic o tom, zda je užitečné tuto známku zahrnout do predikčního modelu, když již do něj zařadili známku z fyziky. Mnohem užitečnější se ukazuje přidat do modelu rozdíl mezi průměrem známek v posledním a prvním ročníku střední školy, což je sám o sobě poměrně špatný prediktor, nese ale "novou" informaci. Pro konstrukci predikcí na základě více faktorů budeme užívat logistickou regresi, tj. modely, u kterých je logit (logaritmus poměru šancí) na úspěšné dokončení studia popsán jako lineární kombinace prediktorů, viz např. Agresti (2002). Modely budeme porovnávat na základě Akaikeho informačního kritéria (AIC). Prediktor
| γ | (s.e.)
AUC (s.e.) Prediktor
| γ | (s.e.)
AUC (s.e.)
SŠ matematika 0,31 (0,06) 0,64 (0,03) SŠ rozdíl 4.-1. 0,05 (0,05) 0,53 (0,03) SŠ fyzika 0,35 (0,05) 0,66 (0,03) Body fyzika 0,28 (0,05) 0,64 (0,03) SŠ biologie 0,36 (0,06) 0,65 (0,03) Body biologie 0,12 (0,06) 0,56 (0,03) SŠ chemie 0,35 (0,05) 0,66 (0,03) Body chemie 0,31 (0,05) 0,65 (0,03) SŠ čes. jazyk 0,28 (0,06) 0,63 (0,03) Body celkem 0,28 (0,05) 0,64 (0,03) SŠ průměr 0,33 (0,05) 0,66 (0,03) Tab. 1: Kruskalovo gamma a plocha pod ROC křivkou u jednotlivých prediktorů
3. Výsledky
ROC Referenční přímka
1,00
Body celkem
Podíl přijatých z úspěšných studentů
V Tabulce 1 na předchozí straně je přehled Kruskalových gamma koeficientů a ploch pod ROC křivkami pro jednotlivé prediktory. Povšimněme si, že známky ze střední školy se zdají být lepšími prediktory než body z přijímacích zkoušek. To potvrzuje i Obrázek 2.
Body fyzika ,75
Body biologie Body chemie SŠ průměr
,50
SŠ čes. jazyk SŠ biologie ,25
SŠ chemie SŠ fyzika
0,00
SŠ matematika
0,00
,25
,50
,75
1,00
Podíl přijatých z neúspěšných studentů
Obr. 2: ROC křivky
U logistické regrese začneme modelem s výsledky přijímacích zkoušek. Koeficienty modelu predikce úspěchu studia v závislosti na bodech z biologie, chemie a fyziky, můžete vidět v Tab. 2. Povšimněme si znaménka u koeficientu b1 značícího, že při daném výsledku přijímacího testu z fyziky a chemie, je test z biologie nejen neužitečný, ale dokonce matoucí (čím méně bodů, tím spíše bude student úspěšný)! logit(pst_úspěchu) = b0 + b1 * body_biologie + b2 * body_fyzika + b3 * body_chemie Koeficient Odhad s.e. Z–hodnota p–hodnota B0 -3,01685 1,05855 -2,850 0,004372 B1 -0,03117 0,01497 -2,082 0,037352 B2 0,03986 0,01182 3,373 0,000744 B3 0,04433 0,01131 3,919 0,000009 Tab. 2: Model závislosti prav. úspěchu na výsledcích přijímacích zkoušek
Model nyní obohatíme o zbylé prediktory a postupně budeme vyřazovat ty, jejichž odebrání vede ke snížení AIC (viz Tabulka 3) až získáme model předpovídající logit úspěšnosti studia na základě bodů z přijímacího testu z fyziky a chemie, průměrné středoškolské známky z biologie a chemie a rozdílu mezi průměrem v čtvrtém a prvním ročníku střední školy (viz Tabulka 4, podrobněji v příloze). Zdůrazněme ještě jednou, že nezařazení ostatních faktorů, tj. průměrné středoškolské známky z matematiky, českého jazyka a biologie, bodů za přijímací zkoušky z biologie,... do modelu v žádném případě neznamená, že by snad tyto s úspěšností studia nesouvisely. Jen jejich znalost není užitečná, pokud již známe faktory do modelu zahrnuté.
Veličiny v modelu
AIC
pohlaví, body_fyzika, body_chemie, sš_matematika, sš_fyzika, sš_chemie, sš_biologie, sš_čes_jazyk, typ_školy,sš_prům._prospěch, sš_rozdíl_prům. pohlaví, body_fyzika, body_chemie, sš_fyzika, sš_chemie, sš_biologie, sš_čes_jazyk, typ_školy, sš_prům._prospěch, sš_rozdíl_prům. pohlaví, body_fyzika, body_chemie, sš_fyzika, sš_chemie, sš_biologie, sš_čes_jazyk, typ_školy, sš_rozdíl_prům. body_fyzika, body_chemie, sš_fyzika, sš_chemie, sš_biologie, sš_čes_jazyk, typ_školy, sš_rozdíl_prům. body_fyzika, body_chemie, sš_fyzika, sš_chemie, sš_biologie, typ_školy, sš_rozdíl_prům. body_fyzika, body_chemie, sš_fyzika, sš_chemie, sš_biologie, sš_rozdíl_prům. body_fyzika, body_chemie, sš_chemie, sš_biologie, sš_rozdíl_prům.
653,52 651,52 650,73 648,97 647,29 645,78 645,68
Tab. 3: Postupný výběr modelu na základě AIC kritéria
Výsledek je poměrně robustní vůči drobným modifikacím. Pokud do modelu přidáme libovolný dříve vyloučený prediktor, hodnota AIC se zvýší. Dále pokud místo průměrů známek do modelu zahrneme čtverce těchto průměrů (progresivně znevýhodníme horší známky), výše popsaná procedura nalezne opět tentýž model. Stejně tomu bude, pokud závislost logitu pravděpodobnosti úspěchu na bodech z přijímacích zkoušek modelujeme (realističtěji) jako kvadratický polynom. logit(pst_úspěchu) = b0 + b1 * body_fyzika + b2 * body_chemie + b3 * sš_chemie + b4 * sš_biologie + b5 *rozdíl_mezi_4_a_1_průměrem Koeficient Odhad s.e. Z–hodnota p–hodnota b0 -2,04463 0,97350 -2,100 0,035703 b1 0,02313 0,01187 1,949 0,051282 b2 0,03651 0,01043 3,499 0,000467 b3 -0,52205 0,22116 -2,361 0,018250 b4 -0,53240 0,27522 -1,934 0,053060 b5 -0,66876 0,33019 -2,025 0,042828 Tab. 4: Model závislosti logitu pravděpodobnosti úspěchu na zvolených prediktorech
Abychom demonstrovali jakého zlepšení lze s pomocí tohoto modelu dosáhnout, zvažme úlohu klasifikace našich 626 studentů na dvě skupiny o 463 a 163 studentech (odpovídá počtu úspěšných a neúspěšných jedinců). V případě klasifikace podle bodů za přijímací zkoušky se dopustíme 272 (42%) chyb, podle průměrného prospěchu 176 chyb (28%), konečně podle navrženého kritéria jen 158 chyb (25%). Pokud vybereme z populace subpopulaci studentů, kteří studium dokončili, a "úspěšnými" pro tuto chvíli nazveme pouze ty z nich, kterým se to podařilo v 6 letech, můžeme zkoumat, jaké jsou prediktory
absolvování studia v řádném termínu. Provedeme-li výběr modelu metodou analogickou k výše popsané, zjistíme, že mezi absolvujícími studenty je jednoznačným ukazatelem na včasné zakončení studia úspěch ve fyzice (jak na střední škole, tak u přijímacích zkoušek).
4. Závěr Naše studie poukázala na dva znepokojivé aspekty přijímacího řízení na 1. lékařské fakultě UK v letech 1994–1997. Za prvé se zdá, že kvalita testů z biologie byla velice nízká a jejich přidaná hodnota k testům z fyziky a chemie zanedbatelná. Dále, výsledky studentů na střední škole byly zcela ignorovány, přestože tyto výsledky u studentů přijatých ke studiu predikují úspěšnost lépe než body z přijímacích zkoušek a kombinací obojího lze dosáhnout dalšího zlepšení. Je pochopitelně diskutabilní, a autoři této studie jsou si toho vědomi, nakolik je hodnocení prediktorů na základě přijatých studentů zobecnitelné na (nové) studenty ke studiu se hlásící, dále nakolik by změna přijímacího řízení mohla vést k deformaci hodnocení studentů na středních školách, zvláště těch hlásících se na medicínu, a do jaké míry lze úspěch studenta hodnotit jen základě schopnosti školu dokončit (a ne již např. podle studijních výsledků). Toto by spolu s lepším ošetřením chybějících pozorování a vícekrát ke studiu přijatých studentů mělo být předmětem dalšího výzkumu. Bližší zkoumání by si také zasluhovalo, proč právě studenti úspěšní ve fyzice spíše absolvují studium v řádném termínu a proč bylo ke studiu přijato i několik studentů s výrazně nižším počtem bodů na přijímacích zkouškách3. Čestmír Štuka,
[email protected], 1. LF UK, Na Bojišti ???, Praha. Petr Šimeček,
[email protected], ÚTIA AV ČR, Pod Vodárenskou věží 4, Praha.
Reference: [1] A. Agresti: Categorical Data Analysis. Wiley, 2002. [2] M. Disman: Jak se vyrábí sociologická znalost. Karolinum, 2002. [3] R.A. Johnson, D.W. Wichern: Applied Multivariate Statistical Analysis, Wiley, 2002. [4] J. Kožený et al.: Akademická úspěšnost na střední škole: prediktor absolvování studia medicíny, Čs. psychol. 45, 2001. [5] P. Stránský, S. Štefanová: Mohou výsledky přijímacího řízení predikovat studijní výsledky v pregraduálním studiu medicíny? XXI. dny lékařské biofyziky, Horní Poříčí, 1998. [6] J. Zvárová: Základy statistiky pro biomed. obory. Karolinum, 1998. 3
Rozdělení počtu bodů z přijímacích zkoušek má těžký levý chvost. Pokud se zaměříme na 12 (2%) studentů s méně než 200 body, zjistíme, že v řádném termínu z nich studium nedokončil nikdo a později jen jeden z nich.
Příloha – popisné statistiky a kvalita navrženého kritéria Popisné statistiky: Pohlaví
Popisné statistiky
SŠ matematika SŠ fyzika SŠ chemie SŠ biologie SŠ čes. jazyk Body chemie Body biologie Body fyzika Body celkem SŠ průměr SŠ rozdíl 4.-1. prům.
Minimum 1 1,00 1,000000 1 1,00 33 49 43 139 1,0000 -1,76
Maximum 4 4,00 4,000000 3 4,00 100 100 100 299 3,1500 1,40
Průměr 2,01 1,7916 1,664563 1,42 1,7500 78,61 87,86 85,42 251,88 1,552097 ,0259
Sm. odchylka ,705 ,63656 ,606322636 ,477 ,59977 11,454 8,343 9,987 25,581 ,4035271 ,28993
žena muž
Frekvence 379 247 626
% 60,5 39,5 100,0
Typ středoškolského vzdělání
gym. jiné
Frekvence 600 26 626
% 95,8 4,2 100,0
Porovnání klasifikace na základě kritéria z modelu v Tab. 4 s průměrným prospěchem na střední škole a počtem bodů na přijímacích zkouškách: Kritérium = 0,02313 * body_fyzika + 0,03651 * body_chemie – 0,52205 * sš_chemie – 0,53240 * sš_biologie – 0,66876 * rozdíl_mezi_4_a_1_průměrem
ROC
Prediktor
Podíl přijatých z úspěšných studentů
1,00
| γ | AUC
Nové kritérium 0,45 0,72 SŠ průměr 0,33 0,66 Body přij. zkoušky 0,28 0,64 Tab. 5: Srovnání dle γ a AUC
,75
,50
Referenční přímka ,25
Námi navržené skóre Body celkem
0,00
SŠ průměr
0,00
,25
,50
,75
1,00
Podíl přijatých z neúspěšných studentů
Obr. 3: Srovnání námi navrženého kritéria, průměru na střední škole a bodů z přijímacích zkoušek podle ROC křivek