NMST551 STATISTICKY´
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
´ NKU ˇ DECKY´CH C ˇ LA ˚ PSANI´ VE ´V A VY´ZKUMNY´CH ZPRA
1
´ vod U
Vytva´rˇenı´ pı´semny´ch a graficky´ch vy´stupu˚, dokumentu˚, cˇla´nku˚ a zpra´v je prˇirozenou soucˇa´stı´ pra´ce (nejen) kazˇde´ho veˇdce. U statistika, ktery´ se zaby´va´ aplikacemi statisticky´ch metod pro rˇesˇenı´ proble´mu˚ z jiny´ch veˇd, oboru˚ a oblastı´ lidske´ cˇinnosti, je schopnost srozumitelneˇ a kvalitneˇ presentovat vy´sledky sve´ pra´ce prˇ´ımo klı´cˇova´. Nic totizˇ nenı´ platna´ sebele´pe provedena´ analy´za, kdyzˇ jejı´ za´veˇry a jejich vy´znam nikdo nepochopı´. Psanı´ cˇla´nku˚ je spı´sˇe umeˇnı´ nezˇ veˇda a jake´koli rady a pravidla ty´kajı´cı´ se tohoto te´matu musı´ by´t nutneˇ pouze ra´mcove´. Kazˇdy´ cˇla´nek ma´ svu˚j zvla´sˇtnı´ u ´ cˇel a je psa´n pro urcˇity´ typ cˇtena´rˇe. Neˇktere´ cˇla´nky se musı´ podrˇ´ıdit vneˇjsˇ´ım pravidlu˚m jako jsou forma´tove´ pozˇadavky veˇdecky´ch cˇasopisu˚, omezenı´ pocˇtem stra´nek/slov, sta´tnı´ normy apod. Veˇtsˇina konvencı´ ohledneˇ psanı´ cˇla´nku˚ je cˇisteˇ zvykova´ a do znacˇne´ mı´ry subjektivnı´ a vycha´zı´ nejen z logiky veˇci, ale i z esteticke´ho cı´teˇnı´ autora. Proto veˇtsˇina rad a za´sad obsazˇeny´ch v tomto dokumentu nema´ by´t cha´pa´na dogmaticky, ale spı´sˇe jako doporucˇenı´, ktera´ je mozˇno prˇizpu˚sobovat situaci. Nezkusˇeny´ autor ma´ veˇtsˇinou tendenci psa´t cˇla´nek jako popis sve´ vlastnı´ zkusˇenosti. Vysveˇtluje, co udeˇlal nejdrˇ´ıve a co na to navazovalo, jak provedl to cˇi ono, zmı´nı´ to, co mu prˇipadalo zajı´mave´, pomine to, co mu je zrˇejme´. Pı´sˇe to prosteˇ ze sve´ho pohledu, svy´m vlastnı´m jazykem. Vy´sledkem je vy´plod, ktery´ je pro kohokoli jine´ho necˇitelny´ a nepochopitelny´. Zkusme to ilustrovat vy´n ˇ atkem z fiktivnı´ vy´zkumne´ zpra´vy, jakou by mohl napsat hodneˇ nezkusˇeny´ statistik: Nejdrˇ´ıve jsem nacˇetl data. Byla tam neˇjaka ´ chybna ´ pozorova ´ nı´, tak jsem je vyhodil. Vsˇechny NA jsem taky vyhodil. Neˇktere´ velicˇiny jsem prˇevedl na faktory, zvla ´ sˇteˇ rggrp, msmt a sex.prd. Udeˇlal jsem si pru˚meˇry a u velicˇiny wrcpt111 to vysˇlo 111.263345, u velicˇiny wrcck112 bylo 2.8363E−03 a u velicˇiny wrcpt112 to dalo 109.276200. Udeˇlal jsem si plot, na ktere´m bylo videˇt, zˇe neˇktera ´ data jsou norma ´ lnı´ a jina ´ nejsou. Pouzˇil jsem funkci shapiro.test a vysˇlo 0.9402, hypote´zu jsem zamı´tl. Fitnul jsem model Yijk = aγj + xij (cij − δ)β + ε. Parametry vysˇly γ = 9.2376E−07, δ = −Inf a β = 0.14423. Na za ´ kladeˇ testu jsme hypote´zu nemohli zamı´tnout. Namaloval jsem si vlivna ´ pozorova ´ nı´ a zˇa ´ dna ´ jsem nenasˇel. Ale z obra ´ zku jsem videˇl, zˇe vy´sledky nejspı´sˇ nemajı´ Weibullovo rozdeˇlenı´. Mozˇna ´ bychom se mohli domnı´vat, zˇe to asi nebylo slabeˇ staciona ´ rnı´.
Tento odstrasˇujı´cı´ prˇ´ıklad je samozrˇejmeˇ prˇehnany´, ale ne zcela nerea´lny´. Cı´lem tohoto dı´lka je poradit, jak se vyhnout nejza´vazˇneˇjsˇ´ım chyba´m prˇi technicke´m psanı´ a jak vytvorˇit zpra´vu, ktera´ se snadno cˇte, je srozumitelna´, budı´ dobry´ dojem a slouzˇ´ı sve´mu u ´ cˇelu.
NMST551 STATISTICKY´
2
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
ˇ LA ´ NKU ˚ PSANI´ C
Struktura c ˇla´nku
ˇ la´nky, ktere´ spocˇ´ıvajı´ v presentaci statisticky´ch analy´z konany´ch za urcˇity´m u C ´ cˇelem a cˇinı´ z jejich vy´sledku˚ konkre´tnı´ za´veˇry, mı´vajı´ na´sledujı´cı´ stavbu: 1. Abstrakt ´ vod 2. U 3. Metody 4. Vy´sledky 5. Za´veˇr Proberme si ted’ strucˇneˇ, co by meˇlo by´t obsazˇeno v jednotlivy´ch cˇa´stech cˇla´nku. Abstrakt by meˇl strucˇneˇ shrnout cely´ obsah cˇla´nku. Obvykly´ rozsah abstraktu je jeden odstavec azˇ pu˚l stra´nky. Abstrakt ma´ jednou nebo dveˇma veˇtami vystihnout podstatu kazˇde´ zby´vajı´cı´ cˇa´sti cˇla´nku, tj. zahrnout to nejdu˚lezˇiteˇjsˇ´ı z u ´ vodu, metod, vy´sledku˚ a za´veˇru˚. Abstrakt se vzˇdy pı´sˇe nakonec. ´ vod ma´ vysveˇtlit, jaky´ proble´m se rˇesˇ´ı, podat ho v sˇirsˇ´ım kontextu a zformulovat U konkre´tnı´ ota´zky, ktere´ ma´ cˇla´nek vyrˇesˇit. Je zde obvykle vysveˇtlena studovana´ problematika na u ´ rovni odpovı´dajı´cı´ znalostem prˇedpokla´dane´ho cˇtena´rˇe. Je zde shrnuto, co je o dane´m proble´mu jizˇ zna´mo, kdo na neˇm pracoval a k cˇemu dospeˇl. Hojneˇ se cituje publikovana´ literatura. Autor by meˇl zdu˚vodnit, procˇ je studovany´ proble´m du˚lezˇity´ a co jeho rˇesˇenı´ prˇinese. V te´to cˇa´sti cˇla´nku je trˇeba co nejprˇesneˇji a co nejkonkre´tneˇji specifikovat ota´zky, na neˇzˇ se cˇla´nek bude snazˇit odpoveˇdeˇt. Ota´zek mu˚zˇe by´t i vı´c, ale meˇly by by´t rozdeˇleny na 1 – 2 ota´zky prima´rnı´, na nichzˇ je soustrˇedeˇn hlavnı´ za´jem, a ota´zky podruzˇne´, sekunda´rnı´. Je velmi du˚lezˇite´, aby ota´zky specifikovane´ v u ´ vodu cˇla´nku byly stanoveny prˇed provedenı´m analy´zy. Pokud se teprve beˇhem analy´zy uka´zˇe zajı´mava´ odpoveˇd’ na ota´zku, kterou si prˇedtı´m nikdo nekladl1 , nemu˚zˇe by´t pru˚kaznost takove´ho vy´sledku kladena naroven ˇ odpoveˇdı´m na ota´zky prˇedem pla´novane´. Metody vysveˇtlujı´ vesˇkerou metodiku studie. Jedna´-li se o experiment, je v metoda´ch popsa´no, jak byl proveden. Jedna´-li se o pozorovacı´ studii, je objasneˇno, jak byli vybı´ra´ni jejı´ u ´ cˇastnı´ci a z jake´ populace pocha´zeli. Je trˇeba vysveˇtlit metody sbeˇru dat a metody meˇrˇenı´ du˚lezˇity´ch velicˇin. Obsahujı´-li data chybeˇjı´cı´ pozorova´nı´ nebo jine´ za´sadnı´ proble´my, autor by meˇl objasnit, jak cˇaste´ byly a jak s nimi bylo nalozˇeno. Popisujı´ se zde i statisticke´ metody pouzˇite´ k analy´ze. Musı´ by´t uvedeno, na jaky´ch podskupina´ch pozorova´nı´ byly jednotlive´ analy´zy provedeny, jak byly ko´dova´ny velicˇiny, jake´ velicˇiny byly zahrnuty v regresnı´ch modelech a jak byly ztransformova´ny, jake´ testy byly provedeny a jak byly pocˇ´ıta´ny intervaly spolehlivosti. Uva´dı´ se tu te´zˇ, v jake´m softwaru byly analy´zy implementova´ny. Metody by meˇly by´t popsa´ny tak podrobneˇ, aby podle tohoto popisu mohl neˇkdo jiny´ celou studii, sbeˇr dat a jejich analy´zu zopakovat. Metody je trˇeba popisovat strucˇneˇ a prˇesneˇ, strˇ´ıdmy´m technicky´m jazykem, 1 Typicky mu˚zˇe nastat trˇeba toto: Provedeme-li pla´novanou analy´zu na cele´m souboru, nevidı´me zˇadny´ efekt. Ale podı´va´me-li se na muzˇe starsˇ´ı 55 let pracujı´cı´ v bankovnı´m sektoru, zjevı´ se vy´znamny´ rozdı´l ve zkoumane´ velicˇineˇ.
2
NMST551 STATISTICKY´
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
ˇ LA ´ NKU ˚ PSANI´ C
s jednoznacˇneˇ definovany´mi pojmy. Do metod nepatrˇ´ı u ´ vahy nad alternativnı´mi zpu˚soby porovedenı´ ani zdu˚vodn ˇ ova´nı´ procˇ bylo provedeno zrovna toto a ne neˇco jine´ho. Do metod te´zˇ nepatrˇ´ı presentace jaky´chkoli vy´sledku˚ s vy´jimkou informace o velikosti populacı´, mnozˇstvı´ vynechany´ch pozorova´nı´, prˇ´ıpadneˇ o velikosti analyzovany´ch podskupin. Vy ´ sledky obsahujı´ soupis vy´sledku˚ vybrany´ch k presentaci v cˇla´nku. Obvykle se takove´ presentace docˇka´ jen velmi mala´ cˇa´st vy´sledku˚, ktere´ statistik beˇhem analy´zy vyprodukuje. Vy´sledky by meˇly zacˇ´ınat popisem analyzovane´ populace formou popisny´ch statistik. Tato cˇa´st je du˚lezˇita´ kvu˚li tomu, aby bylo zrˇejme´, na jake´ populaci byla studie provedena a aby si cˇtena´rˇ mohl ucˇinit prˇedstavu o vhodnosti jejı´ho zobecneˇnı´ na populace jine´. Da´le by meˇly na´sledovat deskriptivnı´ analy´zy, ktere´ se snazˇ´ı naznacˇit odpoveˇd’ na zkoumane´ ota´zky pomocı´ jednoduchy´ch tabulek a grafu˚. Interpretace deskriptivnı´ch analy´z musı´ by´t opatrna´; rozdı´ly v pru˚meˇrech cˇi odlisˇnost v grafu neznamenajı´ nutneˇ, zˇe porovna´vane´ skupiny se skutecˇneˇ lisˇ´ı. Zde je na mı´steˇ pouzˇ´ıvat slova jako „mu˚zˇe by´t“, „zda´ se“, „graf naznacˇuje, zˇe“ apod. Definitivnı´ potvrzenı´ pozdeˇji poskytnou hlavnı´ analy´zy. Pokud ovsˇem hlavnı´ analy´zy dojdou k odlisˇny´m za´veˇru˚m, nezˇ ktere´ lze vytusˇit z tabulek a grafu˚, a autor nenajde pro tento fakt prˇijatelne´ vysveˇtlenı´, mohou by´t vy´sledky hlavnı´ch analy´z a cele´ho cˇla´nku nahlı´zˇeny s nedu˚veˇrou. Vy´sledky hlavnı´ch analy´z obvykle uva´dı´me po deskriptivnı´ch analy´za´ch. Je trˇeba je ihned interpretovat v kontextu zkoumane´ho proble´mu a objasnit, jaky´m zpu˚sobem tyto vy´sledky odpovı´dajı´ na ota´zky specifikovane´ v u ´ vodu cˇla´nku. Po hlavnı´ch analy´za´ch mohou na´sledovat vy´sledky vedlejsˇ´ıch analy´z, jsou-li jake´, prˇ´ıpadneˇ ru˚zne´ nepla´novane´ dopln ˇkove´ analy´zy. ´ cˇelem diskuse je shrnout odpoveˇdi na ota´zky polozˇene´ v u U ´ vodu, vyhodnotit spolehlivost teˇchto odpoveˇdı´ a jejich prakticky´ vy´znam, uve´st je do kontextu proble´mu a porovnat je s drˇ´ıve zna´my´mi vy´sledky a fakty (vcˇetneˇ teˇch zmı´neˇny´ch v u ´ vodu). Diskuse mu˚zˇe probı´rat ru˚zne´ aspekty analy´z, ktere´ mohly ovlivnit vy´sledky, zdu˚vodn ˇ ovat vhodnost pouzˇity´ch metod, vysveˇtlovat silne´ a slabe´ stra´nky pouzˇite´ho prˇ´ıstupu, upozorn ˇ ovat na potencia´lnı´ skryte´ proble´my, shrnovat vy´sledky vedlejsˇ´ıch nebo alternativnı´ch analy´z, ktere´ nebyly vybra´ny k presentaci v cˇla´nku, vyslovovat hypote´zy k oveˇrˇenı´ v budoucı´ch studiı´ch a naznacˇovat smeˇry dalsˇ´ıho vy´zkumu. Diskuse je nesmı´rneˇ du˚lezˇita´, protozˇe uva´dı´ na spra´vnou mı´ru interpretaci obdrzˇeny´ch vy´sledku˚ v cele´m kontextu studovane´ho proble´mu a formuluje jejich konkre´tnı´ prakticke´ du˚sledky. Diskuse by´va´ cˇasto nejdelsˇ´ı cˇa´stı´ cele´ho cˇla´nku. Diskuse je mı´sto, kde mu˚zˇeme vyslovit pochybnosti nad vhodnostı´ zvoleny´ch metod, nebo je naopak obha´jovat, kde mu˚zˇeme upozornit na nejistotu ohledneˇ splneˇnı´ prˇedpokladu˚ pouzˇity´ch metod a poka´zat na mozˇne´ du˚sledky jejich porusˇenı´, kde si mu˚zˇeme dovolit i trochu zaspekulovat. Diskuse by vsˇak meˇla vzˇdy obsahovat neˇjaky´ konkre´tnı´ za´veˇr, a to bud’ na same´m zacˇa´tku nebo naopak na konci. Je-li to mozˇne´ a vhodne´, mu˚zˇeme k cˇla´nku prˇilozˇit dodatky, obsahujı´cı´ podrobnosti, jezˇ nejsou zajı´mave´ pro vsˇechny cˇtena´rˇe a nehodı´ se pro zahrnutı´ do cˇla´nku. Mohou to by´t podrobneˇjsˇ´ı popisy metod, rovnice pouzˇity´ch modelu˚, matematicke´ vzorce, na neˇzˇ nelze odka´zat do literatury, podrobneˇjsˇ´ı tabulky a grafy vy´sledku˚, podrobnosti ˇ la´nek musı´ o softwarove´ implementaci metod, nebo vy´n ˇ atky ze softwarove´ho ko´du. C by´t v kazˇde´m prˇ´ıpadeˇ srozumitelny´ a u ´ plny´ i bez studova´nı´ dodatku˚.
3
NMST551 STATISTICKY´
3
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
ˇ LA ´ NKU ˚ PSANI´ C
Pravidla presentace vy ´ sledku ˚
V za´sadeˇ ma´me trˇi mozˇnosti, jak presentovat konkre´tnı´ vy´sledek statisticke´ analy´zy (odhad parametru, vy´sledek testu apod.): v textu cˇla´nku, v tabulce anebo v grafu. Neˇktere´ za´sady bychom vsˇak meˇli dodrzˇovat bez ohledu na formu presentace vy´sledku. Uved’me si nejdrˇ´ıve neˇktere´ z oneˇch obecny´ch za´sad. • Parametry modelu˚ uva´dı´me v podobeˇ, ktera´ ma´ neˇjakou praktickou interpretaci, a tuto interpretaci slovneˇ popı´sˇeme. Nelze napsat „odhad parametru δ byl 0.0012“. Musı´me si promyslet, co parametr δ znamena´, prˇeve´st ho na co nejsrozumitelneˇjsˇ´ı sˇka´lu a napsat trˇeba „odhadnuty´ relativnı´ na´ru˚st potencia´lu za jednu sekundu byl 0.12%“. • Fysika´lnı´ rozmeˇr parametru nesmı´me opomı´jet. Pokud ma´ naprˇ. odhad parametru u prediktoru vy´sˇka v linea´rnı´m regresnı´m modelu pro hmotnost hodnotu 0.877, pak jej vypisujeme jako 0.877 kg/m. • Pocˇet platny´ch cˇ´ıslic cˇi desetinny´ch mı´st volı´me podle kontextu, nikoli podle toho, co zobrazı´ pocˇ´ıtacˇ. Zrˇ´ıdkakdy je rozumne´ uva´deˇt vı´ce nezˇ trˇi platne´ cˇ´ıslice. Pocˇet desetinny´ch mı´st vsˇak musı´ by´t konsistentnı´ u vy´sledku˚, ktere´ se cˇtou spolecˇneˇ (naprˇ. jeden sloupec tabulky). Pı´sˇeme tedy odhad a interval spolehlivosti takto: 1.24 (0.00 – 2.48), nikoli takto 1.2 (0.0006 – 2.5). • Bodove´ odhady parametru˚, zvla´sˇteˇ teˇch, ktere´ jsou podstatne´ pro u ´ cˇel analy´zy, doprova´zı´me intervalem spolehlivosti. Bodove´ odhady bez intervalu˚ bychom meˇli zpravidla uva´deˇt pouze v tabulka´ch deskriptivnı´ch statistik. Jako krite´rium vy´beˇru mezi presentacı´ v textu, tabulce cˇi v grafu poslouzˇ´ı nejle´pe plosˇna´ u ´ spornost jednotlivy´ch variant. Ma´m-li na sloupcove´m diagramu trˇi sloupce, spotrˇebuji tı´m vlastneˇ pu˚l stra´nky na presentaci trˇ´ı cˇ´ısel. V takove´m prˇ´ıpadeˇ je nejvhodneˇjsˇ´ı uve´st tato trˇi cˇ´ısla prˇ´ımo v textu cˇla´nku. Tabulka s dveˇma rˇa´dky a dveˇma sloupci je take´ velmi neu ´ sporna´, cˇtyrˇi cˇ´ısla v textu zaberou mnohem me´neˇ mı´sta. Tabulky se obecneˇ hodı´ pro prˇehlednou systematickou presentaci veˇtsˇ´ıho pocˇtu cˇ´ıselny´ch vy´sledku˚, ktere´ je trˇeba porovna´vat. Grafy se hodı´ tam, kde je trˇeba porovnat jesˇteˇ veˇtsˇ´ı pocˇet cˇ´ıselny´ch vy´sledku˚, jejichzˇ konkre´tnı´ cˇ´ıselne´ hodnoty nenı´ trˇeba prˇ´ımo uva´deˇt a pro neˇzˇ lze najı´t takovy´ zpu˚sob graficke´ presentace, jenzˇ usnadnı´ jejich vizua´lnı´ porovna´nı´. Grafy se take´ hodı´ pro zobrazenı´ slozˇiteˇjsˇ´ıch funkcı´, ktere´ nelze srozumitelneˇ popsat uvedenı´m jednodusˇe interpretovatelny´ch parametru˚, a pro ilustraci interakcı´ v regresnı´ch modelech. Pouzˇ´ıva´m-li naprˇ´ıklad kvadratickou regresi, je lepsˇ´ı odhadnutou parabolu nakreslit do grafu, nezˇ uva´deˇt odhadnute´ hodnoty regresnı´ch koeficientu˚ — ty majı´ v tomto prˇ´ıpadeˇ velmi nesnadnou interpretaci. Pouzˇ´ıva´nı´ tabulek a grafu˚ v cˇla´ncı´ch ma´ neˇktera´ spolecˇna´ pravidla a neˇktera´ specificka´. Tabulky a grafy neuva´dı´me prˇ´ımo do textu cˇla´nku, ale umı´stı´me je bud’ na samostatne´ stra´nky nebo na vyhrazene´ mı´sto v hornı´ nebo dolnı´ cˇa´sti beˇzˇny´ch stra´nek. LATEX, na rozdı´l od MSWordu, se o umı´steˇnı´ plovoucı´ch grafu˚ a tabulek postara´ automaticky. Kazˇdy´ graf a tabulku ocˇ´ıslujeme a zarˇadı´me k nim legendu (u grafu˚ obvykle pod obra´zkem, u tabulek nad). Legenda musı´ popisovat obsah grafu cˇi tabulky tak podrobneˇ, aby jim cˇtena´rˇ rozumeˇl bez du˚kladne´ho studova´nı´ textu cˇla´nku. Na kazˇdou tabulku a graf musı´ by´t v textu odkaz pomocı´ jejich cˇ´ısla. Na prˇ´ıslusˇne´m mı´steˇ textu pak shrneme ty nejdu˚lezˇiteˇjsˇ´ı za´veˇry, ktere´ lze z tabulky cˇi grafu ucˇinit. Text by
4
NMST551 STATISTICKY´
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
ˇ LA ´ NKU ˚ PSANI´ C
meˇl by´t cˇitelny´ a srozumitelny´ i bez prohlı´zˇenı´ tabulek a grafu˚ a tabulky a grafy by meˇly by´t srozumitelne´ i bez podrobne´ cˇetby textu. Na tabulky a grafy odkazujeme pokud mozˇno neprˇ´ımo v pru˚beˇhu beˇzˇne´ho toku textu; mı´sto „Tabulka 1 ukazuje, zˇe muzˇi jsou v pru˚meˇru vysˇsˇ´ı nezˇ zˇeny“ radeˇji napı´sˇeme „Muzˇi byli vy´znamneˇ vysˇsˇ´ı nezˇ zˇeny (viz Tabulka 1)“. Kra´tky´ cˇla´nek (rozsahem do 10 stran A4) by meˇl obsahovat nejvy´sˇe 5 – 8 tabulek a grafu˚ celkem. U tabulek se doporucˇuje dodrzˇovat na´sledujı´cı´ pravidla: • Vyhy´bat se svisly´m linka´m. Silneˇjsˇ´ımi vodorovny´mi linkami oddeˇlit tabulku od okolnı´ho textu vcˇetneˇ legendy, slabsˇ´ımi vodorovny´mi linkami oddeˇlovat za´hlavı´ sloupcu˚ od teˇla tabulky a jednotlive´ cˇa´sti tabulky mezi sebou. V LATEXu tuto podobu tabulek implementuje balı´k booktabs. Chceme-li vy´razneˇji oddeˇlit neˇktere´ sloupce od jiny´ch, vlozˇ´ıme mezi neˇ veˇtsˇ´ı mezeru. • Nemeˇnit typ, forma´t a vy´znam obsahu polı´cˇek v tomte´zˇ sloupci (nenı´ dobre´ do te´hozˇ sloupce zapisovat tu pru˚meˇr onde procenta). • Neopakovat tenty´zˇ obsah polı´cˇek mnohokra´t za sebou. Ma´me-li sloupec Rozptyl, ktery´ v prvnı´ch deseti rˇa´dcı´ch obsahuje hodnotu 0.5 a v druhy´ch deseti rˇa´dcı´ch hodnotu 1.5, pak tento sloupec radeˇji zrusˇ´ıme a vyrˇesˇ´ıme to jinak. Naprˇ´ıklad mu˚zˇeme tabulku rozdeˇlit na dveˇ nebo do nı´ vlozˇit popisne´ rˇa´dky, ktere´ informujı´ o neˇjake´ promeˇnne´ hodnoteˇ opakujı´cı´ se v na´sledujı´cı´m oddı´le tabulky (naprˇ. „Rozptyl = 0.5“ a nı´zˇe „Rozptyl = 1.5“). ˇ ´ısla v tabulce zarovna´vat na desetinnou tecˇku. • C • V tabulce je neˇkdy potrˇebne´ pouzˇ´ıvat zkratky, ktere´ se jinde v cˇla´nku nevyskytujı´. Tyto zkratky mu˚zˇeme vysveˇtlit v legendeˇ nebo v pozna´mka´ch pod tabulkou. Pozna´mky pod tabulkou mu˚zˇeme vyuzˇ´ıt i k podrobneˇjsˇ´ımu vysveˇtlenı´ vy´znamu neˇktery´ch sloupcu˚ nebo hodnot. Nakonec zmin ˇ me neˇkolik rad ty´kajı´cı´ch se grafu˚. • Graf by meˇl by´t vytvorˇen ve velikosti, v nı´zˇ bude pouzˇit ve cˇla´nku. Zmensˇenı´ prˇ´ılisˇ velke´ho grafu vede ke sˇpatne´ cˇitelnosti popisku˚. • Osy grafu musı´ by´t rˇa´dneˇ popsa´ny ve stejne´m jazyce, v jake´m je psa´n cˇla´nek2 . Kreslı´me-li graf hmotnosti proti vy´sˇce, nenecha´me na nich popisky ht a wt, ale osy popı´sˇeme Vy´sˇka [cm] a Hmotnost [kg]. • Chceme-li na dvourozmeˇrne´m grafu vyznacˇit hodnoty jednotlivy´ch pozorova´nı´, da´me pozor, aby se neslily do jednolite´ cˇerne´ tmy. Je-li pozorova´nı´ mnoho, zmensˇ´ıme velikost symbolu, ktery´m je vykreslujeme, anebo radeˇji na´hodneˇ vybereme malou cˇa´st pozorova´nı´, kterou do grafu zaneseme. Grafy, ktere´ obsahujı´ tisı´ce pozorova´nı´, deˇlajı´ proble´my hlavneˇ v elektronicky´ch dokumentech, protozˇe vy´razneˇ zveˇtsˇujı´ velikost souboru˚.3 ˇ a´ry rozlisˇujeme ty• Je-li dokument urcˇen k tisku, vyhy´ba´me se pouzˇ´ıva´nı´ barev. C pem (plna´, tecˇkovana´, cˇerchovana´,. . . ), plochy dostatecˇneˇ rozdı´lny´mi intensitami sˇede´ nebo sˇrafova´nı´m. Vy´znam jednotlivy´ch typu˚ cˇar a ploch vysveˇtlı´me bud’ v textove´ legendeˇ ke grafu anebo v graficke´ legendeˇ, ktera´ je prˇ´ımo soucˇa´stı´ obra´zku. 2 3
Absenci diakritiky vsˇak lze jisteˇ tolerovat. Jeden takovy´ graf mu˚zˇe mı´t klidneˇ neˇkolik MB.
5
NMST551 STATISTICKY´
4
´R ˇ PROJEKTOVY´ SEMINA
ZA´SADY
ˇ LA ´ NKU ˚ PSANI´ C
Jazykove´ a typograficke´ rady
ˇ la´nek by meˇl by´t napsany´ souvisly´m textem, bez heslovity´ch vsuvek a bez pouzˇitı´ odC ra´zˇek a cˇ´ıslovany´ch odstavcu˚. Kazˇda´ veˇta by meˇla by´t u ´ plna´, s podmeˇtem a prˇ´ısudkem. Autor by se meˇl vyhy´bat jak slozˇity´m souveˇtı´m tak holy´m veˇta´m. Veˇty a odstavce by na sebe meˇly logicky navazovat, systematicky probı´rat jedno te´ma po druhe´m, neprˇeskakovat a neodkazovat na fakta, ktera´ jesˇteˇ nebyla zmı´neˇna. Odstavce nesmı´ by´t prˇ´ılisˇ kra´tke´ (trˇi rˇa´dky je ma´lo) ani prˇ´ılisˇ dlouhe´; idea´lnı´ de´lka odstavce je cˇtvrt azˇ pu˚l stra´nky. Kra´tke´ cˇla´nky (kolem 10 stra´nek textu) nemajı´ obsahovat vı´c nezˇ jedno cˇleneˇnı´, tedy zˇa´dne´ podkapitoly ani mezititulky. Styl by meˇl by´t strˇ´ıdmy´, bez citoveˇ zabarveny´ch a expresı´vnı´ch vy´razu˚. Je trˇeba psa´t u ´ sporneˇ a vyhy´bat se vycpa´vkovy´m slovu˚m a veˇtny´m konstrukcı´m, ktere´ nenesou zˇa´dnou informaci. Mezi takove´ patrˇ´ı zejme´na veˇtsˇina vy´skytu˚ slov „zejme´na“, „takrˇka“, „velmi“, „jak vidı´me“ , „jak bylo ˇrecˇeno“ a podobneˇ. Autor by si meˇl po sobeˇ prˇecˇ´ıst vsˇe, co napsal, a uvazˇovat nad kazˇdy´m slovem, vsuvkou, vedlejsˇ´ı veˇtou, jestli se zmeˇnı´ smysl sdeˇlenı´, pokud by tam tento kus nebyl. Jestlizˇe se smysl nezmeˇnı´, jedna´ se o vycpa´vku, kterou je trˇeba smazat. ˇ la´nek by meˇl by´t napsa´n cely´ v jednotne´m cˇase; obvykle je vhodneˇjsˇ´ı zvolit cˇas C minuly´ nezˇ cˇas prˇ´ıtomny´. Odkazuje-li autor na sebe, deˇla´ to cˇasto v mnozˇne´m cˇ´ısle i kdyzˇ cˇla´nek pı´sˇe sa´m („udeˇlali jsme. . . “, „odhadli jsme. . . “). Neˇkterˇ´ı tento postup kritisujı´ jakozˇto nevhodny´ plural majestatis, ale neˇkomu zas mohou prˇipadat tvary „udeˇlal jsem. . . “, „odhadl jsem. . . “ prˇ´ılisˇ osobnı´. To za´lezˇ´ı na vkusu. V cˇeske´m textu by cizı´ slova meˇla by´t pouzˇ´ıva´na s mı´rou, zvla´sˇteˇ pokud majı´ cˇeska´ synonyma. Obzvla´sˇt’ odporne´ je kopı´rova´nı´ anglicky´ch slov z vy´stupu pocˇ´ıtacˇovy´ch programu˚ („intercept“, „P-value“). U odborny´ch termı´nu˚ radeˇji pouzˇ´ıva´me jednu variantu, i kdyzˇ se tata´zˇ veˇc da´ nazy´vat vı´ce zpu˚soby: naprˇ. nestrˇ´ıda´me pojmy „interval spolehlivosti“, „konfidencˇnı´ interval“ a „intervalovy´ odhad“, ale vybereme si jednu verzi a te´ se drzˇ´ıme. Zkratky vysveˇtlujeme tak, zˇe prˇi prvnı´m pouzˇitı´ uvedeme cely´ nezkra´ceny´ tvar a zkratku da´me za neˇj do za´vorky. Vyhy´ba´me se krypticky´m ko´du˚m (rozhodneˇ neoznacˇ´ıme mladsˇ´ı muzˇe za skupinu I a starsˇ´ı zˇeny za skupinu II, abychom mohli nada´le mluvit jen o rozdı´lech mezi skupinami I a II). Ve cˇla´nku za´sadneˇ nepouzˇ´ıva´me na´zvy velicˇin, ktere´ jsme meˇli zavedeny v programech pro analy´zu anebo ve vstupnı´ch datech. Na za´veˇr prˇipojujeme prˇa´nı´ hodneˇ sˇteˇstı´ prˇi psacı´ a publikacˇnı´ cˇinnosti.
Dopln ˇ ujı´cı´ literatura ˇ esta´k, Zdeneˇk. Jak psa´t a prˇedna´sˇet o veˇdeˇ. Academia, Praha, 2000. S Higham, Nicolas J. Handbook of Writing for the Mathematical Sciences. SIAM, Philadelphia, 1993. c Michal Kulich
8. 10. 2014
6