INFORMACE Data z mezinárodního projektu SHARE O výzkumu SHARE Survey of Health, Ageing and Retirement in Europe (SHARE) je mezinárodní longitudinální výzkum, jehož hlavním cílem je popsat proces stárnutí Evropanů v sociálním kontextu jednotlivých států. Výzkum je zaměřen na populaci ve věku 50+ a respondenti jsou v rámci panelového výzkumu dotazováni každé dva roky. Hlavními tématy jsou tělesné a duševní zdraví, zdravotní péče, vzájemná podpora a finanční pomoc v rodině, sociální sítě, vzdělání, ekonomická aktivita, bydlení, příjmy a spotřeba domácností, kvalita života, očekávání do budoucnosti a demografické charakteristiky. Koordinátorem projektu je profesor Axel Borsch-Supan, ředitel Mannheim Institute for Economics of Ageing, University of Mannheim. Vedoucím české části projektu je Radim Boháček z Národohospodářského ústavu AV ČR, realizátorem sběru dat je agentura SC&C. Správu dat a technickou spolupráci zajišťuje archiv CentERdata, univerzita v Tilburgu. Výzkum je podporován Evropskou komisí za spoluúčasti dalších institucí jednotlivých států. První vlna projektu SHARE byla realizována v roce 2004, dotázáno bylo 27 tisíc respondentů v 11 státech západní Evropy. Druhá vlna proběhla ve stejných zemích v roce 2006, v této fázi se poprvé do projektu zapojila Česká republika a Polsko. V současné době probíhá sběr a příprava dat k další vlně projektu, zvané SHARE LIFE a od roku 2010 je plánováno ještě pětikolové pokračování výzkumu. Díky longitudinální povaze projektu jsou získaná data mimořádně hodnotná. Zachycují nejen společenký vývoj v kontextu makrosociálních událostí, ale díky své panelové povaze umožňují sledovat i změny v situaci, zdraví a názorech jednotlivců. Vzhledem k hlavnímu cíli projektu, kterým je zaměření se na aspekt stárnutí, jsou velmi cenné podrobné otázky mapující zdravotní stav dotázaných spolu s fyzickými testy, které jsou součástí dotazování. Tyto údaje poskytují globální informaci o zdravotním stavu stárnoucích generací a vlivu této charakteristiky na další aspekty života. Sběr dat k projektu SHARE podléhá přísným požadavkům na kvalitu dat. Samozřejmostí jsou několikadenní školení tazatelů podle sjednocené metodiky. Výběr respondentů v první vlně stojí na pravděpodobnostní bázi. Spolu s vybranými osobami jsou dotazováni i jejich partneři či partnerky. V další, longitudinální vlně výzkumu jsou pak opětovně osloveni titíž respondenti. Za respondenty, kteří v intervalu mezi dotazováními zemřeli, je vyplňován speciální „Proxy“ dotazník s blízkým náhradníkem, který popisuje mimo jiné okolnosti úmrtí původního respondenta. Standardně je ve výzkumu počítáno s 85% návratností. V dalších vlnách jsou výběry pro dodržení požadovaného rozsahu vzorku navyšovány o nové respondenty opět pravděpodobnostní metodou. Samotné dotazování probíhá formou CAPI s následným papírovým samovyplňovacím dotazníkem. - 259 -
O datech SHARE Velkou předností projektu SHARE je, že data jsou zdarma přístupná veškeré vědecké veřejnosti. Metadata k výzkumu jsou k dispozici volně na oficiálních stránkách projektu www.share-project.org. Zde nalezneme dotazníky z obou minulých vln projektu, a to jak v původní anglické verzi, tak i přeložené verze ve všech národních jazycích. V sekci „Results“ na stejných internetových stránkách jsou vyvěšeny podrobné výsledky analýz z první i druhé vlny srovnávající všechny zúčastněné země, a také základní výsledky uspořádané do brožurek pro jednotlivé státy v národních jazycích. Na další texty, které vznikly na základě dat z projektu SHARE, odkazuje sekce „Publications“, kde jsou uvedeny jednotlivé citace, a to často i s odkazem na elektronickou verzi daného dokumentu. Některé další materiály v češtině je možné nalézt na českých oficiálních stránkách projektu na adrese http://www. cerge-ei.cz/share%2Dproject/. Metodologie výzkumu SHARE je vysvětlena na stránkách projektu v sekci „Methodology”. Zde jsou uloženy materiály podrobně popisující projekt od vývoje a překladu nástrojů, přes školení tazatelů, výběrové procedury a průběh dotazování až po informace o návratnosti. Všechny tyto soubory se ovšem týkají pouze první vlny projektu. Pro získání přístupu k samotným datům je třeba vyplnit registrační formulář a poslat jej faxem, poštou nebo naskenovaný e-mailem na adresu Tilburg University, která má správu archivu CentERdata na starosti. Registrační formulář ke stažení a kontaktní údaje jsou k dispozici na stránkách projektu SHARE v záložce „Research Data Center“. V registračním formuláři zájemce vyplní své jméno a jméno instituce, ke které se hlásí, dále zadá kontaktní e-mail a podepíše souhlas s podmínkami pro využívání dat. Podmínkami užívání jsou zákaz přímého poskytování dat další osobě, striktně výzkumné účely využití, povinnost informovat koordinátora projektu SHARE o každé publikaci pracující s daty a také povinnost odkazovat u veškerých vytvořených publikací citací, jež je v registračním formuláři doslovně předepsána. Zájemce o data není povinen specifikovat účel svého zájmu o data. Následná spolupráce s archivem funguje velice rychle. Během několika hodin od odeslání registračního formuláře obdrží zájemce o data e-mail s identifikačním číslem a přístupovým heslem. S těmito údaji je pak možné se přihlásit a stáhnout soubory opět z oficiálních stránek projektu SHARE v záložce „Research Data Center / Download the Data“. Přístupové údaje zůstávají nadále platné a umožňují tak opětovný vstup do systému. Po zadání přístupových údajů je uživateli nabídnuta možnost stáhnout data z první nebo druhé vlny výzkumu SHARE. Vzhledem k české účasti pouze ve druhé vlně je pro českého uživatele zajímavější složka SHARE Wave 2. Složka souborů ke stažení obsahuje kromě datových matic průvodce pro usnadnění orientace v datech „SHARE Guide to Release 2.3.0, Wave 1 and Wave 2_update 10.12.2009”. Ten je zároveň ke stažení i na stránkách projektu v sekci „Documentation“. Tento dokument je velmi přínosný. Upozorňuje na nesamo- 260 -
Obrázek 1. Projekt SHARE na internetu
Zdroj: SHARE, http://www.share-project.org/.
zřejmosti, se kterými by uživatel mohl mít při práci s maticemi problémy, pokud by jim nevěnoval zvláštní pozornost. Mimo jiné vysvětluje například doporučené postupy při spojování matic, při používání vah a objasňuje možnosti transformace některých národně-specifických proměnných do srovnatelné podoby. Dále složka obsahuje datové matice. Data jsou dostupná ve formátech SPSS nebo STATA. Matice jsou sloučené pro všechny státy, ale oddělené podle jednotlivých modulů dotazníku (dotazník obsahuje dvacet tematických modulů, Coverscreen, který je vždy společný pro domácnost, a Drop off, neboli samovyplňovací dotazník opět na individuální úrovni, který vyplňují respondenti na konci rozhovoru). Je pak možné stáhnout pouze data z konkrétního modulu nebo rovnou zip soubor s maticemi za všechny moduly projektu SHARE. Jednotlivé datové matice obsahují na počátku vždy identifikační údaje, mezi nimiž je důležité zejména identifikační číslo respondenta. Toto číslo je pro každého respondenta unikátní a zůstává mu po celou dobu sběru dat, napříč vlnami. Pomocí této proměnné a další proměnné, která specifikuje pořadí respondenta v domácnosti, je doporučeno spojovat jednotlivé matice pro potřeby analýzy více modulů či více vln zároveň. Vždy je ale třeba dbát na fakt, že ne všechny moduly zodpovídali všichni respondenti. Informace o respondentech a o spojování dat z - 261 -
modulů finance, bydlení a rodina, které jsou sbírány pouze na úrovni domácností, konkrétně popisuje výše zmiňovaný průvodce pro práci s daty. V každé matici ke stažení jsou dále proměnné „country“ a „language“, které udávají původ respondenta. Ostatní proměnné jsou vždy pojmenovány zkratkou modulu a číslem a případně dalším specifickým označením podle čísla otázky v dotazníku. Konkrétní logiku značení standardních proměnných i nových, na první pohled lehce nepřehledných „dummy variables“ osvětluje opět průvodce. Veškeré proměnné i hodnoty v maticích jsou popsány a data jsou vyčištěna. Doporučení v dokumentaci ale přesto nabádá výzkumníky ke kontrole dat při práci s nimi. Data z projektu SHARE jsou tedy snadno k dispozici a jsou připravena k analýze. Na nesrovnalosti či nástrahy, které mohou uživatele překvapit, je systematicky upozorněno v přiložené dokumentaci dat. Malou nevýhodou může být nemožnost stažení celkové matice ve spojeném datovém souboru a také relativně zúžený obsah dokumentace specificky ke druhé vlně výzkumu. Hlavními přednostmi dat z projektu SHARE jsou jejich snadná dostupnost, vysoká kvalita daná metodikou šetření a jejich longitudinální a mezinárodně srovnatelný charakter. Data jsou využitelná jak pro aplikovaný výzkum v oblasti národního hospodářství, zdravotnictví a sociálního či důchodového zabezpečení, tak i pro sociologické analýzy mapující vliv zdraví a dalších faktorů na rozličné oblasti života starších generací. Možnost zjišťovat veškeré údaje v mezinárodním a časovém srovnání vnáší do prováděných analýz další dimenze. V roce 2009 probíhal sběr dat další vlny výzkumu SHARE. Tento dílčí projekt se nazývá SHARE LIFE a jeho cílem je rekonstruovat životní dráhy současné populace 50+. Z dat, která budou k dispozici po jejich zpracování, bude možné získat informace o vlivu minulých událostí na současné zdraví a na další aspekty života. Informace bude možné stavět do souvislostí s někdejším politickým děním a institucionálními kroky sociálního státu. Tato vlna bude mít již i pro Českou republiku panelový charakter. Specifikem pro dotazování v Česku a Polsku bude také část věnovaná prohibici a postižení lidí a jejich rodin nedemokratickými režimy minulosti. Spojení informací o současné zdravotní, ekonomické, sociální a rodinné situaci a o pociťovaných náladách jednotlivců s jejich životními příběhy v historickém kontextu tak otevře nové možnosti pro analýzu dat z projektu SHARE. Romana Benešová (Sociologický ústav AV ČR, v.v.i.) Poznámka: This paper uses data from SHARE Waves 1 & 2, as of December 2008. SHARE data collection in 2004-2007 was primarily funded by the European Commission through its 5th and 6th framework programmes (project numbers QLK6-CT-2001- 00360; RII-CT- 2006062193; CIT5-CT-2005-028857). Additional funding by the US National Institute on Aging (grant numbers U01 AG09740-13S2; P01 AG005842; P01 AG08291; P30 AG12815; Y1-AG4553-01; OGHA 04-064; R21 AG025169) as well as by various national sources is gratefully acknowledged (see http://www.share-project.org for a full list of funding institutions).
- 262 -
NetMonitor NetMonitor je výzkumný projekt, který se zabývá návštěvností internetu v České republice. Přestože má tento projekt primárně komerční využití, jeho výstupy obsahují i mnoho zajímavých informací pro sociálněvědní účely.
O projektu Projekt NetMonitor je výzkumný projekt mapující návštěvnost internetu v České republice a jeho přínos pro sociální výzkum spatřuji v mapování sociodemografického složení návštěvníků internetu. Primární účel tohoto projektu je ale samozřejmě komerční. Základní myšlenkou je poskytování informací o počtu návštěvníků jednotlivých serverů a jejich sociodemografickém složení, které dále slouží zadavatelům reklamy pro lepší a cílenější kampaň. Zadavatelem projektu je SPIR (Sdružení pro internetovou reklamu), což je profesní sdružení, které zahrnuje jak zástupce poskytovatelů obsahu, tak zadavatelů reklamy, a realizátorem je Mediaresearch, společnost zabývající se výzkumem trhu, médií a veřejného mínění. Výzkum je tedy rozdělen na dvě části: měření návštěvnosti a výzkum sociodemografie návštěvníků. Měření podává informaci o všech návštěvnících serveru a je prováděno na straně serveru pomocí systému gemiusTraffic, vyvinutého polskou firmou Gemius, který je používán i v dalších zemích východní Evropy. Výzkum sociodemografie probíhá pomocí pop-up dotazníků, které jsou umístěny na straně měřeného serveru. Dostáváme tak informaci o sociodemografickém složení návštěvníků internetu na základě vzorku respondentů. Webové stránky NetMonitoru jsou uživatelsky příjemné a přehledné. Na úvodní stránce se dozvíme základní informace o projektu. Metodika Jak již bylo výše uvedeno, metodika obou částí se liší. Pro sledování návštěvnosti jsou data měřena pomocí JavaScriptu, který je vložený do stránek, a pomocí cookies, které poskytují okamžitá on-line data přístupná na stránkách NetMonitoru a také shrnující statistiky. Pro dosažení celkového počtu návštěvníků je ale potřeba data upravit. Nejprve se vygeneruje počet cookies, které by vznikaly, kdyby nebyly mazány, a poté se na základě počtu uživatelů internetu v České republice vypočte reálný počet uživatelů jednotlivých serverů. Je to tedy odhad na základě promyšlených propočtů a měl by reálnému stavu odpovídat více než jednoduchý počet cookies. Sociodemografické údaje jsou shromažďovány pomocí pop-up dotazníků. Dotazník se skládá ze sedmi kroků, kdy přejít na další krok je možno vždy až po vyplnění otázek na straně stávající. První otázka se týká místa vyplňování dotazníku a tedy připojení k internetu, druhá – navazující – pak času stráveného na tomto počítači v porovnání s ostatními uživateli. Další otázky se ptají na obecně nejčastější místo připojení k internetu, frekvence používání internetu a hodnocení znalostí práce s počítačem a internetem. Dále jsou zde otázky týkající se činností prováděných na počítači a na internetu a otázka věnovaná trávení času - 263 -
vyhledáváním na zahraničních serverech. Poté již následují sociodemografické otázky jako pohlaví, datum narození, nejvyšší dokončené vzdělání, rodinný stav, počet osob v domácnosti a také otázky zjišťující postavení osoby v domácnosti, ekonomickou aktivitu, zaměstnání respondenta, příjem domácnosti, bydliště a otázky týkající se vybavenosti domácnosti.
Data Na stránkách nalezneme veřejné výstupy a on-line data. Podíváme se nejprve na veřejné výstupy. Tato záložka zahrnuje měsíční zprávy a sociodemografické zprávy a to vždy za každý měsíc od března 2005. Měsíční zpráva obsahuje vždy rozsáhlou tabulku týkající se jednotlivých serverů a jejich návštěvnosti, tzn. počet návštěvníků (reálných uživatelů) za měsíc, průměrný počet návštěvníků za týden, průměrný počet návštěvníků za den, průměrný počet návštěvníků za pracovní den, průměrný počet návštěvníků za víkend, počet zobrazení za měsíc, průměrný strávený čas návštěvníka za měsíc, průměrný strávený čas návštěvníka za den, návštěvy za měsíc, průměrná délka návštěvy za měsíc. Z délky jednotlivých měsíčních zpráv můžeme usuzovat na rozšiřování projektu, zpráva z března 2005 má 8 stran, zatímco zpráva z dubna 2009 již stran 52. Novější zprávy obsahují navíc členění podle médií, provozovatelů, packů a kategorií (např. vyhledávače a katalogy; služby – mapy, e-maily, jízdní řády; zpravodajství; sport; bulvární zpravodajství, společenské magazíny; životní styl, hobby; atd.) Sociodemografická zpráva obsahuje informace (tabulky a grafy) o základních ukazatelích, jako jsou pohlaví, věk, vzdělání, rodinný stav, údaje o domácnosti, ekonomické aktivitě, příjmu domácnosti, údaje o bydlišti, údaje týkající se používání a připojení k internetu, zaměstnání, atd. Tabulka vždy obsahuje údaj o počtu návštěvníků vybraného média z cílové skupiny, procentuálním složením návštěvníků, počet zobrazení generovaných na médiu uživateli z příslušné cílové skupiny, procentuální složení zobrazení a hrubý zásah dané cílové skupiny na vybraném médiu. Nyní se podíváme na on-line data. Tato sekce umožňuje zobrazovat data o cookies. V on-line aplikaci můžeme pomocí záložek nastavovat různá zobrazení dat. Můžeme si zobrazit všechna data, nebo pouze data za Českou republiku, či naopak za ostatní. Dále si můžeme vybrat, zda chceme zobrazit data za média, provozovatele, packy, či kategorie. Také si můžeme přidat či odebrat jednotlivé sloupce, které zobrazují různé údaje. Tyto údaje jsou podobné jako u měsíční zprávy, tzn. odhad reálných uživatelů, reální uživatelé, zobrazení, návštěvy, celkový strávený čas, průměrný strávený čas reálným uživatelem a jeho odhad a průměrná délka návštěvy. Dále si můžeme vybrat datum a možnost zobrazení dat za den, týden nebo měsíc. Po nastavení všech záložek klikneme na tlačítko „spočti“ a tabulka se nám převede do souboru v excelu, který je ikonou zobrazen v horní části stránky. Stačí si pak soubor uložit či otevřít a můžeme s ním dále pracovat. Na stránkách je dále možno v sekci novinky a tiskové zprávy stahovat tiskové zprávy, které informují o zajímavých zjištěních. Jedná se krátké přehledné články, které obsahují statistiky, tabulky a grafy. Další sekcí jsou dokumenty o projektu. - 264 -
Zde jsou umístěny praktické dokumenty jako metodika projektu, etický kodex, ceník a smlouvy, jak o účasti ve výzkumu, tak o poskytování dat. Zajímavým materiálem v této sekci je dokument Trendy v návštěvnosti internetu leden 2007 – únor 2009, který obsahuje zajímavé ucelené informace mapující toto období. Je zde také sekce vyhledávání, která umožňuje hledání v tiskových zprávách. Další dvě sekce se týkají přihlášení. Za prvé přihlášení média do projektu a za druhé přihlášení odběratele dat. Následují kontakty.
Závěr Projekt NetMonitor představuje velmi zajímavý zdroj dat. Jeho nevýhodou ovšem je, že kompletní primární data nejsou volně přístupná a je třeba je zaplatit. Přesto si myslím, že i volně přístupná data a vypracované výstupy poskytují poměrně velké množství zajímavých a využitelných informací. Stránky NetMonitoru jsou tak přinejmenším zajímavým zdrojem pro sledování trendů a novinek v oblasti návštěvnosti internetu. Světlana Zeipeltová (Fakulta sociálních věd UK)
35. výročná konferencia IASSIST: Mobilné dáta a životný cyklus V dňoch 26. - 29. mája 2009 sa vo fínskom Tampere uskutočnila už 35. výročná konferencia organizácie IASSIST (International Association for Social Science Information Service and Technology), v spolupráci s IFDO (International Federation of Data Organisations for the Social Science). IASSIST je medzinárodnou organizáciou s globálnym pokrytím združujúcou profesionálov pracujúcich s informačnými technológiami a poskytujúcimi dátové služby na podporu výskumu a výučby v sociálnych vedách. Členovia pôsobia na rôznych pracoviskách, od dátových archívov a štatistických agentúr, cez výskumné centrá, knižnice, až po vládne či neziskové organizácie, ale aj súkromné spoločnosti. IASSIST je otvorená novým členom, ktorým ponúka príležitosť na profesionálne kontakty a orientáciu v najnovších trendoch v danej oblasti. Témou tohtoročnej konferencie boli Mobilné dáta a životný cyklus (Mobile data and the life-cycle) a hostil ju Fínsky dátový archív1. Miesto konania Tampere je známe ako kolíska mnohých technologických inovácií, sídlo aj s vývojovými laboratóriami, tu má napríklad Nokia. Autor tejto správy sa konferencie zúčastnil vďaka podpore Agentúry na podporu výskumu a vývoja2, IASSIST, Council of European Social Science Data Archives (CESSDA) a Slovenského archívu sociálnych dát, ktorým patrí autorova vďaka. Téma konferencie Mobilné dáta a životný cyklus predstavovala zámer usporiadateľov podnietiť diskusiu o tvorbe, zbere, zdieľaní, archivovaní, rozširovaní, dôvernosti a prístupe k dátam vo svete, ktorý sa stáva stále mobilnejším. Životný 1
http://www.fsd.uta.fi
2 Grant číslo: APVV-0529-07; Slovensko v kľúčových medzinárodných výskumoch: dvadsať rokov premien spoločnosti.
- 265 -
Obrázok 1. Konferencia IASSIST na www stránkach FSD
Zdroj: FSD/IASSIST, http://www.fsd.uta.fi/iassist2009/.
cyklus v názve témy mal poukázať na význam každej jednotlivej fázy životného cyklu dát na zabezpečenie voľného a jednoduchého pohybu informácií medzi hardwarovými komponentmi, softwarovými platformami, jednotlivcami, štátmi a organizáciami. Konferenciu sprevádzali spoločenské podujatia a zasadnutia viacerých komisií a organizácií pridružených pri IASSIST. Konferencii predchádzali workshopy na rôzne témy, medzi inými aj o používaní Nesstar 4.0, či o prechode na ostatnú verziu štandardu dokumentácie sociálnych výskumov DDI 3 (Data Documentation Initiative). Samotná konferencia pozostávala z troch plenárnych zasadnutí, 26 tematických sekcií a posterovej sekcie. Účastníci konferencie sa zišli zo všetkých obývaných kontinentov, čo prinieslo skutočne bohatý a rozmanitý program. Najpočetnejšie bola zastúpená severná Amerika (USA a Kanada) a Európa (najmä Nemecko, Veľká Británia a škandinávske krajiny). Väčšinu času sa rôzne sekcie odohrávali paralelne v štyroch miestnostiach, preto je nezmyselné menovať ich všetky. Kompletný program s abstraktmi príspevkov sa nachádza na webovej stránke konferencie3. Na stránke konferencie sú okrem kompletného programu k dispozícii prezentácie všetkých príspevkov na stiahnutie, ako aj videozáznamy z niektorých sekcií. 3 http://www.fsd.uta.fi/iassist2009/
- 266 -
Medzi inými sa viaceré sekcie venovali DDI 3. Konkrétne nástrojom a implementáciám DDI; vývoju Best practices; DDI aplikáciám a skúsenostiam a napokon predstaveniu možností DDI 3 z pohľadu životného cyklu dát od konceptu cez produkciu a archiváciu až po znovu použitie dát. Ďalej sa viacero sekcií venovalo problematike kultúry zdieľania (dát), výhodám, rizikám a prekážkam zdieľania medzi výskumníkmi, medzi vednými disciplínami a medzi organizáciami. Ďalšie témy, ktorým sa venovali sekcie sú vzťahy medzi inštitúciami rôznymi spôsobmi zainteresovanými do produkcie, využívania či archivovania sociálnych dát, dátové služby pre vzdelávanie, spolupráca medzi organizáciami, či význam a vytváranie dátových archívov. Jedna sekcia sa venovala čisto problematike kvalitatívnych dát, konkrétne etike a “chápajúcemu” prístupu a ich implikáciám pre archiváciu a zdieľanie dát a znovu používaniu kvalitatívnych dát pre výučbu a štúdium. Rovnako jedna sekcia sa venovala aj CESSDA PPP4, v rámci ktorej okrem iného Brigitte Hausstein prezentovala svoj príspevok: Changing the Data Sharing Culture in Eastern European Countries. Tento príspevok pojednával o záveroch z jej pozorovaní a rozhovorov počas návštev krajín strednej a východnej Európy, kde sa stretávala s predstaviteľmi novo vznikajúcich archívov, resp. takých, ktoré sú relatívne mladé, ale aj s predstaviteľmi iných zainteresovaných inštitúcií. Z jej záverov vyplýva, stručne povedané, že zdieľanie sociálnych dát v týchto krajinách je ešte treba kultivovať. V roku 2010 sa konferencia bude konať v júni, v USA v štáte New York a hosťovať ju bude Cornell inštitút pre sociálny a ekonomický výskum5. Pre potenciálnych záujemcov môže byť zaujímavá informácia, že v ostatných rokoch sa IASSIST darí sponzorovať účasť zakaždým niekoľkým novým členom. Juraj Švec (Slovenský archív sociálnych dát)
4 Prípravný projekt na výskumnú infraštruktúru pre sociálne a humanitné vedy, bližšie viď http://www.cessda.org/project/. 5 CISER – Cornell Institute for Social and Economic Research.
- 267 -