NESSTAR Systém pro publikování, prezentaci a analýzu dat PhDr. Martin Vávra, Mgr. Tomáš Čížek
Vznik a vývoj DDI • Potřeba standardizace popisu datových souborů v souvislosti s elektronickou archivací dat • V roce 1995 vzniká DDI jako standard popisu dat (metadata), první verze v roce 2000 • neustálé zdokonalování, několik verzí v současnosti 3.0
Struktura DDI • DDI je velkoryse navrženo, obsahuje několik desítek položek • Využívána je většinou jen část • Technicky je DDI navázáno na programovací jazyk XML
1
Struktura DDI • specifikace samotné datové dokumentace – kdo a kdy ji vytvořil (obvykle jsou to samotné archivy ukládající data) • popis výzkumného projektu, v jehož rámci data vznikla • popis datových souborů • popis jednotlivých proměnných • popis ostatních neuvedených materiálů
NESSTAR • NESSTAR jako konkrétní příklad programu využívajícího DDI • Vznikl v roce 1998 za podpory EU, vyvíjen norským NSD • Dnes komerční platforma, užívání na základě placené licence
Co je XML ? • Jazyk pro vytváření strukturovaných elektronických dokumentů • Položky jsou definovány pozicí v rámci dokumentu a vztahem k ostatním položkám • Není vázáno na konkrétní software, snadná přenositelnost • Nekomerční, otevřený software
Co všechno NESSTAR obsahuje ? • Server kde jsou data informace a data uložená • Program Publisher k převodu datových souborů do formátu Nesstaru • Nesstar WebView – webová stránka / program k prohlížení, analýze i stahování datových souborů
2
Vstup do katalogu
Informace o výzkumech – Study description
Popis proměnných – Variable description
3
Stažení dotazníku
Další funkce Nesstaru • Kromě prohlížení metadat a proměnných Nesstar umožňuje: • Vytváření kontingenčních tabulek • Provádění korelační a regresní analýzy • Výsledky lze zobrazit mnoha typy grafů • Vytváření nových a rekódování starých proměnných • K využívání těchto funkcí je nutná registrace
Registrace
Registrace • Uživatelské jméno a heslo jsou automaticky posílány na uvedenou mailovou adresu
4
Vytváření tabulek
Vytváření tabulek
• Volba Tabulation v menu programu • umožňuje vytvářet jednouchou tabulku četností jednotlivé proměnné nebo kontingenční tabulku pro více proměnných
Vytváření tabulek
Analýza • Volba „Correlation“ vyvolá prázdnou korelační tabulku. Proměnné lze do analýzy přidávat ze seznamu v levém sloupci pomocí volby „Add to correlation“. • Regresní analýza se provádí obdobně zvolením „Regression“. V levém sloupci zobrazujícím proměnné je pak možno vybrat nezávislou proměnnou (Add as independent variable) a proměnné závislé (Add as dependent variable).
5
Analýza
Grafické znázornění výsledků • Typ grafu lze zvolit pomocí příslušné ikony v pravém horním rohu obrazovky.
Typy grafů
Typy grafů
• Bar chart (sloupcový graf), tento typ grafu je dostupný pokud je v tabulce jedna nebo více proměnných ( a nejedná se o jedinou míru) • Stacked bar chart (součtový sloupcový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) • Pie chart (výsečový graf), dostupný pokud jsou v tabulce dvě a více proměnných (a žádná míra) • Box whisker (krabicový graf), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. Pokud je v tabulce přítomna pouze míra zobrazí její frekvence s normálním rozdělením a kvartily. • Confidence interval graph (graf intervalů spolehlivosti), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra
• Bar chart – mean (sloupcový graf s průměrem), dostupný pokud jsou v tabulce dvě a více proměnných z nichž jedna musí být míra. • Regression chart (regresní graf), dostupný pouze po provedení regresní analýzy, nahrazuje ikonu sloupcového grafu. • Time series graph (graf časových řad), dostupný pouze pokud je v tabulce přítomna časová proměnná/dimenze. • Scatterplot, dostupný pouze po provedení regresní analýzy, nahrazuje ikonu grafu časových řad.
6
Typy grafů
Další funkce
Vytváření a rekódování proměnných
Vytváření a rekódování proměnných
• Systém Nesstar ve své nejnovější verzi umožňuje i vytváření nových uživatelsky definovaných proměnných. To je možné pomocí v programu předem připravených matematických a statistických operací. Po zvolení ikony „Compute“ se rozbalí nabídka jednotlivých operací.
7
Vytváření a rekódování proměnných
Stahování datových souborů
Stahování datových souborů
Nesstar ve světě • Nesstar se stává univerzální platformou pro online prezentaci dat • Všechny významné archivy mají Nesstar v provozu
8
ZACAT
UK DA
ICPSR
European Social Survey
9
Blízká budoucnost • Proběhl projekt CESSDA-PPP • Přípravná fáze podpořena EU • Vytvoření integrovaného datového katalogu, ne jako jednoho velkého archivu, ale jako propojení stávajících datových knihoven
10