Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze Září 2014
Autoři Autor
Organizace
Dušan Chlapek
Vysoká škola ekonomická v Praze
Tomáš Knap
Vysoká škola ekonomická v Praze
Jan Kučera
Vysoká škola ekonomická v Praze
Jiří Makalouš
KOMIX s.r.o.
Luboš Marek
Vysoká škola ekonomická v Praze
Petr Mazouch
Vysoká škola ekonomická v Praze
Martin Nečaský
Vysoká škola ekonomická v Praze
Martin Lipš
KOMIX s.r.o.
Tomáš Vahalík
KOMIX s.r.o.
Jan Vrána
KOMIX s.r.o.
Popis výstupu Datová pumpa zajišťuje převod zdrojových dat do formátu RDF a jejich uložení v publikační databázi. Při transformaci jsou respektovány navržené ontologie.
Poděkování Projekt “Publikace dat statistických ročenek ve standardu otevřených dat” (TD020121) je spolufinancován Technologickou agenturou České republiky.
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Obsah 1
2
Úvod ................................................................................................................................... 4 1.1
Data statistických ročenek ČSSZ z oblasti důchodového pojištění ............................... 4
1.2
Cílový formát dat .......................................................................................................... 5
Programové řešení ............................................................................................................. 5 2.1
Výběr nástroje.............................................................................................................. 5
2.2
Stručný popis nástroje UnifiedViews ............................................................................ 6
2.2.1
Licence k nástroji UnifiedViews ............................................................................. 7
2.2.2
Hlavní principy použití nástroje UnifiedViews ........................................................ 7
2.2.3
Odkazy ................................................................................................................. 9
2.3
3
2.3.1
Tvorba pipelines a DPU ........................................................................................ 9
2.3.2
Export / import pipeline ........................................................................................10
Tvorba šablon ....................................................................................................................10 3.1
Fakty ....................................................................................................................11
3.1.2
Dimenze ..............................................................................................................11
3.1.3
Přiřazení dimenzí k faktům...................................................................................12
3.1.4
Cílová datová kostka............................................................................................12
3.1.5
Postup transformace ............................................................................................14
3.1.6
Doporučení pro tvorbu šablon ..............................................................................16
Přehled šablon ............................................................................................................16
Dokumentace pipeline v UV ...............................................................................................17 4.1
Přehled pipelines ........................................................................................................17
4.2
[CSSZ] Creating data cube 2008 ................................................................................18
4.2.1
Vstupy..................................................................................................................18
4.2.2
Výstupy ................................................................................................................18
4.2.3
Popis pipeline ......................................................................................................18
4.3 5
Popis značek pro definici exportu................................................................................11
3.1.1
3.2 4
Popis řešení v rámci projektu ....................................................................................... 9
Popis tvorby pipeline pro další roky .............................................................................19
Přílohy ...............................................................................................................................20 5.1
UV pipeliny .................................................................................................................20
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
2 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
5.1.1
DPUs ...................................................................................................................20
5.1.2
[CSSZ] Creating data cube 2008 .........................................................................20
5.1.3
[CSSZ] Creating data cube 2009 .........................................................................21
5.1.4
[CSSZ] Creating data cube 2010 .........................................................................21
5.1.5
[CSSZ] Creating data cube 2011 .........................................................................21
5.1.6
[CSSZ] Creating data cube 2012 .........................................................................21
5.2
Vstupy.........................................................................................................................21
5.2.1 5.3
Specifikace zdrojových souborů dat důchodové statistiky ....................................21
Výstupy .......................................................................................................................95
5.3.1
Datové kostky a definice jejich struktury...............................................................95
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
3 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
1 Úvod V tomto dokumentu je popsána datová pumpa pro převod dat důchodové statistiky České správy sociálního zabezpečení (ČSSZ) ze zdrojových souborů ve formátu MS Excel do cílového formátu RDF s využitím navržených ontologií. Dokument obsahuje popis výběr vhodných softwarových nástrojů a zvolenou platformu pro vytvoření samotné datové pumpy. Dále jsou popsána zdrojová data, jejich struktura a způsob jejich konverze za pomocí šablon.
1.1 Data statistických ročenek ČSSZ z oblasti důchodového pojištění V rámci projektu jsou ve formátu otevřených propojitelných dat publikována data České správy sociálního zabezpečení, která slouží jako podkladová data statistických ročenek z oblasti důchodového pojištění (dále jen “důchodová statistika”). V rámci projektu jsou zpracovávána data za období let 2008-2012. Zdrojová data jsou uložena v sadě souborů MS Excel. Zdrojové soubory s daty pro ročenky 2008-2012 uvádí tabulka 1. Tabulka 1: Přehled zdrojových souborů s daty pro ročenky 2008-2012 2008
2009
2010
2011
2012
05 Demografie 2008.xls
05 Demografie 2009.xls
05 Demografie 2010.xls
05 Demografie 2011.xls
05 Demografie 2012.xls
06 a 07 Agenda pro ročenku 2008.xls
06 a 07 Agenda pro ročenku 2009.xls
06 a 07 Agenda pro ročenku 2010.xls
06 a 07 Agenda pro ročenku 2011.xls
06 a 07 Agenda pro ročenku 2012.xls
08.01 Počet důchodců podle krajů.xls
08.01 Počet důchodců podle krajů.xls
08.01 Počet důchodců podle krajů.xls
08.01 Počet důchodců podle krajů.xls
08.01 Počet důchodců podle krajů.xls
08.02 Počet důchodců podle věku.xls
08.02 Počet důchodců podle věku.xls
08.02 Počet důchodců podle věku.xls
08.02 Počet důchodců podle věku.xls
08.02 Počet důchodců podle věku.xls
08.03 Počet důchodců podle výše důchodu.xls
08.03 Počet důchodců podle výše důchodu.xls
08.03 Počet důchodců podle výše důchodu.xls
08.03 Počet důchodců podle výše důchodu.xls
08.03 Počet důchodců podle výše důchodu.xls
09.01 Nově přiznané důchody dle věku důchodce.xls
09.01 Nově přiznané důchody dle věku důchodce.xls
09.01 Nově přiznané důchody dle věku důchodce.xls
09.01 Nově přiznané důchody dle věku důchodce.xls
09.01 Nově přiznané důchody dle věku důchodce.xls
09.02 Nově přiznané důchody dle výše důchodu.xls
09.02 Nově přiznané důchody dle výše důchodu.xls
09.02 Nově přiznané důchody dle výše důchodu.xls
09.02 Nově přiznané důchody dle výše důchodu.xls
09.02 Nově přiznané důchody dle výše důchodu.xls
09.03 Nově přiznané důchody dle OVZ.xls
09.03 Nově přiznané důchody dle OVZ.xls
09.03 Nově přiznané důchody dle OVZ.xls
09.03 Nově přiznané důchody dle OVZ.xls
09.03 Nově přiznané důchody dle OVZ.xls
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
4 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008
2009
2010
2011
2012
10 Zaniklé důchody 2008.xls
10 Zaniklé důchody 2009.xls
10 Zaniklé důchody 2010.xls
10 Zaniklé důchody.xls
10 Zaniklé důchody.xls
11 Invalidita.xls
11 Invalidita.xls
11 Invalidita.xls
11 Invalidita.xls
11 Invalidita.xls
12 Změny mezi stupni invalidního důchodu.xls
12 Změny mezi stupni invalidního důchodu.xls
12 Změny mezi stupni invalidního důchodu.xls
12 Data pro grafy 2009.xls
13 Data pro grafy 2010.xls
13 Data pro grafy 2011.xls
13 Data pro grafy 2012.xls
2009_PREHEDOPO CTUDUCHODCUP OOKRESECH.xls
2010_prehledopoctu duchodcupookresec h_1.xls
duchodcipookresech akrajichk31122011.xl s
duchodcipookresech akrajichk31122012.x ls
12 Data pro grafy 2008.xls
Specifikace dat obsažených ve zdrojových souborech MS Excel je uvedena v příloze 5.2.1.
1.2 Cílový formát dat Cílovým formátem je formát RDF1. Protože RDF je zcela obecný formát, je dále využita ontologie The RDF Data Cube Vocabulary2, která je určená pro reprezentaci multidimenzionálních dat a je založena na mezinárodním standardu SDMX3. Díky využití této ontologie je možné data důchodové statistiky publikovat ve formátu otevřených a propojitelných dat v souladu s mezinárodním standardem a dobrou praxí publikace statistických dat.
2 Programové řešení 2.1 Výběr nástroje Pro realizaci datové pumpy pro převod zdrojových souborů v různých formátech do cílového formátu RDF a publikaci výsledných dat dle principů Linked Data je nutné zvolit vhodný softwarový nástroj, který umožní datovou pumpu naprogramovat, nakonfigurovat, testovat a opakovaně spouštět. Nástroj musí nabídnout prostředky pro realizaci všech potřebných kroků, které zahrnují: ● ● ●
●
extrakci datových hodnot ze zdrojových datových souborů ve formátu MS Excel transformaci datových hodnot do cílového formátu RDF dle navržených ontologií propojení vytvořených RDF dat s dalšími datovými zdroji reprezentovanými v podobě RDF (např. Registr územních identifikátorů, adres a nemovitostí, časové intervaly dle Interval ontology, atd.) obohacení vytvořených dat o metadata v RDF reprezentaci
1
http://www.w3.org/TR/rdf11-primer/ http://www.w3.org/TR/vocab-data-cube/ 3 http://sdmx.org/ 2
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
5 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
uložení výsledných dat a metadat do RDF databáze a publikace dat dle principů Linked Data Pro práci s RDF reprezentací dat existuje několik nástrojů a jazyků. Každý z nich však umožňuje realizovat pouze část cílové datové pumpy. Jedná se např. o následující nástroje a jazyky ● ● ● ● ● ● ●
SILK je nástroj pro vytváření propojení mezi dvěma RDF datovými zdroji TARQL je nástroj pro extrakci RDF dat z CSV datových souborů D2R je nástroj pro extrakci RDF dat z relační databáze Virtuoso, Fuseki, Sesame apod. jsou nástroje pro ukládání RDF dat XSLT je jazyk pro transformace XML dat SPARQL je dotazovací jazyk pro manipulaci s RDF daty R2RML je jazyk pro popis mapování mezi relační databází a RDF reprezentaci
Pro potřeby tohoto projektu však není vhodné instalovat a kombinovat všechny potřebné nástroje manuálně. Cílem bylo identifikovat ETL (Extract-Transform-Load) nástroj, který by potřebné techniky obsahoval a umožňoval jejich programování v jednotném uživatelském rozhraní, sestavování do složitějších ETL procedur a jejich testování a opakované spouštění. Na základě těchto požadavků byl identifikován jako vhodný nástroj UnifiedViews 4.
2.2 Stručný popis nástroje UnifiedViews Nástroj UnifiedViews je tzv. ETL (Extract, Transform, Load) nástroj s podporou RDF a Linked Data. Nástroj umožňuje specifikovat různé zdroje dat, jako například relační databáze, XML soubory, CSV soubory, RDF soubory nebo tzv. SPARQL endpointy (webové služby umožňující přístup k RDF datům uloženým v RDF databázi prostřednictvím dotazovacího jazyka SPARQL). Z těchto zdrojů dat pak umožňuje data získat (fáze Extract) a různými způsoby transformovat, integrovat a propojovat (fáze Transform). Nakonec cílová data nahraje (fáze Load) do specifikované databáze či souboru. Výstupem mohou být jak RDF data, tak i jejich ekvivalent v jiných formátech (CSV, XML atd.).
Základní pojmy Základním konstruktem, se kterým umožňuje nástroj UnifiedViews pracovat je tzv. ETL proces (krátce pipeline). Nástroj umožňuje datovým specialistům vytvářet a editovat jejich vlastní pipeliny a poté je testovat, spouštět a plánovat pro automatické opakované spouštění. Pipeline sestává z jednoho či více kroků. Krok je nazýván Data Processing Unit (krátce DPU). V rámci pipeline si DPU předávají data a postupně je zpracovávají. Jedno DPU může předat data žádnému, jednomu i více různým DPU, které v pipeline následují. Naopak může přijímat data od žádného, jednoho i více různých DPU, které mu v pipeline předcházejí. Předávaná data jsou buď ve formátu RDF, nebo v libovolném jiném formátu. Speciálně hovoříme o formátu RDF, neboť pro formát RDF je nástroj optimalizován, k předávání RDF dat dochází prostřednictvím zabudovaného (embedovaného) databázového systému. V 4
Nástroj UnifiedViews vznikl v rámci evropských projektů LOD2 a COMSODE.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
6 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
případě ostatních formátů jsou data předávána v podobě datových souborů uložených v souborovém systému. Formálně je pipeline matematický graf. Uzly tohoto grafu tvoří DPU. Hrany popisují tok dat mezi DPU. Každá hrana propojuje zdrojové DPU s cílovým DPU a značí, že výstup zdrojového DPU je předán na vstup cílového DPU. Topologie grafu je orientovaný strom. Technicky je DPU plugin do prostředí UnifiedViews vytvořený v programovacím jazyku Java. Vnitřní logika programového kódu DPU může být libovolná, pouze musí splňovat definované programové rozhraní (interface), tj. implementovat metody požadované prostřením UnifiedViews. Do prostředí UnifiedViews je pak DPU vloženo v podobě knihovny JAR. DPU lze opakované používat v různých pipelinách. Na DPU můžeme nahlížet ze dvou pohledů. ●
●
DPU šablona - DPU je nástrojem UnifiedViews zpřístupněno mimo konkrétní pipeline. Lze specifikovat výchozí nastavení, příp. zjistit, ve kterých pipelinách je DPU použito a aktualizovat jeho knihovnu JAR novou verzí. DPU instance - DPU je použito v rámci konkrétní pipeline. Defaultně je nastavení instance dáno výchozím nastavením šablony. Nastavení může uživatel (autor pipeliny) měnit podle potřeby, aniž by ovlivnil výchozí nastavení pipeliny.
Nástroj UnifiedViews je webový nástroj. Nabízí uživatelský frontend, což je aplikace běžící v prostředí webového prohlížeče. Prostřednictvím frontendu může v jedné instalaci nástroje spolupracovat více datových expertů a společně tvořit a spouštět pipeliny. Backend potom zpracovává data na základě instrukcí daných jednotlivými DPU v pipelině.
2.2.1 Licence k nástroji UnifiedViews Nástroj je poskytován pod licencí GPLv3 - http://www.gnu.org/licenses/gpl-3.0.html.
2.2.2 Hlavní principy použití nástroje UnifiedViews Uživatel nástroje UnifiedViews je datový expert, jehož cílem je dané zdrojová data v libovolném datovém formátu (CSV, XML, XLS(X), …) a typu datového zdroje (datový soubor v souborovém systému, datový soubor na webu, databázový systém, webová služba, …) transformovat do formátu RDF a dle principů Linked Data (tj. principů propojitelných dat) je publikovat. To znamená uložit ve vhodném databázovém systému, který nabízí i publikační službu splňující požadavky principů Linked Data. Takovým databázovým systémem je např. Virtuoso. Pro svá zdrojová data založí uživatel v nástroji novou pipeline a postupně na ní umísťuje jednotlivá DPU, která potřebuje pro přípravu svých dat. Uživatel pracuje v grafickém prostředí, ve kterém je pipeline vizualizována. DPU v pipelině jsou vizualizovány jako obdélníky obsahující název a popis DPU. Nástroj poskytuje uživatelské rozhraní pouze v angličtině a proto i názvy a popisy DPU uvádíme v angličtině. Barevně odlišuje typy DPU: ● ● ●
Extraktory jsou uvedeny červeně. Transformery jsou uvedeny modře. Loadery jsou uvedeny zeleně.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
7 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
Dále jsou využívány DPU, které nerealizují fáze Extract, Transform a Load ale kontrolují datovou kvalitu. DPU, které kontrolují datovou kvalitu, jsou znázorněny žlutě.
Např., pokud se mají zdrojová data získat stažením datového souboru z webu, volí uživatel DPU typu Extraktor s názvem E-HttpDownloader. Pokud jsou zdrojová data ve formátu CSV či XLS(X), umístí dále do pipeline DPU typu Transformer s názvem UK-T-Tabular, který provede transformaci tabulkového souboru do ekvivalentu v RDF reprezentaci. Poté na pipeline umístí jeden či více DPU typu Transformer s názvem T-Sparql, který pomocí dotazů v jazyku SPARQL umožňuje upravit strukturu RDF dat do cílové podoby a napojit výsledná RDF data na jiné datové zdroje. Poté může využít sady DPU typu Transformer, které připravují výstupní data, např. T-RdfToFiles pro export RDF dat do souboru nebo T-Zipper pro komprimaci dat. Nakonec zvolí sadu DPU typu Loader pro nahrání připraveného datového souboru na cílové místo, např. L-FilesToScp pro přenos souboru na jiný server pomocí protokolu SCP nebo L-FilesToVirtuoso pro nahrání RDF souboru do databázového systému Virtuoso. Pro kontrolu datové kvality ještě uživatel vkládá speciální DPU pro kontrolu neprázdného výstupu z XLS souboru (DPU QFromSimpleRDFNotEmpty) a pro kontrolu neprázdného výsledku propojování (DPU QAfterLinkageNotEmpty). Příklad pipeline vytvořené dle výše popsaného postupu je znázorněn na obrázku 1.
Obrázek 1: Příklad pipeline v nástroji UnifiedViews
Uživatel má několik možností práce s vytvořenou pipeline: ●
V rámci vývoje pipeline může pipeline ladit (funkce debug). V ladícím módu lze pustit pipeline k určitému vybranému DPU. Pomocí speciální obrazovky může uživatel sledovat podobu dat vytvořenou jednotlivými DPU na cestě k vybranému DPU. RDF
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
8 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
●
data vytvořená jednotlivými DPU může prohlížet pomocí dotazů v jazyku SPARQL a odhalovat tak případné chyby ve svých konfiguracích. Pokud je pipeline již dokončená, může ji spustit. Proběhne jednorázově a celá. Výsledná data nelze procházet v ladícím módu. Protože nedochází k ukládání ladících dat a logů, je běh rychlejší. Další možností v případě dokončené pipeline je naplánování běhu pipeline k určitému času a nastavení periody opakovaného spouštění. Dle vytvořeného plánu nástroj pipeline automaticky spouští a zasílá uživateli reporty o běhu.
2.2.3 Odkazy Cílem této sekce bylo pouze představit základní principy použití nástroje. Protože nástroj samotný není v projektu vyvíjen ale pouze využíván, odkazujeme na jeho uživatelskou dokumentaci na následujícím URL: https://grips.semanticweb.at/display/UDDOC/UnifiedViews+User+Documentation . Nástroj je možné stáhnout na následujícím URL: https://github.com/UnifiedViews, z repositářů: ● https://github.com/UnifiedViews/Core (základ) ● https://github.com/UnifiedViews/Plugin-DevEnv (rozhraní pro práci s DPUs) ● https://github.com/UnifiedViews/Plugins (základní DPUs) Dokumentaci k ruční instalaci je možné najít na následujícím URL: https://grips.semantic-web.at/display/UDDOC/Installation+Guide Nástroj je také možné instalovat na systém Linux - Debian pomoci .deb balíčků. Při instalaci přes balíčky se pracuje s repositářem: https://github.com/UnifiedViews/Packages Návod pro instalaci přes balíčky je popsán tu: https://github.com/UnifiedViews/Packages/blob/develop/README.md
2.3 Popis řešení v rámci projektu Předmětem softwarové části projektu věnované konverzi dat ze zdrojové podoby XLS souborů do cílové RDF podoby je tedy na základě analýzy zdrojových dat statistických ročenek České správy sociálního zabezpečení a navržených ontologií popisujících cílovou RDF podobu dat vytvořit sadu pipeline v nástroji UnifiedViews, které realizují konverzi.
2.3.1 Tvorba pipelines a DPU V rámci projektu tedy tvoříme pomocí nástroje UnifiedViews pipeliny pro transformaci dat z popsané zdrojové podoby do popsané cílové podoby. Každá pipeline je programový kód tvořený konfigurací jednotlivých DPU. Konfigurace může v případě jednodušších DPU znamenat nastavení jednoduchých parametrů, ale v případě složitějších DPU se může jednat např. o programování dotazů v jazyku SPARQL. Softwarový výstup tohoto projektu tedy není nástroj UnifiedViews. Ten je pouze využíván. Softwarovým výstupem je množina jednotlivých pipeline naprogramovaných v prostředí nástroje UnifiedViews. V rámci projektu využíváme především transformace vyjádřené v jazyku SPARQL a poté jeden pro projekt speciálně naprogramovaný DPU s označením xls2csv (v
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
9 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
programovacím jazyku Java), který transformuje komplexní strukturu vstupních XLS souborů do jednodušší CSV struktury na základě definovaných šablon (k tvorbě těchto šablon viz následující kapitola). Programový kód tvořený v rámci projektu tedy představuje programový kód nově vytvořeného DPU pro transformaci dat z formátu XLS do formátu CSV a dále především výrazy v jazyku SPARQL.
2.3.2 Export / import pipeline Nástroj UnifiedViews umožňuje vytvořenou pipeline exportovat z jedné instance nástroje a importovat ji později do libovolné jiné instance nástroje. Je tedy možné pipelines přenášet mezi různými instancemi nástroje. To lze využít např. v situaci, kdy je jedna instance používána jako testovací a druhá jako produkční. V rámci projektu máme pouze jednu instanci na serveru http://opendata.vse.cz. Tato instance není z bezpečnostních důvodů volně zpřístupněna. Možnost exportu využíváme, abychom mohli zdrojové kódy naprogramovaných pipeline dodat jako výstup projektu, především pro případné využití ze strany České správy sociálního zabezpečení, která si může vytvořit na svém vlastním HW vlastní instanci nástroje UnifiedViews a námi naprogramované pipeline může jednoduše importovat a spouštět. Export pipeline je ZIP archiv s následující strukturou: ● ● ●
dpu.xml - XML soubor obsahující konfiguraci jednotlivých DPU typu Extractor a Loader v pipeline. pipeline.xml - XML soubor obsahující konfiguraci propojení DPU v pipeline a konfiguraci jednotlivých DPU typu Transformer v pipeline (např. naprogramované SPARQL dotazy). used_dpu.xml - XML soubor obsahující mapování použitých DPU na JAR knihovny obsahující implementaci DPU.
Pipeliny vytvořené v rámci tohoto projektu jsme exportovali a přiložili jako výstupy projektu. Pipeliny jsou navíc dokumentovány níže v tomto dokumentu.
3 Tvorba šablon Tabulky zdrojových dat obsahují hodnoty (např. počet důchodců), ke kterým vždy náleží hodnoty z použitých číselníků, např. věk důchodce, druh důchodu, nebo pohlaví. Sledované hodnoty jsou označovány jako fakty. Hodnoty číselníků pak vyjadřují dimenze, ve kterých jsou fakty sledovány - např. počet důchodců podle věku. V rámci převodu zdrojových souborů je původní tabulková struktura převedena do CSV tak, že na každém řádku (kromě prvního, kde bude uloženo záhlaví sloupců) je vždy hodnota faktu, za kterou následuje množina všech dimenzí příslušných danému faktu. V souladu s principy CSV budou hodnota faktu i hodnoty příslušných dimenzí odděleny čárkami. Kódování CSV souborů je UTF-8. Kromě sloupců odpovídajících dimenzím může výstupní CSV soubor obsahovat sloupec “target_data_cube” označující cílovou datovou kostku (viz níže) a také sloupec “source_file” obsahující název zdrojového datového souboru, ze kterého je údaj vyexportován. Údaj o
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
10 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
zdrojovém souboru usnadňuje zpracování CSV souborů pomocí pipeline v nástroji UnifiedViews. Příslušné DPU, které provádí transformaci dat z formátu MS Excel do formátu RDF, přidává údaj o zdrojovém souboru automaticky, tj. není třeba definovat žádnou řídící značku v šablonách exportu. CSV soubory představují v rámci transformace dat důchodové statistiky z formátu MS Excel do formátu RDF dílčí výstup. Transformace do CSV je prováděna z důvodu, aby bylo možné využít existující DPU nástroje UnifiedViews a aby tak tvorba pipeline byla efektivní. Aby nebylo třeba konfigurovat DPU pro každý zdrojový soubor MS Excel zvlášť, jsou definovány tzv. šablony exportu. Šablona exportu obsahuje metadata, která určují rozložení faktů a dimenzí ve zdrojovém souboru a příp. také, jaké dimenze jsou přiřazeny jakým faktům obsaženým ve zdrojovém souboru. Algoritmus, který realizuje transformaci na základě definované šablony je pak implementován do DPU, který byl v projektu za tímto účelem vyvinut. Využití šablon omezuje potřebu upravovat pipeliny v případě změn v datech - pokud se např. mezi roky změní struktura zdrojového souboru, může stačit změnit šablonu exportu. V následujících částech je vysvětlen význam jednotlivých značek použitých v šablonách a je popsán algoritmus transformace dat s využitím šablon.
3.1 Popis značek pro definici exportu Jednotlivé buňky obsahující hodnoty faktů nebo hodnoty dimenzí jsou nahrazeny značkami označujícími jejich význam. Zápis značky vždy začíná a končí dvěma znaky procenta “%%”. Zápis značky tak vypadá obecně jako “%%ZNAČKA%%”. Přidáním znaků “%%” umožňuje snadnou identifikaci metadat popisujících export dat v šabloně pomocí regulárních výrazů.
3.1.1 Fakty Klíčový znak: F Zápis: %%FčísloFaktu%% Příklad: %%F01%% Protože se v rámci jednoho souboru, nebo i v rámci jednoho listu zdrojového souboru může vyskytovat více faktů, jsou fakty rozlišovány pořadovým číslem. Všechny fakty stejného označení se exportují do stejného výstupního souboru. Sloupec s fakty je ve výstupním CSV souboru uveden jako první. Jako záhlaví sloupce s fakty je uveden slovo “Fakt”.
3.1.2 Dimenze Klíčová znak: D Zápis: %%DčísloDimenze_(text záhlaví sloupce)%% nebo %%DčísloDimenze_(text záhlaví sloupce#KONSTANTA)%%, nebo %%DčísloDimenze%% Příklad: %%D03_(Věk)%%, %%D06_(Období#2012)%% nebo %%D03%%
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
11 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Protože je vhodné uvést, jaké má být uvedeno záhlaví sloupce s dimenzí ve výstupním CSV souboru, je umožněno zapsat text záhlaví sloupce dimenze v rámci označení dimenze. Pokud se v rámci souboru nebo listu značka dimenze opakuje vícekrát, není třeba opakovat text záhlaví sloupce. Program použije takový text záhlaví sloupce, který najde alespoň u jedné značky dimenze v souboru šablony nebo jeho listu. Pokud pro dané číslo dimenze není text záhlaví sloupce uveden, ve výstupním souboru je jako text záhlaví sloupce použito označení dimenze D a její pořadové číslo. Číslo dimenze také udává pořadí, v jakém jsou dimenze zapsány do výstupního souboru. Dimenze s nejnižším číslem je zapsána do výsledného řádku CSV souboru hned za fakt. Dimenze s nejvyšším pořadovým číslem bude zapsána jako poslední. Pokud je třeba vyjádřit, že hodnota dimenze má mít určitou definovanou hodnotu, lze do značky dimenze zapsat konstantu. Např. pokud buňka zdrojového souboru obsahuje text “k 31.12.2012”, potom značka %%D06_(Stav k#2012-12-31)%% vyjadřuje, že se do výstupního CSV souboru do sloupce “Stav k” zapíše hodnota “2012-12-31” namísto hodnoty “k 31.12.2012.” Stejné dimenze by měly mít stejné záhlaví sloupce ve všech šablonách. Je vhodné, aby tvůrce šablon udržoval slovník použitých označení dimenzí a při tvorbě šablon označoval dimenze v souladu s tímto slovníkem. Nicméně označení dimenzí a jejich pojmenování zcela závisí na uvážení tvůrce šablony.
3.1.3 Přiřazení dimenzí k faktům Klíčový znak: P Zápis: %%PčísloFaktu_(DčísloDimenze, DčísloDimenze,…)%% Příklad: %%P01_(D01, D02, D03, D04)%% Protože se ve zdrojových souborech vyskytuje někdy více faktů a ne ke každému jsou přiřazeny všechny dimenze, umožňuje výše uvedená značka určit, jaké dimenze se přiřazují k jakému faktu. Pro určení, k jakému faktu náleží dané přiřazení, se použije číslo faktu. Tj. P01 znamená přiřazení dimenzí k faktu F01. Značka se uvádí v šabloně do 1. řádku prvního listu do buňky, která je v souboru s daty prázdná. Pokud je třeba v šabloně použít více značek P, S, C nebo G, použije se více buněk prvního řádku prvního listu šablony, které jsou v souboru s daty prázdné. Značka platí pro celý soubor. Pokud značka uvedena není, postupuje se při transformaci tak, že k faktu jsou přiřazeny všechny dimenze, které se nacházejí v buňkách sloupce faktu nad buňkou faktu a v buňkách nalevo od buňky faktu ve stejném řádku, jako je řádek buňky faktu.
3.1.4 Cílová datová kostka Klíčový znak: C
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
12 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Zápis: C_(název cílové datové kostky#ČisloFaktu, ČísloFaktu,...)%% Příklad: %%C_(duchodci-v-krajich#13,14,15,16,17,18,19,20,21,22,23,24)%% Aby transformační procedura vytvořená v nástroji UnifiedViews mohla rozlišit, do jaké cílové datové kostky mají být zařazena transformovaná data, je třeba, aby k vlastním datům důchodové statistiky byl vždy přidán údaj o tom, jaká je cílová datová kostka pro konkrétní údaje. V rámci šablon je proto zaveden speciální značka C s výše uvedenou definicí, která udává, jaké hodnoty faktů mají být přidány do jaké cílové datové kostky. Při transformaci je přidán nový sloupec do výstupního CSV souboru každého označeného faktu se záhlavím “target_data_cube”, kde hodnotou tohoto sloupce bude na všech řádcích uvedený název cílové datové kostky. Viz příklad níže. "Fakt","Typ faktu","Pohlaví","Druh důchodu","Kraj","Stav k","target_data_cube","source_file" "311444.0","Počet důchodců","Total","Celkem bez netypických výplat","Hl. m. Praha","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "329657.0","Počet důchodců","Total","Celkem bez netypických výplat","Středočeský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "175809.0","Počet důchodců","Total","Celkem bez netypických výplat","Jihočeský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "159033.0","Počet důchodců","Total","Celkem bez netypických výplat","Plzeňský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "79704.0","Počet důchodců","Total","Celkem bez netypických výplat","Karlovarský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "228276.0","Počet důchodců","Total","Celkem bez netypických výplat","Ústecký kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "121696.0","Počet důchodců","Total","Celkem bez netypických výplat","Liberecký kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "158913.0","Počet důchodců","Total","Celkem bez netypických výplat","Královéhradecký kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "145065.0","Počet důchodců","Total","Celkem bez netypických výplat","Pardubický kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "145866.0","Počet důchodců","Total","Celkem bez netypických výplat","Kraj Vysočina","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "324087.0","Počet důchodců","Total","Celkem bez netypických výplat","Jihomoravský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "175315.0","Počet důchodců","Total","Celkem bez netypických výplat","Olomoucký kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "168444.0","Počet důchodců","Total","Celkem bez netypických výplat","Zlínský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls" "342747.0","Počet důchodců","Total","Celkem bez netypických výplat","Moravskoslezský kraj","2012-12-31","duchodci-v-krajich","08.01_Počet_důchodců_podle_krajů.xls"
Značka se uvádí v šabloně do 1. řádku prvního listu do buňky, která je v souboru s daty prázdná. Pokud je třeba v šabloně použít více značek P, S, C nebo G, použije se více buněk 1. řádku prvního listu šablony, které jsou v souboru s daty prázdné. Značka platí pro celý soubor. Pokud není značka použita, žádná hodnota cílové datové kostky se nepřiřazuje. Cílový soubor Klíčový znak: S Zápis: %%SčísloFaktu_(název cílového souboru)%% Příklad: %%S01_(08.02_2012_pocet_vyplacenych_duchodu.csv)%% Data pro každý fakt jsou exportována do samostatného výstupního souboru. Tato značka umožňuje určit název výstupního souboru pro export dat určitého faktu. Pro určení, ke kterému faktu náleží název výstupního souboru, se použije číslo faktu. Tj. S01 znamená přiřazení výstupního souboru k faktu F01. Značka se uvádí v šabloně do 1. řádku prvního listu do buňky, která je v souboru s daty prázdná. Pokud je třeba v šabloně použít více značek P, S, C nebo G, použije se více buněk 1. řádku prvního listu šablony, které jsou v souboru s daty prázdné. Značka platí pro celý soubor. Pokud značka uvedena není, výstupní soubor je pojmenován stejně jako vstupní zdrojový soubor a na konec je přiřazeno označení faktu, např. F01.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
13 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Výstupní soubory CSV jsou ukládány do stejné složky, ve které jsou uloženy vstupní zdrojové soubory. Stejné listy Klíčový znak: G Zápis: %%GčísloSkupiny_(číslo listu, číslo listu, …)%%, nebo %%G_(ALL)%% Příklad: %%G01_(1,2,3)%%, nebo %%G_(ALL)%% Pomocí klíčového znaku G lze označit listy, které se exportují stejně. Není pak potřeba značky opakovat na všech listech a pro všech jejich buňky, ale postačí uvést značky jen na první list skupiny. Pokud je použito %%G_(ALL)%%, znamená to, že všechny listy jsou stejné a pro všechny se použijí metadata z prvního listu souboru. Značka se uvádí v šabloně do 1. řádku prvního listu do buňky, která je v souboru s daty prázdná. Pokud je třeba v šabloně použít více značek P, S, C nebo G, použije se více buněk 1. řádku prvního listu šablony, které jsou v souboru s daty prázdné. Značka platí pro celý soubor. Pokud značka uvedena není, zpracovává se každý list samostatně. Pokud značka uvedena je, ale ne všechny listy šablony jsou zařazeny do některé skupiny, zpracovávají se tyto listy samostatně. Odkaz na buňku Klíčový znak: B Zápis: %%B_(sloupec, řádek)%% Příklad: %%B_(D,15)%% - použijí se metadata buňky D15 šablony a hodnota buňky D15 zdrojového souboru. Pro řešení nestandardních situací, kdy nelze najít příslušné dimenze hledáním v rámci buněk, které se nacházejí v buňkách sloupce faktu nad buňkou faktu a v buňkách nalevo od buňky faktu ve stejném řádku, jako je řádek buňky faktu, je zaveden odkaz na buňku. Při zpracování dat na základě šablony se v případě, že je uveden odkaz na buňku, použijí metadata pro odkazovanou buňku a na základě těchto metadat je pak zpracována hodnota odkazované buňky ve zdrojovém souboru. Např. pokud se v buňce D14 šablony nachází zápis %%B_(D,15)%% a v buňce D15 šablony se nachází zápis %%D02_(Typ faktu)%%, tak při zpracování buňky D14 se namísto hodnoty D14 ze zdrojového souboru použije hodnota z buňky D15 zdrojového souboru a bude aplikována jako hodnota dimenze 2 s textem záhlaví sloupce “Typ faktu”. Neudává se list souboru, vždy se použije buňka v aktuálním listu.
3.1.5 Postup transformace Při zpracování vstupního souboru je postupováno následovně:
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
14 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
1. Je otevřen zdrojový soubor a na základě jeho názvu je otevřen soubor příslušné šablony. 2. Zpracování začíná na buňce A1 prvního listu a postupuje po řádcích. 3. Zpracovávají se všechny buňky zdrojového souboru, které v šabloně začínají a končí “%%”. Ostatní buňky se ignorují. 4. Z 1. řádku prvního listu šablony se načtou metadata určující přiřazení faktů a dimenzí (P), výstupních souborů (S), cílových datových kostek (C) a skupin stejných listů (G). Pokud se na 1. řádku tato metadata nenacházejí, postupuje se tak, jak je uvedeno výše u popisu značek P, S, C a G. 5. Pokud je v šabloně uvedena značka faktu (%%FčísloFaktu%%), postupuje se následovně: a. Hodnota ze stejné buňky zdrojové souboru je uložena na první pozici nového řádku výstupního CSV souboru. b. Následně se prohledávají buňky, které se nacházejí v buňkách sloupce faktu nad buňkou faktu a v buňkách nalevo od buňky faktu ve stejném řádku, jako je řádek buňky faktu. c. Faktu jsou přiřazeny všechny dimenze v tomto prostoru, nebo pouze dimenze určené značkou P. d. Pokud je uvedeno určení cílové datové kostky (značka C), přiřadí se určenému faktu hodnota cílové datové kostky. Údaj o cílové datové kostce je zapsán do sloupce “target_data_cube”. e. Pokud se v prohledávaném prostoru nachází vícekrát značka pro stejnou dimenzi, použije se hodnota dimenze ve stejném řádku, jako je řádek buňky faktu, nebo ve stejném sloupci, jako je sloupec buňky faktu. f. Pokud se v daném prostoru nachází vícekrát značka pro stejnou dimenzi, ale hodnota dimenze se nenachází ve stejném řádku, jako je řádek buňky faktu, resp. ve stejném sloupci, použije se hodnota dimenze, která je buňce faktu nejblíže. g. Pokud se v daném prostoru nachází značka B pro odkaz na buňku, použijí se metadata v odkazované buňce šablony a hodnota v odkazované buňce zdrojového souboru. 6. Pokud je při provádění kroku 5 dimenze označenou značkou, která v sobě obsahuje i text záhlaví sloupce, k příslušné dimenzi se přiřadí daný text záhlaví sloupce. 7. Na základě čísla faktu je nutné rozlišovat, do jakého výstupního souboru bude uložen řádek vytvořený v kroku 5. 8. Při provádění transformace jsou data ukládána do paměti. Do výsledného souboru se zapisují, až při dosažení konce souboru (poslední buňka posledního listu souboru). 9. Před tím, než jsou jednotlivé řádky s hodnotami faktů a dimenzí zapsány do výstupních souborů, je pro každý výsledný soubor sestaven řádek záhlaví. Jsou využity uložené údaje o textech záhlaví sloupců získané během zpracování. 10. Pokud je dosažen konec listu, pokračuje se na dalším listu souboru. Při zpracování listů je respektováno určení skupin listů, které se zpracovávají stejně – značka G. Listy nezařazené do žádné skupiny se zpracovávají samostatně.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
15 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
11. Data z více listů mohou být zapsána do stejného výstupního souboru. Tj. fakty i dimenze se stejným číslem se mohou opakovat na více listech a exportují se do stejného souboru bez ohledu na to, na jakém listu se nacházejí. 12. Názvy souborů a přiřazení faktů a dimenzí pomocí značek S, P, C a G platí v rámci celého souboru. Není je třeba opakovat na každém listu.
3.1.6 Doporučení pro tvorbu šablon Protože při transformaci jsou pro každý fakt zpracovávány pouze buňky ve sloupci nad buňkou faktu a v řádu nalevo od buňky faktu, je třeba doplnit do volných buněk (zpravidla ve sloupci faktu, kde bývá dostatek místa) odkazy na všechny dimenze, které je třeba připojit k faktu, jež se nacházejí v buňkách mimo řádek či sloupec buňky faktu. Tj. dimenze, které by bez doplnění odkazu na buňku nebyly nezpracovány. Je vhodné vytvářet a při tvorbě šablon využívat slovník dimenzí, který udává, jaká záhlaví sloupců jsou používána pro jednotlivé dimenze. V rámci šablon je pak vhodné používat vždy stejné označení pro stejné dimenze. Díky tomu bude zajištěno, že ve výstupních souborech budou pro stejné dimenze používána stejná záhlaví sloupců. Toho pak lze využít při mapování sloupců na jednotlivé prvky navržených ontologií.
3.2 Přehled šablon Tabulka 2: Přehled šablon 2008-2012 2008
2009
2010
2011
2012
SABLONA_05_Dem ografie_2008.xls
SABLONA_05_Demo grafie_2009.xls
SABLONA_05_Dem ografie_2010.xls
SABLONA_05_Dem ografie_2011.xls
SABLONA_05_Dem ografie_2012.xls
SABLONA_06_a_07 _Agenda_pro_ročen ku_2008.xls
SABLONA_06_a_07 _Agenda_pro_ročenk u_2009.xls
SABLONA_06_a_07 _Agenda_pro_ročen ku_2010.xls
SABLONA_06_a_07 _Agenda_pro_ročen ku_2011.xls
SABLONA_06_a_07 _Agenda_pro_ročen ku_2012.xls
SABLONA_08.01_P očet_důchodců_pod le_krajů.xls
SABLONA_08.01_Po čet_důchodců_podle _krajů.xls
SABLONA_08.01_P očet_důchodců_pod le_krajů.xls
SABLONA_08.01_P očet_důchodců_pod le_krajů.xls
SABLONA_08.01_P očet_důchodců_pod le_krajů.xls
SABLONA_08.02_P očet_důchodců_pod le_věku.xls
SABLONA_08.02_Po čet_důchodců_podle _věku.xls
SABLONA_08.02_P očet_důchodců_pod le_věku.xls
SABLONA_08.02_P očet_důchodců_pod le_věku.xls
SABLONA_08.02_P očet_důchodců_pod le_věku.xls
SABLONA_08.03_P očet_důchodců_pod le_výše_důchodu.xl s
SABLONA_08.03_Po čet_důchodců_podle _výše_důchodu.xls
SABLONA_08.03_P očet_důchodců_pod le_výše_důchodu.xl s
SABLONA_08.03_P očet_důchodců_pod le_výše_důchodu.xl s
SABLONA_08.03_P očet_důchodců_pod le_výše_důchodu.xl s
SABLONA_09.01_N ově_přiznané_důch ody_dle_věku_důch odce.xls
SABLONA_09.01_No vě_přiznané_důchod y_dle_věku_důchodc e.xls
SABLONA_09.01_N ově_přiznané_důch ody_dle_věku_důch odce.xls
SABLONA_09.01_N ově_přiznané_důch ody_dle_věku_důch odce.xls
SABLONA_09.01_N ově_přiznané_důch ody_dle_věku_důch odce.xls
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
16 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008
2009
2010
2011
2012
SABLONA_09.02_N ově_přiznané_důch ody_dle_výše_důch odu.xls
SABLONA_09.02_No vě_přiznané_důchod y_dle_výše_důchodu .xls
SABLONA_09.02_N ově_přiznané_důch ody_dle_výše_důch odu.xls
SABLONA_09.02_N ově_přiznané_důch ody_dle_výše_důch odu.xls
SABLONA_09.02_N ově_přiznané_důch ody_dle_výše_důch odu.xls
SABLONA_09.03_N ově_přiznané_důch ody_dle_OVZ.xls
SABLONA_09.03_No vě_přiznané_důchod y_dle_OVZ.xls
SABLONA_09.03_N ově_přiznané_důch ody_dle_OVZ.xls
SABLONA_09.03_N ově_přiznané_důch ody_dle_OVZ.xls
SABLONA_09.03_N ově_přiznané_důch ody_dle_OVZ.xls
SABLONA_10_Zani klé_důchody_2008.x ls
SABLONA_10_Zanikl é_důchody_2009.xls
SABLONA_10_Zani klé_důchody_2010.x ls
SABLONA_10_Zani klé_důchody.xls
SABLONA_10_Zani klé_důchody.xls
SABLONA_11_Inval idita.xls
SABLONA_11_Invali dita.xls
SABLONA_11_Inval idita.xls
SABLONA_11_Inval idita.xls
SABLONA_11_Inval idita.xls
SABLONA_12_Změ ny_mezi_stupni_inv alidního_důchodu.xl s
SABLONA_12_Změ ny_mezi_stupni_inv alidního_důchodu.xl s
SABLONA_12_Změ ny_mezi_stupni_inv alidního_důchodu.xl s
SABLONA_12_Data_ pro_grafy_2009.xls
SABLONA_13_Data _pro_grafy_2010.xls
SABLONA_13_Data _pro_grafy_2011.xls
SABLONA_13_Data _pro_grafy_2012.xls
SABLONA_2009_PR EHEDOPOCTUDUC HODCUPOOKRESE CH.xls
SABLONA_2010_pr ehledopoctuduchod cupookresech_1.xls
SABLONA_duchodc ipookresechakrajich k31122011.xls
SABLONA_duchodc ipookresechakrajich k31122012.xls
SABLONA_12_Data _pro_grafy_2008.xls
4 Dokumentace pipeline v UV 4.1 Přehled pipelines Pro transformaci dat ze zdrojových souborů MS Excel do formátu RDF byly vytvořeny následující pipeliny: ● ● ● ● ●
[CSSZ] Creating data cube 2008 [CSSZ] Creating data cube 2009 [CSSZ] Creating data cube 2010 [CSSZ] Creating data cube 2011 [CSSZ] Creating data cube 2012
Všechny uvedené pipelines mají stejnou strukturu i význam - zpracovávají vstupní data důchodové statistiky České správy sociálního zabezpečení (ČSSZ) ze zdrojových souborů ve formátu MS Excel do cílového formátu RDF s využitím navržených ontologií. Popsané pipelines se liší pouze rokem, který zpracovávají. Tedy pipeline “[CSSZ] Creating data cube 2008”, popsaná detailněji níže, zpracovává vstupní data pro rok 2008. Dále popisujeme jen tuto pipeline, ostatní pipelines jsou analogické.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
17 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Jednotlivé pipelines jsou poskytovány pod licencí GNU GPL v3. Pipelines jsou vždy tvořeny soubory dpu.xml, pipeline.xml a used_dpu.xml. Pokud jsou v archivu s exportem pipeline přiloženy i jiné soubory, může se jejich užití řídit jinými podmínkami užití, resp. pokud se jedná o počítačový program, může být poskytnut pod jinou licencí. DPU xls2csv vytvořené v rámci tohoto projektu, které realizuje export dat ze souborů MS Excel na základě definovaných šablon, je také poskytováno pod licencí GNU GPL v3. Spustitelný soubor tohoto DPU (JAR archiv) je přiložen jako součást exportu pipelines. Výsledná data pro pipelines jsou dostupná na http://opendata.vse.cz:8890/sparql
4.2 [CSSZ] Creating data cube 2008 4.2.1 Vstupy Data důchodové statistiky České správy sociálního zabezpečení (ČSSZ) ve formátu MS Excel. Stručný přehled dat za všechny roky, viz Tabulka 1. Pipelina zpracovává soubory za příslušný rok, tj. v tomto případě za rok 2008. Vstupem jsou také šablony, které popisují, kterak se mají XLS data převést do dílčího výstupu ve formátu CSV. Detailní specifikace vstupních dat je uvedena v příloze 5.2.1. Ke každému vstupnímu souboru náleží jedna šablona (přehled šablon je uveden v tabulce 2)
4.2.2 Výstupy Datové kostky, publikované v RDF datovém formátu dle ontologie RDF Data Cube Vocabulary (http://www.w3.org/TR/vocab-data-cube/). Přehled datových kostek a jim příslušných definic struktury je uveden v příloze 5.3.1. Samotné definice datových kostek jsou dostupné na adrese: https://code.google.com/p/cssz-pensions/source/browse/dc-definition/cssz-pensions-dcdefinition.ttl.
4.2.3 Popis pipeline Pipeline zpracovává vstupní data důchodové statistiky České správy sociálního zabezpečení (ČSSZ) ze zdrojových souborů ve formátu MS Excel do cílového formátu RDF s využitím navržených ontologií. Celá pipeline je zobrazena na obrázku 2. Data jsou nejprve převedena z XLS formátu, dle přiložené šablony, do příslušného CSV formátu (DPU [CSSZ] xls2csv). Následně jsou tabulková CSV data převedena do interního RDF formátu (DPU [CSSZ] Tabular to RDF)). Z interního RDF formátu jsou poté vytvořeny observations datových kostek dle specifikace RDF Data Cube vocabulary - každý řádek ve vstupním CSV soubor je převeden do jednoho observation (pozorování) (viz DPU [CSSZ] Creates data cube observations). DPU [CSSZ] Processed Year konfiguruje rok, který je použit při tvorbě identifikátoru pro observations - toto DPU je třeba patřičně nastavit pro právě zpracovávaný rok (viz dále). DPU [CSSZ] Versions of pensions hierarchy konfiguruje příponu identifikátorů RDF objektů reprezentujících druhy důchodů - toto je potřeba, neboť hierarchie druhů důchodů je odlišná pro roky 2008/2009 a 2010+. Tedy DPU [CSSZ] Versions of pensions hierarchy konfiguruje verzi použité hierarchie.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
18 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Dalších přibližně 20 DPUs upravuje vytvářená observations výstupních datových kostek - každé takové DPU upravuje určitou dimenzi ve vytvářených observations výstupních datových kostek. Dimenze a ontologie pro jejich reprezentaci ve formátu RDF jsou popsány ve výstupu tohoto projektu “Návrh metodiky popisu a prezentace dat důchodové statistiky ve formátu otevřených propojitelných dat a návrh typové architektury IT řešení”. Některá DPUs, jako například DPU upravující elementy dimenze RefArea ([CSSZ] Dim RefArea Kraj 6), také přímo linkují hodnoty dimenzí na existující slovníky (RUIAN).
Obrázek 2: Pipelina pro zpracování dat za rok 2008
V závěru jsou výstupní data nahrána na cílový SPARQL end point dostupný na serveru http://opendata.vse.cz (DPU [CSSZ] Loader to opendata.vse.cz).
4.3 Popis tvorby pipeline pro další roky 1) Zkopírujte v prostředí UnifiedViews pipeline “[CSSZ] Creating data cube 2008” 2) Otevřete zkopírovanou pipeline, upravte si jméno, popis pipeline 3) Je třeba upravit DPU E-FilesFromLocal, aby pipeline pracovala se správnými daty (pro příslušný rok). Tedy je třeba specifikovat správnou cestu k adresáři s daty k danému roku, viz obrázek níž. Ve vstupním adresáři musí být kromě dat samotných také šablony. Soubory se šablonami musí být prefixované “SABLONA_” (toto lze volitelně změnit v DPU [CSSZ] xls2csv, v jeho konfiguraci)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
19 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
4) Je třeba upravit konfiguraci DPU [CSSZ] Processed Year, kde konfigurace musí obsahovat zpracovávaný rok (obrázek níž zobrazuje konfiguraci pro rok 2009, pro jiné roky je třeba tuto hodnotu patřičně upravit):
5) Je třeba upravit konfiguraci DPU [CSSZ] Versions of pensions hierarchy, kde konfigurace musí obsahovat správný rok, který se připojuje k vytvářeným identifikátorům pro druhy důchodů. Tedy pokud vyplníte 2010, budou se vytvářet identifikátory pro druhy důchodů ve stylu “http://linked.cssz.cz/resource/pension-kind/PK_SD_2010”. Pokud nedojde od roku 2010 k žádné další změně, stačí pro roky 2010+ vždy vyplnit 2010 v následující konfiguraci (tedy místo 2008 vyplnit 2010):
5 Přílohy 5.1 UV pipeliny 5.1.1 DPUs Před importováním pipeline je třeba importovat DPUs, která jsou dostupná na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-dpus.zip.
5.1.2 [CSSZ] Creating data cube 2008 Export pipeline “[CSSZ] Creating data cube 2008” je k dispozici na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-pipeline-2008.zip.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
20 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
5.1.3 [CSSZ] Creating data cube 2009 Export pipeline “[CSSZ] Creating data cube 2009” je k dispozici na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-pipeline-2009.zip.
5.1.4 [CSSZ] Creating data cube 2010 Export pipeline “[CSSZ] Creating data cube 2010” je k dispozici na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-pipeline-2010.zip.
5.1.5 [CSSZ] Creating data cube 2011 Export pipeline “[CSSZ] Creating data cube 2011” je k dispozici na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-pipeline-2011.zip.
5.1.6 [CSSZ] Creating data cube 2012 Export pipeline “[CSSZ] Creating data cube 2012” je k dispozici na adrese: http://opendata.vse.cz/cssz/cssz-data-cubes-pipeline-2012.zip.
5.2 Vstupy 5.2.1 Specifikace zdrojových souborů dat důchodové statistiky T5.1 Počet obyvatel podle krajů Zdrojová tabulka obsahuje data v následující struktuře: ● Kraj ● Muži ● Ženy ● Celkem ● Relativně - vypočtený podíl počtu obyvatel v kraji na celkovém počtu obyvatel ČR Mimo výše uvedenou strukturu je pod tabulkou nebo vedle tabulky uvedeno: ● ●
Celkový počet obyvatel ČR za daný rok Celkový přírůstek/úbytek obyvatelstva za celý rok
Změny ve struktuře dat v období 2008-2012: ●
v roce 2008 je uveden i relativní podíl mužů a relativní podíl žen na celkovém počtu obyvatel ČR.
V tabulce 3 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
21 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 3: Údaje a rozsahy buněk v T5.1 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet
C6-C19 (počet mužů) D6-D19 (počet žen)
obyvatelstvo podle krajů (1)
05 Demografie ROK
Ne
Kraj
B6-19
obyvatelstvo podle krajů (1)
05 Demografie ROK
Ne
Pohlaví
C5 (muži) D5 (ženy)
obyvatelstvo podle krajů (1)
05 Demografie ROK
Ne
Rok
Název souboru Parsování textu v B3
obyvatelstvo podle krajů (1)
05 Demografie ROK
Ne
Součtový sloupec tabulky: ●
E5:F20 (2008-2012, list 1)
Součtový řádek tabulky: ●
B20-F20 (2008-2012, list 1)
T5.2 Věkové složení obyvatel České republiky Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ●
Věk (pozn. pásmo) Muži Ženy Celkem
Změny ve struktuře dat v období 2008-2012: ●
v roce 2008 chybí název sloupce Věk.
V tabulce 4 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 4: Údaje a rozsahy buněk v T5.2 Cílový sloupec
Věk obyvatele (pozn. číselník věk obyvatele 1)
Zdrojové buňky/údaje
B5-B25
List
obyvatelstvo podle věku (2)
Soubor
05 Demografie ROK
Změny v umístění mezi roky Ne
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
22 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet
C5-C25 (muži) D5-D25 (ženy)
obyvatelstvo podle věku (2)
05 Demografie ROK
Ne
Pohlaví
C4 (muži) D4 (ženy)
obyvatelstvo podle věku (2)
05 Demografie ROK
Ne
Rok
Název souboru Parsování textu v B1
obyvatelstvo podle věku (2)
05 Demografie ROK
Ne
Součtový sloupec tabulky: ●
E4-E26 (2008-2012, list 2)
Součtový řádek tabulky: ●
B26-E26 (2008-2012, list 2)
T5.3 Relativní rozložení populace Zdrojová tabulka obsahuje data v následující struktuře: ●
● ●
Skupina obyvatel (pozn. v souboru pojmenování chybí) ○ pojištěnci ○ počet důchodců bez sirotků ○ počet obyvatel mladších 19 let ○ ostatní Počet (pozn. v souboru pojmenování chybí) Podíl (pozn. v souboru pojmenování chybí) - vypočtený podíl na celkovém počtu obyvatel ČR
Kromě roku 2008 obsahuje list i údaje ● ●
Relativní podíl mužů na obyvatelstvu ČR Relativní podíl žen na obyvatelstvu ČR
V ročence pak jsou koláčové grafy pro rozdělení obyvatelstva mezi muže a ženy a pro rozdělení obyvatelstva dle výše uvedených skupin. Změny ve struktuře dat v období 2008-2012: ● ●
V roce 2008 je relativní podíl mužů a žen na obyvatelstvu uveden na listu “obyvatelstvo podle krajů.” Relativní podíly mužů a žen jsou v letech 2012 a 2011 vypočteny, v ostatních souborech jsou uvedeny jako hodnota
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
23 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
V tabulkách 5 a 6 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 5: Údaje a rozsahy buněk v T5.3 - skupiny obyvatel Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Skupina obyvatel
B4-B8
relat. rozložení populace (3)
05 Demografie ROK
Ne
Počet
E4-E8
relat. rozložení populace (3)
05 Demografie ROK
Ne
Podíl v populaci
F4-F8
relat. rozložení populace (3)
05 Demografie ROK
Ne
Rok
Název souboru Parsování textu v B2
relat. rozložení populace (3)
05 Demografie ROK
Ne
Tabulka 6: Údaje a rozsahy buněk v T5.3 - podíl v populaci Cílový sloupec Podíl v populaci
Zdrojové buňky/údaje List 3 -C13(ženy, 2009-2012) -C14 (muži, 20092012)
List
Soubor
Změny v umístění mezi roky
obyvatelstvo podle krajů (1) relat. rozložení populace (3)
05 Demografie ROK
Ano
obyvatelstvo podle krajů (1) relat. rozložení populace (3)
05 Demografie ROK
Ano
relat. rozložení populace (3)
05 Demografie ROK
Ne
List 1 -C22 (muži, 2008) -D22 (ženy, 2008) Pohlaví
List 3 -C13(ženy, 2009-2012) -C14 (muži, 20092012) List 1 -C5 (muži, 2008) -D5 (ženy, 2008)
Rok
Název souboru Parsování textu v B2
Součtový sloupec tabulky: ●
Není
Součtový řádek tabulky:
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
24 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
není
T5.4 Srovnání věkového složení obyvatel v letech 2012 a 2030 Zdrojová tabulka obsahuje data v následující struktuře: ● ●
Věk obyvatele (pozn. v souboru pojmenování chybí) Počet mužů (za určitý rok dle souboru, v roce 2008 jsou údaje na listu “data pro graf” označena jako za rok 2006, ale graf je uvádí jako data za rok 2008) ● Počet žen (za určitý rok dle souboru, v roce 2008 jsou údaje na listu “data pro graf” označena jako za rok 2006, ale graf je uvádí jako data za rok 2008) ● Počet mužů 2030 ● Počet žen 2030 Na listu “data pro graf jsou i pomocné sloupečky, které nejsou vždy pojmenovány. Pro vykreslení grafu se počet mužů udává jako záporné číslo (-1 * počet) Změny ve struktuře dat v období 2008-2012: ●
Žádné, v roce 2008 je nesoulad ve významu údajů mezi daty a grafem.
V tabulce 7 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 7: Údaje a rozsahy buněk v T5.4 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Věk obyvatele (pozn. číselník věk obyvatele 2)
B5-B23
data pro graf (5)
05 Demografie ROK
Ne
Počet
C5-C23 (muži, daný rok) D5-D23 (ženy, daný rok) E5-E23 (muži, 2030) F5-F23 (ženy, 2030)
data pro graf (5)
05 Demografie ROK
Ne
Pohlaví
Chybí ve zdrojovém souboru, musí se doplnit při transformaci
data pro graf (5)
05 Demografie ROK
Ne
Rok
Sloučené buňky C4+D4 (daný rok) Sloučené buňky E4+F4 (2030)
data pro graf (5)
05 Demografie ROK
Ne
Součtový sloupec tabulky: ●
Není
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
25 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový řádek tabulky: ●
Není
Odhady za rok 2030 se zdají být shodné ve všech souborech 2008-2012. T6.1 Přehled o počtu některých výkonů souvisejících s důchodovou agendou Zdrojová tabulka obsahuje data v následující struktuře: ● Druh výkonu (pozn. pojmenování chybí) ● Počet výkonů (pozn. pojmenování chybí) Změny ve struktuře dat v období 2008-2012: ●
porovnání struktury uvedených výkonů mezi jednotlivými roky viz tabulka 8. Tabulka 8: Porovnání struktury výkonů v T6.1 mezi jednotlivými roky 2008-2009
2010
2011
2012
Počet vyplácených důchodů k 31. 12. 2008
Počet vyplácených důchodů k 31. 12. 2012
Počet vyplácených důchodů k 31. 12. 2012
Počet vyplácených důchodů k 31. 12. 2012
Netypické výplaty (zahraniční agenda)
Netypické výplaty (zahraniční agenda)
Netypické výplaty (zahraniční agenda)
Netypické výplaty (zahraniční agenda)
Počet důchodců k 31. 12. 2008
Počet důchodců k 31. 12. 2012
Počet důchodců k 31. 12. 2012
Počet důchodců k 31. 12. 2012
Počet důchodců s netypickou výplatou
Počet důchodců s netypickou výplatou
Počet důchodců s netypickou výplatou
Počet došlých žádostí o důchod v roce 2008
Počet došlých žádostí o důchod
Počet došlých žádostí o důchod
Počet došlých žádostí o důchod
Počet přiznaných důchodů v roce 2008
Počet přiznaných důchodů
Počet přiznaných důchodů
Počet přiznaných důchodů
Počet zpracovaných spisů v dávkovém řízení
Počet zpracovaných spisů v dávkovém řízení
Počet zpracovaných spisů v dávkovém řízení
Počet zpracovaných spisů v dávkovém řízení
- z toho zahraničních agend
- z toho zahraničních agend
- z toho zahraničních agend
- z toho zahraničních agend
Informační kancelář - počet klientů v roce 2008
Informační kancelář - počet klientů v roce 2008
Klientské centrum počet klientů
Klientské centrum počet klientů
Počet podaných informací (telefon, fax, e-mail) v ústředí ČSSZ
Počet podaných informací (telefon, fax, e-mail) v ústředí ČSSZ
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
26 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2009
2010
2011
2012
Call centrum - počet klientů
Call centrum - počet klientů
Počet došlých evidenčních listů důch. pojištění
Počet došlých evidenčních listů důchodového pojištění
Počet došlých evidenčních listů důchodového pojištění
Počet došlých evidenčních listů důchodového pojištění
Počet evidenčních listů důch. pojištění přijatých elektronicky
Počet evidenčních listů důchodového pojištění přijatých elektronicky
Počet evidenčních listů důchodového pojištění přijatých elektronicky
Počet evidenčních listů důchodového pojištění přijatých elektronicky
Počet došlých podání
Počet došlých podání
Počet došlých podání
Počet došlých podání
- z toho do datových schránek
- z toho do datových schránek
- z toho do datových schránek
Počet expedovaných zásilek
Počet expedovaných zásilek
Počet expedovaných zásilek
Počet expedovaných zásilek
Počet zaslaných datových zpráv Počet formulářů přihlášek, odhlášek a změn u pojištěnců přijatých elektronicky
Počet formulářů přihlášek, odhlášek a změn u pojištěnců přijatých elektronicky
Počet formulářů přihlášek, odhlášek a změn u pojištěnců přijatých elektronicky
Počet formulářů přihlášek, odhlášek a změn u pojištěnců přijatých elektronicky
Tabulky za roky 2011 a 2012 obsahují nejen počty za aktuální rok, ale i za minulý rok. V tabulce 9 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 9: Údaje a rozsahy buněk v T6.1 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh výkonu
A13-A26 (2008, 2009) A13-A28 (2010, 2011) A13-A29 (2012)
06.01 důchodová agenda (1)
06 a 07 Agenda pro ročenku ROK
Ano
Počet výkonů
H13-H26 (2008) J13-J26 (2009) J13-J28 (2010) K13-K28 (2011) K13-K29 (2012)
06.01 důchodová agenda (1)
06 a 07 Agenda pro ročenku ROK
Ano
Rok
Název souboru
06.01 důchodová agenda (1)
06 a 07 Agenda pro ročenku ROK
Ne
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
27 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový sloupec tabulky: ●
není
Součtový řádek tabulky: ●
není
T6.2 Došlé žádosti o důchod Zdrojová tabulka obsahuje data v následující struktuře: ●
●
2008 a 2009 ○ Měsíc (pozn. není uvedeno) ○ S ○ z toho S ○ z toho SR ○ z toho SRN ○ z toho SD ○ z toho ST ○ I ○ IČ ○ V ○ VM ○ D ○ CELKEM 2010 až 2012 ○ Měsíc (pozn. není uvedeno) ○ S ○ z toho S+SI+SIN ○ z toho SR+SRN ○ z toho SD ○ z toho ST ○ I ○ IČ ○ IP ○ ID ○ IT ○ V ○ VM ○ D ○ CELKEM
Pod tabulkami se nacházejí textové poznámky.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
28 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Změny ve struktuře dat v období 2008-2012: ●
viz výše, změny souvisí se změnou klasifikace invalidních důchodů.
V tabulce 10 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 10: Údaje a rozsahy buněk v T6.2 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet došlých žádostí
B10:L21 (2008, 2009) B10:M21 (2010-2012)
06.02 Došlé žádosti v roce ROK (2)
06 a 07 Agenda pro ročenku ROK
Ano
Druh důchodu
B9-L9 (2008, 2009) B9-M9 (2010-2012)
06.02 Došlé žádosti v roce ROK (2)
06 a 07 Agenda pro ročenku ROK
Ano
Měsíc
A10-A21
06.02 Došlé žádosti v roce ROK (2)
06 a 07 Agenda pro ročenku ROK
Ne
Rok
Název souboru Parsovat B6
06.02 Došlé žádosti v roce ROK (2)
06 a 07 Agenda pro ročenku ROK
Ne
Součtový sloupec tabulky: ● ●
M9-M22 (2008, 2009) O9-O22
Součtový řádek tabulky: ● ●
A22-M22 (2008, 2009) A22-O22
T6.3 Zamítnuté žádosti o invalidní důchod Zdrojová tabulka obsahuje data v následující struktuře: ●
●
2008, 2009 ○ KRAJ ○ Plné invalidní důchody ○ Částečné invalidní důchody ○ ÚHRN 2010-2012 ○ KRAJ ○ I
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
29 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○ ○ ○
IČ I* (Pozn.: I* je souhrnné označení pro invalidní důchody všech stupňů (IP, ID, IT)) ÚHRN
Změny ve struktuře dat v období 2008-2012: ● viz výše. V tabulce 11 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 11: Údaje a rozsahy buněk v T6.3 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet zamítnutých důchodů
B10:D23 (2008, 2009) B10:E23 (2010-2012)
06.03 zamítnuté žádosti I a IČ (3)
06 a 07 Agenda pro ročenku ROK
Ano
Druh důchodu
B9, C9 (2008, 2009) B9, C9, D9 (20102012)
06.03 zamítnuté žádosti I a IČ (3)
06 a 07 Agenda pro ročenku ROK
Ano
Kraj
A10-A23
06.03 zamítnuté žádosti I a IČ (3)
06 a 07 Agenda pro ročenku ROK
Ne
Rok
Název souboru Pozn.: buňky k parsování k dispozici, ale sloučené
06.03 zamítnuté žádosti I a IČ (3)
06 a 07 Agenda pro ročenku ROK
Ano (sloučené buňky)
Součtový sloupec tabulky: ● ●
D9-D24 (2008, 2009) E9-E24 (2010-2012)
Součtový řádek tabulky: ● ●
A24-D24 (2008, 2009) A24-E24 (2010-2012)
T7.1 Počet vyplácených důchodů Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ●
Druh důchodu (pozn. název sloupce neuveden) Muži Ženy Celkem
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
30 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Změny ve struktuře dat v období 2008-2012: ●
V letech 2008 a 2009 je odlišná struktura druhů důchodů než v letech 2010-2012. Viz tabulka 12.
Tabulka 12: Porovnání struktury druhů důchodů v T7.1 2008-2009 Starobní důchody (S)
2010-2012 Starobní důchody (S) Starobní důchody (SI)
Starobní důchody (SRN)
Starobní důchody (SRN)
Starobní důchody (ST)
Starobní důchody (ST)
Starobní důchody (SD)
Starobní důchody (SD)
Poměrné starobní důchody (SR)
Poměrné starobní důchody (SR)
S-CELKEM
S-CELKEM
Plné invalidní důchody (I+IM)
Invalidní důchody 3. stupně (IT)
Částečné invalidní důchody (IČ)
Invalidní důchody 2. stupně (ID) Invalidní důchody 1. stupně (IP)
Vdovské důchody (V)
Vdovské důchody (V)
Vdovecké důchody (VM)
Vdovecké důchody (VM)
Sirotčí důchody (D)
Sirotčí důchody (D)
Celkem
Celkem
Netypické výplaty
Netypické výplaty
ÚHRN
ÚHRN
V tabulce 13 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
31 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 13: Údaje a rozsahy buněk v T7.1 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet vyplácených důchodů
E7-E19 (muži, 20082009) F7-F19 (ženy, 20082009) E7-E21 (muži, 20102012) F7-F21 (ženy, 20102012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Druh důchodu
A7-A19 (2008-2009) A7-A21 (2010-2012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Pohlaví
E5 (muži) F5 (ženy)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ne
Rok
Název souboru Parsovat A3
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ne
Netypické výplaty pouze v součtovém sloupci v buňce G19 (2008-2009), resp. G21 (20102012). Součtový sloupec tabulky: ● ●
G5-G20 (2008-2009) G5-G22 (2010-2012)
Součtový řádek tabulky: ● ●
A20-G20 (2008-2009) A22-G22 (2010-2012)
T7.2 Počet důchodců Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ●
Druh důchodu (pozn. název sloupce neuveden) Muži Ženy Celkem
Změny ve struktuře dat v období 2008-2012: ●
V letech 2008 a 2009 je odlišná struktura druhů důchodů než v letech 2010-2012. Viz tabulka 14.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
32 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 14: Porovnání struktury druhů důchodů v T7.2 2008-2009 Starobní důchody (S)
2010-2012 Starobní důchody (S) Starobní důchody (SI)
Starobní důchody (SRN)
Starobní důchody (SRN)
Starobní důchody (ST)
Starobní důchody (ST)
Starobní důchody (SD)
Starobní důchody (SD)
Poměrné starobní důchody (SR)
Poměrné starobní důchody (SR)
S-CELKEM
S-CELKEM
Plné invalidní důchody (I+IM)
Invalidní důchody 3. stupně (IT)
Částečné invalidní důchody (IČ)
Invalidní důchody 2. stupně (ID) Invalidní důchody 1. stupně (IP)
Vdovské důchody (V)
Vdovské důchody (V)
V-komb.
Vdovské v souběhu (V-KOMB)
Vdovecké důchody (VM)
Vdovecké důchody (VM)
VM-komb.
Vdovecké v souběhu (VM-KOMB)
Sirotčí důchody (D)
Sirotčí důchody (D)
Celkem
Celkem
Netypické výplaty
Netypické výplaty
ÚHRN
ÚHRN
V tabulce 15 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
33 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 15: Údaje a rozsahy buněk v T7.2 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet důchodců
E27-E41 (muži, 20082009) F27-F41 (ženy, 20102012) E29-E45 (muži, 20082009) F29-F45 (ženy, 20102012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Druh důchodu
A27-A41 (2008-2009) A29-A45 (2010-2012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Pohlaví
E25 (muži, 2008-2009) F25 (ženy, 2008-2009) E27 (muži, 2010-2012) F27 (ženy, 2010-2012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Rok
Název souboru Parsovat A23 (20082009) Parsovat A25 (20102012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano (buňky k parsování)
Netypické výplaty pouze v součtovém sloupci v buňce G41 (2008-2009), resp. G45 (20102012). Součtový sloupec tabulky: ● ●
G25-G42 (2008-2009) G27-G46 (2010-2012)
Součtový řádek tabulky: ● ●
A42-G42 (2008-2009) A46-G46 (2010-2012)
T7.3 Počet nově přiznaných důchodů Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ●
Druh důchodu Muži Ženy Celkem
Změny ve struktuře dat v období 2008-2012:
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
34 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
V letech 2008 a 2009 je odlišná struktura druhů důchodů než v letech 2010-2012. Viz tabulka 16. Tabulka 16: Porovnání struktury druhů důchodů v T7.3 2008-2009
2010-2011
Starobní důchody (S)
Starobní důchody (S) Starobní důchody (SI)
Starobní důchody (SRN)
Starobní důchody (SRN)
Starobní důchody (ST)
Starobní důchody (ST)
Starobní důchody (SD)
Starobní důchody (SD)
Poměrné starobní důchody (SR)
Poměrné starobní důchody (SR)
S-CELKEM
S-CELKEM
Plné invalidní důchody (I+IM)
Invalidní důchody 3. stupně (IT)
Částečné invalidní důchody (IČ)
Invalidní důchody 2. stupně (ID) Invalidní důchody 1. stupně (IP)
Vdovské důchody (V)
Vdovské důchody (V)
Vdovecké důchody (VM)
Vdovecké důchody (VM)
Sirotčí důchody (D)
Sirotčí důchody (D)
CELKEM
Celkem
V tabulce 17 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 17: Údaje a rozsahy buněk v T7.3 Cílový sloupec Počet nově přiznaných důchodů
Zdrojové buňky/údaje E53-E63 (muži, 20082009) F53-F63 (ženy, 20082009) E58-E70 (muži, 20102012) F58-F70 (ženy, 20102012)
List 07 Základní přehled- ROK (4)
Soubor 06 a 07 Agenda pro ročenku ROK
Změny v umístění mezi roky Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
35 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
A53-A63 (2008-2009) A58-A70 (2010-2012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Pohlaví
E51 (muži, 2008-2009) F51 (ženy, 2008-2009) E56 (muži, 2010-2012) F56 (ženy, 2010-2012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano
Rok
Název souboru Parsovat A49 (20082009) Parsovat A54 (20102012)
07 Základní přehled- ROK (4)
06 a 07 Agenda pro ročenku ROK
Ano (buňky k parsování)
Součtový sloupec tabulky: ● ●
G51-G64 (2008-2009) G56-G71 (2010-2012)
Součtový řádek tabulky: ● ●
A64-G64 (2008-2009) A71-G71 (2010-2012)
T7.4 Vývoj výdajů na důchody od roku 1996 Zdrojová tabulka obsahuje data v následující struktuře: ● ● ●
Rok (pozn. název sloupce není uveden) Výdaje v tis. Kč Z toho na starobní důchody
Změny ve struktuře dat v období 2008-2012: ●
Žádné, v každém roce přibude nový řádek. Zdrojový soubor s daty za rok 2012 obsahuje i data za minulé roky. Při exportu dat tak nemusí být třeba převádět data pro tuto tabulku za roky 2008-2011.
V tabulce 18 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
36 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 18: Údaje a rozsahy buněk v T7.4 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Rok
A9-A21 (2008) A9-A22 (2009) A9-A23 (2010) A9-A24 (2011) A9-A25 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Výdaje v tis. Kč
C9-C21 (2008) C9-C22 (2009) C9-C23 (2010) C9-C24 (2011) C9-C25 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Z toho na starobní důchody
D9-D21 (2008) D9-D22 (2009) D9-D23 (2010) D9-D24 (2011) D9-D25 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Rok souboru
Název souboru
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ne
Součtový sloupec tabulky: ●
Není
Součtový řádek tabulky: ●
není
T7.5 Výdaje na dávky důchodového pojištění (v tis. Kč) Zdrojová tabulka obsahuje data v následující struktuře: ● ●
Druh důchodu Výdaje
Změny ve struktuře dat v období 2008-2012: ●
V letech 2008 a 2009 je odlišná struktura druhů důchodů než v letech 2010-2012. Viz tabulka 19. Tabulka 19: Porovnání struktury druhů důchodů v T7.5 2008-2009
2010-2012
Starobní důchod (S)
Starobní důchody (S-CELKEM)
Plný invalidní důchod (I)
Invalidní důchody pro invaliditu III. stupně
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
37 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2009
2010-2012
Částečný invalidní důchod (IČ)
Invalidní důchody pro invaliditu II. stupně Invalidní důchody pro invaliditu I. stupně
Vdovský důchod (V)
Vdovské důchody (V)
Vdovecký důchod (VM)
Vdovecké důchody (VM)
Sirotčí důchod (D)
Sirotčí důchody (D)
V tabulce 20 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 20: Údaje a rozsahy buněk v T7.5 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
A28-A33 (2008-2009) A30-A36 (2010) A31-A37 (2011) A32-A38 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Výdaje
D28-D33 (2008-2009) D30-D36 (2010) D31-D37 (2011) D32-D38 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Rok
Název souboru Parsovat A24 (20082009) Parsovat A26 (2010) Parsovat A27 (2011) Parsovat A28 (2012)
07.04 07.05 výdaje na důchody (5)
06 a 07 Agenda pro ročenku ROK
Ano
Součtový sloupec tabulky: ●
Není
Součtový řádek tabulky: ● ● ● ●
A35-D35 (2008-2009) A38-D38 (2010) A39-D39 (2011) A40-D40 (2012)
Pod tabulkou jsou uvedeny poznámky.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
38 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
T7.6 Přehled o rozložení souboru důchodců podle výše důchodů v kvantilovém vyjádření od roku 2001 Zdrojová tabulka obsahuje data v následující struktuře: ●
důchod starobní sólo ○ Rok (pozn. název sloupce není uveden) ○ Q10 ○ Q50 - medián ○ Q90 ● důchod plný invalidní sólo (od roku 2010 důchod invalidní sólo) ○ Rok (pozn. název sloupce není uveden) ○ Q10 ○ Q50 - medián ○ Q90 Na jednom samostatném listu jsou 2 tabulky - starobní důchody a invalidní důchody Změny ve struktuře dat v období 2008-2012: ●
Žádné, za jednotlivé roky přibývají řádky. Změna ve významu od roku 2010 - do roku 2009 se jedná o plné invalidní důchody, od roku 2010 o invalidní důchody třetího stupně.
V tabulce 21 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 21: Údaje a rozsahy buněk v T7.6 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet důchodců
D10:F17 (starobní důchody sólo, 2008) D21:F17 (invalidní důchody sólo, 2008)
07.06 kvantily (6)
06 a 07 Agenda pro ročenku ROK
Ano
Rok
C10-C17 a C21-C28 (2008)
07.06 kvantily (6)
06 a 07 Agenda pro ročenku ROK
Ano
Kvantil
D9, E9, F9
07.06 kvantily (6)
06 a 07 Agenda pro ročenku ROK
Ne
Druh důchodu
Odpovídající buňky nejsou k dispozici pravidla je třeba nastavit dle oblasti (starobní/invalidní) a podle roku souboru (u invalidních se mění skupiny)
07.06 kvantily (6)
06 a 07 Agenda pro ročenku ROK
Ne
Rok souboru
Název souboru Parsovat C2
07.06 kvantily (6)
06 a 07 Agenda pro ročenku ROK
Ne
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
39 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový sloupec tabulky: ●
Není
Součtový řádek tabulky: ●
není
T7.7 Vývoj průměrné délky doby pobírání řádného starobního důchodu od roku 1970 (v letech) Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ●
Rok zániku důchodu Muži Ženy Celkem
Změny ve struktuře dat v období 2008-2012: ●
Žádné, přibývá řádek za každý rok. Nicméně k dispozici pouze v ročenkách 2011 a 2012.
V tabulce 22 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 22: Údaje a rozsahy buněk v T7.7 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Délka pobírání řádného starobního důchodu
B7-B21 (muži, 2011) C7-C21 (ženy, 2011) D7-D21 (celkem, 2011) B7-B22 (muži, 2012) C7-C22 (ženy, 2012) D7-D22 (celkem, 2012)
07.07 délka pobírání S (7)
06 a 07 Agenda pro ročenku ROK
Ano
Rok zániku důchodu
A7-A21 (2011) A7-A22 (2012)
07.07 délka pobírání S (7)
06 a 07 Agenda pro ročenku ROK
Ano
Pohlaví + Celkem
B6 (muži) C6 (ženy) D6 (celkem)
07.07 délka pobírání S (7)
06 a 07 Agenda pro ročenku ROK
Ne
Rok souboru
Název souboru Parsovat A2
07.07 délka pobírání S (7)
06 a 07 Agenda pro ročenku ROK
Ne
Součtový sloupec tabulky:
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
40 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
Není
Součtový řádek tabulky: ●
není
T8.1 Přehled o počtu důchodců v členění podle krajů, podle pohlaví, průměrné výše důchodu, průměrného věku a podle druhu důchodu Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ● ● ● ● ● ● ●
Druh důchodu (pozn. název sloupce neuveden) Počet mužů Počet žen Počet celkem Průměrná výše důchodu muži Průměrná výše důchodu ženy Průměrná výše důchodu celkem Průměrný věk muži Průměrný věk ženy Průměrný věk celkem
V roce 2008 mají sloupce průměrné výše důchodu v popisku uvedeno “prům. výše důchodu bez součástí.” Data uvedena ve zdrojovém souboru na listech - první list obsahuje data za celou ČR, ostatní listy obsahují data za jednotlivé kraje ČR. Struktura se na jednotlivých listech opakuje Změny ve struktuře dat v období 2008-2012: ●
Rozložení dat se nemění. Mění se struktura druhů důchodu. V letech 2008 a 2009 je odlišná struktura druhů důchodů než v letech 2010 a 2012, rok 2011 obsahuje navíc jednu kategorii oproti rokům 2010 a 2012. Viz tabulka 23. Tabulka 23: Údaje a rozsahy buněk v T8.1 2008-2009
S
2011
2010, 2012
S
S
SI
SI
SRN
SRN
SRN
ST
ST
ST
SD
SD
SD
S-CELKEM
S-CELKEM
S-CELKEM
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
41 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2009 SR
2011
2010, 2012
SR
SR
IT
IT
ID
ID
IP
IP
V-SÓLO
V-SOLO
V-SOLO
SV
SV
SV
SIV
SIV
SRNV
SRNV
SRNV
STV
STV
STV
SDV
SDV
SDV
SRV
SRV
SRV
ITV
ITV
IDV
IDV
IPV
IPV
V-KOMB
V-KOMB
V-KOMB
V-CELKEM
V-CELKEM
V-CELKEM
VM-SÓLO
VM-SOLO
VM-SOLO
SVM
SVM
SVM
SIVM
SIVM
SRNVM
SRNVM
SRNVM
STVM
STVM
STVM
SDVM
SDVM
SDVM
I IČ
IV IČV
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
42 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2009 SRVM
2011
2010, 2012
SRVM
SRVM
ITVM
ITVM
IDVM
IDVM
IPVM
IPVM
VM-KOMB
VM-KOMB
VM-KOMB
VM-CELKEM
VM CELKEM
VM CELKEM
D-DĚTI
D-DĚTI
D-DĚTI
IVM IČVM
D-KMENY ÚHRN
ÚHRN
ÚHRN
Kategorie D-KMENY, uvedená v datech pro ročenku 2011, nicméně není v textu ročenky (PDF) uvedena. V tabulkách 24, 25 a 26 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 24: Údaje a rozsahy buněk v T8.1 - počet důchodců Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet důchodců
C18-C46 (muži, 20082009, listy 1-15) D18-D46 (ženy, 20082009, listy 1-15) C18-C52 (muži, 2010, 2012, listy 1-15) D18-D52 (ženy, 20102012, listy 1-15) C18-C53 (muži, 2011, listy 1-15) D18-D53 (ženy, 2011, listy 1-15)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ano
Druh důchodu
A18-A46 (2008-2009, listy 1-15) A18-A52 (2010, 2012) A18-A53 (2011)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
43 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Pohlaví
C16 (muži, 2008-2012, listy 1-15) D16 (ženy, 2008-2012, listy 1-15)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Oblast (ČR nebo kraj)
Název listu
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Rok
Parsovat A8 Doplnit rok do názvu souboru před zpracováním
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Součtový sloupec pro CSV T8.1 - počet důchodců: ● ● ●
E16-E47 (2008-2009, listy 1-15) E16-E53 (2010, 2012, listy 1-15) E16-E54 (2011, listy 1-15)
Součtový řádek pro CSV T8.1 - počet důchodců: ● ● ●
A47, C47-E47 (2008-2009, listy 1-15) A53, C53-E53 (2010, 2012, listy 1-15) A54, C54-E54 (2010, listy 1-15) Tabulka 25: Údaje a rozsahy buněk v T8.1 - průměrná výše důchodů
Cílový sloupec Průměrná výše důchodů
Zdrojové buňky/údaje F18-F47 (muži, 20082009, listy 1-15) G18-G47 (ženy, 20082009, listy 1-15) H18-H47 (celkem, 2008-2009, listy 1-15) F18-G53 (muži, 2010, 2012, listy 1-15) G18-G53 (ženy, 20102012, listy 1-15) H18-H53 (celkem, 2010-2012, listy 1-15) F18-F54 (muži, 2011, listy 1-15) G18-G54 (ženy, 2011, listy 1-15) H18-H54 (celkem, 2011, listy 1-15)
List Všechny (1-15)
Soubor 08.01 Počet důchodců podle krajů
Změny v umístění mezi roky Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
44 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
A18-A47 (2008-2009, listy 1-15) A18-A53 (2010, 2012) A18-A54 (2011)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ano
Pohlaví + Celkem
F16 (muži, 2008-2012, listy 1-15) G16 (ženy, 2008-2012, listy 1-15) H16 (celkem, 20082012, listy 1-15)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Oblast (ČR nebo kraj)
Název listu
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Rok
Parsovat A8 Doplnit rok do názvu souboru před zpracováním
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Součtový sloupec pro CSV T8.1 - průměrná výše důchodů: ●
není - průměrnou výši důchodů nelze sčítat
Součtový řádek pro CSV T8.1 - průměrná výše důchodů: ●
není - průměrnou výši důchodů nelze sčítat Tabulka 26: Údaje a rozsahy buněk v T8.1 - průměrný věk
Cílový sloupec
Zdrojové buňky/údaje
Průměrný věk
I18-I47 (muži, 20082009, listy 1-15) J18-J47 (ženy, 20082009, listy 1-15) K18-K47 (celkem, 2008-2009, listy 1-15) I18-I53 (muži, 2010, 2012, listy 1-15) J18-J53 (ženy, 20102012, listy 1-15) K18-K53 (celkem, 2010-2012, listy 1-15) I18-I54 (muži, 2011, listy 1-15) J18-J54 (ženy, 2011, listy 1-15) K18-K54 (celkem, 2011, listy 1-15)
List Všechny (1-15)
Soubor 08.01 Počet důchodců podle krajů
Změny v umístění mezi roky Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
45 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
A18-A47 (2008-2009, listy 1-15) A18-A53 (2010, 2012) A18-A54 (2011)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ano
Pohlaví + Celkem
I16 (muži, 2008-2012, listy 1-15) J16 (ženy, 2008-2012, listy 1-15) K16 (celkem, 20082012, listy 1-15)
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Oblast (ČR nebo kraj)
Název listu
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Rok
Parsovat A8 Doplnit rok do názvu souboru před zpracováním
Všechny (1-15)
08.01 Počet důchodců podle krajů
Ne
Součtový sloupec pro CSV T8.1 - průměrný věk: ●
není - průměrný věk nelze sčítat
Součtový řádek pro CSV T8.1 - průměrný věk: ●
není - průměrný věk nelze sčítat
T8.2 Přehled o počtu vyplácených důchodů podle věku důchodce Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
46 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List invalidní ■ VĚK ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem ○ List vdovské a vdovecké ■ VĚK ■ V-SÓLO ■ V-KOMB ■ V-CELKEM ■ VM-SÓLO ■ VM-KOMB ■ VM-CELKEM ○ List ČR ■ VĚK ■ MUŽI ■ ŽENY ■ CELKEM Roky 2010-2012 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
47 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List invalidní ■ VĚK ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP - Celkem ○ List vdovské a vdovecké ■ VĚK ■ V-SÓLO ■ V-KOMB ■ V-CELKEM ■ VM-SÓLO ■ VM-KOMB ■ VM-CELKEM ○ List ČR ■ VĚK ■ MUŽI ■ ŽENY ■ CELKEM Změny ve struktuře dat v období 2008-2012: ●
Změny mezi soubory 2008 - 2009 a soubory 2010-2012 dané změnou struktury důchodů, struktura věkových pásem je shodná ve všech souborech
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
48 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
V tabulce 27 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Poslední řádek v každé tabulce udává průměrný věk pro každý druh důchodu. Tabulka 27: Údaje a rozsahy buněk v T8.2 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet vyplácených důchodů
B10:F66 (2008-2009, list 1-2) C10:D66 (muži, 20082009, list 4) E10:F66 (ženy, 20082009, list 4) B10:C66 (ženy, 20082012, list 5) E10:F66 (muži, 20082012, list 5) B10:G66 (2010-2012, list 1-2) C10:E66 (muži, 20102012, list 4) F10:H66 (ženy, 20102012, list 4)
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Ano
Průměrný věk
B68-H68 (list 1-2, 2010-2012) C68-K68 (list 4, 20102012) B68-G68 (list 5, 20082012) C68-E68 (list 6, 20082012) B68-G68 (list 1-2, 2008-2009) C68-H68 (list 4, 20082009)
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Ano
Věk
A10-A66 (2008-2012)
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Ne
Druh důchodu
B9-F9 (2008-2009, list 1, 2) C9-F9 (2008-2009, list 4) B9, C9, E9, F9 (20082012, list 5) B9-G9 (2010-2012, list 1, 2) C9-H9 (2010-2012, list 4)
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
49 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Pohlaví
Parsovat název listu 1 (2008-2012) Parsovat název listu 2 (2008-2012) C8, E8 (2008-2009, list 4) B8, E8 (2008-2009, list 5)
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Rok
Parsovat A5 Doplnit rok do názvu souboru před zpracováním
Listy 1, 2, 4, 5
08.02 Počet důchodců podle věku
Změny v umístění mezi roky
Ne
Součtové sloupce tabulky: ● ● ● ● ●
G9-G67 (2008-2012, list 1, 2, 5) G9:H67 (2008-2009, list 4) D9-D67 (2008-2012, list 5) H9-H67 (2010-2012, list 1-2) I9:K67 (2010-2012, list 4)
Součtové řádky tabulky: ● ● ● ● ●
A67-G67 (2008-2009, list 1,2, 5) A67-H67 (2008-2009, list 4) A67-H67 (2010-2012, list 1-2) A67-K67 (2010-2012, list 4) A67-G67 (2012-2012, list 5)
Součtové listy: ● ●
List 3: S-celkem List 5: ČR
T8.3 Přehled o počtu vyplácených důchodů podle měsíční výše důchodu Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
50 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List invalidní ■ VĚK ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem ○ List vdovské a vdovecké ■ VĚK ■ V-SÓLO ■ V-KOMB ■ V-CELKEM ■ VM-SÓLO ■ VM-KOMB ■ VM-CELKEM ○ List ČR ■ VĚK ■ MUŽI ■ ŽENY ■ CELKEM Roky 2010-2012 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
51 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○
○
○
○
○
■ ST ■ SR ■ SI ■ CELKEM List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List invalidní ■ VĚK ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP - Celkem List vdovské a vdovecké ■ VĚK ■ V-SÓLO ■ V-KOMB ■ V-CELKEM ■ VM-SÓLO ■ VM-KOMB ■ VM-CELKEM List ČR ■ VĚK ■ MUŽI
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
52 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
■ ■
ŽENY CELKEM
Změny ve struktuře dat v období 2008-2012: ●
Změny mezi soubory 2008 - 2009 a soubory 2010-2012 dané změnou struktury důchodů. V ročence za rok 2012 je změněná struktura pásem výše důchodu - viz tabulka 28. Tabulka 28: Porovnání struktury pásem důchodů 2008-2011
2012
1–2 999
1–2 999
3 000–3 499
3 000–3 499
3 500–3 999
3 500–3 999
4 000–4 199
4 000–4 499
4 200–4 399
4 500–4 999
4 400–4 599 4 600–4 799 4 800–4 999 5 000–5 199
5 000–5 199
5 200–5 399
5 200–5 399
5 400–5 599
5 400–5 599
5 600–5 799
5 600–5 799
5 800–5 999
5 800–5 999
6 000–6 199
6 000–6 199
6 200–6 399
6 200–6 399
6 400–6 599
6 400–6 599
6 600–6 799
6 600–6 799
6 800–6 999
6 800–6 999
7 000–7 199
7 000–7 199
7 200–7 399
7 200–7 399
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
53 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2011
2012
7 400–7 599
7 400–7 599
7 600–7 799
7 600–7 799
7 800–7 999
7 800–7 999
8 000–8 199
8 000–8 199
8 200–8 399
8 200–8 399
8 400–8 599
8 400–8 599
8 600–8 799
8 600–8 799
8 800–8 999
8 800–8 999
9 000–9 199
9 000–9 199
9 200–9 399
9 200–9 399
9 400–9 599
9 400–9 599
9 600–9 799
9 600–9 799
9 800–9 999
9 800–9 999
10 000–10 199
10 000–10 199
10 200–10 399
10 200–10 399
10 400–10 599
10 400–10 599
10 600–10 799
10 600–10 799
10 800–10 999
10 800–10 999
11 000–11 499
11 000–11 199
11 500–11 999
11 200–11 399 11 400–11 599 11 600–11 799 11 800–11 999
12 000–12 499
12 000–12 199
12 500–12 999
12 200–12 399 12 400–12 599
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
54 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2011
2012 12 600–12 799 12 800–12 999
13 000–13 499
13 000–13 499
13 500–13 999
13 500–13 999
14 000–14 499
14 000–14 499
14 500+
14 500–14 999 15 000–15 499 15 500–15 999 16 000–16 499 16 500–16 999 17 000–17 499 17 500–17 999 18 000 +
NEUDÁNO
NEUDÁNO
V tabulkách 29 a 30 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Poslední řádek v tabulkách udává průměrnou výši důchodu pro jednotlivé druhy důchodů.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
55 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 29: Údaje a rozsahy buněk v T8.3 - přehled důchodů Cílový sloupec
Počet vyplácených důchodů
Zdrojové buňky/údaje
B11:F57 (2008-2009, list 1-2) C11:D57 (2008-2009, muži, list 4) E11:F57 (2008-2009, ženy, list 4) B11:C57 (2008-2011, ženy, list 5) E11:F57 (2008-2011, muži, list 5) B11:G57 (2010-2011, list 1-2) C11:E57 (2010-2011, muži, list 4) F11:H57 (2010-2011, ženy, list 4)
List
Soubor
Změny v umístění mezi roky
Listy 1, 2, 4, 5
08.03 Počet důchodců podle výše důchodu
Ano
B11:G67 (2012, list 12) C11:E67 (2012, muži, list 4) F11:H67 (2012, ženy, list 4) B11:C67 (2012, ženy, list 5) E11:F67 (202, muži, list 5) Měsíční výše
A11-A57 (2008-2011, listy 1, 2, 4, 5) A11-A67 (2012, listy 1, 2, 4, 5)
Listy 1, 2, 4, 5
08.03 Počet důchodců podle výše důchodu
Ano
Druh důchodu
B10-F10 (2008-2009, list 1, 2) C10-F10 (2008-2009, list 4) B10, C10, E10, F10 (2008-2012, list 5) B10-G10 (2010-2012, list 1, 2) C10-H10 (2010-2012, list 4)
Listy 1, 2, 4, 5
08.03 Počet důchodců podle výše důchodu
Ano
Pohlaví
Parsovat název listu 1 (2008-2012) Parsovat název listu 2 (2008-2012) C9, E9 (2008-2009, list 4) C9, E9 (2008-2012, list 5) C9, F9 (2010-2012, list 4)
Listy 1, 2, 4, 5
08.03 Počet důchodců podle výše důchodu
Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
56 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Rok
Zdrojové buňky/údaje
Parsovat A6 Doplnit rok do názvu souboru před zpracováním
List
Listy 1, 2, 4, 5
Soubor
08.03 Počet důchodců podle výše důchodu
Změny v umístění mezi roky Ne
Součtové sloupce tabulky T8.3 - přehled důchodů: ● ● ● ● ● ● ● ●
G10-G58 (2008-2011, listy 1, 2, 5) G10:H58 (2008-2009, list 4) D10-D58 (2008-2011, list 5) H10-H58 (2010-2011, listy 1, 2, 5) I10:K58 (2012, list 4) H10-H68 (2012, listy 1, 2, 5) I10:K68 (2012, list 4) D10-D68 (2012, list 5)
Součtové řádky tabulky T8.3 - přehled důchodů: ● ● ● ● ● ● ●
A58-G58 (2008-2011, list 1, 2, 5) A58-H58 (2008-2009, list 4) A58-H58 (2010-2011, list 1, 2) A58-K58 (2010-2011, list 4) A68-H68 (2012, list 1, 2) A68-K68 (2012, list 4) A68-G68 (2012, list 5)
Součtové listy tabulky T8.3 - přehled důchodů: ● ●
List 3: S-celkem List 5: ČR
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
57 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 30: Údaje a rozsahy buněk v T8.3 - průměrná výše důchodů Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrná výše důchodu
B59-G59 (2008-2009, listy 1, 2, 3, 5) C59-H59 (2008-2009, list 4) C59-E59 (2008-2011, list 6) B59-H59 (2010-2011, listy 1-3) C59-K59 (2010-2011, list 4) B59-G59 (2010-2011, list 5) B69-H69 (2012, listy 13) C69-K69 (2012, list 4) B69-G69 (2012, list 5) C69-E69 (2012, list 6)
Všechny (1-6)
08.03 Počet důchodců podle výše důchodu
Ano
Druh důchodu
B10-F10 (2008-2009, list 1, 2, 3) C10-F10 (2008-2009, list 4) B10, C10, E10, F10 (2008-2012, list 5) B10-G10 (2010-2012, list 1, 2, 3) C10-H10 (2010-2012, list 4)
Všechny (1-6)
08.03 Počet důchodců podle výše důchodu
Ano
Pohlaví + celkem
Parsovat název listu 1 (2008-2012) Parsovat název listu 2 (2008-2012) C9, E9 (2008-2009, list 4) C9, E9 (2008-2012, list 5) C9, F9 (2010-2012, list 4) C10-E10 (2008-2012, list 6)
Všechny (1-6)
08.03 Počet důchodců podle výše důchodu
Ano
Rok
Parsovat A6 Doplnit rok do názvu souboru před zpracováním
Všechny (1-6)
08.03 Počet důchodců podle výše důchodu
Ne
Součtový sloupec tabulky T8.3 - průměrná výše důchodů ●
není
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
58 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový řádek tabulky T8.3 - průměrná výše důchodů: ●
není
T9.1 Přehled o počtu nově přiznaných důchodů podle věku důchodce Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List I ■ VĚK ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem ○ List Pozůstalostní a celkem ■ VĚK ■ V-CELKEM ■ VM-CELKEM ■ D-CELKEM
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
59 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
■ Muži - celkem ČR ■ Ženy - celkem ČR ■ CELKEM Roky 2010-2012 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List I ■ VĚK ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP - Celkem ○ List Pozůstalostní a celkem ■ VĚK
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
60 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
■ ■ ■ ■ ■
V-CELKEM VM-CELKEM Muži - celkem ČR Ženy - celkem ČR CELKEM
Změny ve struktuře dat v období 2008-2012: ●
Změny ve struktuře důchodů - struktura je jiná v letech 2008-2009 a 2010-2011. Struktura věkových pásem se nemění.
Poslední řádek v tabulkách udává průměrný věk dle jednotlivých typů důchodu. V tabulkách 31 a 32 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 31: Údaje a rozsahy buněk v T9.1 - přiznané důchody Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet nově přiznaných důchodů
B7:F63 (2008-2009, listy 1-2) B7:E63 (2008-2009, list 4) B7:D63 (2008-2012, list 5) B7:G63 (2010-2012, listy 1, 2, 4)
Listy 1, 2, 4, 5
09.01 Nově přiznané důchody dle věku důchodce
Ano
Věk
A7-A63
Listy 1, 2, 4, 5
09.01 Nově přiznané důchody dle věku důchodce
Ne
Druh důchodu
B6-F6 (2008-2009, listy 1-2) B6-E6 (2008-2009, list 4) B5-D5 (2008-2012, list 5) B6:G6 (2010-2012, listy 1, 2, 4)
Listy 1, 2, 4, 5
09.01 Nově přiznané důchody dle věku důchodce
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) E6, F6 (2008-2012, list 5) B5, E5 (2010-2012, list 4)
Listy 1, 2, 4, 5
09.01 Nově přiznané důchody dle věku důchodce
Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
61 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Rok
Zdrojové buňky/údaje
Parsovat A3 - POZOR, v roce 2011 je na listu 5 v uvedeném roce chyba
List
Soubor
Listy 1, 2, 4, 5
Změny v umístění mezi roky
09.01 Nově přiznané důchody dle věku důchodce
Ne
Přidat rok do názvu souboru před zpracováním
Součtový sloupec tabulky pro T9.1 - přiznané důchody: ● ● ● ● ●
G6-G64 (2008-2009, listy 1-2) F6:G64 (2008-2009, list 4) E6:G64 (2008-2012, list 5) H6-H64 (2010-2012, listy 1-2) H6:J64 (2010-2012, list 4)
Součtový řádek tabulky pro T9.1 - přiznané důchody: ● ● ● ●
B64-G64 (2008-2009, listy 1, 2, 4, 5) B64-H64 (2010-2012, listy 1, 2) B64-J64 (2010-2012, listy 4) B64-G64 (2010-2012, listy 5)
Součtové listy pro T9.1 - přiznané důchody: ●
S-Celkem (3) Tabulka 32: Údaje a rozsahy buněk v T9.1 - průměrný věk přiznání důchodu
Cílový sloupec
Průměrný věk přiznání důchodu
Zdrojové buňky/údaje
B65-G65 (2008-2009, listy 1-5) B65-H65 (2010-2012, listy 1-3) B65-J65 (2010-2012, list 4) B65-G65 (2010-2012, list 5)
List
Všechny (1-5)
Soubor
09.01 Nově přiznané důchody dle věku důchodce
Změny v umístění mezi roky Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
62 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
B6-F6 (2008-2009, listy 1-3) B6-E6 (2008-2009, list 4) B5-D5 (2008-2012, list 5) B6:G6 (2010-2012, listy 1, 2, 3, 4)
Všechny (1-5)
09.01 Nově přiznané důchody dle věku důchodce
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) E6, F6 (2008-2012, list 5) B5, E5 (2010-2012, list 4)
Všechny (1-5)
09.01 Nově přiznané důchody dle věku důchodce
Ano
Rok
Parsovat A3 - POZOR, v roce 2011 je na listu 5 v uvedeném roce chyba
Všechny (1-5)
09.01 Nově přiznané důchody dle věku důchodce
Ne
Přidat rok do názvu souboru před zpracováním
Součtový sloupec tabulky pro T9.1 - průměrný věk přiznání důchodu: ●
Není
Součtový řádek tabulky pro T9.1 - průměrný věk přiznání důchodu: ●
není
T9.2 Přehled o počtu nově přiznaných důchodů podle výše důchodu Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
63 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○
●
List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List I ■ VĚK ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem ○ List Pozůstalostní a celkem ■ VĚK ■ V-CELKEM ■ VM-CELKEM ■ D-CELKEM ■ Muži - celkem ČR ■ Ženy - celkem ČR ■ CELKEM Roky 2010-2012 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List S-ženy ■ VĚK
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
64 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○
○
○
■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List I ■ VĚK ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP - Celkem List Pozůstalostní a celkem ■ VĚK ■ V-CELKEM ■ VM-CELKEM ■ Muži - celkem ČR ■ Ženy - celkem ČR ■ CELKEM
Změny ve struktuře dat v období 2008-2012: ●
Změny mezi soubory 2008 - 2009 a soubory 2010-2012 dané změnou struktury důchodů. V ročence za rok 2012 je změněná struktura pásem výše důchodu - viz tabulka 33.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
65 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 33: Porovnání struktury pásem důchodů 2008-2011
2012
1–2 999
1–2 999
3 000–3 499
3 000–3 499
3 500–3 999
3 500–3 999
4 000–4 199
4 000–4 499
4 200–4 399
4 500–4 999
4 400–4 599 4 600–4 799 4 800–4 999 5 000–5 199
5 000–5 199
5 200–5 399
5 200–5 399
5 400–5 599
5 400–5 599
5 600–5 799
5 600–5 799
5 800–5 999
5 800–5 999
6 000–6 199
6 000–6 199
6 200–6 399
6 200–6 399
6 400–6 599
6 400–6 599
6 600–6 799
6 600–6 799
6 800–6 999
6 800–6 999
7 000–7 199
7 000–7 199
7 200–7 399
7 200–7 399
7 400–7 599
7 400–7 599
7 600–7 799
7 600–7 799
7 800–7 999
7 800–7 999
8 000–8 199
8 000–8 199
8 200–8 399
8 200–8 399
8 400–8 599
8 400–8 599
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
66 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2011
2012
8 600–8 799
8 600–8 799
8 800–8 999
8 800–8 999
9 000–9 199
9 000–9 199
9 200–9 399
9 200–9 399
9 400–9 599
9 400–9 599
9 600–9 799
9 600–9 799
9 800–9 999
9 800–9 999
10 000–10 199
10 000–10 199
10 200–10 399
10 200–10 399
10 400–10 599
10 400–10 599
10 600–10 799
10 600–10 799
10 800–10 999
10 800–10 999
11 000–11 499
11 000–11 199
11 500–11 999
11 200–11 399 11 400–11 599 11 600–11 799 11 800–11 999
12 000–12 499
12 000–12 199
12 500–12 999
12 200–12 399 12 400–12 599 12 600–12 799 12 800–12 999
13 000–13 499
13 000–13 499
13 500–13 999
13 500–13 999
14 000–14 499
14 000–14 499
14 500+
14 500–14 999
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
67 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008-2011
2012 15 000–15 499 15 500–15 999 16 000–16 499 16 500–16 999 17 000–17 499 17 500–17 999 18 000 +
NEUDÁNO
NEUDÁNO
Poslední řádek v tabulkách udává průměrnou výši důchodu dle jednotlivých typů důchodu. V tabulkách 34 a 35 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 34: Údaje a rozsahy buněk v T9.2 - přiznané důchody Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet nově přiznaných důchodů
B7:F53 (2008-2009, listy 1-2) B7:E53 (2008-2009, list 4) B7:D53 (2008-2011, list 5) B7:G53 (2010-2011, listy 1, 2, 4) B7:G63 (2012, listy 1, 2, 4) B7:D63 (2012, list 5)
Listy 1, 2, 4, 5
09.02 Nově přiznané důchody dle výše důchodu
Ano
Měsíční výše
A7-A53 (2008-2010) A7-A63 (2012)
Listy 1, 2, 4, 5
09.02 Nově přiznané důchody dle výše důchodu
Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
68 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh důchodu
B6-F6 (2008-2009, listy 1-2) B6-E6 (2008-2009, list 4) B5-D5 (2008-2012, list 5) B6:G6 (2010-2012, listy 1, 2, 4)
Listy 1, 2, 4, 5
09.02 Nově přiznané důchody dle výše důchodu
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) E6, F6 (2008-2012, list 5) B5, E5 (2010-2012, list 4)
Listy 1, 2, 4, 5
09.02 Nově přiznané důchody dle výše důchodu
Ano
Rok
Parsovat A3 Přidat rok do názvu souboru před zpracováním
Listy 1, 2, 4, 5
09.02 Nově přiznané důchody dle výše důchodu
Ne
Součtový sloupec tabulky pro T9.2 - přiznané důchody: ● ● ● ● ● ● ● ●
G6-G54 (2008-2009, listy 1-2) F6:G54 (2008-2009, list 4) E6:G54 (2008-2011, list 5) H6-H54 (2010-2011, listy 1-2) H6:J54 (2010-2011, list 4) H6-H64 (2012, listy 1-2) H6:J64 (2012, list 4) E6-G64 (2012, list 5)
Součtový řádek tabulky pro T9.2 - přiznané důchody: ● ● ● ● ● ● ●
B54-G54 (2008-2009, listy 1, 2, 4, 5) B54-H54 (2010-2011, listy 1, 2) B54-J54 (2010-2011, listy 4) B54-G54 (2010-2011, listy 5) B64-H64 (2012, listy 1, 2) B64-J64 (2012, listy 4) B64-G64 (2012, listy 5)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
69 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtové listy pro T9.2 - přiznané důchody: ●
S-Celkem (3) Tabulka 35: Údaje a rozsahy buněk v T9.2 - průměrná výše důchodu
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrný věk přiznání důchodu
B55-G55 (2008-2009, listy 1-5) B55-H55 (2010-2011, listy 1-3) B55-J55 (2010-2011, list 4) B55-G55 (2010-2011, list 5) B65-H65 (2012, listy 13) B65-J65 (2012, list 4) B65-G65 (2012, list 5)
Všechny (1-5)
09.02 Nově přiznané důchody dle výše důchodu
Ano
Druh důchodu
B6-F6 (2008-2009, listy 1-3) B6-E6 (2008-2009, list 4) B5-D5 (2008-2012, list 5) B6:G6 (2010-2012, listy 1, 2, 3, 4)
Všechny (1-5)
09.02 Nově přiznané důchody dle výše důchodu
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) E6, F6 (2008-2012, list 5) B5, E5 (2010-2012, list 4)
Všechny (1-5)
09.02 Nově přiznané důchody dle výše důchodu
Ano
Rok
Parsovat A3 Přidat rok do názvu souboru před zpracováním
Všechny (1-5)
09.02 Nově přiznané důchody dle výše důchodu
Ne
Součtový sloupec tabulky pro T9.2 - průměrná výše důchodu: ●
Není
Součtový řádek tabulky pro T9.12- průměrná výše důchodu: ●
není
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
70 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
T9.3 Přehled o počtu nově přiznaných důchodů podle osobního vyměřovacího základu Zdrojová tabulka obsahuje data v následující struktuře: ●
●
Roky 2008-2009 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ CELKEM ○ List I ■ VĚK ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem Roky 2010-2012 ○ List S-muži ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
71 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○
○
○
■ SI ■ CELKEM List S-ženy ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List S-celkem ■ VĚK ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM List I ■ VĚK ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP – Celkem
Změny ve struktuře dat v období 2008-2012: ●
Změny mezi soubory 2008 - 2009 a soubory 2010-2012 dané změnou struktury důchodů. V ročence za rok 2008 je odlišná struktura pásem výše vyměřovacího základu - viz tabulka 36.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
72 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 36: Porovnání struktury pásem výše OVZ 2008
2009-2012
1–1 999
1–1 999
2 000–2 999
2 000–2 999
3 000–3 499
3 000–3 999
3 500–3 999
4 000–4 999
4 000–4 499
5 000–5 999
4 500–4 999
6 000–6 999
5 000–5 499
7 000–7 999
5 500–5 999
8 000–8 999
6 000–6 499
9 000–9 999
6 500–6 999
10 000–10 999
7 000–7 499
11 000–11 999
7 500–7 999
12 000–12 999
8 000–8 499
13 000–13 999
8 500–8 999
14 000–14 999
9 000–9 499
15 000–15 999
9 500–9 999
16 000–16 999
10 000–10 499
17 000–17 999
10 500–10 999
18 000–18 999
11 000–11 499
19 000–19 999
11 500–11 999
20 000–20 999
12 000–12 499
21 000–21 999
12 500–12 999
22 000–22 999
13 000–13 499
23 000–23 999
13 500–13 999
24 000–24 999
14 000–14 499
25 000–25 999
14 500–14 999
26 000–26 999
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
73 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
2008
2009-2012
15 000–15 499
27 000–27 999
15 500–15 999
28 000–28 999
16 000–16 499
29 000–29 999
16 500–16 999
30 000–30 999
17 000–17 499
31 000–31 999
17 500–17 999
32 000–32 999
18 000–18 499
33 000–33 999
18 500–18 999
34 000–34 999
19 000–19 499
35 000–35 999
19 500–19 999
36 000–36 999
20 000–20 999
37 000–37 999
21 000–21 999
38 000–38 999
22 000–22 999
39 000–39 999
23 000–23 999
40 000–40 999
24 000–24 999
41 000–41 999
25 000–25 999
42 000–42 999
26 000–26 999
43 000–43 999
27 000–27 999
44 000–44 999
28 000–28 999
45 000–45 999
29 000+
46 000+
NEUDÁNO
NEUDÁNO
Poslední řádek v tabulkách udává průměrnou výši OVZ dle jednotlivých typů důchodu. V tabulkách 37 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
74 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 37: Údaje a rozsahy buněk v T9.3 - přiznané důchody Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet nově přiznaných důchodů
B7:F53 (2008-2009, listy 1-2) B7:E53 (2008-2009, list 4) B7:G53 (2010-2012, listy 1, 2, 4)
Listy 1, 2, 4
09.03 Nově přiznané důchody dle OVZ
Ano
OVZ
A7-A53 (2008-2012)
Listy 1, 2, 4
09.03 Nově přiznané důchody dle OVZ
Ano
Druh důchodu
B6-F6 (2008-2009, listy 1-2) B6-E6 (2008-2009, list 4) B6:G6 (2010-2012, listy 1, 2, 4)
Listy 1, 2, 4
09.03 Nově přiznané důchody dle OVZ
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) B5, E5 (2010-2012, list 4)
Listy 1, 2, 4
09.03 Nově přiznané důchody dle OVZ
Ano
Rok
Parsovat A3 Přidat rok do názvu souboru před zpracováním
Listy 1, 2, 4
09.03 Nově přiznané důchody dle OVZ
Ne
Součtový sloupec tabulky pro T9.3 - přiznané důchody: ● ● ● ●
G6-G54 (2008-2009, listy 1-2) F6:G54 (2008-2009, list 4) H6-H54 (2010-2012, listy 1-2) H6:J54 (2010-2012, list 4)
Součtový řádek tabulky pro T9.3 - přiznané důchody: ● ● ●
B54-G54 (2008-2009, listy 1, 2, 4) B54-H54 (2010-2012, listy 1, 2) B54-J54 (2010-2012, listy 4)
Součtové listy pro T9.3 - přiznané důchody: ●
S-Celkem (3)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
75 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 38: Údaje a rozsahy buněk v T9.3 - průměrná výše vyměřovacího základu Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrná výše vyměřovacího základu
B55-G55 (2008-2009, listy 1-4) B55-H55 (2010-2012, listy 1-3) B55-J55 (2010-2012, list 4)
Všechny (1-4)
09.03 Nově přiznané důchody dle OVZ
Ano
Druh důchodu
B6-F6 (2008-2009, listy 1-2) B6-E6 (2008-2009, list 4) B6:G6 (2010-2012, listy 1, 2, 4)
Všechny (1-4)
09.03 Nově přiznané důchody dle OVZ
Ano
Pohlaví
Název listu 1 (20082012) Název listu 2 (20082012) B5, D5 (2008-2009, list 4) B5, E5 (2010-2012, list 4)
Všechny (1-4)
09.03 Nově přiznané důchody dle OVZ
Ano
Rok
Parsovat A3 Přidat rok do názvu souboru před zpracováním
Všechny (1-4)
09.03 Nově přiznané důchody dle OVZ
Ne
Součtový sloupec tabulky pro T9.3 - průměrná výše vyměřovacího základu: ●
Není
Součtový řádek tabulky pro T9.3 - průměrná výše vyměřovacího základu: ●
není
T10.1 Přehled o počtu zaniklých důchodů podle druhu zániku Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ List Zaniklé S důchody ■ List obsahuje 3 tabulky ve shodné struktuře - starobní důchody muži, ženy a celkem ■ DRUH ZÁNIKU ■ S ■ SRN ■ SD
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
76 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
■ ST ■ SR ■ SI ■ CELKEM ○ List Zaniklé Invalidní ■ DRUH ZÁNIKU ■ I - Muži ■ IČ - Muži ■ I - Ženy ■ IČ - Ženy ■ I - Celkem ■ IČ - Celkem ○ Zaniklé pozůstalostní důchody ■ DRUH ZÁNIKU ■ V ■ VM ■ D ○ Zaniklé důchody celkem ■ DRUH ZÁNIKU ■ MUŽI ■ ŽENY ■ CELKEM Roky 2010-2012 ○ List Zaniklé S důchody ■ DRUH ZÁNIKU ■ S ■ SRN ■ SD ■ ST ■ SR ■ SI ■ CELKEM ○ List Zaniklé Invalidní ■ DRUH ZÁNIKU ■ IT - Muži ■ ID - Muži ■ IP - Muži ■ IT - Ženy ■ ID - Ženy ■ IP - Ženy ■ IT - Celkem ■ ID - Celkem ■ IP - Celkem ○ Zaniklé pozůstalostní důchody
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
77 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○
■ DRUH ZÁNIKU ■ V ■ VM ■ D Zaniklé důchody celkem ■ DRUH ZÁNIKU ■ MUŽI ■ ŽENY ■ CELKEM
Změny ve struktuře dat v období 2008-2012: ●
Díky změně zákonné úpravy druhů důchodu rozdílné druhy důchodů v letech 2008-2009 a 2010-2012. V letech 2008 a 2009 se nevyskytuje druh zániku 02Z
V tabulce 39 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 39: Údaje a rozsahy buněk v T10.1 Cílový sloupec Počet zaniklých důchodů
Zdrojové buňky/údaje B6:F15 (muži, 20082009, list 1) B22:F31 (ženy, 20082009, list 1) B6:G16 (muži, 20102012, list 1) B23:F33 (ženy, 20102012, list 1) B7:E16 (2008-2009, list 2) B7:G17 (2010-2012, list 2) B7:D16 (2008-2009, list 3) B7:D17 (2010-2012, list 3)
List Listy 1-3
Soubor 10 Zaniklé důchody
Změny v umístění mezi roky Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
78 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Druh zániku
A6-A15 (2008-2009, list 1) A22-A31 (2008-2009, list 1) A6-A16 (2010-2012, list 1) A23-A33 (2010-2012, list 1) A7-A16 (2008-2009, list2) A7-A17 (2010-2012, list 2) A7-A16 (2008-2009, list 3 A7-A17 (2010-2012, list 3)
Listy 1-3
10 Zaniklé důchody
Ano
Druh důchodu
B5-F5 (2008-2009, list 1) B21-F21 (2008-2009, list 1) B5-G5 (2010-2012, list 1) B22-G22 (2010-2012, list 1) B6-E6 (2008-2009, list 2) B6-G6 (2010-2012, list 2) B6-D6 (2008-2012, list 3)
Listy 1-3
10 Zaniklé důchody
Ano
Pohlaví
Parsovat A3 (20082012, list 1) Parsovat A19 (20082009, list 1) Parsovat A20 (20102012, list 1) B5, D5 (2008-2009, list 2) B5, E5 (2010-2012, list 2)
Listy 1-3
10 Zaniklé důchody
Ano
Rok
Parsovat A1 Z názvu souboru, nicméně soubor pro rok 2012 nemá rok v názvu
Listy 1-3
10 Zaniklé důchody
Ne
Součtový sloupec tabulky: ● ● ● ●
G5-G16 (2008-2009, list 1) G21-G32 (2008-2009, list 1) H5-H17 (2010-2012, list 1) H22-H34 (2010-2012, list 1)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
79 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
● ●
F5:G17 (2008-2009, list 2) H5:J18 (2010-2012, list 2)
Součtový řádek tabulky: ● ● ● ● ● ●
A16-G16 (2008-2009, list1) A32-G32 (2008-2009, list 1) A17-H17 (2010-2012, list 1) A34-H34 (2010-2012, list 1) A17-G17 (2008-2009, list 2) A18-J18 (2010-2012, list 2) ○ A17-D17 (2008-2009, list 3) ○ A18-D18 (2010-2012, list 3)
Součtová tabulka: ●
A37:G48 (2008-2009, list 1)
Součtové listy: ●
List 4 (2008-2012)
T11.1 Přehled o počtu nově přiznaných invalidních důchodů podle věku a skupin diagnóz WHO Zdrojová tabulka obsahuje data v následující struktuře: ●
Roky 2008-2009 ○ Listy ■ I - muži ■ I - ženy ■ I - celkem ■ IČ - muži ■ IČ - ženy ■ IČ - celkem ○ Každý list má strukturu ■ Skupiny diagnóz dle WHO ■ 0–19 ■ 20–24 ■ 25–29 ■ 30–34 ■ 35–39 ■ 40–44 ■ 45–49 ■ 50–54 ■ 55–59 ■ 60–64 ■ 65+
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
80 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
■ CELKEM Roky 2010-2012 ○ Listy ■ IT - muži ■ IT - ženy ■ IT - celkem ■ ID - muži ■ ID - ženy ■ ID - celkem ■ IP - muži ■ IP - ženy ■ IP - celkem ○ Každý list má strukturu ■ Skupiny diagnóz dle WHO ■ 0–19 ■ 20–24 ■ 25–29 ■ 30–34 ■ 35–39 ■ 40–44 ■ 45–49 ■ 50–54 ■ 55–59 ■ 60–64 ■ 65+ ■ CELKEM
Změny ve struktuře dat v období 2008-2012: ●
Struktura tabulek na jednotlivých listech se nemění. V období 2009-2008 je odlišná struktura listů než v období 2010-2012 (viz výše).
V tabulce 40 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 40: Údaje a rozsahy buněk v T11.1 Cílový sloupec Počet nově přiznaných invalidních důchodů
Zdrojové buňky/údaje B6-L25 (2008-2012, všechny listy)
List Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
Soubor 11 Invalidita
Změny v umístění mezi roky Ne
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
81 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Skupiny diagnóz dle WHO
A6-A25 (2008-2012, všechny listy)
Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
11 Invalidita
Ne
Věk
B5-L5 (2008-2012, všechny listy)
Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
11 Invalidita
Ne
Druh důchodu
Parsovat název listu
Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
11 Invalidita
Ne
Pohlaví
Parsovat název listu
Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
11 Invalidita
Ne
Rok
Parsovat A2 Doplnit rok do názvu souboru před zpracováním
Listy 1, 2, 4, 5 (2008-2009 Listy 1, 2, 4, 5, 7, 8 (2010-2012)
11 Invalidita
Ne
Součtový sloupec tabulky: ●
M5-M26 (2008-2012, všechny listy)
Součtový řádek tabulky: ●
A26-M26 (2008-2012, všechny listy)
Součtové listy: ● ●
List 3, 6 (2008-2012) List 9 (2010-2012)
T12.1 Změny mezi stupni invalidního důchodu Zdrojová tabulka obsahuje data v následující struktuře: ● ● ● ● ● ● ● ●
Důvod změny IT - Muži ID - Muži IP - Muži IT - Ženy ID - Ženy IP - Ženy IT - Celkem
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
82 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
● ●
ID - Celkem IP – Celkem
Změny ve struktuře dat v období 2008-2012: ●
Žádné, struktura stejná ve všech letech. Tabulka není k dispozici v ročenkách 2008 a 2009.
V tabulce 41 je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Tabulka 41: Údaje a rozsahy buněk v T12.1 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet po provedené změně stupně
B7:H10 (2010-2012, list 1)
List 1 (Změny mezi stupni)
12 Změny mezi stupni invalidního důchodu
Ne
Důvod změny
A7-A10 (2010-2012, list 1)
List 1 (Změny mezi stupni)
12 Změny mezi stupni invalidního důchodu
Ne
Druh důchodu
B6-G6 (2010-2012, list 1)
List 1 (Změny mezi stupni)
12 Změny mezi stupni invalidního důchodu
Ne
Pohlaví
B5, E5 (2010-2012, list 1)
List 1 (Změny mezi stupni)
12 Změny mezi stupni invalidního důchodu
Ne
Rok
Parsovat A3 Doplnit rok do názvu souboru před zpracováním
List 1 (Změny mezi stupni)
12 Změny mezi stupni invalidního důchodu
Ne
Součtový sloupec tabulky: ●
H5:J10 (2010-2012, list 1)
Součtový řádek tabulky: ●
není
T13 Data pro grafy Zdrojový soubor obsahuje data v následující struktuře: ● ● ●
Každý zdrojový soubor obsahuje na 1. listu zdrojová data pro grafy 1-9 v příloze ročenky Každý zdrojový soubor obsahuje na listech 2-10 grafy 1-9 přílohy ročenky Tabulky dat pro grafy 1-6 na listu 1 má následující strukturu ○ Pohlaví ○ Sloupce pro jednotlivé roky (od roku 1989 až po rok ročenky)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
83 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
○ Každá tabulka dat pro graf má součtový řádek Celkem, nemají součtové sloupce ● Tabulky pro graf 7 a 8 ○ Druh důchodu ○ Sloupce pro jednotlivé roky (od roku 1996 až po rok ročenky) ● Tabulka pro graf 9 ○ Druh důchodu ○ Sloupce pro jednotlivé roky (od roku 1989 až po rok ročenky) Změny ve struktuře dat v období 2008-2012: ● Každý rok je přidán jeden sloupec na konec tabulky s daty za aktuální rok. V tabulkách uvedených níže je popsáno, jaké údaje jsou obsaženy ve zdrojovém souboru či zdrojových souborech pro danou tabulku a rozsahy buněk, ve kterých jsou tyto údaje zaznamenány. Číslo v závorce za názvem listu značí pořadí listu v rámci sešitu. Každá tabulka se zdroji pro graf na listu 1 je popsána samostatně. Tabulka 42: Údaje a rozsahy buněk v T13 - Graf 1 Počet vyplácených důchodů od 1989 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet vyplácených důchodů
C6:V7 (2008, list 1) C6:W7 (2009, list 1) C6:X7 (2010, list 1) C6:Y7 (2011, list 1) C6:Z7 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B6-B7 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C5-V5 (2008, list 1) C5-W5 (2009, list 1) C5-X5 (2010, list 1) C5-Y5 (2011, list 1) C5-Z5 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 1 Počet vyplácených důchodů od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 1 Počet vyplácených důchodů od 1989: ● ● ● ●
B8:V8 (2008, list 1) B8:W8 (2009, list 1) B8:X8 (2010, list 1) B8:Y8 (2011, list 1)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
84 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
●
B8:Z8 (2012, list 1)
Tabulka 43: Údaje a rozsahy buněk v T13 - Graf 2 Průměrná výše vyplácených důchodů od 1989 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrná výše vyplácených důchodů
C14:V15 (2008, list 1) C14:W15 (2009, list 1) C14:X15 (2010, list 1) C14:Y15 (2011, list 1) C14:Z15 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B14-B15 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C13-V13 (2008, list 1) C13-W13 (2009, list 1) C13-X13 (2010, list 1) C13-Y13 (2011, list 1) C13-Z13 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 2 Průměrná výše vyplácených důchodů od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 2 Průměrná výše vyplácených důchodů od 1989: ● ● ● ● ●
B16:V16 (2008, list 1) B16:W16 (2009, list 1) B16:X16 (2010, list 1) B16:Y16 (2011, list 1) B16:Z16 (2012, list 1) Tabulka 44: Údaje a rozsahy buněk v T13 - Graf 3 Počet důchodců od 1989
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet důchodců
C22:V23 (2008, list 1) C22:W23 (2009, list 1) C22:X23 (2010, list 1) C22:Y23 (2011, list 1) C22:Z23 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B22-B23 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
85 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Rok
C21-V21 (2008, list 1) C21-W21 (2009, list 1) C21-X21 (2010, list 1) C21-Y21 (2011, list 1) C21-Z21 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 3 Počet důchodců od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 3 Počet důchodců od 1989: ● ● ● ● ●
B24:V24 (2008, list 1) B24:W24 (2009, list 1) B24:X24 (2010, list 1) B24:Y24 (2011, list 1) B24:Z24 (2012, list 1)
Tabulka 45: Údaje a rozsahy buněk v T13 - Graf 4 Průměrná výše důchodů vyplácená důchodcům od 1989 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrná výše důchodu
C30:V31 (2008, list 1) C30:W31 (2009, list 1) C30:X31 (2010, list 1) C30:Y31 (2011, list 1) C30:Z31 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B30-B31 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C29-V29 (2008, list 1) C29-W29 (2009, list 1) C29-X29 (2010, list 1) C29-Y29 (2011, list 1) C29-Z29 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
86 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový sloupec tabulky T13 - Graf 4 Průměrná výše důchodů vyplácená důchodcům od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 4 Průměrná výše důchodů vyplácená důchodcům od 1989: ● ● ● ● ●
B32:V32 (2008, list 1) B32:W32 (2009, list 1) B32:X32 (2010, list 1) B32:Y32 (2011, list 1) B32:Z32 (2012, list 1)
Tabulka 46: Údaje a rozsahy buněk v T13 - Graf 5 Počet důchodců pobírajících sólo starobní důchod od 1989 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet důchodců
C38:V39 (2008, list 1) C38:W39 (2009, list 1) C38:X39 (2010, list 1) C38:Y39 (2011, list 1) C38:Z39 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B38-B39 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C37-V37 (2008, list 1) C37-W37 (2009, list 1) C37-X37 (2010, list 1) C37-Y37 (2011, list 1) C37-Z37 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 5 Počet důchodců pobírajících sólo starobní důchod od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 5 Počet důchodců pobírajících sólo starobní důchod od 1989: ● ● ●
B40:V40 (2008, list 1) B40:W40 (2009, list 1) B40:X40 (2010, list 1)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
87 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
● ●
B40:Y40 (2011, list 1) B40:Z40 (2012, list 1)
Tabulka 47: Údaje a rozsahy buněk v T13 - Graf 6 Průměrná výše vyplácených sólo starobních důchodů od 1989 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Průměrná výše vyplácených sólo starobních důchodů
C46:V47 (2008, list 1) C46:W47 (2009, list 1) C46:X47 (2010, list 1) C46:Y47 (2011, list 1) C46:Z47 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Pohlaví
B46-B47 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C45-V45 (2008, list 1) C45-W45 (2009, list 1) C45-X45 (2010, list 1) C45-Y45 (2011, list 1) C45-Z45 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 6 Průměrná výše vyplácených sólo starobních důchodů od 1989: ●
Není
Součtový řádek tabulky T13 - Graf 6 Průměrná výše vyplácených sólo starobních důchodů od 1989: ● ● ● ● ●
B48:V48 (2008, list 1) B48:W48 (2009, list 1) B48:X48 (2010, list 1) B48:Y48 (2011, list 1) B48:Z48 (2012, list 1)
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
88 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Tabulka 48: Údaje a rozsahy buněk v T13 - Graf 7 Počet vyplácených předčasných starobních důchodů od 1996 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Počet vyplácených důchodů
C54:O55 (2008, list 1) C54:P55 (2009, list 1) C54:Q55 (2010, list 1) J54:Y55 (2011, list 1) J54:Z55 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Druh důchodu
B54-B55 (2008-2010, list 1) H54-H55 (2011-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok
C53-O53 (2008, list 1) C53-P53 (2009, list 1) C53-Q53 (2010, list 1) J53-Y53 (2011, list 1) J53-Z53 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 7 Počet vyplácených předčasných starobních důchodů od 1996: ●
Není
Součtový řádek tabulky T13 - Graf 7 Počet vyplácených předčasných starobních důchodů od 1996: ●
není
Tabulka 49: Údaje a rozsahy buněk v T13 - Graf 8 Výdaje na vyplácené předčasné starobní důchody od 1996 Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Výdaje na vyplácené důchody (v tis. Kč)
C56:O57 (2008, list 1) C56:P57 (2009, list 1) C56:Q57 (2010, list 1) J56:Y57 (2011, list 1) J56:Z57 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Druh důchodu
B54-B55 (2008-2010, list 1) H54-H55 (2011-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
89 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Rok
C53-O53 (2008, list 1) C53-P53 (2009, list 1) C53-Q53 (2010, list 1) J53-Y53 (2011, list 1) J53-Z53 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 8 Výdaje na vyplácené předčasné starobní důchody od 1996: ●
není
Součtový řádek tabulky T13 - Graf 8 Výdaje na vyplácené předčasné starobní důchody od 1996: ●
není Tabulka 50: Údaje a rozsahy buněk v T13 - Graf 9 Roční výdaje na důchody
Cílový sloupec
Zdrojové buňky/údaje
List
Soubor
Změny v umístění mezi roky
Roční výdaje na důchody
C63:V64 (2008, list 1) C63:W64 (2009, list 1) C63:X64 (2010, list 1) C63:Y64 (2011, list 1) C63:Z64 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Druh důchodu (pozn. Celkem nebo S)
B63-B64 (2008-2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ne
Rok
C62-V62 (2008, list 1) C62-W62 (2009, list 1) C62-X62 (2010, list 1) C62-Y62 (2011, list 1) C62-Z62 (2012, list 1)
List 1 (Data pro graf)
13 Data pro grafy
Ano
Rok souboru
Název souboru Parsovat D3 Záhlaví posledního sloupce rozsahu dat
List 1 (Data pro graf)
13 Data pro grafy
Ne - název souboru, D3 Ano - záhlaví posledního sloupce rozsahu dat
Součtový sloupec tabulky T13 - Graf 9 Roční výdaje na důchody: ●
není
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
90 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Součtový řádek tabulky T13 - Graf 9 Roční výdaje na důchody: ●
není
Popis souborů s daty v členění dle okresů Soubory s daty o počtu důchodců, průměrné výši důchodů a průměrném věku důchodců v členění podle okresů jsou formátovány pro tisk, tj. soubory obsahují listy pro jednotlivé kraje a na těchto listech jsou postupně pod sebou uváděny jednotlivé stránky k tisku s údaji za kraje. Vzhledem k velkému rozsahu dat není uvedeno pro každý rok a každý kraj přesné vymezení rozsahu buněk v souborech. Je popsána pouze struktura tabulky na stránce k tisku, která se opakuje. Dostupnost dat ● ●
Data jsou dostupná pro roky 2009-2012 Data nejsou dostupná za rok 2008
Následující tabulka 51 obsahuje popis, na jakých listech souboru jsou uvedena data pro jakou část území ČR (kraj). Tabulka 51: Popis struktury souborů - listy Poř. č. listu
Popisek
Kraj
1
Praha
Praha
2
STRC
Středočeský
3
JC
Jihočeský
4
PM
Plzeňský
5
KV
Karlovarský
6
UL
Ústecký
7
LB
Liberecký
8
HK
Královehradecký
9
PU
Pardubický
10
Vysočina
Vysočina
11
JM
Jihomoravský
12
OL
Olomoucký
13
ZL
Zlínský
14
OV+ČR
Moravskoslezský Obsahuje i souhrnnou tabulku za ČR
15
Legenda
Legenda k datům, obsažena jen v roce 2009
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
91 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Stránkou je dále myšlen rozsah buněk, který začíná nadpisem tabulky s údaji za kraj/oblast a posledním prázdným řádkem před nadpisem následující tabulky (včetně), v případě poslední tabulky listu pak oblast od nadpisu až po takový počet prázdných řádků za posledním řádkem tabulky, který je běžně mezi tabulkami necháván. Rok 2009 Řádky 1-5 jsou prázdné. Výchozí buňka 1. tabulky listu: A6 (platí pro všechny listy) - 1. Stránka začíná buňkou A6 Výchozí buňka obsahuje nadpis, nadpis ve výchozí buňce každé Stránky Velikost Stránky: 45 řádek, nicméně některé tabulky jsou nestejně osazené a velikost může být i 44 řádek Využité sloupce: A-J (platí pro všechny listy) Název územní části: ve sloupci B, na 8. řádku Stránky při velikosti Stránky 45ř, na 7. řádku při velikosti 44ř Popisky řádků tabulky: sloupec A, 10. - 43. řádek Stránky při velikosti Stránky 45, 9. - 42. řádek při velikosti Stránky 44ř Popisky sloupců tabulky: sloupce B-J, řádky 10 a 11 při velikosti Stránky 45ř, řádky 9 a 10 při velikosti Stránky 44ř. Počet důchodců - sloupce B-D, průměrná výše důchodu - sloupce E-G, průměrný věk - sloupce H-J. Poslední řádek tabulky je součtový. Odsazení mezi tabulkou a 1. řádkem následující Stránky: 2 prázdné řádky Rok 2010 Řádky 1-5 jsou prázdné. Výchozí buňka 1. tabulky listu: A6 (platí pro všechny listy) - 1. Stránka začíná buňkou A6 Výchozí buňka je prázdná. Nadpis je umístěn ve sloupci B na 1. a 2. řádku Stránky. Velikost Stránky: 51ř Využité sloupce: A-J (platí pro všechny listy) Název územní části: ve sloupci C, na 8. řádku Stránky při velikosti Stránky 51ř Popisky řádků tabulky: sloupec A, 10. - 48. řádek Stránky při velikosti Stránky 51ř
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
92 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Popisky sloupců tabulky: sloupce B-J, řádky 10 a 11 při velikosti Stránky 51ř. Počet důchodců - sloupce B-D, průměrná výše důchodu - sloupce E-G, průměrný věk - sloupce H-J. Poslední řádek tabulky je součtový. Odsazení mezi tabulkou a 1. řádkem následující Stránky: 3 prázdné řádky Rok 2011 Data začínají 1. řádkem listu. Výchozí buňka 1. tabulky listu: A1 (platí pro všechny listy) - 1. Stránka začíná buňkou A1 Výchozí buňka je prázdná. Nadpis je umístěn ve sloupci B na 1. a 2. řádku Stránky. Velikost Stránky: 52ř Využité sloupce: A-K (platí pro všechny listy) Název územní části: ve sloupci C, na 8. řádku Stránky při velikosti Stránky 52ř Popisky řádků tabulky: sloupec A, 10. - 49. řádek Stránky při velikosti Stránky 52ř Popisky sloupců tabulky: sloupce C-K, řádky 10 a 11 při velikosti Stránky 52ř. Počet důchodců - sloupce C-E, průměrná výše důchodu - sloupce F-H, průměrný věk - sloupce I-K. Poslední řádek tabulky je součtový. Odsazení mezi tabulkou a 1. řádkem následující Stránky: 3 prázdné řádky Rok 2012 Data začínají 1. řádkem listu. Výchozí buňka 1. tabulky listu: A1 (platí pro všechny listy) - 1. Stránka začíná buňkou A1 Výchozí buňka je prázdná. Nadpis je umístěn ve sloupci B na 1. a 2. řádku Stránky. Velikost Stránky: 52ř Využité sloupce: A-K (platí pro všechny listy) Název územní části: ve sloupci C, na 8. řádku Stránky při velikosti Stránky 52ř Popisky řádků tabulky: sloupec A, 10. - 49. řádek Stránky při velikosti Stránky 52ř Popisky sloupců tabulky: sloupce C-K, řádky 10 a 11 při velikosti Stránky 52ř. Počet důchodců - sloupce C-E, průměrná výše důchodu - sloupce F-H, průměrný věk - sloupce I-K. Poslední řádek tabulky je součtový. Odsazení mezi tabulkou a 1. řádkem následující Stránky: 3 prázdné řádky
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
93 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Použité číselníky V datech důchodové statistiky jsou uvedeny číselníky popsané v tabulce 52. Tabulka 52: Číselníky dat důchodové statistiky
Číselník
Počet úrovní
Pohlaví
1
Výše důchodu – pásmo Výše osobního vyměřovacího základu – pásmo Druh důchodu (pozn. hodnoty v letech 2010-2012 se liší od let 2008 a 2009 - jiná klasifikace invalidních důchodů, číselník byl rozšířen, staré kategorie v číselníku zůstaly)
1 1
Statistický důvod zániku důchodu Skupiny diagnóz dle WHO
1 2 - jednotlivé diagnózy - skupiny diagnóz 1 1 1 1 1 1 1 1 1 1 1
Invalidní důchody – stupně invalidity Statistický důvod změny inval. důchodu Kraje Okres Věk obyvatele 1 - pásmo Věk obyvatele 2 - pásmo Věk důchodce – pásmo Věk důchodce v době přiznání důchodu Doba pobírání důchodu Měsíce v roce Roky
Relativní výše důchodu (v kvantilovém vyjádření) Druh výkonu
3 - přímé a pozůstalostní - přímé se dělí na starobní a invalidní - jednotlivé druhy důchodů
V tabulkách T.5.1, T5.2, T5.3, T5.4, T7.1, T7.2, T7.3, T7.7, T8.1, T8.2, T8.3, T9.1, T9.2, T9.3, T10.1, T11.1, T12.1, T13 T8.3, T9.2 T9.3 T6.2, T6.3, T7.1, T7.2, T7.3, T7.4 (?), T7.5, T7.6, T8.1,T8.2, T8.3, T9.1, T9.2, T9.3, T10.1, T11.1, T12.1, T13 T10.1 T11.1
T12.1 T5.1, T6.3, T8.1 T5.2 T5.4 T8.2, T9.1, T11.1
1 decily
T6.2 T5.1, T5.2, T5.3, T5.4, T7.4, T7.6, T7.7, T8.1, T8.2, T8.3 T9.1, T9.2, T9.3, T10.1, T11.1, T12.1, T13 T7.6
1
T6.1
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
94 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
5.3 Výstupy 5.3.1 Datové kostky a definice jejich struktury Data důchodové statistiky ze zdrojových souborů MS Excel byla transformována do formátu RDF, konkrétně do datových kostek dle RDF Data Cube Vocabulary. Tabulka 53 uvádí přehled vytvořených datových kostek včetně definic jejich struktury. Tabulka 53: Přehled datových kostek a příslušných definic jejich struktury Datová kostka
Název datové kostky
Definice struktury datové kostky
Název definice struktury datové kostky
http://linked.cssz.cz/dataset/p enze/duchodci-prehled-cr
Celkový počet důchodců, průměrná výše důchodu a průměrný věk důchodců v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#duchodciprehled-cr
Definice struktury datové kostky s počty důchodců v ČR.
http://linked.cssz.cz/dataset/p enze/duchodci-v-krajich
Celkový počet důchodců v krajích České republiky
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#duchodci-vkrajich
Definice struktury datové kostky s počty důchodců v krajích ČR.
http://linked.cssz.cz/dataset/p enze/duchodci-v-cr-krajichokresech
Celkový počet důchodců v krajích a okresech České republiky
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#duchodci-vcr-krajich-okresech
Definice struktury datové kostky s počty důchodců v ČR, krajích a okresech.
http://linked.cssz.cz/dataset/p enze/casove-rady-grafy-1-6
Důchody a důchodci v České republice - různé statistiky
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#casoverady-grafy-1-6
Definice struktury datové kostky pro data časových řad obsažená v přílohách statistické ročenky (grafy 1-6).
http://linked.cssz.cz/dataset/p enze/rozlozeni-souboruduchodcu-podle-vyseduchodu-v-kvantilovemvyjadreni
Měsíční výše důchodů
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#rozlozenisouboru-duchodcu-podlevyse-duchodu-v-kvantilovemvyjadreni
Definice struktury datové kostky přehledu o rozložení souboru důchodců podle výše důchodů v kvantilovém vyjádření.
http://linked.cssz.cz/dataset/p enze/duchodci-v-cr
Počet důchodců v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#duchodci-vcr
Definice struktury datové kostky s počty důchodců v České republice.
http://linked.cssz.cz/dataset/p enze/nove-priznane-duchodyv-cr
Počet nově přiznaných důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#novepriznane-duchody-v-cr
Definice struktury datové kostky s počty nově přiznaných důchodů v České republice.
http://linked.cssz.cz/dataset/p enze/invalidita
Počet nově přiznaných invalidních důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#invalidita
Definice struktury datové kostky počtu nově přiznaných důchodů podle skupin diagnóz definovaných v MKN10.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
95 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Datová kostka
Název datové kostky
Definice struktury datové kostky
Název definice struktury datové kostky
http://linked.cssz.cz/dataset/p enze/nove-priznane-duchodydle-vyse-duchodu
Počet nově přiznaných důchodů v České republice dle měsíční výše důchodu
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#novepriznane-duchody-dle-vyseduchodu
Definice struktury datové kostky s počty nově přiznaných důchodů v ČR dle měsíční výše důchodu.
http://linked.cssz.cz/dataset/p enze/nove-priznane-duchodydle-veku
Počet nově přiznaných důchodů v České republice dle věkové kategorie
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#novepriznane-duchody-dle-veku
Definice struktury datové kostky s počty nově přiznaných důchodů v ČR dle věku důchodce.
http://linked.cssz.cz/dataset/p enze/nove-priznane-duchodydle-osobniho-vymerovacihozakladu
Počet nově přiznaných důchodů v České republice dle osobního vyměřovacího základu
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#novepriznane-duchody-dleosobniho-vymerovacihozakladu
Definice struktury datové kostky s počty nově přiznaných důchodů v ČR dle osobního vyměřovacího základu.
http://linked.cssz.cz/dataset/p enze/obyvatelstvo-podle-kraju
Počet obyvatel v krajích České republiky
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#obyvatelstv o-podle-kraju
Definice struktury datové kostky obyvatelstva České republiky v členění dle krajů.
http://linked.cssz.cz/dataset/p enze/obyvatelstvo-podle-veku
Počet obyvatel ve věkových skupinách
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#obyvatelstv o-podle-veku
Definice struktury datové kostky obyvatelstva České republiky v členění dle věku.
http://linked.cssz.cz/dataset/p enze/vyplacene-duchody-v-cr
Počet vyplacených důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#vyplaceneduchody-v-cr
Definice struktury datové kostky s počty vyplácených důchodů v České republice.
http://linked.cssz.cz/dataset/p enze/vyplacene-duchody-dlevyse
Počet vyplacených důchodů v České republice dle měsíční výše důchodu
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#vyplaceneduchody-dle-vyse
Definice struktury datové kostky s počty vyplácených důchodů v ČR dle měsíční výše důchodu.
http://linked.cssz.cz/dataset/p enze/duchody-dle-veku
Počet vyplacených důchodů v České republice dle věkové kategorie
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#duchodydle-veku
Definice struktury datové kostky s počty důchodů podle věku důchodce.
http://linked.cssz.cz/dataset/p enze/zmeny-mezi-stupniinvalidniho-duchodu
Počet vyplácených invalidních důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#zmenymezi-stupni-invalidnihoduchodu
Definice struktury datové kostky počtu invalidních důchodů po změně stupně invalidity.
http://linked.cssz.cz/dataset/p enze/casove-rady-grafy-7-8
Počet vyplácených předčasných starobních důchodů, výdaje na předčasné starobní důchody v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#casoverady-grafy-7-8
Definice struktury datové kostky pro data časových řad obsažená v přílohách statistické ročenky (grafy 7-8).
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
96 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Datová kostka
Název datové kostky
Definice struktury datové kostky
Název definice struktury datové kostky
http://linked.cssz.cz/dataset/p enze/zanikle-duchody
Počet zaniklých důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#zanikleduchody
Definice struktury datové kostky počtu zaniklých důchodů dle důvodu zániku důchodu.
http://data.czso.cz/resource/d ataset/demography
Počty obyvatel v regionech ČR
http://data.czso.cz/ontology/d atasetdefinition/DemographyDefiniti on
Definice datové kostky obsahující demografická data o regionech České republiky
http://linked.cssz.cz/dataset/p enze/prum-delka-pobirani-sduchodu
Průměrná délka pobírání starobního důchodu
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prumdelka-pobirani-s-duchodu
Definice struktury datové kostky s daty o průměrné délce vyplácení starobního důchodu.
http://linked.cssz.cz/dataset/p enze/prum-vyse-duchodu-unove-priznanych-duchodupodle-druhu-duchodu
Průměrná výše důchodů v Kč u nově přiznávaných důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prum-vyseduchodu-u-nove-priznanychduchodu-podle-druhuduchodu
Definice struktury datové kostky s daty o průměrné výši důchodu u nově přiznaných důchodů dle druhu důchodu.
http://linked.cssz.cz/dataset/p enze/prum-vyse-duchodupodle-druhu-duchodu
Průměrná výše důchodu v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prum-vyseduchodu-podle-druhuduchodu
Definice struktury datové kostky udávající průměrnou měsíční výši důchodu dle druhu důchodu.
http://linked.cssz.cz/dataset/p enze/prum-vyse-osobnihovymerovaciho-zakladu-unove-priznanych-duchodupodle-druhu-duchodu
Průměrná výše osobního vyměřovacího základu u nově přiznávaných důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prum-vyseosobniho-vymerovacihozakladu-u-nove-priznanychduchodu-podle-druhuduchodu
Definice struktury datové kostky průměrné výše osobního vyměřovacího základu u nově přiznaných důchodů dle druhu důchodu.
http://linked.cssz.cz/dataset/p enze/prum-vek-duchodce-dledruhu-duchodu
Průměrný věk důchodce v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prum-vekduchodce-dle-druhu-duchodu
Definice struktury datové kostky s průměrným věkem důchodců dle druhu důchodu.
http://linked.cssz.cz/dataset/p enze/prum-vek-u-novepriznanych-duchodu-dledruhu
Průměrný věk u nově přiznaných důchodů v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#prum-veku-nove-priznanych-duchodudle-druhu
Definice struktury datové kostky pro průměrný věk důchodce u nově přiznaných důchodů podle druhu důchodu.
http://linked.cssz.cz/dataset/p enze/relat-rozlozeni-populace
Relativní rozložení populace
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#relatrozlozeni-populace
Definice struktury datové kostky popisující rozložení populace České republiky mezi definované skupiny.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
97 (z 98)
Publikace dat statistických ročenek ve standardu otevřených dat (TD020121)
Datová kostka
Název datové kostky
Definice struktury datové kostky
Název definice struktury datové kostky
http://linked.cssz.cz/dataset/p enze/srovnani-vekovehoslozeni-obyvatel-v-letech
Srovnání počtu obyvatel ve věkových skupinách
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#srovnanivekoveho-slozeni-obyvatel-vletech
Definice struktury datové kostky porovnávající počet obyvatel České republiky v jednotlivých věkových skupinách s predikcí pro rok 2030.
http://data.czso.cz/resource/d ataset/social-service-facilities
Statistická data o zařízeních sociálních služeb a domů s pečovatelskou službou v okresech ČR
http://data.czso.cz/ontology/d atasetdefinition/SocialServiceFaciliti esDefinition
Definice datové kostky obsahující statistická data o zařízeních sociálních služeb a domů s pečovatelskou službou.
http://linked.cssz.cz/dataset/p enze/vydaje-na-duchody-v-cr
Výdaje na důchody
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#vydaje-naduchody-v-cr
Definice struktury datové kostky s celkovými výdaji na důchody v České republice v členění dle druhů důchodu.
http://linked.cssz.cz/dataset/p enze/vydaje-na-duchody-odroku-1996
Výdaje na důchody od roku 1996
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#vydaje-naduchody-od-roku-1996
Definice struktury datové kostky s celkovými výdaji na důchody v České republice v členění dle let.
http://linked.cssz.cz/dataset/p enze/casove-rady-grafy-9
Výdaje na starobní důchody v České republice
http://linked.cssz.cz/ontology/ datasetdefinitions/penze#casoverady-grafy-9
Definice struktury datové kostky pro data časových řad obsažená v přílohách statistické ročenky (graf 9).
Datové kostky jsou přístupné prostřednictvím SPARQL endpointu na adrese: http://opendata.vse.cz:8890/sparql. Definice datových kostek jsou dostupné na adrese: https://code.google.com/p/csszpensions/source/browse/dc-definition/cssz-pensions-dc-definition.ttl.
Datová pumpa pro převod zdrojových dat do publikační databáze a vytvoření publikační databáze
98 (z 98)