IT projekt nemusí být jen o IT Komplexnost jakéhokoli projektu by filozof patrně charakterizoval rčením, že „šedivá je teorie a zelený strom života“ a rozhodně by měl pravdu. O tom, že komplexní projekt může být opravdu košatý, ale také o tom, že projekt v oblasti informačních technologií nemusí být zdaleka jen o počítačích a programech, Vás přesvědčí tento příspěvek.
Charakteristika na úvod Obsahem příspěvku je shrnutí poznatků a zkušeností projektového manažera projektu s dlouhým názvem „Generální dodavatel informačních technologií pro Sčítání lidu, domů a bytů 2011“ (zkráceně GDIT pro SLDB 2011). Zakázku na tento projekt, kterou vypsal Český statistický úřad, získala společnost HEWLETT-PACKARD s.r.o. a realizovala jí v období květen 2010 až leden 2012. Díky potřebě hromadného zpracování velkých objemů dat provází sčítání lidu v moderní době užití výpočetních systémů a technologií. Ať už to byly děrné štítky a pásky v 70. a 80. letech minulého století, přes nasazení technologie skenování a rozpoznávání textu na přelomu století, až po aktuální možnost elektronického odevzdání sčítacích formulářů prostřednictvím libovolného personálního počítače připojeného k internetu. HP Solutions #1
1/9
Sčítání lidu, domů a bytů 2011
2011
poprvé v historii zvolena elektronická distribuce a sběr sčítacích formulářů
Projekt GDIT pro SLDB 2011 byl unikátní především z pohledu rozsahu, komplexnosti a v neposlední řadě i finančního objemu a byl pro HP jedním z nejrozsáhlejších projektů ve státní správě. Ovšem byl také v mnoha směrech unikátní i pro ČSÚ. Poprvé v historii byla distribuce a sběr sčítacích formulářů řešena externím dodavatelem a stejně tak byla poprvé v historii zvolena elektronická distribuce a sběr sčítacích formulářů jako alternativa ke klasickému vyplnění a odevzdání papírového formuláře. Předmět dodávky byl definován smlouvou jako soubor služeb vedoucích k celkovému zabezpečení informatické podpory ve všech fázích SLDB 2011, což zní velice obecně. Nejdůležitějším slovem v předchozí větě je slovo „informatické“, neboť cílem bylo nejen vytvořit komplexní systém, který zajišťoval zpracování sebraných dat v rámci sčítání lidu, ale také zajišťovat logistiku jejich sběru, podporovat informačně veškeré činnosti uživatelů a prezentovat správné informace ve správný čas na správném místě. Prostě Informační systém ve všech slova smyslech. Nezbytnou součástí všech dodaných řešení byla vysoká míra bezpečnosti a ochrany zpracovávaných dat a to jak z pohledu ochrany proti zneužití citlivých osobních údajů, tak i zajištění vysoké dostupnosti aplikací a jejich nepřerušeného provozu v prostředí internetu.
Projekt v číslech HP v rámci projektu navrhlo a úspěšně implementovalo více než 30 aplikací s uživatelským rozhraním a dalších 50 aplikací běžících na pozadí v dávkovém režimu zpracování dat SLDB. Dále HP navrhlo a dodalo vhodnou architekturu s ohledem na zpracování osobních údajů – zohlednění legislativních a bezpečnostních aspektů, vymezení informačních domén podle klasifikace zpracovávaných údajů a řízení životního cyklu osobních údajů. Zajistilo i detašované lokality pro zabezpečený provoz systémů a provozovalo více než 80 režimových pracovišť souvisejících se zajištěním SLDB 2011. Kompletní systém distribuce a sběru elektronických formulářů byl součástí předmětu plnění HP a to jak po stránce technologické, tak i organizační. Výsledkem byl bezchybný a ničím nekompromitovaný provoz systému po celou dobu distribuce a sběru, ale především neuvěřitelných 25 % formulářů sebraných elektronicky ze všech formulářů. V absolutních číslech to znamená 4,3 milionu formulářů distribuovaných a sebraných v průběhu tří týdnů se špičkovou výkonností až 50 tisíc formulářů za hodinu. Systém byl navržen s vícestupňovou ochranou proti útokům hackerů a byl provozován ze dvou geograficky oddělených lokalit, přičemž primární lokalitou byl mediálně velice dobře známý protiatomový kryt, tzv. „Bunkr“. V rámci zpracování papírových dokumentů jsme realizovali skenování, rozpoznání a verifikování téměř 13 milionů listinných dokumentů v průběhu pěti měsíců, tj. s denní výkonností více než 300 tisíci kompletně zpracovaných formulářů. Pro zajímavost, pokud bychom sebrané a zpracované listinné formuláře poskládali na sebe, tak získáme sloupec vysoký 1300 m (tj. jako 4 Eiffelovky nebo sloupec 3x vyšší než Empire State Building). To vše samozřejmě pouze v ideálním případě, protože formuláře byly různě pomačkané, roztržené nebo přeložené, výška takového sloupce by tedy byla reálně výrazně vyšší. HP Solutions #1
80 režimových pracovišť souvisejících se zajištěním SLDB 2011
25% formulářů sebraných elektronicky
4,3mil. formulářů distribuovaných a sebraných v průběhu tří týdnů se špičkovou výkonností až 50 tisíc formulářů za hodinu
300tis. kompletně zpracovaných formulářů denně 2/9
3760 útoků odrazil systém ochrany proti průniku u aplikace pro distribuci a sběr elektronických formulářů
70 pracovníků zde pracovalo v průběhu digitalizace a validace sčítacích formulářů v každé směně dvou i třísměnného provozu
Systém ochrany proti průniku u aplikace pro distribuci a sběr elektronických formulářů odrazil 3 760 různých pokusů o útok. Nejčastějším typem útoku bylo hledání XSS slabin systému. Byly zaznamenány i neúspěšné pokusy o DoS útok. Pro potřeby digitalizace listinných formulářů a následného primárního zpracování dat byla provozována detašovaná lokalita (tzv. Režimové pracoviště), kde byly umístěny centrální výpočetní systémy a probíhalo zpracování neanonymizovaných dat v režimu zvýšené objektové a fyzické bezpečnosti. V průběhu digitalizace a validace sčítacích formulářů zde pracovalo až 70 pracovníků v každé směně dvou i třísměnného provozu. Celkem se tedy na Režimovém pracovišti střídalo více než 200 pracovníků. A co tedy vlastně bylo v našich aplikacích spočítáno? To se můžete dozvědět na oficiálních webových stránkách ČSÚ www.czso.cz v sekci Statistiky.
Co se také stalo... Systém distribuce a sběru elektronických formulářů pracoval bez potíží i v období největších špiček, které nastávaly se železnou pravidelností každý den okolo 19:30 v průběhu nebo těsně po odvysílání hlavních zpravodajských relací na TV stanicích. Bezkonkurenčně nevyšší špička byla v neděli 27.3.2011 v 19:37, když TV Nova odvysílala reportáž se záběry z „bunkru“, tj. serverovny Režimového pracoviště. Zároveň se na internetu rozpoutala bohatá diskuze o tom, kde je tento bunkr umístěn. Několik diskutujících s naprostou přesvědčivostí tvrdilo, že bunkr je v Prokopském údolí a dokonce uváděli jeho GPS souřadnice. Ale smůla! Bunkr se před médii podařilo utajit a důvěrnost zpracování nebyla ohrožena. Vzhledem ke skutečnosti, že občané mohli papírové sčítací formuláře nejen předat komisaři, ale také poslat v obálce, nastala řada kuriózních situací. Společně s formuláři bylo v obálkách objeveno 29 občanských průkazů, jeden pas, čtyři tramvajenky, nespočet rodných, oddacích a úmrtních listů, ale také daňová přiznání, parte, důchodové výměry, vyplněné přihlášky na vysoké školy včetně stvrzenky o zaplacení potřebného poplatku, desítky originálů nejrůznějších smluv, neschopenky, lékařské zprávy či dokumentaci k umístění člověka do psychiatrické léčebny. Za nejpodařenější kuriozitu byla považována fotka miminka, o kterou se s úředníky podělili hrdí prarodiče s tím, že jejich vnouček má první sčítání za sebou.
HP Solutions #1
19:30 období největších špiček
kuriózní situace Společně s formuláři bylo v obálkách objeveno 29 občanských průkazů, jeden pas, čtyři tramvajenky, nespočet rodných, oddacích a úmrtních listů atd.
3/9
Hodnocení projektu
projekt = předmět, čas a zdroj jednoduchá definice, že projekt je úspěšný, pokud je naplněn jeho předmět, není překročen určený čas pro realizaci a nejsou přečerpány přidělené zdroje.
Všechny příručky o řízení projektů nás učí, že základním prvkem projektového managementu je tzv. projektový trojimperativ, neboli, že projekt je definován předmětem, časem a zdroji. Z tohoto by tedy vyplývala jednoduchá definice, že projekt je úspěšný, pokud je naplněn jeho předmět, není překročen určený čas pro realizaci a nejsou přečerpány přidělené zdroje. Ano, toto zobecnění je platné, ale jak by řekl matematik, je to „podmínka nutná, nikoliv však postačující“. V praxi je situace výrazně složitější a v jejím důsledku k základním parametrům přibývají ještě další faktory, jako jsou např. kvalita, dílčí termíny, splnění i nepsaných očekávání, reakce tisku i široké veřejnost a mnoho dalších. Z jednoduchého trojimperativu se rázem stává jakýsi n-imperativ, který již není jednoduše popsatelný. Čím je projekt komplexnější, tím více parametrů jej definuje a tím je obtížnější charakterizovat úspěšnost projektu. Patrně nejdůležitějším výstupem projektu je skutečnost, aby byla naplněna veškerá očekávání zákazníka a jím investované prostředky byly efektivně využité. Z tohoto pohledu lze konstatovat, že zákazník byl s činností týmu HP opravdu spokojen. Výsledky projektu nejlépe shrnují představitelé HP a ČSÚ: „Pro úspěšnou realizaci informatizace SLDB 2011 bylo zapotřebí zapojit přibližně 300 členů dynamicky alokovaných řešitelských týmů HP, kteří zajišťovali návrh a správu systémové architektury, řízení kvality, koordinaci projektových aktivit s ostatními subdodavateli SLDB 2011 a vývojovými týmy, implementaci, ladění a testování IS SLDB, dodávky vybraných služeb formou služby na klíč, návrh a implementaci procesů přípravy či provoz informačních systémů SLDB,“ vyzdvihuje generální ředitel HP Jan Kameníček. „Fyzická i digitální úroveň zabezpečení informačních systémů SLDB a bezpečnost elektronického sčítání potvrdila kvalitu řešení renomovaného dodavatele,“ doplňuje za ČSÚ Stanislav Drápal (viz. tisková zpráva ze dne 15. 3. 2012). Velice důležitými výstupy projektu pro dodavatele je ověření použitých řešení v reálném provozu. Vzniklo mnoho dílčích řešení, které jsme zdokumentovali a zobecnili tak, aby bylo možno tato praxí ověřená řešení implementovat v jiných oblastech. A právě tyto zmíněné výstupy jsou jedněmi z těch „neviditelných“ parametrů projektu, které ale ve své podstatě právě určují úspěšnost či neúspěšnost projektu. Detaily projektu ➔
Vizitka autora
Karel Karban Project Manager v HP Enterprise Services
Karel pracuje řadu let jako Project manager ve společnosti HewlettPackard. Jeho role spočívá ve vedení projektů pro zákazníky z oblasti státní správy a jako konzultant se specializuje na oblast ČSÚ, bezpečnostních složek státu a zpravodajských služeb. Od května 2010 vedl jeden z největších
E-mail:
projektů HP v oblasti státní správy ČR, projekt Generálního dodavatele IT pro Sčítání lidu, domů a bytů 2011. Projekt byl hodnocen jako úspěšný z pohledu všech metrik projektového řízení. Karel je certifikovaným projekt manažerem ISO 10006 a disponuje také mezinárodní certifikací PRINCE2 Practitioner.
[email protected]
Detailní popis projektu
Vlastní projekt SLDB 2011 sestával z několika dílčích fází, které na sebe bezprostředně navazovaly a byly na sobě přímo závislé. Na jednotlivých činnostech se podílelo paralelně několik řešitelských týmů, řízených projektovými vedoucími za jednotlivé oblasti. Nitky řízení se sbíhaly v centrálním týmu, který zastřešoval orchestraci celého projektu, komunikoval s vedením projektu na straně zákazníka a s ostatními externími dodavateli. Základním úkolem centrálního týmu bylo zajistit konzistenci v oblastech systémové integrace, projektového řízení, architektury řešení, řízení bezpečnosti a v neposlední řadě řízení kvality.
Systémová integrace a projektové řízení
Zajištění bezpečnosti
Systémová integrace a projektové řízení je rodinným stříbrem HP a u takto rozsáhlého a komplikovaného projektu je tato oblast klíčem k úspěchu. Proto byla věnována této disciplíně opravdu extrémní pozornost, a to především v následujících oblastech:
Otázky bezpečnosti a ochrany osobních dat byly detailně sledovány ze strany zákazníka a v průběhu realizace projektu se několikrát ukázalo, že HP disponuje kvalitními odborníky, kteří realizovali v rámci GDIT následující oblasti:
•P rojektové řízení činností GDIT ve všech oblastech v souladu s metodikou PMI (Project Management Institute), tj. řízení integrace procesů a dodávek, rozsahu, času, nákladů, kvality, lidských zdrojů, komunikace, rizik a subdodavatelů na základě dynamicky alokovaných řešitelských týmů podle řešené oblasti. •O rganizační zajištění projektového řízení s ohledem na ochranu zpracovávaných osobních údajů (zajištění prokazatelnosti práce s osobními údaji, mediální ochrana citlivých informací, součinnost s dodavatelem PR ČSÚ) •N ávrh a správa systémové architektury dílčích informačních systémů a technologií podporujících SLDB 2011 (dále též IS SLDB) včetně popisu vybraných procesů, identifikace dotčených subjektů (stakeholders), abstraktních a konkretizovaných funkcionalit, systémové dekompozice a návrhu implementace v souladu s principy TOGAF9
HP Solutions #1
•A nalýza IS SLDB, analýza rizik, nadřazených bezpečnostních politik, směrnic ČSÚ v oblasti informačních technologií a legislativních požadavků •N ávrh a realizace bezpečnostní politiky IS SLDB s oporou v normách a standardech a v souladu s legislativním rámcem • Implementace schválené bezpečnostní politiky na procesy, postupy a produkty GDIT pomocí nezbytných organizačněadministrativních a technických prostředků v rámci realizace a provozu IS SLDB •P růběžné i periodické činnosti řízení bezpečnosti všech oblastí projektu GDIT podle schválené bezpečnostní politiky GDIT (interní kontrola fyzické bezpečnosti i bezpečnosti IS SLDB včetně bezpečnosti dat, zajištění a kontrola ochrany osobních údajů aj.)
5/9
Zajištění kvality
podíl HP na řízení kvality byl ze strany zákazníka hodnocen velmi vysoko
Oblast řízení kvality byla další z unikátních charakteristik projektu SLDB 2011. Podíl HP na tomto procesu byl opět ze strany zákazníka hodnocen velmi vysoko a spočíval v následujících oblastech: •S polupráce při zajištění kvality Projektu SLDB 2011 formou implementace systému řízení kvality v souladu s ČSN EN ISO 9001 •V ypracování závazného dokumentu Manuál kvality projektu GDIT • Implementace měřitelných indikátorů kvality pro hodnocení kvality dat v souladu s požadavky a doporučeními Evropského parlamentu, Rady EU a příslušné legislativy České republiky •P růběžné i periodické činnosti řízení kvality všech oblastí projektu GDIT podle Manuálu kvality projektu GDIT (interní kontrola kvality výstupů před jejich předáním ČSÚ, provádění pravidelných kontrolních bodů kvality, průběžné ověřování kvality projektu GDIT formou externího ověřování shody ČSÚ aj.)
Architektura řešení pro jednotlivé fáze SLDB Posloupnost jednotlivých fází SLDB 2011 demonstruje následující obrázek:
Distribuce a sběr listinných SF
Digitalizace listinných SF Primární zpracování dat
Příprava dat Distribuce a sběr elektronických SF
Podpůrné systémy
HP Solutions #1
Zpracování předběžných výsledků
prezentace výsledků SLDV
Zpracování definitivních výsledků
Režimové pracoviště
Bezpečnost
6/9
Příprava dat V rámci přípravy dat jsme analyzovali, navrhli, vyvinuli a nasadili řadu aplikací pro přípravu dat z administrativních zdrojů a použití těchto dat pro předvyplnění sčítacích formulářů. •A plikace čerpaly data z dostupných registrů vedených ČSÚ a Ministerstvem vnitra ČR a jejich výstupem byly datové dávky pro tisk formulářů. •P ro každý formulář bylo vygenerováno unikátní číslo, které následně bylo na formuláři vytištěno ve formě čárového kódu. Toto číslo sloužilo k identifikaci každého jednoho formuláře z celkového počtu 21 miliónů vytištěných kusů. •S tejně tak byly generovány podklady pro tisk průkazů sčítacích komisařů. Aplikace pro územní přípravu zpracovaly data z registru sčítacích obvodů a databáze doručovacích adres jako podklad pro sčítací komisaře k distribuci formulářů.
Podpůrné systémy Tyto systémy jsme navrhli a vyvinuli pro interní potřeby všech pracovníků, kteří se jakýmkoliv způsobem podíleli na SLDB 2011. • J ednalo se o systém správy uživatelů ve kterém byla přidělována práva přístupu k aplikacím pro více než 2000 uživatelů. •D ále to byla specializovaná aplikace pro oslovení velkých vlastníků nemovitostí, kdy majitelé většího počtu nemovitostí byli osloveni mimo standardní postup distribuce sčítacích formulářů a bylo jim umožněno kromě standardních metod sběru využít k odevzdání vyplněných formulářů i datové schránky. •D ůležitou komponentou podpůrných systémů byl systém portálů, který se skládal ze znalostního portálu pro podporu činnosti centra telefonické podpory a služebního portálu pro řízený přístup k aplikacím SLDB.
Distribuce a sběr listinných formulářů Kromě HP se na realizaci SLDB 2011 podíleli ještě další externí dodavatelé. Klíčovým hráčem v této oblasti byla Česká pošta, s.p. v roli Dodavatele terénních prací (DTP). Úlohou DTP bylo nejen zajistit doručení sčítacích formulářů do domácností, ale také evidovat životní cyklus každého jednoho sčítacího formuláře. • Informace o změnách stavu formuláře přebíral nepřetržitě přes datové rozhraní náš systém pro podporu evidence a logistiky procesů SLDB.
HP Solutions #1
• Vzhledem k tomu, že pro formulář bylo definováno více než 30 různých stavů a evidovaných formulářů bylo 21 miliónů, tak bylo třeba na denní bázi zpracovat desítky GB informací. Systém musel být postaven tak, aby v každé chvíli bylo možno zjistit o každém formuláři, kde se zrovna nachází, zda byl již doručen obyvateli či zda byl již sebrán. • Pomocnými aplikacemi pro činnost komisařů, ale i informování veřejnosti byly aplikace evidence sběrných míst a sčítacích obvodů, webová aplikace pro vyhledávání sčítacích komisařů a systém distribuce vývěsek sčítacích komisařů na obce.
Distribuce a sběr elektronických formulářů Z pohledu uživatele byl důraz celkového řešení kladen na maximální bezpečnost, transparentnost a uživatelskou jednoduchost, a to jak z pohledu celého procesu distribuce a sběru elektronických formulářů, tak i z pohledu vlastního ovládání elektronického formuláře. Ve výše uvedeném kontextu jsme navrhli systém, který byl ve své podstatě velice jednoduchý. Tím byla zajištěna jeho robustnost a zároveň uživatelská přívětivost, a z pohledu respondenta se skládal pouze z několika činností: Všechny vytištěné papírové formuláře měly paralelně vygenerován svůj elektronický obraz ve formátu PDF. Při vlastní distribuci občan zadal na příslušné stránce číslo a bezpečnostní kód svého listinného formuláře, podle kterého se „pouze“ našel v databázi PDF formulář a ten byl občanovi poskytnut prostřednictvím zabezpečeného spojení (HTTPS). Následně občan vyplnil částečně předvyplněný PDF formulář, který vzhledově vypadal téměř stejně jako papírový, ale byl doplněn o logické kontroly některých polí a hodnota pro vyplnění jiných polí se vybírala z rozbalovacích menu. Po dokončení vyplnění a kontrole byl obsah elektronického formuláře, tedy nikoliv celý formulář, ale pouze data v objemu zlomku původní velikosti formuláře, odeslán opět zabezpečeným kanálem do vstupní databáze ČSÚ, kde byl následně zpracován. Po odeslání dat z formuláře občan obdržel nový PDF dokument s jednoznačně identifikovatelným potvrzením o podání formuláře. Systém pro distribuci a sběr elektronických formulářů byl realizován ve dvou vzdálených lokalitách s vysokou dostupností a možností souběžného provozu a řízení plynulého rozložení zátěže.
Digitalizace papírových formulářů Komplexní službu digitalizace listinných formulářů jsme dodávali „na klíč“, což znamená, že předmětem dodávky byl
7/9
nejen HW a SW technologie, ale také personální zajištění celého pracoviště. Vlastní zpracování spočívalo v několika na sobě navazujících krocích: • prvním byla digitalizace, tj. získání elektronických obrazů listinných formulářů na linkách obsluhujících velkokapacitní skenery. Data z takto sejmutých obrazů byla systémem OCR převedena do elektronické podoby. • Tato data byla následně manuálně verifikována a validována tak, aby se eliminovala potenciální chybovost rozpoznávání psaného písma a byla zajištěna vysoká kvalita získávaných dat. Zpracování nebylo ovšem jen o skenování a validaci, ale také o zajištění veškeré logistiky a manipulace s plastovými krabicemi, ve kterých byly formuláře převáženy. Naši pracovníci denně přebírali desítky krabic, které byly přiváženy nákladními vozy, každou museli evidovat, zkontrolovat pečetě, rozpoznat formuláře, které obsahuje a tyto připravit ke skenování. Následně po skenování přeložit formuláře do jiné krabice, tu zapečetit, vybavit průvodkou a odeslat do archivu.
Primární zpracování dat Aplikace pro zpracování dat byly vyvinuty v prostředí PL-SQL. Základní úlohou primárního zpracování bylo kódování dat. Jinými slovy se k textovým položkám z formulářů přiřazovaly číselníkové hodnoty. Systém kódování sestával z aplikace pro automatické kódování a aplikace pro kódování manuální. Pokud aplikace automatického kódování pro určitý výskyt textu nenašla adekvátní položku v číselníku, tak byl takový záznam předán do aplikace pro manuální kódování, kterou obsluhovalo 60 současně pracujících kodérů v jedné směně. Data doplněná o číselníkové hodnoty byla následně podrobena testu obsahu jednotlivých záznamů. Kontroly přípustnosti údajů prováděla univerzální aplikace, která definice jednotlivých kontrol přebírala přímo ze statistického metainformačního systému. Kontroly se týkaly především obsahu jednotlivých datových polí, např. pole pro číselnou hodnotu obsahuje opravdu číslo. Tím došlo k dalšímu zkvalitnění údajů a odstranění ať již úmyslně nebo neúmyslně zavlečených chyb. Dále byla data zpracovávána aplikací pro deduplikaci a prioritizaci s využitím dat z administrativních zdrojů. Tato aplikace nejprve ošetřila potenciální duplicity, tzn. pokud občan odevzdal více sčítacích formulářů a následně byla data porovnávána proti administrativním zdrojům a formou priorit se nastavilo, který z porovnávaných záznamů má větší vypovídací schopnost, tedy vlastně větší prioritu.
HP Solutions #1
Zpracování předběžných výsledků Základem zpracování předběžných výsledků byly aplikace spouštěné v dávkovém režimu a postupně realizující statistické operace dle předdefinované metodiky ČSÚ. Prvním krokem zpracování byly rozšířené logické kontroly, dalším bylo odvozování ukazatelů a následně výpočet agregací. Logické kontroly se týkaly především logických závislostí mezi jednotlivými údaji ve formuláři, např. že muž nemůže porodit dítě. Z pohledu obyčejného smrtelníka je velice zajímavý krok odvozování ukazatelů, který statistikům umožňuje z několika zdánlivě nesouvisejících otázek v dotazníku odvodit další skutečnosti, které nejsou ve formuláři na první pohled patrné. Pro předběžné výsledky se následné agregace vypočítávají pouze pro vyšší územní celky, jako jsou kraje a statutární města. Následně se tyto agregáty ukládají do statistického datového skladu, kde jsou připraveny pro další zpracování v rámci prezentace.
Zpracování definitivních výsledků Zpracování definitivních výsledků je sice na první pohled podobné zpracování předběžných výsledků, ale výrazně komplikovanější. Podobně jako u předběžných výsledků jsou prvním krokem důsledné logické kontroly. Následně pak dochází k odvozování místa obvyklého pobytu, což je oproti předchozím sčítáním novinka, protože dříve se pracovalo u jednotlivých obyvatel pouze s místem trvalého pobytu. Vzhledem k tomu, že stále víc obyvatel se stěhuje mimo města, ale zároveň si nechávají trvalý pobyt na původní adrese, tak ukazatel obvyklého pobytu nabývá na důležitosti a má výrazně vyšší vypovídací hodnotu. Dalším krokem je kompletace společně hospodařících domácností, což je pro aplikace velmi složitá úloha, protože to není výpočet nad jednotlivými záznamy, ale hledají se kombinace záznamů. Důležitým krokem při zpracování je odvozování dojížďkových proudů, kde vznikají informace o denních přesunech obyvatel za prací. Tady je na místě povzdech, zda by taková informace neměla být následně lépe zužitkovávána organizacemi zajišťujícími dopravní obslužnost a plánujícími dopravní infrastrukturu. Výstupem fáze zpracování definitivních výsledků jsou opět agregace ukládané do statistického datového skladu, ovšem tentokrát již s mnohem vetší mírou detailu, a to na úrovni obcí.
8/9
Prezentace výsledků SLDB Výstupem předchozích fází zpracování jsou méně či více agregovaná data, která již v sobě neobsahují osobní údaje a jsou tedy určeny k publikování. Pro vlastní prezentaci výsledků jsme dodali větší množství aplikací, které slouží k vazbě na stávající prezentační systémy zákazníka. Vypočtené agregáty jsou v rámci výstupu z předchozí fáze ukládány do statistického datového skladu a odtud poté následně prezentovány. Vlastní prezentace jsou připravovány jak ve formě tištěných publikací, internetových prezentací, tak, a to především, formou datových výstupů prostřednictvím tzv. veřejné databáze. To je řešení zákazníka, které je v pozadí předefinovaných datových výstupů, ale i ad hoc výběrů z těchto dat. Otázkou je, pro koho jsou určeny tyto výstupy. Odpověď je snadná, pro nás všechny. Zákon o státní statistické službě totiž definuje, že ČSÚ své výstupy poskytuje komukoliv, a dokonce bezplatně. Všichni, kdo mají o tyto informace zájem, mohou jednoduše přes internet tato data získat a pokud potřebují nějaký speciální pohled, tak je možno se obrátit na informační servis ČSÚ a speciální data si nechat připravit.
Režimové pracoviště Pro provoz technologické infrastruktury a zpracování neanonymizovaných dat jsme v rámci plnění GDIT vybudovali detašovanou lokalitu, která byla určena pro provoz výpočetních
HP Solutions #1
systémů (servery, disková pole, síťová infrastruktura), byla zabezpečená automatickým hasicím systémem, kamerovým systémem, kartovým systémem řízení vstupu a vícenásobným jištěním dodávky elektrické energie (UPS, motorgenerátor). Toto vše bylo umístěno několik metrů pod zemí za betonovými zdmi a pancéřovými dveřmi bývalého protiatomového krytu. Součástí byla v nadzemní části objektu i pracoviště v souladu s požadovanými bezpečnostními standardy, s prostory a kapacitou pro personální obsazení příslušných pracovišť, potřebnou technologickou infrastrukturou a vysokorychlostním komunikačním propojením se sídlem ČSÚ. Celý provoz detašované lokality byl zajištěn návrhem a implementací provozních procesů zabezpečeného režimového pracoviště včetně fyzické a informační bezpečnosti, bezpečnosti práce a požární bezpečnosti v souladu s metodikou ITIL a vypracování komplexní provozní dokumentace pro zajištění provozu. Detailně zpracovaná dokumentace je sice nezbytná, nicméně nejen předpisy živ je člověk, takže součástí pracoviště musely být také kuchyňky, odpočinkové zóny a také šatny s veškerým hygienickým zázemím. Součástí realizace detašované lokality bylo i zajištění vysoké dostupnosti výpočetních systémů a proto jsme vybudovali záložní datové centrum pro zajištění a provoz redundantní vysoce dostupné a vysoce zabezpečené infrastruktury pro služby poskytované veřejnosti (zejména distribuce a sběr elektronických formulářů) na základě služeb typu Cloud poskytovaných společností HP.
9/9