Konference DATA A ZNALOSTI 2015 1. – 2. 10. 2015
Řízení kvality dat s přihlédnutím k otevřeným propojeným datům Dušan Chlapek Jan Kučera
Fakulta informatiky a statistiky Vysoká škola ekonomická v Praze
Obsah 1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
2
Architektura v podnikové informatice •
Architektura (dle ISO/IEC 42010:2007) fundamentální uspořádání systému, které tvoří komponenty a vztahy mezi nimi, včetně vztahu k prostředí, a principy, které řídí jeho návrh a rozvoj (ISO/IEC, 2007)
•
Architektura v podnikové informatice (Enterprise Architecture, EA) je přístup, koncept, prostředek a nástroj, kterým vyjadřujeme fundamentální uspořádání vztahu mezi byznysem a jeho informačním systémem, které vede k naplnění mise organizace, přičemž respektuje okolní prostředí a konzistentně dodržuje formulované principy návrhu a rozvoje systému (Voříšek a kol., 2008) • Pozn.: dále bude také používán pojem „Podniková architektura“
•
Datová architektura popisuje strukturu datové základny organizace. Datová architektura popisuje jednotlivé datové sady, datové zdroje, vazby mezi nimi a vazby na další relevantní prvky podnikové architektury (Enterprise Architecture)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
3
Australian Government Architecture
Zdroj: (Australian Government Information Management Office, 2011)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
4
Národní architektura ICT VS ČR - 1
Zdroj: (Felix a kol, 2015)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
5
Národní architektura ICT VS ČR - 2
Zdroj: (Felix a kol, 2015)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
6
Cíle analýzy a návrhu datové architektury
• Analyzovat potřeby v oblasti dat a jejich správy • Identifikovat a popsat požadavky na datovou architekturu • Navrhnout datovou architekturu, která bude v souladu s definovanými požadavky a která umožní naplnit definovanou strategie v oblasti řízení a využívání dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
7
Obsah datové architektury • Konkrétní obsah se může lišit v závislosti na použitém rámci podnikové architektury a na potřebách organizace • Typické součásti datové architektury dle DAMA-DMBOK (Mosley a kol., 2010): • Datový model organizace – na konceptuální úrovni • Zachycení vazby prvků datového modelu na další prvky podnikové architektury jako procesy, organizační jednotky, role, aplikace, cíle, strategie, projekty, technologie. • Specifické architektury • Architektura souvisejících technologií – architektura popisující jaké technologie a nástroje jsou v rámci organizace používány pro zpracování a ukládání dat • Integrační architektura • Architektura datových skladů a business intelligence • Architektura metadat
• Datová architektura zachycuje také referenční a master data © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
8
Správa dat •
Jedna z domén řízení informatiky
•
Anglicky Data Management, používají se i pojmy (Enterprise) Information Management, Enterprise Data Management, Information Asset/Resource Management apod.
•
Data Management představuje plánování a provádění politik, praktik a projektů pořízení, kontroly, ochrany, dodávky a zvyšování hodnoty dat a informačních aktiv (Mosley a kol., 2010)
•
Information management představuje prostředky pomocí kterých organizace zajišťuje plánování, identifikaci, vytvoření, získání, sběr, organizování, řízení (governance), zabezpečení, použití, sledování, distribuci, výměnu, údržbu, uchování a vyřazení informací jakož i prostředky, kterými zajišťuje, že hodnota informací je rozpoznána a maximálně využita (QGCIO, 2009)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
9
Cíle správné a efektivní správy dat •
Hlavním cílem je zajistit, že data, resp. informace jsou k dispozici1 • tomu, kdo je potřebuje, • v podobě či formátu, v jakém je potřebuje a • v okamžiku, kdy je potřebuje.
•
K naplnění cíle je třeba zejména realizovat následující dílčí cíle2 1. Definovat informační potřeby organizace a jednotlivých zainteresovaných stran 2. Pořizovat, shromažďovat, ukládat, chránit a zajišťovat integritu datových zdrojů 3. Průběžně zajišťovat a zvyšovat kvalitu dat 4. Zajišťovat důvěrnost a ochranu datových zdrojů 5. Zajišťovat efektivní využívání dat a informací 6. Řídit náklady správy dat 7. Propagovat princip, že data představují pro organizaci cenné aktivum 8. Zajistit, že jsou data řízena konzistentně napříč celou organizací 9. Zajistit soulad mezi řízením dat, používanými technologiemi a potřebami organizace (byznysu) 1 Upraveno 2 Upraveno
© FIS VŠE, 2015
dle: (QGCIO. 2009) dle: (Mosley a kol., 2010)
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
10
Oblasti správy dat 1. Strategické řízení 2. Analýza a návrh datové architektury 3. Pořizování, provoz a údržba dat, poskytování dat, skartace dat 4. Řízení nákladů a přínosů dat 5. Řízení bezpečnosti dat 6. Řízení kvality dat 7. Řízení metadat 8. Řízení referenčních dat a master dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
11
JK2
Životní cyklus informačních aktiv dle QGEA Plánování (Plan) Tvorba a pořízení (Construct, create, acquire) Uložení, klasifikace a příprava k použití (Commision, organise, store) Nastavení oprávnění přístupu (Access) Použití (Use) Vyhodnocení (Assess) Údržba (Maintain) Skartace (Retire) Zdroj: (QGCIO, 2011)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
12
Snímek 12 JK2
Vybrat jen jeden ze snímků s obrázky životního cyklu (11-13) Jan Kučera; 1.10.2015
JK3
The DCC Curation Lifecycle Model
Zdroj: (Digital Curation Centre, 2014)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
13
Snímek 13 JK3
Vybrat jen jeden ze snímků s obrázky životního cyklu (11-13) Jan Kučera; 1.10.2015
Životní cyklus dat – shrnutí • Životní cyklus dat – vymezuje jednotlivá stadia, kterými data procházejí od okamžiku, kdy je plánováno jejich pořízení, až do okamžiku jejich odstranění (skartace) • Základní stadia životního cyklu dat 1. 2. 3. 4. 5. 6. 7.
© FIS VŠE, 2015
Plánování Specifikace Pořízení Uložení a klasifikace Použití a údržba Archivace a obnova Skartace Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
14
Obsah 1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
15
Co jsou otevřená data? •
Data zveřejněná na Internetu, která jsou • úplná, • snadno dostupná, • strojově čitelná, • používající standardy s volně dostupnou specifikací, • zpřístupněna za jasně definovaných podmínek užití dat s minimem omezení, • dostupná uživatelům při vynaložení minima možných nákladů.
•
Požadavky na podmínky užití otevřených dat: • Neomezují jejich uživatele ve způsobu použití dat. • Opravňují uživatele k jejich dalšímu šíření. • Musí být uveden autor dat (i při dalším šíření). • Při dalším šíření musí i ostatní uživatelé mít stejná oprávnění s daty nakládat - během šíření dat nesmí dojít např. k omezení jejich využití pouze pro nekomerční účely.
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
16
Přínosy otevřených dat • (P1) posílení transparentnosti, • (P2) podpora ekonomického růstu, • (P3) zlepšení služeb veřejné správy, • (P4) podpora opětovného použití dat, • (P5) zlepšení vnímání veřejné správy veřejností, • (P6) zlepšení procesů a dat veřejné správy, • (P7) zamezení chyb vzniklých při práci s daty
© FIS VŠE, 2015
• (P8) snížení počtu dotazů dle zák. č. 106/1999 Sb. • (P9) pořádek ve vlastních datech • (P10) možnost transparentně informovat veřejnost o subjektech, které neplní své zákonné povinnosti • (P11) zvýšení hodnoty dat • (P12) budování dobrého jména
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
17
Rizika otevřených dat • • • • • • •
(R1) Zveřejnění dat v rozporu se zákonem (R2) Riziko porušení ochrany obchodního tajemství (R3) Riziko porušení ochrany osobních údajů (R4) Zveřejnění nevhodných dat či informací (R5) Dezinterpretace dat (R6) Absence konzumentů dat (R7) Překrývání dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
18
Otevřená data – stupně otevřenosti
Zdroj: (Hausenblas, 2012)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
19
Otevřená data – stupeň 5 • Otevřená data na stupni 5 jsou také nazývána Propojená otevřená data (angl. Linked Open Data, zkratka LOD)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
20
Dostupnost dat na webu Regionální statistiky ČSÚ
RÚIAN
ARES
Sbírka zákonů
RPP
http://www.czso.cz
http://www.cuzk.cz
http://www.mfcr.cz
http://portal.gov.cz
http://www.szrcr.cz
Kontroly ČIZP
Kontroly SŽPI Web nabízí řadu dat o kontrolách. Můžeme s nimi efektivně (strojově) pracovat? • http://www.potravinynapranyri.cz/
Kontroly ČOI
http://www.coi.cz
Data o kontrolách a související data jsou publikována v různých dokumentech mnoha organizacemi a na mnoha místech.
•
Dokumenty jsou až na výjimky určeny pro lidi, ne pro strojové zpracování.
•
Souvislosti nejsou dostatečně popsány a zaznamenány.
http://www.cizp.cz
Kontroly NKÚ
http://data.nku.cz Zdroj: Upraveno dle (Nečaský a kol., 2014)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
21
Dostupnost dat na webu Regionální statistiky ČSÚ
RÚIAN
ARES
Sbírka zákonů
RPP
http://www.czso.cz
http://www.cuzk.cz
http://www.mfcr.cz
http://portal.gov.cz
http://www.szrcr.cz
Kontroly ČIZP
Kontroly SŽPI Jak nalézt odpovědi na následující otázky? •
Kontroly provedené v okrese Semily •
http://www.potravinynapranyri.cz/
Kontroly ČOI
http://www.coi.cz
+ u subjektů provozující obor činnosti „Pronájem a půjčování věcí movitých“
•
Kontroly provedené v rámci agendy „Odpadové hospodářství“
•
Počty kontrol a objemy pokut v okresech přepočtené na 1000 obyvatel
http://www.cizp.cz
Kontroly NKÚ
http://data.nku.cz Zdroj: Upraveno dle (Nečaský a kol., 2014)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
22
Principy propojených dat 1. Identifikujte datové entity pomocí http:// URL. 2. Používejte URL tak, aby jej ostatní mohli vyhledat v síti WWW, přistupovat k němu a odkazovat se na něj. 3. Pokud někdo přistoupí k URL entity, poskytněte o ni údaje ve formátu RDF. •
Případně nabídněte RDF datové API (SPARQL).
4. Mezi údaji poskytněte odkazy na URL souvisejících entit, abyste k doplnili kontext a umožnili procházení entit v rámci sítě WWW.
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
23
Propojená data – cíle • Cílem propojených dat (angl. Linked Data) je vytvořit ekosystém webových služeb (aplikací), které publikují, obohacují a využívají data o entitách v jednom globálním sdíleném datovém prostoru (tzv. Web dat). Služba 3
Služba 4
Služba 1
Služba 4
Služba 2
Služba 5 Sdílený globální prostor dat na Webu (Web of Data)
© FIS VŠE, 2015
Zdroj: (Chlapek a kol., 2015)
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
24
Standardy Ministerstva vnitra ČR • MV ČR připravuje standardy publikace a katalogizace otevřených dat VS ČR. http://opendata.gov.cz
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
25
Standardy Ministerstva vnitra ČR • Standardy jsou založeny na výše prezentovaných principech a dále je rozšiřují o: • vzorové publikační plány pro jednotlivé typy orgánů veřejné moci a pro samosprávy • doporučené postupy publikace a katalogizace otevřených dat • povinnost katalogizovat otevřená data v Národním katalogu otevřených dat (http://portal.gov.cz/portal/obcan/rejstriky/data/) • povinnost publikovat na stupni 3, volitelně na stupni 5 • povinnost dodržovat předpřipravená datová schémata pro doporučené datové sady na stupni 3 • povinnost dodržovat několik základních pravidel • http://opendata.gov.cz/standardy:stupne-otevrenosti • http://opendata.gov.cz/standardy:technicke-standardy-pro-datove-sady-na-stupni-3 • http://opendata.gov.cz/standardy:technicke-standardy-pro-vytvareni-datovychschemat-na-stupni-3 • http://opendata.gov.cz/standardy:technicke-standardy-pro-datove-sady-na-stupni-5 • http://opendata.gov.cz/standardy:technicke-standardy-pro-vytvareni-datovychschemat-na-stupni-5
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
26
Standardizace publikace a katalogizace otevřených dat http://opendata.gov.cz
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
27
Vzorový publikační plán • •
•
•
Vzorový publikační plán vymezuje doporučené oblasti či doporučené datové sady k publikaci otevřených dat včetně typických rizik a přínosů Vzorové publikační plány by měly být vytvořeny pro následující typy orgánů VS: a) Ústřední orgán státní správy – ministerstvo b) Ústřední orgán státní správy – ostatní c) Krajský úřad d) Obce s rozšířenou působností e) Obecní úřad – ostatní Vzorový publikační plán by měl zejména obsahovat: • Seznam doporučených datových sad k otevření, příp. oblastí, ze kterých datové sady vybírat • Detailní popis doporučených datových sad • Vzory katalogizačních záznamů • Typická rizika spojená s publikací doporučených datových sad a doporučené kroky k jejich zmírnění • Typické přínosy publikace doporučených datových sad a doporučené kroky pro jejich dosažení (upozornit u jednotlivých datových sad možnost jak přes publikaci otevřených dat mohou subjekty splnit svou zákonnou povinnost - např. „dálkový přístup“ k určeným datům) • Příklad publikovaných otevřených dat u vybraného validátora Vzorové publikační plány jsou k dispozici http://opendata.gov.cz v části „Vzorové publikační plány“.
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
28
Národní katalog otevřených dat VS ČR (NKOD) • NKOD je dostupný prostřednictvím Portálu veřejné správy ČR (PVS) v záložce „Otevřená data“ • NKOD obsahuje: • katalogizační záznamy o datových sadách zveřejněných jednotlivými OVM včetně odkazů ke stažení dat • data ke stažení mohou být uložena: • na webu příslušného poskytovatele dat • přímo na PVS v Rejstříku datových zdrojů (součást NKOD)
• NKOD umožňuje katalogizaci následujícími způsoby: • vyplnění formuláře na PVS a jeho odeslání přes ISDS • automatické plnění metadaty z lokálních katalogů OVM (po předchozí registraci lokálního katalogu v NKOD)
• Zahájení pilotního provozu 10.dubna 2015 • Plný ostrý provoz 15. května 2015 © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
29
Národní katalog otevřených dat VS ČR (NKOD)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
30
Připravovaná úprava legislativy •
Návaznost na schválenou novelu zákona o svobodném přístupu k informacím (106/1999 Sb.), novelizován zákonem č. 222/2015 Sb. – účinnost od 10.9.2015
•
V souvislosti se standardy MV ČR připravuje novelu zákona o informačních systémech (365/2000 Sb.)
•
Novela zavede pojem otevřených dat, významných datových sad a povinnost publikovat významné datové sady v podobě otevřených dat
•
MV ČR upraví prováděcí vyhláškou kritéria pro významné datové sady, minimální stupeň otevřenosti (3), postup publikace otevřených dat a Národní katalog otevřených dat
•
MV ČR upraví technické standardy pro otevřená data v podobě Technického manuálu • • •
datové formáty pro stupně otevřenosti 3 a 5 obecné požadavky na strukturu dat konkrétní datová schémata pro doporučené datové sady na stupni 3
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
31
Obsah 1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
32
Řízení kvality dat - jedna z oblastí správy dat
1. Strategické řízení 2. Analýza a návrh datové architektury 3. Pořizování, provoz a údržba dat, poskytování dat, skartace dat 4. Řízení nákladů a přínosů dat 5. Řízení bezpečnosti dat 6. Řízení kvality dat 7. Řízení metadat 8. Řízení referenčních dat a master dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
33
Správa dat Otevřená data jsou nedílnou součástí datové architektury příslušného subjektu. Správa dat musí být vykonávána na „uzavřených“ i otevřených datech.
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
34
Cíle řízení kvality dat • Zajistit, že data jsou uživatelům dostupná v kvalitě, kterou potřebují • Průběžně vyhodnocovat a zvyšovat kvalitu dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
35
Obsah řízení kvality dat • Fáze zlepšování kvality dat (Batini a kol., 2009): 1. 2. 3.
Popis současného stavu Hodnocení/měření kvality dat Zvyšování kvality dat
• Aktivity řízení kvality dat dle DAMA-DMBOK (Mosley a kol., 2010): 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Propagace konceptu datové kvality Identifikace a popis požadavků na kvalitu dat Profilování, analýza a hodnocení datové kvality Definice metrik datové kvality Definice byznys pravidel pro datovou kvalitu Testování a ověřování požadavků na datovou kvalitu Nastavení a ověření úrovně služeb datové kvality Průběžné sledování a vyhodnocování datové kvality Řešení zjištěných problémů v datové kvalitě Čištění a oprava chyb v datech Návrh a implementace operativních procedur řízení datové kvality Sledování a vyhodnocování výkonnosti operativních procedur řízení datové kvality
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
36
Hlavní dimenze datové kvality - obecné • • • • • • • • • • • • • • • •
Správnost Data musí věrně zachycovat reálné objekty a události. Úplnost Míra, do jaké jsou přítomna všechna požadovaná data. Validita Míra, do jaké data odpovídají nadefinovaným syntaktickým pravidlům. Včasnost Míra, do jaké data správně/aktuálně reprezentují realitu ke konkrétnímu časovému bodu. Konzistentnost datových hodnot Data vypovídající o stejném úseku reality/objektu musí být konzistentní napříč jednotlivými datovými zdroji. Dostupnost Míra, do jaké je uživatel schopný přistupovat k datům. Duplicitnost Žádný objekt či skutečnost není zaznamenána duplicitně. Spolehlivost Data jsou spolehlivá, pokud víme, že jejich sběr a zpracování probíhá podle definovaného procesu. Zdroj: upraveno dle (Tomčová, 2014)
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
37
Mapování dimenzí kvality na principy OD
Zdroj: (Tomčová, 2014) © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
38
Specifické dimenze kvality pro OD a LOD Dimenze
Konsolidovaná definice
Příklad způsobu měření
Licencování
Zda jsou data opatřená vhodnou licencí upravující jejich užití a následné zpracování.
Primárnost
Míra do jaké jsou data zveřejněna Kontrolní součty u agregovaných tak, jak byla vytvořena. statistických dat.
Míra do jaké jsou data Zpracovatelnost srozumitelná a zpracovatelná v rámci automatických procesů. Jsou uzly náležitě popsané podle toho, čím skutečnou jsou nebo Korektní zápis označeny jen datovým typem? Zlepšuje schopnost vyhledávat a dotazovat se.
Vyhodnocení úrovně licence, která je datovému setu přidělena.
Podíl dat, která jsou zapsána ve strojově čitelné formě.
Podíl uzlů s korektním zápisem.
Zdroj: upraveno dle (Tomčová, 2014) © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
39
Kategorie technik zvyšování kvality dat • Techniky zaměřené na data • Zvýšení kvality dat změnou jejich hodnoty • Příklady technik • • • •
Nahrazení nekvalitních dat jinými daty, která jsou kvalitnější Standardizace – např. využívání číselníků Identifikace a oprava chyb v datech Atd.
• Techniky zaměřené na procesy • Zvýšení kvality dat úpravou procesů, v rámci kterých vznikají, aby bylo zamezeno vzniku chyb • Příklady technik • Zavedení kroků do procesu, v rámci kterých jsou data kontrolována • Redesign procesu, aby v jednotlivých krocích již vznikala data vyšší kvality Zdroj: (Batini a kol., 2009) © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
40
Obsah 1. Datová architektura a správa dat 2. Otevřená propojená data 3. Řízení kvality dat 4. Role ve správě dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
41
Role podílející se na správě dat • Řídící role • Manažer podnikové informatiky (CIO) • Manažer správy dat • Manažer bezpečnosti
• Architektonické role • Podnikový architekt • Datový architekt
• Výkonné role, experti, specialisté • Kurátor dat (vlastník procesu) – expert na konkrétní doménu, o které data vypovídají • IT Datový specialista – specialista na jednotlivé oblasti správy a zpracování dat • Administrátor databáze • Správce datového katalogu • Expert na datovou kvalitu • Expert na bezpečnost informací • Expert na řízení rizik © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
42
Kurátor dat (vlastník procesu) • Kurátor dat (vlastník procesu) • je expert na konkrétní doménu, o které vypovídají, nebo ze které pocházejí určitá data. • Odpovídá v oblasti správy dat zejména za • Správu a údržbu vybraných datových sad v průběhu jejich životního cyklu • Správu a údržbu metadat o příslušných datových sadách, včetně registrace katalogizačních záznamů v datovém katalogu • Definici požadavků na zajištění kvality příslušných datových sad a účast na zajištění požadované úrovně kvality datových sad • Účast na definici požadavků na zajištění bezpečnosti datové sady včetně klasifikace dat z hlediska jejich důvěrnosti
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
43
IT datový specialista • IT datový specialista • je IT specialista se zaměřením na oblast dat, jejich zpracování, využití a správy. V organizaci může být přítomno více IT datových specialistů se specifickým zaměřením, např. na analýzu a modelování dat, nástroje pro ukládání, zálohování a obnovu dat, transformaci dat, ontologie, referenční a master data apod. • Odpovídá v oblasti správy dat zejména za • Provádění jednotlivých činností správy dat v závislosti na zaměření IT datového specialisty • Účast na tvorbě datové architektury © FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
44
Administrátor databáze • Administrátor databáze • je osoba odpovědná za provoz a údržbu databázového systému. • Odpovídá v oblasti správy dat zejména za • Účast na návrhu databázových systém • Implementaci databázových systémů dle návrhu • Provoz a údržbu databázového systému včetně • Aktualizace databáze a aktualizace SŘBD • Zajištění požadované dostupnosti a výkonnosti databázového systému • Ladění výkonnosti databázového systému • Řešení problémů a incidentů týkajících se databázových systémů
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
45
Správce datového katalogu • Správce datového katalogu • je osoba či subjekt odpovědný za datový katalog. • Odpovídá v oblasti správy dat zejména za • Zajištění výběru a implementace katalogizačního nástroje • Definici parametrů pro provoz datového katalogu • Sběr podnětů na zlepšení datového katalogu a zadávání a zajištění implementace změnových požadavků • Zajištění provozu datového katalogu • Organizaci práce s datovým katalogem • Zajišťování přístupových práv pro přístup do datového katalogu • Sledování a vyhodnocování kvality obsahu datového katalogu (metadat) a komunikaci s kurátory ohledně kvality katalogizačních záznamů • Kontrolu existence katalogizačního záznamu pro všechny datové sady, které by v datovém katalogu měly být registrovány
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
46
Expert na datovou kvalitu • Expert na datovou kvalitu • je specialista na datovou kvalitu, její sledování, vyhodnocování a zvyšování. • Odpovídá v oblasti správy dat zejména za • • • • •
Sběr a analýzu požadavků na kvalitu dat Definice business pravidel pro datovou kvalitu Definice dimenzí a metrik datové kvality Nastavení a ověření úrovně služeb datové kvality Průběžné sledování a vyhodnocování datové kvality včetně profilování, analýzy a hodnocení kvality datových sad • Řešení zjištěných problémů v datové kvalitě • Čištění a oprava chyb v datech
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
47
Expert na bezpečnost informací • Expert na bezpečnost informací • je specialista na bezpečnost informací a její zajištění. • Odpovídá v oblasti správy dat zejména za • Analýzu požadavků v oblasti bezpečnosti dat a regulatorních požadavků • Klasifikaci dat/informací z hlediska jejich důvěrnosti (ve spolupráci s kurátory dat) • Definici kontrol a procedur bezpečnosti dat • Spolupráci s kurátory dat a ostatními relevantními rolemi na zajištění bezpečnosti dat • Provádění auditu bezpečnosti dat
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
48
Expert na řízení rizik • Expert na řízení rizik • je specialista na oblast řízení rizik a související postupy, metody a techniky. • Odpovídá v oblasti správy dat zejména za • Zajištění, že v rámci správy dat jsou adekvátním způsobem řízena rizika • Zajištění integrace a koordinace řízení rizik v oblasti správy dat s řízením v rámci organizace • Analýzu rizik s dopadem na data organizace a jejich správu • Spolupráci s ostatními rolemi na návrhu a implementaci opatření pro zmírnění rizik, resp. dopadů rizik • Účast na zajištění bezpečnosti informací
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
49
Zdroje Australian Government Information Management Office. 2011. Australian Government Architecture Reference Models. Version 3.0. In: Australian Government. [Online] August 2011 [Citace: 29. září 2014.] http://www.finance.gov.au/sites/default/files/AGA-RM-Final-v3.0-July-2013.pdf. Batini, Carlo, a kol. 2009. Methodologies for data quality assessment and improvement. ACM Computing Surveys. Červenec 2009, Sv. 41, 3, stránky 16:1-16:52. Digital Curation Centre. 2014. DCC Curation Lifecycle Model. In: Digital Curation Centre. [Online] © 2004-2014 [Citace: 29. září. 2014.] http://www.dcc.ac.uk/resources/curation-lifecycle-model. Felix, Ondřej; Kuchař, Petr; Kroupa, Tomáš; Tiller, Petr; Hrabě, Pavel; Šedivec, Tomáš. 2015. Národní architektura ICT ve veřejné správě ČR. [Online] 23.9.2015. [Citace: 1. října 2015.] http://www.cssi.cz/cssi/enterprise-architektura-v-ceske-verejne-sprave Hausenblas, Michael. 2012. 5 star Open Data. 5 star Open Data. [Online] 3. duben 2012. [Citace: 20. září 2013.] http://5stardata.info/. Chlapek, Dušan; Kučera, Jan a Nečaský, Martin. 2015. Principy a technologie otevřených dat a jejich využití v managementu. [Online] 22.1.2015. [Citace: 1. října 2015.] http://www.cssi.cz/cssi/system/files/all/SI_2015_01_Chlapek_Kucera_Necasky.pdf. ISO/IEC. 2007. ISO/IEC 42010:2007 Systems and Software Engineering - Recommended practice for architectural description of software-intensive systems. Mosley, Mark, a kol. 2010. The DAMA Guide to the Data Management Body of Knowledge. Technics Publications, LLC, 2010. str. 406. ISBN 978-19355040-2-3. Nečaský, Martin; Kučera, Jan a Klímek, Jakub. 2014. Tutoriál “Otevírání a propojování dat” - I. část. Propojitelná data(Linked Data –LD). [Online] 6.6.2014. [Citace: 1. října 2015.] http://www.cssi.cz/cssi/system/files/all/Seminar_CSSI_6-6-2014_tutorial%20dopoledne.zip. QGCIO. 2011. Information asset lifecycle. . In: Queenslad Government. [Online] October 2011 [Citace: 29. září 2014.] https://www.qgcio.qld.gov.au/images/documents/QGEA_documents/QGEA/Information%20asset%20lifecycle.pdf. QGCIO. 2009. Queensland Government Information Management Policy Framework Definitions. In: Queenslad Government. [Online] December 2009 [Citace: 29. září 2014.] https://www.qgcio.qld.gov.au/images/documents/QGEA_documents/QGEA/Information%20Management%20Policy%20Framework.doc. Tomčová, Lucie. 2014. Datová kvalita v prostředí otevřených a propojitelných dat. Diplomová práce, VŠE-FIS, Praha. Voříšek, Jiří, a kol. 2008. Principy a modely řízení podnikové informatiky. Praha : Oeconomia, 2008. ISBN: 978-80-245-1440-6.
© FIS VŠE, 2015
Chlapek, D. – Kučera, J.: Řízení kvality dat s přihlédnutím k otevřeným propojeným datům
50