Informatika 2
Data v informačních systémech
EIS MIS
strategické řízení taktické řízení operativní řízení a provozu
TPS Spojení: e-mail:
[email protected] tel.: 48 535 2442 Konzultace: pondělí 1030 - 1130 17.5.2016
IN2-16-02
1
IS2
Informatika 2 – 02 Dnešní info: Uniklá hesla Výpalné
Autentizace bankovních karet Odposlechy politiků
2
IS2
Informatika 2 – 02 Dnešní info:
3
IS2
Informatika 2 – 02 Dnešní info: Hackeři se nabourali do sítě losangeleské nemocnice v pátek 5. února. Do systému se zřejmě dostali přes e-mail a síť zaplavili škodlivým počítačovým programem ransomware, který uložená data zašifrovává a který znepřístupní uživatelům počítač či dokumenty. Pro obnovení přístupu vyžaduje zaplacení určité finanční částky. Program se nazývá podle anglického slova ransom - výkupné.
4
IS2
Informatika 2 – 02 Dnešní info: Výpalné
5
Data v počítači Data strukturovaná Základní typy (dělení z důvodu rozlišení povolených a nepovolených manipulací a hodnot): textová (řetězce znaků) číselná – čísla reálná, racionální … datum, čas logická – splnění podmínek, existence či neexistence vlastností objektu kategorie – hodnota vlastností vybraná ze škály (často číselníky, umožňující zaznamenání hodnoty pouze kódem) Strukturováním je vytvářena taková organizace dat, která umožňuje efektivně zpracovat a vyhledat údaje podle potřeby. Strukturovaná data vytvářejí vyhledávací klíče. Klíče, jež jednoznačně identifikující datový záznam, jsou nazývány primární klíče (někdy též identifikační klíče). 17.5.2016
6
Data v počítači Data strukturovaná
představují údaje „o něčem“
operace aneb co s daty mohu dělat:
jméno, příjmení, adresa, rodné číslo, telefonní číslo, věk, váha, cena, datum, počet bodů, kategorie, průměrná známka, kódovaná data počet kusů, počet stran, ... sčítání, zaokrouhlení, násobení připojení (jméno + příjmení), zkrácení, řazení den v týdnu, negace,…
číslo textový údaj datum a čas logický údaj (ano/ne)
17.5.2016
- např. 324H 101000100 - binárně
jsou charakterizována datovým typem
různá vyjádření čísel
text, písmena - různé kódové standardy (tabulky) datum a čas - převod na jediné číslo logická hodnota - 1 bit kategorie - číselníky
7
Data v počítači Data nestrukturovaná Data typu: volný text audio video grafika multimédia …
Přibližné objemy dat
17.5.2016
Jsou datově bohatší, než strohé strukturované údaje Problém: podle nestrukturovaných dat lze obtížněji vyhledávat
Používané řešení - nestrukturová data bývají doplněna daty strukturovanými Stránka textu ASCII
1800 B
Stránka textu - Word
50 kB
Vektorová grafika A4
30 kB
Bitmapový obraz A4 – jpg
5 MB
Záznam 1 minuty zvuku
10 MB
Záznam 90 minut obrazu
3 GB 8
Souborový a databázový přístup Datová základna - samostatná část informačního systému (IS)
měla by co nejlépe obstát při změnách v IS návrh datové základny - pohled na to, co datová základna obsahuje odpovídá pohledu na skutečnost, ve které se odehrává činnost podniku nebo organizace.
Základní pojmy databázových struktur:
záznam (record) - množina údajů v datové základně, které se týkají jednoho reálného objektu (věci, jevu, osoby, děje - např. záznam o konkrétním druhu zboží), atribut - zaznamenaná vlastnost reálného objektu - např. název zboží, jeho váha, rozměry, barva, materiál, datum výroby, trvanlivost,…
17.5.2016
9
Souborový a databázový přístup Souborový přístup Historicky první
aplikace ukládá svá data do jednoho či několika datových souborů Soubor obsahuje záznamy o jednom typu objektů ve formě datových vět Hodnoty atributů v jednom záznamu se nazývají položky
Omezení
každá aplikace si udržuje svá data
problémové využívání týchž dat pro různé aplikace (např. adresa bydliště – nutnost opakovaných změn dat v řadě souborů při přestěhování)
přístup je koncipován pro jednoúkolové zpracování (při zpracování několik úloh současně mají různé aplikace potíže)
17.5.2016
10
Souborový a databázový přístup Souborový přístup Organizace vět v souboru
položky tvoří strukturu záznamu (v aplikačním programu)
záznamy se ukládají jako věty do souboru Hodnoty atributů v jednom záznamu se nazývají položky
Omezení souborového přístupu
koncipován pro jednoúkolové zpracování
těsná vazba struktury dat na aplikační program
17.5.2016
11
Základní pojmy pro zpracování dat Entita - každý objekt, jev, událost a pod., který je pro nás ve vymezeném systému z nějakého důvodu významný a který označujeme vhodným jménem Typ entity - vymezuje množinu objektů stejného typu, charakterizovaných názvem typu a popsaných pomocí jejich vlastností – atributů Výskyt entity – individuum, jeden objekt z typu entity Atribut – významná vlastnost či souhrn významných vlastností typu entity Doména – množina hodnot, kterých může atribut nabývat Primární klíč - slouží k vzájemnému rozlišení výskytů entit stejného typu Příklad:
Typ entity - "student TU Liberec" Atributy - např. jméno, datum narození, číslo indexu, studijní obor, ročník, číslo OP, výška, znalost cizích jazyků, r.č.,… Výskyt entity - každý ze studentů TU Liberec Primární klíč - číslo OP nebo číslo indexu 17.5.2016
12
Základní pojmy pro zpracování dat datová věta - je datovým obrazem jednoho výskytu entity, obsahuje primární klíč datová položka - zobrazuje, resp. vyjadřuje hodnotu jednoho z atributů PK hodnota A1 hodnota A2 hodnota A3 ... primární klíč jednotlivé datové položky datový soubor - datový obraz všech výskytů entit stejného typu
datová základna - souhrn datových souborů v systému (ve většině informačních systémů je datově zobrazeno více typů entit) vlastní data - konkrétní udávané hodnoty jednotlivých atributů
17.5.2016
13
Souborový a databázový přístup Databázový přístup Základní princip
Koncepce oddělení dat od aplikací a svěření jejich správy do databáze
Databáze spravuje a řídí datovou základnu Jednotlivé aplikace, pokud chtějí nějaká data uložit nebo přečíst, žádají o tuto službu databázi
17.5.2016
14
Souborový a databázový přístup
Databázový přístup
Databáze
Aplikace 1
Data
Aplikace 3
17.5.2016
Aplikace 2 15
Souborový a databázový přístup Databázový přístup Požadavky na databázový systém:
sdílení dat - odstranění redundance a paralelní přístup Každý údaj je v databázi pouze jedenkrát a mohou k němu přistupovat různé aplikace; různé aplikace obecně mohou do databáze přistupovat paralelně (zároveň)
nezávislost aplikací na změnách ve fyzickém uložení dat, abstraktní pohled na data, možnost definice datových typů, centrální popis dat
Fyzické uložení dat spravuje systém řízení báze dat (SŘBD) - pro přístup k datům nabízí aplikacím a uživatelům nástroje, s jejichž pomocí mohou vyjádřit, jaká data požadují. ochrana dat před neoprávněným přístupem a poškozením Různí uživatelé mají různá přístupová práva do databáze; databáze má být schopna ochránit data i před výpadky elektřiny, poruchami různých zařízení apod. 17.5.2016
16
Souborový a databázový přístup Database Management System (DBMS) Informační systém
SŘBD
DB
DBS
DBS = SŘBD + DB SŘBD - umožňuje definovat a udržovat data v databázi mimo programy, které tato data využívají
17.5.2016
17
Souborový a databázový přístup Databázový přístup Požadavky na databázový systém:
kontrola konzistence dat Databáze má být schopna zajistit dodržování určených pravidel (tzv. integritních omezení) a zabezpečit data před případnými nehodami, které mohou vzniknout v průběhu transakcí Transakce je posloupnost manipulací s daty, která musí proběhnout celá, aby data byla uložena "správně". Např. převod z jednoho účtu na jiný účet v bance musí proběhnout jako odpovídající změny na obou účtech.
spolehlivost dat - integrity – zajištění integrity, konzistence databáze - security – autorizace, ochrana před neoprávněným přístupem
17.5.2016
18
Souborový a databázový přístup Databázový přístup Požadavky na databázový systém: perzistence dat - přetrvání dat po ukončení procesu, který s nimi pracuje - možnost znovupoužití dat v dalších procesech paralelní přístup – sdílení dat - častý přístup více uživatelů ve stejnou dobu - aktualizace menšího objemu dat - požadavky na transakční zpracování neredundance - neopakování dat (prvků dat) nezávislost - programy přistupující k datům nejsou závislé na datových úložištích 17.5.2016
19
Souborový a databázový přístup Správa dat - etapy vývoje Souborový (agendový) přístup UŽIVATEL
APLIKACE
Databázový (systémový) přístup
UŽIVATEL
UŽIVATEL
UŽIVATEL
APLIKAČNÍ PROGRAMY SŘBD
SOUBOR DAT 17.5.2016
BÁZE DAT F 20
Souborový a databázový přístup Databázový přístup Velké relační databázové systémy - firmy ORACLE, IDB2 (IBM), Progress, SYBASE - nákladné Menší (cenově dostupnější) databázové systémy - MS Access, Paradox, F ("malé" databázové systémy - dostupné zcela zdarma, př. MySQL)
jazyk SQL - standard, umožňující využívání datových zdrojů spravovaných různými databázovými systémy
Tvorba datové základny IS organizace - složitá záležitost, vyžadující péči lidí s různým odborným zaměřením. Při návrhu konceptuálního schématu datové základny se rozhoduje o tom, co v datové základně bude
17.5.2016
21
Návrh strukturované datové základny
Realita, jejímž odrazem má být navrhovaná datová základna, se skládá z různých objektů neboli entit Mezi sledovanými entitami mohou existovat různé vztahy Vztah mezi entitami stejného typu – rekurzivní vztah
Kardinalita vztahu - symbolické označení 1:1, 1:n nebo m:n 1:1 – pedagog A má manželku B 1:n – pedagog A přednáší studentům CCC m:n – studenti CCC navštěvují přednášky pedagogů DDD
17.5.2016
23
Návrh strukturované datové základny
Integritní omezení datové základny – veškerá pravidla,
vymezující přípustné hodnoty (a kombinace hodnot) atributů – přípustné hodnoty, formát zobrazení Relační model dat předpokládá existenci jednohodnotových atributů představa zobrazení formou relační tabulky, ve které odpovídá pojmu n-tice řádek a pojmu atribut sloupec
17.5.2016
24
Návrh strukturované datové základny
Relační databáze všechna data mají tvar jedné nebo více tabulek s pojmenovanými sloupci každý sloupec obsahuje data z jedné domény (tj. jednoho datového typu) prvky jednotlivých sloupců (jimž je dáno jméno a typ) se nazývají obvykle položky nebo pole a pojem řádek splývá s pojmem záznam (věta) Relacemi ve smyslu relačního modelu dat se obecně popisují jak entity, tak vztahy mezi nimi.
17.5.2016
26
Datové sklady Datový sklad (anglicky Data Warehouse, případně DWH) je zvláštní typ relační databáze, která umožňuje řešit úlohy zaměřené převážně na analytické dotazování nad rozsáhlými soubory dat. • poskytuje přehledný přístup k datům celé organizace • poskytování souhrnů – tj. statistik, přehledů vývoje, porovnání
– analytické pohledy na sumární skutečnosti různých dimenzí Odlišnosti od relační databáze Nízká proměnlivost - Data jsou do datového skladu obvykle nahrávána ve větších dávkách (například v denních nebo týdenních intervalech) a pak již nejsou nijak modifikována.
Historizace - Data jsou v datovém skladu obvykle udržována v historické podobě, nikoliv pouze v aktuálním stavu. To je dáno nutností provádění analýz zaměřených na vývoj v čase. 17.5.2016
27