základní informace • předměty: – KI/DSY (B1801 Informatika - dvouoborová) – KI/P502 (B1802 Aplikovaná informatika)
Databázové systémy
• ukončení: – Zápočet + Zkouška / 5kb
Úvodní přednáška
• ki.ujep.cz – termínovník, e-nástěnka • literatura – stag.ujep.cz • Prohlížení -> Předměty
• KI/ADS – podmiňující předmět • e-mail:
[email protected] 2
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
Obsah přednášky • • • • • • •
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
Databázové systémy
pojem „Databáze“ základní pojmy historický vývoj DBS úrovně DBS datové modely struktura DBS typy DBS
• dříve - informace uchovávány v papírové podobě v kartotékách a registrech • dnes – informace uchovávány v elektronické podobě v databázích Databáze = elektronická podoba kartotéky nebo registru.
– předrelační, relační, postrelační – operační, analytické 3
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
4
Mgr. Květuše Sýkorová
Základní pojmy
Základní pojmy • atribut = charakteristická vlastnost objektu
• DBS = databázový systém
– např. jméno, název, destinace, město
– systém uchovávající a spravující určité informace o různých reálných objektech.
• záznam = všechny vlastnosti příslušející jednomu objektu
• objekt = reálný existující člověk, předmět, místo, událost nebo pojem
– např. student Jan Novák, narozen 18.5.1974
• hodnota = konkrétní vlastnost objektu
– např. student, kniha, zájezd, faktura
– např. „Jan“, „Fimfárum“, „Podhajská“, „Kolín“
5
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
KI PřF UJEP Ústí nad Labem
6
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
1
Základní pojmy
číslo objednávky datum objednávky 10456 12.8.2005 10456 12.8.2005 10456 12.8.2005 10457 12.8.2005 10457 12.8.2005 10458 12.8.2005 10458 12.8.2005 10458 12.8.2005 10458 12.8.2005 10459 13.8.2005 10459 13.8.2005 10459 13.8.2005 10460 13.8.2005 10461 13.8.2005 10461 13.8.2005 10462 14.8.2005 10462 14.8.2005 10462 14.8.2005 10462 14.8.2005 10463 14.8.2005 10463 14.8.2005 10463 14.8.2005 10463 14.8.2005
• redundance dat = nadbytečný výskyt stejných hodnot – minimalizace redundantních dat v DBS
• integrita dat = všechna související data musí odpovídat existujícímu objektu – nutná redundance dat v DBS – např. student studuje existující obor
jméno zaměstnance zaměstnán od Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Emil Král 15.3.2005 Emil Král 15.3.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Václav Nový 25.5.2005 Václav Nový 25.5.2005 Václav Nový 25.5.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Jan Novák 1.2.2005 Emil Král 15.3.2005 Emil Král 15.3.2005 Emil Král 15.3.2005 Emil Král 15.3.2005
název výrobku cena výrobku Funghi 105 Kč Hawai 127 Kč Insalata Belucci 125 Kč Fausto 115 Kč Carpaccio 155 Kč Insalata Caesar 128 Kč Rustica 159 Kč Carpaccio 155 Kč Hawai 127 Kč Quatro formaggi 157 Kč Insalata Belucci 125 Kč Insalata Greca 109 Kč Trapolla 145 Kč Carpaccio 155 Kč Funghi 105 Kč Hawai 127 Kč Fausto 115 Kč Insalata Greca 109 Kč Insalata Caesar 128 Kč Fausto 115 Kč Trapolla 145 Kč Quatro formaggi 157 Kč Rustica 159 Kč
7
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
8
Mgr. Květuše Sýkorová
Historie zpracování dat
Historie zpracování dat 50. léta
60. léta aplikace
systém
• systém pro zpracování souborů
• aplikace obsahovala vše – data – datové typy (struktura dat) – algoritmy pro manipulaci s daty
KI PřF UJEP Ústí nad Labem
algoritmy data
– datové typy (struktura dat) – algoritmy pro manipulaci s daty
typy
• externí soubory dat
algoritmy typy
soubor data
9
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
Historie zpracování dat
10
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
Historie zpracování dat
nevýhody:
60. léta - konec SŘBD
• • • •
obtížná změna struktury dat velká redundance dat problémy se zajištěním integrity dat problémy s bezpečností dat – omezení přístupu uživatelů • přístup k datům značně omezen sekvenčním vyhledáváním
• systém řízení báze dat – algoritmy pro manipulaci s daty
algoritmy
• databáze dat – datové typy (struktura dat) – data
databáze data typy
11
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
12
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
2
úrovně DBS
Datové modely
= způsob pohledu na data v databázi
= způsob uložení dat v databázi • • • •
hierarchický síťový relační objektový
historický vývoj
• fyzická (interní) – způsob fyzického uložení dat na disku • konceptuální – popis struktury databáze (tabulek) – popis vztahů mezi uloženými daty • externí – popis dat z pohledu uživatele, tj. uživatelské prostředí (formuláře, sestavy, …) 13
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
14
Mgr. Květuše Sýkorová
Datové modely
KI PřF UJEP Ústí nad Labem
Datové modely
hierarchický:
hierarchický: záznamy organizovány ve stromové struktuře UJEP
PF
katedra matemat.
rektorát
katedra psychol.
úřad kvestora
Výhody: • řeší snadno a rychle vztahy 1:N • nezáleží na fyzické struktuře dat
PřF
katedra chemie
katedra fyziky
Nevýhody: • problémy při řešení vztahů M:N • problémy při změně struktury dat 15
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
16
Mgr. Květuše Sýkorová
Datové modely
KI PřF UJEP Ústí nad Labem
Datové modely
síťový:
síťový: data reprezentována kolekcemi záznamů a vztahů mezi nimi
katedra matemat.
zaměstnan ec 1
katedra chemie
zaměstnan ec 2
katedra fyziky
zaměstnan ec 3
zaměstnan ec 4
Výhody: • řeší snadno a rychle vztahy 1:N i M:N • nezáleží na fyzické struktuře dat • rychlé vyhledávání Nevýhody: • problémy při změně struktury dat
17
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
18
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
3
Datové modely
Datové modely číslo objednávky název výrobku 10456 003 10456 004 10456 101 10457 002 10457 001 10458 102 10458 006 10458 001 10458 004 10459 005 10459 101 10459 103 10460 007 10461 001 10461 003 10462 004 10462 002 10462 103 10462 102 10463 002 10463 007 10463 005 10463 006
relační: • RDBS = relační databázový systém – informace o jednom typu objektu jsou uchovávány v tabulkách s určitou strukturou. – tabulky jsou navzájem provázány relacemi – relace usnadňují vyhledávání různých informací uložených v těchto tabulkách.
• v současnosti nejpoužívanější model
19
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
záznamy
jméno zaměstnance zaměstnán od Jan Novák 1.2.2005 Emil Král 15.3.2005 Václav Nový 25.5.2005
název výrobku cena výrobku Carpaccio 155 Kč Fausto 115 Kč Funghi 105 Kč Hawai 127 Kč Quatro formaggi 157 Kč Rustica 159 Kč Trapolla 145 Kč Insalata Belucci 125 Kč Insalata Caesar 128 Kč Insalata Greca 109 Kč
číslo objednávky datum objednávky id zaměstnance 10456 12.8.2005 01 10457 12.8.2005 02 10458 12.8.2005 01 10459 13.8.2005 01 10460 13.8.2005 03 10461 13.8.2005 03 10462 14.8.2005 01 10463 14.8.2005 02
objektový: • vychází z principů objektově orientovaného přístupu • objekt = datová struktura definovaná jako třída s určitými vlastnostmi a metodami • komunikace mezi objekty probíhá pomocí zpráv
název výrobku cena výrobku Carpaccio 155 Kč Fausto 115 Kč Funghi 105 Kč Hawai 127 Kč Quatro formaggi 157 Kč Rustica 159 Kč Trapolla 145 Kč Insalata Belucci 125 Kč Insalata Caesar 128 Kč Insalata Greca 109 Kč
Výhody: • nejen statické, ale i dynamické chování objektů • možné vytváření složitějších objektů • snadnější zadávání dotazů 21
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
22
Mgr. Květuše Sýkorová
typy DBS
KI PřF UJEP Ústí nad Labem
typy DBS
1. Předrelační:
2. Relační:
• hierarchické – nebyl pro něj určen žádný standard – nejznámější DBS je IMS (Information Management Systém) od firmy IBM • síťové – standardizován roku 1972 výborem DBTG – nejznámější DBS je IDMS (Integrated Database Management Systém) používající programovací jazyk Cobol
• RDBMS = Relational Database Management System – poprvé popsal E.F.Codd v r.1970 – základem je matematický aparát relační algebry v kombinaci s predikátovou logikou – vyhovují běžným databázovým požadavkům – nejznámější DBS jsou MS Access, MySQL, Oracle, MS SQL server, a další.
23
Mgr. Květuše Sýkorová
20
KI PřF UJEP Ústí nad Labem
Datové modely
atributy
id výrobku 001 002 003 004 005 006 007 101 102 103
id výrobku 001 002 003 004 005 006 007 101 102 103
id zaměstnance 01 02 03
Mgr. Květuše Sýkorová
Datové modely relační tabulka:
relační:
KI PřF UJEP Ústí nad Labem
24
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
4
typy DBS
Struktura DBS
3. Postrelační:
databázový systém je tvořen:
• objektové (ODBMS) = Objective Database Management System – využívají základní rysy OOP – dosud ve vývoji, méně výkonné než relační – nejznámější DBS je ObjectStore, GemStone, Versant, Caché, … • objektově relační (ORDBMS) – kombinují výhody objektové a relační DBS – nejznámější DBS je PostgreSQL.
• databáze – fyzicky uložená data ve struktuře datového modelu • SŘBD – rozhraní mezi uloženými daty a aplikačními programy – využívají pro komunikaci dotazovací jazyk (SQL) • aplikační programy – nabízejí uživatelsky přívětivé prostředí – generují dotazy a vypisují jejich výsledky • uživatelé
25
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
26
Mgr. Květuše Sýkorová
Struktura DBS
KI PřF UJEP Ústí nad Labem
uživatelé DBS • administrátor databáze
aplikace
aplikace 1
aplikace 2
– zajišťuje centrální kontrolu nad daty a programy – plní rozhodnutí správce dat – definuje databázové schéma, navrhuje strukturu, přiděluje práva
• aplikační programátoři
předkompilátor DML
SŘBD
– vytvářejí aplikační programy s využitím databázového dotazovacího jazyka (nejčastěji SQL) vloženého do hostitelského jazyka (např. PHP, Object Pascal, C++ atd.).
překladač DDL řízení databáze
• znalí uživatelé – nevytvářejí programy – formulují požadavky v databázovém dotazovacím jazyce
databáze
datové soubory
• běžní uživatelé
slovník
– komunikují se systémem prostřednictvím aplikačního programu 27
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
28
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
typy DBS • operační (OLTP) – slouží pro každodenní úpravu a přidávání dat – data jsou dynamického typu, tj. neustále se mění a jsou vždy aktuální – např. nabídka obchodů, nemocnice, nakladatelství
• analytické (OLAP) – slouží pro ukládání historicky a časově závislých dat – vhodné pro sledování trendů a dlouhodobých prognóz – data jsou statického typu, tj. nikdy se nemění a nejsou aktuální – např. geologické společnosti, chemické laboratoře 29
Mgr. Květuše Sýkorová
KI PřF UJEP Ústí nad Labem
5