ˇ systémy Databázové a informacní
Databázové a informaˇcní systémy Michal Krátký, Miroslav Beneš Katedra informatiky VŠB–Technická univerzita Ostrava
5.12.2005
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
1/24
ˇ systémy Databázové a informacní
Obsah
Databázové technologie – datové modely, dotazovací jazyky. Informaˇcní systémy – IS v prostˇredí internetu, architektura, datová vrstva. Dokumentografické informaˇcní systémy. Geografické informaˇcní systémy. Metody analýzy dat. Základy algoritmizace.
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
2/24
ˇ systémy Databázové a informacní
Databázové technologie
Jak ukládat a efektivneˇ zpracovávat rozsáhlé soubory dat? Typy databázových systému, ˚ datové modely, dotazovací jazyky, hlavní pˇredstavitelé na trhu. ˇ Moderní datové modely - objektove-orientovaný datový model, XML datový model.
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
3/24
ˇ systémy Databázové a informacní
Co je to databáze?
Soubor informací existujících po dlouhou dobu, cˇ asto mnoho let. ˇ Správu databáze zajišt’uje SRBD (systém ˇrízení báze dat, databázový systém). Perzistence - dlouhodobé bezpeˇcné uložení velkého objemu informací. Programátorské rozhraní – dotazovací jazyky. Správa transakcí – souˇcasný pˇrístup mnoha procesu˚ k datum. ˚ Distribuované báze dat.
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
4/24
ˇ systémy Databázové a informacní
Agendové zpracování dat
Agendové zpracování dat Samostatné programy pro každou agendu. Vlastní formáty dat. Naˇctení dat – zpracování – uložení dat. Obtížná spolupráce aplikací. Nutnost vyˇclenit správu perzistentních dat. ˇ => systémy pro ˇrízení báze dat (SRBD).
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
5/24
ˇ systémy Databázové a informacní
Databázové systémy
První databázové systémy Konec 60. let 20. století – první komerˇcní systémy Rezervaˇcní systémy aerolinií Bankovní systémy Firemní systémy
Ruzné ˚ datové modely Hierarchický model Sít’ový model Relaˇcní model ˇ Objektove-orientovaný model XML model
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
6/24
ˇ systémy Databázové a informacní
Relaˇcní datový model
Data jsou organizována jako tabulky reprezentující relace. Def.: relace = podmnožina kartézského souˇcinu Osoba: login, jméno, pˇríjmení, datum narození String × String × String × Date Primární klíˇc. login dan001 wal001
2005
name Jack Johnny
Michal Krátký, Miroslav Beneš
surname Daniels Walker
birth 23.1. 1957 10.8. 1979
ˇ systémy Databázové a informacní
7/24
ˇ systémy Databázové a informacní
Organizace dat - motivace
ˇ ˇ Mejme 107 záznamu˚ (data obˇcanu˚ CR). Hledáme záznam dle ˇ Pokud by porovnání jednoho záznamu trvalo 10 ms, pak RC. vyhledání (sekvenˇcním pruchodem ˚ – n/2 porovnání) ˇ eˇ 13,9 h. pˇríslušného záznamu bude trvat prum ˚ ern Je tedy nutné hledat algoritmy a datové struktury, které ˇ efektivní vyhledávání (Základy algortitmizace). umožnují
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
8/24
ˇ systémy Databázové a informacní
Organizace dat
Sekvenˇcní pˇrístup Postupný pruchod ˚ všemi záznamy v tabulce ˇ Pevná / promenná délka záznamu
Indexové soubory – v další datové struktuˇre jsou záznamy uspoˇrádány dle hodnot indexovaného atributu. Stromové datové struktury – B-strom. Hashování.
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
9/24
ˇ systémy Databázové a informacní
Dotazovací jazyky
Definice struktury databáze. Vytvoˇrení databáze, tabulky, indexu.
Manipulace s databází Vkládání nových záznamu. ˚ Aktualizace existujících záznamu. ˚ Rušení záznamu. ˚
ˇ dat z databáze Výber ˇ ˇrádku˚ a sloupcu˚ tabulky podle zadaných podmínek, Výber ˇ z více tabulek – spojení tabulek. výber
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
10/24
ˇ systémy Databázové a informacní
Dotazovací jazyky
Structured Query Language (SQL) Standardizovaný dotazovací a manipulaˇcní jazyk pro relaˇcní databáze (ANSI SQL-92). ˇ Rozšíˇrení SQL-99 s objektove-relaˇ cními prvky. Využívá se i pro komunikaci s databázovými servery. Rozhraní ODBC, JDBC, ADO .NET.
Query by Example (QBE) - dotaz pˇríkladem – pro ˇ tvorby dotazu. usnadnení ˚
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
11/24
ˇ systémy Databázové a informacní
Jazyk SQL 1/2
SELECT
FROM WHERE <podmínka> ORDER BY <podle ˇ ceho seˇ radit> SELECT login,jmeno,prijmeni FROM osoba WHERE prijmeni LIKE "Novák" ORDER BY prijmeni,jmeno
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
12/24
ˇ systémy Databázové a informacní
Jazyk SQL 2/2
INSERT INTO osoba VALUES (‘bec022’, ‘Jan’, ‘Becher’, ’1980-01-20’) UPDATE osoba SET jmeno=‘Jeník’ WHERE login=‘wal001’ DELETE FROM osoba WHERE login=‘dan001’
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
13/24
ˇ systémy Databázové a informacní
ˇ Objektove-orientovaný datový model ˇ Bolestivý pˇrechod od RSRBD - není pˇríliš rozšíˇren. ˇ ˇ cila kombinace V existujících SRBD se ale velmi osvedˇ ˇ relaˇcního a oo datové modelu – objektove-relaˇ cní datový model. CREATE OR REPLACE TYPE TAddress AS OBJECT ( street VARCHAR2(30), ... ); CREATE OR REPLACE TYPE TPerson AS OBJECT ( login VARCHAR2(6), fname VARCHAR2(20), sname VARCHAR2(20), address TAddress, ... ) NOT FINAL NOT INSTANTIABLE; 2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
14/24
ˇ systémy Databázové a informacní
XML datový model
The Two Towers J.R.R. Tolkien The Return of the King J.R.R. Tolkien ..
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
15/24
ˇ systémy Databázové a informacní
XML datový model
0 books (0)
book 1 (1)
id
00304312 (3)
2 (2)
title
3 (4)
The Two Towers (5)
author
J.R.R. Tolkien (7)
4 (6)
id
00100863 (8)
book
5 (1)
title
7 (4)
6 (2)
The Return of the King (9)
author
J.R.R. Tolkien (7)
8 (6)
id
04500012 (10)
10 (2)
book
9 (1)
title
11 12 author (4) (6)
Catch 22 (11)
Joseph Heller (12)
XPath dotaz: /books/book[author="Joseph Heller"]/title
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
16/24
ˇ systémy Databázové a informacní
Pˇríklady databázových systému˚
Volneˇ dostupné MySQL, PostgreSQL MSDE
Komerˇcní DBase, Access, FoxPro Oracle, IBM DB2, MS SQL Server, Sybase
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
17/24
ˇ systémy Databázové a informacní
Informaˇcní systém - Tvorba informaˇcních systému˚
Automatizovaný systém zahrnující osoby, stroje a metody organizované tak, aby umožnily uchovávat, pracovávat, pˇrenášet a šíˇrit data reprezentující informace. Pˇríklady Podnikové informaˇcní systémy Fakultní IS „KatIS“
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
18/24
ˇ systémy Databázové a informacní
Informaˇcní systémy v prostˇredí Internetu
Datová vrstva - pˇrístup k datum ˚ nezávislý na konkrétním databázovém systému. Rozhraní ODBC, JDBC + jazyk SQL. 2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
19/24
ˇ systémy Databázové a informacní
Datové sklady – Metody analýzy dat
Kopie velkých objemu˚ dat Pˇr.: údaje o prodeji výrobku˚ v hypermarketu, záznamy o platební historii klienta v bance
Vyhledávání vzoru˚ nebo trendu˚ duležitých ˚ pro organizaci (data mining) Pˇr.: závislosti mezi nákupy ruzných ˚ typu˚ výrobku˚
OLAP (On-line Analytic Processing) „datové krychle“ – speciální datové struktury
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
20/24
ˇ systémy Databázové a informacní
Dokumentografické informaˇcní systémy
ˇ reny na zpracování rozsáhlých kolekcí dokumentu˚ Zameˇ Pˇr.: Záznamy z jednání Parlamentu, sbírka zákonu, ˚ informace na Internetu (Google, . . . )
Základní problémy: Efektivní ukládání dokumentu˚ Komprese dat
Efektivní vyhledávání Podle klíˇcových slov Podle podobnosti dokumentu˚
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
21/24
ˇ systémy Databázové a informacní
Dokumentografické informaˇcní systémy
Booleovský model - termy dokumentu˚ jsou indexovány napˇr. B-stromem. Vektorový model - dokument je chápán jako vektor v ˇ n-rozmerném prostoru. Velký objem dat – 109 dokumentu, ˚ 106 termu. ˚
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
22/24
ˇ systémy Databázové a informacní
Geografické informaˇcní systémy
ˇ reny na zpracování Zameˇ ˇ prostorových informací (napˇr. parcely na katastrální mape), popisných informací (napˇr. majitel parcely, typ pozemku, cena, . . . )
Základní problémy: Ukládání dat – datové modely (vektory, rastr). Indexovací datové struktury - Kvadrantové stromy, R-stromy. Vyhledávání – speciální operátory, SpatialSQL
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
23/24
ˇ systémy Databázové a informacní
Studijní program „Informaˇcní technologie“
Základy algoritmizace – 1. r. LS Teorie zpracování dat – 2. r. LS Databázové a informaˇcní systémy – 3. r. ZS Tvorba informaˇcních systému˚ – 3. r. LS Dokumentografické informaˇcní systémy Metody analýzy dat Geografické informaˇcní systémy
2005
Michal Krátký, Miroslav Beneš
ˇ systémy Databázové a informacní
24/24