4IT218 Databáze Třináctá přednáška
Dušan Chlapek (katedra informačních technologií, VŠE Praha)
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Program přednášek (12 přednášek) Týden
Kalendář
Program
1.
39
Cíle předmětu, základní pojmy, relační algebra.
2.
40
Databázové jazyky. SQL - Přehled norem jazyka SQL. SQL – příkaz Select. Vlastnosti relačních databázových systémů.
3.
41
SQL - dokončení manipulačních příkazů, definiční příkazy.
4.
42
Nástroje dbs ORACLE pro zadávání a ladění příkazů SQL.
5.
43
Vlastnosti relačních databázových systémů. Datové modelování – úvod.
6.
44
Datové modelování.
7.
45
Transformace datového modelu do relačních datových struktur. Normalizace dat.
8.
46
Transakční zpracování, ochrana a bezpečnost v databázovém zpracování.
9.
47
Odpadá - státní svátek
10.
48
Fyzické struktury – implementační úroveň návrhu datové základy. Optimalizace v databázových systémech.
11.
49
Fyzické struktury a optimalizace v dbs.
12.
50
Demonstrace vybraného databázového systému.
13.
51
Architektury databázového zpracování. Databázová konektivita. Další databázové modely. Trendy a kritéria hodnocení a výběru dbs.
Chlapek, D.: 4IT218 Databáze
Zkouškový příklad Dokumentace bude u zkoušky předána v tištěném i digitálním tvaru. Konzistence návrhu a realizace datové základny budou hlavním předmětem obhajoby zkouškového příkladu. Úkol 1. Stručný popis zobrazené výseče světa datovým modelem a databází, včetně popisu věcných pravidel, která budou podkladem pro definici integritních omezení. Zadání (v textovém editoru) bude obsahovat popis zahrnující: o alespoň čtyři entity (každá s alespoň třemi atributy), o alespoň jeden vztah M:N. Pozn: Text zadání se musí přesně shodovat s datovými modely (úkoly ad 2. a 3.).
Počet bodů
3
2. Datové modely a) Konceptuální schéma v notaci používané na přednáškách
5
b) Datový model (včetně popisu atributů) bude vytvořen s použitím dostupného CASE prostředku. (např. PowerDesigner CDM)
10
3. Návrh logické struktury databáze implementující datový model (relační schémata) a podrobný popis integritních omezení navržené databáze. (výstup z PowerDesigner - PDM, MS-Word)
7
4. Realizace návrhu databáze v prostředí databázového systému ORACLE, včetně zabezpečení všech ze zadání vyplývajících integritních omezení, naplnění testovacími daty - pro každou tabulku minimálně 3 řádky. K datům budou definována přístupová práva pro následující uživatele: a) uživatel STUDENT: práva pro Select, b) uživatel IT218: práva na operace Select, Insert, Update, Delete Dokumentace bude obsahovat v textovém tvaru všechny skripty (opis použitých příkazů) v členění: a) definice tabulek b) definice integritních omezení c) definice přístupových práv d) definice dalších použitých databázových objektů e) opis vložených dat
10
5. Aplikace sloužící k ověření integrity databáze. Aplikace musí umožnit prohlížet, aktualizovat (vkládat, měnit i rušit) data ve všech nadefinovaných tabulkách. Aplikace může být vytvořena v libovolném vývojovém prostředí (přístupném v počítačové síti VŠE), které přistupuje k datům uloženým v ORACLE přes standardizované rozhraní, např. ODBC. Chlapek, D.: 4IT218 Databáze
5
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Architektury databázového zpracování* Typy služeb v databázové aplikaci: • PS - prezentační služby (poskytuje je zařízení přijímající výstup / vstup - display, myš, klávesnice, ...) • PL - prezentační logika (řídí interakci uživatele s počítačem) • LA - logika aplikace (daná aplikačními programy) • LD - logika dat (operace s databází, operace I, U, D, S, integritní omezení) • DS - datové služby (akce s databází vně logiky dat, např. DDL operace, transakční zpracování) • SZS - služby zpracování souborů (služby poskytované zejména OS - práce s vnějšími paměťovými zařízení)
Chlapek, D.: 4IT218 Databáze
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 1. Centralizované zpracování Stanice <--------------------> Centrální Počítač <----------------> (PS) (PL, LA, LD, DS, SZS)
DB
Chlapek, D.: 4IT218 Databáze
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 1. Centralizované zpracování Stanice <--------------------> Centrální Počítač <----------------> (PS) (PL, LA, LD, DS, SZS) 2. Souborové servery Stanice <--------------------> (PS, PL, LA, LD, DS)
Chlapek, D.: 4IT218 Databáze
File server (SZS)
<---------------->
DB
DB
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 1. Centralizované zpracování Stanice <--------------------> Centrální Počítač <----------------> (PS) (PL, LA, LD, DS, SZS) 2. Souborové servery Stanice <--------------------> (PS, PL, LA, LD, DS) 3. Klient-server se vzdálenými daty Stanice <--------------------> (PS, PL, LA, LD)
File server (SZS)
Server (DS, SZS)
<---------------->
<---------------->
DB
DB
DB
Chlapek, D.: 4IT218 Databáze
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 4. Klient-server se vzdálenou prezentací Stanice <--------------------> Server (PS, PL) (LA, LD, DS, SZS)
Chlapek, D.: 4IT218 Databáze
<---------------->
DB
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 4. Klient-server se vzdálenou prezentací Stanice <--------------------> Server (PS, PL) (LA, LD, DS, SZS) 5. Klient-server s rozdělenou logikou Stanice <--------------------> Server PL, LA, LD) (LA, LD, DS, SZS)
<---------------->
<---------------->
DB
DB (PS,
Chlapek, D.: 4IT218 Databáze
Architektury databázového zpracování Typy služeb v databázové aplikaci: • PS - prezentační služby • PL - prezentační logika • LA - logika aplikace • LD - logika dat • DS - datové služby • SZS - služby zpracování souborů
Typy zpracování: 4. Klient-server se vzdálenou prezentací Stanice <--------------------> Server (PS, PL) (LA, LD, DS, SZS)
<---------------->
DB
<---------------->
DB
6. Klient-server se třemi vrstvami Stanice <---------> Aplikační server <----------> DB Server <----------> (PS, PL) (LA, LD) (LD, DS, SZS)
DB
5. Klient-server s rozdělenou logikou Stanice <--------------------> File server (PS, PL, LA, LD) (LA, LD, DS, SZS)
Chlapek, D.: 4IT218 Databáze
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Distribuované databázové systémy E.F.Codd: DB obsahuje data rozmístěná do dvou či více uzlů sítě, uzly sítě jsou spojeny komunikační sítí, v libovolném uzlu mohou uživatelé i programy zpracovávat data jako by byla umístěna v jedné globální DB umístěné v tomto uzlu, všechna data nacházející se v uzlu X a používaná v globální DB mohou být zpracována uživateli v uzlu X stejným způsobem jako by šlo o lokální DB izolovanou od zbytku sítě. Distribuční nezávislost Nezávislost umístění
Chlapek, D.: 4IT218 Databáze
Distribuované databázové systémy Techniky používané při distribuci dat Fragmentace (části relační tabulky jsou rozděleny do lokálních databází): horizontální fragmentace (restrikce) vertikální fragmentace (projekce) Replikace (opakovaný výskyt identické kopie tabulky v různých uzlech sítě) Alokace (kombinace ad a) a b))
2PC (Two Phase Commit) - zajištění integrity distribuované databáze, distribuovaná transakce se provede ve všech uzlech sítě, nebo v žádném. Údržba replikovaných dat - strategie řešení: současná aktualizace všech replik (kopií) - není-li jeden uzel sítě dostupný nemůže být transakce dokončena, provádění aktualizace se zpožděním - určení primární repliky, po aktualizaci primární repliky, je tento uzel DDBS zodpovědný za provedení aktualizace i na všech ostatních replikách. Chlapek, D.: 4IT218 Databáze
Distribuované databázové systémy Základní vlastnosti DDBS - C.J.Date: k uživateli se DDBS chová jako nedistribuovaná databáze, musí být zajištěna lokální autonomie, nezávislost na centrálním uzlu (rovnoprávnost uzlů), nepřetržitý provoz, nezávislost na umístění dat, nezávislost na fragmentaci dat, nezávislost na replikaci dat, zajištění optimalizace dotazu nad DDB, řízení distribuovaných transakcí (2PC), nezávislost na HW, nezávislost na OS, nezávislost na síti, nezávislost na DBS (integrace heterogenních DBS)
Chlapek, D.: 4IT218 Databáze
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Databázová konektivita = poskytnutí nástrojů pro přístup k více heterogenním datovým zdrojům z jedné aplikace Překážky: programátorské rozhraní - každý dodavatel poskytuje vlastní programátorské rozhraní, protokoly DBMS (SŘBD) - jednotliví dodavatelé DMBS používají vlastní formáty dat, komunikační metody mezi aplikací a DBMS, např. způsoby označení konce řádky, odlišné síťové protokoly DBMS
Chlapek, D.: 4IT218 Databáze
Databázová konektivita = poskytnutí nástrojů pro přístup k více heterogenním datovým zdrojům z jedné aplikace Překážky: programátorské rozhraní - každý dodavatel poskytuje vlastní programátorské rozhraní, protokol DBMS (SŘBD) - jednotliví dodavatelé DMBS používají vlastní formáty dat, komunikační metody mezi aplikací a DBMS, např. způsoby označení konce řádky, odlišné síťové protokoly DBMS Způsoby řešení databázové konektivity: native routery ( slouží pro překlad volání mezi API dvou výrobců) standardy ODBC, JDBC, ...
Chlapek, D.: 4IT218 Databáze
ODBC (Open Database Connectivity) Aplikace A pro DBS 1
Aplikace B pro DBS 1
Aplikace A pro DBS 2
Aplikace B pro DBS 2
API pro DBS 1
API pro DBS 2
síťová podpora pro DBS 1
síťová podpora pro DBS 2
Client síť síťová podpora pro DBS 1
síťová podpora pro DBS 2
DBS 1
DBS 2
Server Chlapek, D.: 4IT218 Databáze
Server API = Application Programming Interface
ODBC (Open Database Connectivity) = specifikace aplikačního programového prostředí, která standardizuje způsob přístupů aplikací k databázovým serverům různých výrobců. Umožňuje vytvářet aplikace nezávisle na konkrétním databázovém prostředí. Architektura ODBC: aplikace (požaduje spojení s datovým zdrojem, volá funkce ODBC pro provádění SQL příkazů a čtení výsledků), manažer ovladače (knihovny, umístěné mezi aplikací a ovladači, hlavním úkolem je natažení příslušných ovladačů na požádání aplikace, poskytování informací o dostupných datových zdrojích a ovladačích) ovladače ODBC (realizují ODBC volání, generují SQL požadavky - pokud je nutno překládají příkaz do dialektu příslušného DBS - na datový zdroj a vrací aplikaci výsledky) datové zdroje (data spravovaná příslušným DBS). Jednotlivé ovladače se výrazně liší funkcionalitou, rychlostí, cenou.
Chlapek, D.: 4IT218 Databáze
ODBC (Open Database Connectivity) Aplikace A pro DBS 1
Aplikace B pro DBS 1
Aplikace A pro DBS 2
Aplikace B pro DBS 2
API pro DBS 1
API pro DBS 2
síťová podpora pro DBS 1
síťová podpora pro DBS 2
Aplikace A
Aplikace B
ODBC Driver Manager
Client
ODBC Driver pro DBS 1
ODBC Driver pro DBS 2
síťová podpora pro DBS 1
síťová podpora pro DBS 2
Client síť
síť
síťová podpora pro DBS 1
síťová podpora pro DBS 2
síťová podpora pro DBS 1
síťová podpora pro DBS 2
DBS 1
DBS 2
DBS 1
DBS 2
Server Chlapek, D.: 4IT218 Databáze
Server API = Application Programming Interface
Server
Server
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Modely dat • Model dat způsob uspořádání a způsob manipulace s daty Lineární
Síťový A
A
B
C
D B
Stromový
Relační
C
D
Objektově relační
Tabulka A a
a
aaa
aaaa
aaaaa
Tabulka A
A
a
a
b b
B
C
Chlapek, D.: 4IT218 Databáze
aaa
aaaa
aaaaa
bb
bbb
bbbb
Tabulka B Tabulka B
D
bb
bbb
bbbb
bbbbb
bbbbb
Modely dat a databázové systémy • Modely dat a databázové systémy DBS budovány nad určitým modelem dat Hierarchické DBS (1967) – IMS, System M Síťové DBS (1969, 1971) – IDMS Relační (1970, 2. pol. 70. let, 80. léta) a objektově relační (90. léta) DBS – ORACLE, Informix, Sybase, MS SQL Server, Progress, DB/2, MySQL, ... Objektové DBS (90. léta) – Orion, GemStone, Ontos, Object Store
Chlapek, D.: 4IT218 Databáze
Objektově orientované DBS Dva směry vývoje: • revoluční (vznik zcela nových systémů, většinou na základě OO programovacích nástrojů) - ObjectStore (C++), Ontos (C++), Orion (LISP), GemStone (Smalltalk), • evoluční (doplňování OO principů do relačních DBS) - např. Oracle (od verze 8i) Standardizace: ODMG, ISO SQL 99 Charakteristika OODBS: • data v OODBS jsou chápána jako objekty odpovídající entitám (objektům) zachycovaného světa, • objekty zachycují data i chování (tj. funkčnost, která je v jiných typech DBS zajišťována aplikačními programy).
Chlapek, D.: 4IT218 Databáze
Objektově orientované DBS Vlastnosti: • komplexní objekty (kromě relačních tabulek i další typy objektů, např. seznamy, pole. Komplexní objekty možno navzájem skládat, mohou být hodnotou atributu nebo mohou existovat jako samostatné objekty v DB) • identita objektů (DBS zajišťuje unikání identifikaci objektu v rámci celé DB OID), • logická datová nezávislost (zapouzdření, skrývání dat + zveřejnění rozhraní, tj. hodnoty atributů nejsou přístupné přímo, ale přes definované rozhraní), • třídy a typy (možnost definice typu, resp. třídy, jako popisu společné struktury množiny objektů se stejnými vlastnostmi), • dědičnost (odvozování nových tříd z existujících, nové třídy dědí všechny atributy a chování existující třídy, vícenásobná dědičnost), • polymorfismus (schopnost operací fungovat na objektech více než jednoho typu), • rozšiřitelnost (možnost definovat nové základní typy).
Chlapek, D.: 4IT218 Databáze
Objektové DBS vs. Relační DBS Relační DBS: + silné teoretické zázemí, + vysoká míra standardizace, + robustní dotazovací jazyk, + pokročilé metody výběru dat, včetně využití služeb vestavěných optimalizátorů, + definice pravidel pro zajištění konzistence a integrity dat, + optimalizace pro práci na víceprocesorových systémech, + paralelní zpracování, + možnost vytváření transparentních distribuovaných systémů, replikační mechanismy, + pokročilé transakční zpracování (včetně 2PC) -
omezená množina podporovaných datových typů, obtížné zachycení komplexních objektů pomocí tabulek, obtížná navigace mezi objekty v SQL, omezené možnosti analytických operací s použitím SQL.
Chlapek, D.: 4IT218 Databáze
Objektové DBS: + schopnost zachycovat komplexní objekty, + zapouzdření dat s asociovanými věcnými pravidly a metodami, + dědičnost a polymorfismus, + navigace mezi objekty, + možnost vytváření nových datových typů -
nejednotné teoretické zázemí, nepropracované technologické vlastnosti DBS (transakční zpracování, paralelní zpracování, distribuované vlastnosti, zajištění konzistence a integrity dat, ...).
Typy DBS Vývoj modelů dat Síťové DBS • • •
60. léta standardizace CODASYL, DBTG (Database Task Group) IDMS
Hierarchické DBS • •
IMS (r. 1967 – projekt Apollo) Nemá standard
Relační DBS • • • • •
Robustní teorie, prof. Codd (1970) První implementace 1978 Standardizace SQL První implementace: System R, QBE, INGRES Komerční produkty: Oracle, Sybase, Informix, DB2, Progress, ...
Objektové DBS • • •
Druhá polovina 80. let De facto standard ODMG-93 komerčně nepříliš rozšířené
Chlapek, D.: 4IT218 Databáze
Typy DBS Objektově relační DBS • •
• • • •
•
90. léta kombinace vlastností OO přístupu a relační technologie pro ukládání a vyhledávání dat o obdržet maximum z předchozích rozsáhlých investic do relační technologie o využít výhody v pružnosti, produktivitě a provozních přínosech OO modelování o integrovat databázové služby do nových typů IS brány a objektové obálky (wrappers) – objektový pohled na neobjektová data (Visual Age C++ Access Builder, Object Store Gateway, Presistence, UniSQL/M, Gemstone/Gateway) rozšiřitelné DBS ( přídávání nových datových typů, nových vyhledávacích funkcí pro efektivní vyhledávání dat v souladu s jejich strukturou) univerzální servery (Oracle, Informix, DB2, Sybase) podporují o strukturálně složité objekty o i relační struktury obsahující multimediální data podpora komponentového přístupu ( o cartridges – Oracle o Data Blades – Informix o Extenders – DB2 Objektová rozšíření SQL 1999 (širší neprosazení standardu OQL)
Chlapek, D.: 4IT218 Databáze
Principy OLAP technologie Pozn.: V rámci 4IT218 se zabýváme primárně OLTP systémy. OLAP technologie podrobněji v 4IT435 Business Intelligence.
1. 2. 3. 4. 5. 6. 7. 8. 9.
Multidimenzionální koncept data a manipulace s daty Přístup k primárním datům - OLAP funguje jako mediator Dynamická manipulace s "řídkými" maticemi Zpracování nenormalizovaných dat Intuitivní operace s daty a multidimenzionálními strukturami Uložení výsledků OLAP, jejich uchování mimo zdrojová data Analytické model OLAP Volný počet dimenzí a agregačních úrovní Standardní databázové operace (výkonnost, dávkové zpracování, zpracování neurčených hodnot, multiuživatelský provoz, bezpečnost, ..) Pozn.: a) použití pro aplikace typu DSS (Decision Support System), BI (Business Intelligence, BW (Business Warehouse, DW (Data Warehouse). b) ROLAP - rozšíření relačních DBS o funkce OLAP, např. OLAP Services v MS SQL Serveru.
Chlapek, D.: 4IT218 Databáze
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Kritéria výběru DBS 1. 2. 3. 4. 5. 6. 7.
Základní funkční a technologická kritéria Výkonnost Zabezpečení a utajení dat Rozšířenost Podpora ze strany dodavatele Cena Další rozvoj
Rozšířenost robustních DBS
Rozšířenost Open Source DBS
Oracle IBM (DB2, Informix) Microsoft (MS SQL Server) Teradata Sybase
MySQL (přes 70%) PostgreSQL Firebird Ingres
Budeme ještě vybírat DBS? Nebudou pouze součástí poskytované služby IS/ICT? Chlapek, D.: 4IT218 Databáze
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Trendy DBS Web a internet, umožňující uložit a zpřístupňovat informace v jednom rozsáhlém „globálním informačním systému“ • •
•
zpřístupnění dat novým způsobem (portály, dynamické webové stránky) e-comerce (sdílení obchodních informací, udržování obchodních vztahů a řízení obchodních transakcí pomocí telekomunikační sítě) o B2B o B2C Personalizace dat
Stále nová aplikační prostředí vyžadující integrovat data a programy • • •
Rozvoj OR DBS Zahnízděné databáze v aplikačních programech (Progress) Rozšíření databázových serverů o aplikační služby
Pokroky v HW • • •
Velikost vnitřní paměti umožňuje umístit tabulky a objekty do vnitřní paměti a radikálně mění vyhodnocování dotazů a jejich optimalizaci Možnost současné práce až desetitisíců uživatelů – nároky na škálovatelnost DBS a dostupnost dat Zvyšování počtů transakcí – milióny transakcí za minutu
Velikost databází • •
Dosavadní velikost databází v GB a TB S rozvojem nových typů aplikací (multimediální data, archivy, lidský genom, ..) zvětšení do řádů petabajtů, exabajtů a zetabajtů (10*21)
Heterogennost databází •
Přístup k více informačním zdrojům, které se vyvíjely samostatně a jsou nyní dostupné prostřednictvím internetu pro uživatele
Chlapek, D.: 4IT218 Databáze
Trendy DBS SŘBD typu „Plug and Play“ • •
Zlepšení administrace DBS „auto“ ladění DBS na základě „zkušeností“
Federace milionů databázových systémů • • • •
volný přístup k integraci – obdoba politických systémů neexistuje centrální řídící autorita, komponenty federace žijí autonomně, přesto jsou schopny se chovat jako vyšší celek řízení globálních transakcí a globální integrity různé typy federací – nejvolnější založené na schématech importu a exportu: o privátní schéma o exportní schéma (data ke kterým mohou přistupovat jiné systémy) o importní schéma (data přijímaná od jiných systémů)
Přehodnocení tradičních databázových architektur • • •
mobilní databáze paralelismy databáze ve vnitřní paměti
Unifikace procesů a dat v DBS •
zahrnutí aplikační logiky do databází (např. propojení triggerů s pracovními toky – workflows)
Integrace strukturovaných a semistrukturovaných dat • • • • •
výměna různorodých dat (např. dat ze systémů GIS, systémů pro návrh CAD, strukturovaných dat) využití XML datové sklady (pumpování dat z OLTP databází, jejích čištění a uložení do speciálních – OLAP datbází) požadavek integrovat netriviální objekty (text, audio, video, ..) nové typy dotazů (např. nelezení souseda v určitém prostoru, nalezení podobného dokumentu atd.)
Chlapek, D.: 4IT218 Databáze
Trendy DBS Nepřesné dotazování • • •
•
•
v internetu jediné možné integrace dosud oddělených technologií • strukturované databáze založené na databázovém modelu • textové databáze založené na modelech textu (Booleovské, vektorové, ..) rozvoj univerzálních serverů přináší potřebu Booleovského přístupu • zadání dotazu pomocí množiny termů a logických spojek • odlišnost od přístupu SQL – výsledky dotazu (hity) pouze obsahují dané termy. Přístup je zatížen jistou nepřesností oproti dotazu v SQL, kde data získáme v logické souvislosti dané klauzulí WHERE. Míry relevance odpovědi o Koeficient přesnosti (podíl počtu vybraných relevantních ku počtu všech vybraných objektů) o Koeficient úplnosti (podíl počtu vybraných relevantních ku počtu všech relevantních objektů v informačním zdroji) Současné technologie dostupné na webu poskytují vyhledávání s nízkým koeficientem přesnosti při poměrně vysokém koeficientu úplnosti
Chlapek, D.: 4IT218 Databáze
Trendy DBS Další rozvoj OR SŘBD • •
Uživatelsky definované typy a funkce umožňující zpracování multimediálních dat Integrace semistrukturovaných dat na bázi XML
Vznik nových typů databázových systémů • •
které budou obsahovat přímo semistrukturovaná data ve formátu XML – databázové systémy řízené obsahem (Content Management Systems) umožnění manipulací fragmentů textu, řízení verzí, publikace, oddělení obsahu a stylu, integraci se strukturovanými daty atd.
Integrace v prostředí internetu • •
soustředění na vyhledávací systémy zprostředkující dotazovací systémy (Mediated Query Systems) - rozdělení do tří vrstev o nejnižší – datové zdroje (legacy systems, databáze, aplikace produkující data) o střední – integrační (sw pro transformace, integraci či přidání hodnoty) o nejvyšší – uživatelské rozhraní o datové zdroje jsou začleněny do systému pomocí obálek, které exportují funkcionalitu a data způsobem, který zdroje unifikuje o obálky jsou implementovány na základě dotazovacích možností zdrojů (SQL, fulltextové vyhledávání, dotazovací jazyk nad XML apod) o součástí architektury jsou ontologie, tj. organizované množiny pojmů, prostřednictvím kterých se uživatel může domluvit s databází speciální případ metadat
Digitální knihovny • • •
analogie klasické knihovny kolekce informačních zdrojů na různých médiích, které nemusí být nutně propojeny DLI (Digital Library Initiative) založená NSF, DARPA, NASA
Chlapek, D.: 4IT218 Databáze
Navazující předměty 4IT340 Správa databázového systému Oracle (standardní i mezisemestrální forma) 4IT219 Object-relational databases (mezisemestrální forma) 4IT435 Business Intelligence (standardní forma)
Chlapek, D.: 4IT218 Databáze
MEZISEMESTRÁLNÍ KURZ OBJECT-RELATIONAL DATABASES 4IT219 Objectives: 1. 2. 3. 4. 5.
To To To To To
appreciate the need for object-relational databases understand the main principles of object-relational databases gain working knowledge of object-relational features of Oracle DBMS understand object-relational databases design issues and tradeoffs appreciate the challenges of managing semi-structured XML data
Topics: 1. 2. 3. 4. 5. 6. 8. 9.
Introduction - changing requirements for data management Review of basic relational database principles Overview of object-oriented principles - ODMG model and OODBMS Object-relational databases: main principles, key features of SQL:2003 SQL:2003: LOBs, UDTs, OIDs, REFs, Arrays, Multisets, Oracle 11g: Nested Tables,Object Views, Subtyping, PL/SQL Object-relational design and implementation techniques Management of semistructured and multi-media data
The course covers advanced database concepts focusing on the management of complex data objects using object-relational techniques based on the SQL:2003 standard. The subject contains a practical laboratory component using Oracle11g.
Course Presenter: The course will be presented by Dr. George Feuerlicht, who lectures on database and enterprise computing topics at the University of Technology, Sydney, Australia and at the Prague University of Economics. He has presented seminars and professional development courses in Australia, USA, Europe and Asia. Dr. George Feuerlicht is the author of more than 70 journal and conference publications. The course materials and presentation will be in English; additional explanation is possible in Czech.
Dates: Lectures: Examination:
14 – 20 January, 2010 25 – 29 January, 2010
Course enrolments:
via ISIS
4IT218 Databáze Třináctá přednáška • Architektury databázového zpracování. • Distribuované DBS • Databázová konektivita • Další databázové modely. • Kritéria hodnocení a výběru dbs. • Trendy v DBS • Zkouškové otázky
Zkouškové otázky 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25.
Uveďte přednosti a nároky databázové koncepce datové základny ve srovnání se souborovou datovou základnou? Jaké další kroky budou následovat po vytvoření konceptuálního schéma dat při realizaci datové základny v prostředí relačního databázového systému? Rozeberte možnosti využití řetězení dat pro realizaci struktury dat. Jaké možnosti ochrany a zabezpečení dat poskytují databázové systémy. Uveďte přehled (obecných) možností fyzické realizace přístupových cest k uloženým datům. Jaké jsou funkce a přínosy použití katalogu (slovníku) dat v databázových systémech? Uveďte kritéria pro porovnání databázových systémů? Uveďte na příkladech dvou vám známých databázových systémů. Vysvětlete podstatu a důvody oddělení návrhu datové základny na konceptuální a implementační úrovni. Vysvětlete podstatu převodu konceptuálního schéma datové základny do implementačního (realizačního) prostředí? Jaké jsou z hlediska datové základny možnosti řešení problému nepřiměřeně dlouhé doby odezvy. Vysvětlete příčiny, důsledky a možnosti řešení redundance v datech. Uveďte, jak se liší popis dat v souborové koncepci datové základy oproti databázové koncepci. Vysvětlete princip a možnosti využití indexování. Rozeberte a vysvětlete základní možnosti (způsoby) fyzické realizace dat. Blíže charakterizujte nějaký Vám známý databázový systém. Nastiňte podstatu relačního modelu. Charakterizujte relační databáze. Vysvětlete rozdíly mezi databázovými systémy založenými na různých datových modelech (stromovém, síťovém, relačním, objektovém)? Jaké zásady (doporučení) je dobré uplatňovat při návrhu a provozu datové základny a proč? Charakterizujte databázové jazyky. Uveďte příklady. Charakterizujte vlastnosti a vývoj jazyka SQL. Vysvětlete pojem klient/server. Popište základní pojmy a principy spojené s distribucí dat a distribuovanými databázovými systémy. Charakterizujte transakční zpracování dat. Popište problémy a způsoby jejich řešení. Charakterizujte objektové databázové systémy. Proveďte jejich srovnání s relačními dbs. Co znamená a jakým způsobem je řešena problematika optimalizace v databázových systémech?
Chlapek, D.: 4IT218 Databáze
Program přednášek (12 přednášek) Týden
Kalendář
Program
1.
39
Cíle předmětu, základní pojmy, relační algebra.
2.
40
Databázové jazyky. SQL - Přehled norem jazyka SQL. SQL – příkaz Select. Vlastnosti relačních databázových systémů.
3.
41
SQL - dokončení manipulačních příkazů, definiční příkazy.
4.
42
Nástroje dbs ORACLE pro zadávání a ladění příkazů SQL.
5.
43
Vlastnosti relačních databázových systémů. Datové modelování – úvod.
6.
44
Datové modelování.
7.
45
Transformace datového modelu do relačních datových struktur. Normalizace dat.
8.
46
Transakční zpracování, ochrana a bezpečnost v databázovém zpracování.
9.
47
Odpadá - státní svátek
10.
48
Fyzické struktury – implementační úroveň návrhu datové základy. Optimalizace v databázových systémech.
11.
49
Fyzické struktury a optimalizace v dbs.
12.
50
Demonstrace vybraného databázového systému.
13.
51
Architektury databázového zpracování. Databázová konektivita. Další databázové modely. Trendy a kritéria hodnocení a výběru dbs.
Chlapek, D.: 4IT218 Databáze