Wat gaan we doen, vandaag?
Inleiding Informatiekunde I Anne-Marie Mineur
College 3, 14 november 2006
Anne-Marie Mineur
Inleiding Informatiekunde I
Wat gaan we doen, vandaag?
College 3. Databases 1
Databases Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
2
Bespreking opdracht 1 Procedure Inhoudelijk LaTeX / BibTeX Stijl
3
Toelichting opdracht 3
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.1 Wat gaan we doen, vandaag?
Databases: Historische ontwikkeling Manipulatie van databases Voorbeelden in de informatiekunde Relevante literatuur voor vandaag: Glenn Brookshear’s Computer Science, an overview: Hoofdstuk 8, Data abstractions Hoofdstuk 9, Database systems
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.2 Wat zijn databases? Definition Een database is een grote hoeveelheid data die opgeslagen zijn op een gestructureerde manier, zodanig dat er gemakkelijk in gezocht kan worden. De tegenstelling tussen een database en een platte tekst, is vergelijkbaar met het verschil tussen een Word document en een Excel-document, of tussen een lange tape met doorlopende tekst, of een archiefdoos, met verschillende kaarten.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.3 Voorbeelden In welke databases zit je zelf? Informatie Beheer Groep (IBG) ProgRESS Bankrekening / PIN-automaat Bibliotheek Ziekenhuis Gemeentelijke basisadministratie Belastingdienst ...
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.4 Geschiedenis V´ o´ or de computer hadden bedrijven een personeelsadministratie een accountantsafdeling klantendossiers archieven van oude transacties Dat betekende: veel duplicaten geen automatische kruisverwijzingen garantie van discretie
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.4 Geschiedenis (2) Risico’s: Ambigu¨ıteit Verschillende labels Verschillende betekenis Inconsistentie Afhankelijk van invoer Veranderingen kunnen de hele database be¨ınvloeden (“update propagation”) Ineffici¨entie Dubbel werk
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.5 Verschillen
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.5 Verschillen (2)
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.6 Schema’s en subschema’s
Schema: de gehele database met alle informatie Subschema: dat deel van de database waar een gebruiker toegang toe heeft → discretie
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
1.7 Manipulatie van de data
Twee vormen: 1
interactie met de gebruiker
2
manipulatie in de database → database management system (DBMS)
Voordelen: 1
Het DBMS treedt op als “front-office”
2
Data-onafhankelijke aanpak → verschillende user interfaces op ´e´en database
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Databases ID 3716PZ 24RE00 04NGHX
Naam Mark Hoogstraten Els Reerink Douwe Leerdam
Adres Thorbeckestraat 12 Hilversumseweg 142 Lingedijk 25
Sofi 149967554 692306674 147258369
Een tuple bevat alle informatie over ´e´en werknemer (horizontaal). 3716PZ Mark Hoogstraten Thorbeckestraat 12 149967554 Een attribuut bevat alle informatie in ´e´en kolom (verticaal) Adres Thorbeckestraat 12 Hilversumseweg 142 Lingedijk 25 Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Risico’s Redundantie Meerdere waarden (meerdere functies) Veranderende waarden (carri`ere) ‘Zwevende’ informatie als de chef bordkrijt met ontslag gaat, is de waarde chef bordkrijt uit het systeem verdwenen. Oplossing: relationele database
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Relationele database
Geen onderscheid tussen personen en attributen. Ook attribuut (bijvoorbeeld: ‘functieomschrijving’) wordt zelf onderwerp van een eigen reeks attributen — van een tuple. Een derde relatie koppelt personen aan attributen.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Voorbeelden WERKNEMER Werkn. ID Naam 24RE00 Els Reerink 04NGHX Douwe Leerdam BAAN Baan ID AB12 MN03
Omschrijving chef bordkrijt secretaresse
ASSIGNMENT Werkn. ID Baan ID 04NGHX AB12 04NGHX MN03
Adres Hilversumseweg 142 Lingedijk 25
Code T5 T47
Afdeling Logistiek Verkoop
Begindatum 3-1-1999 5-3-2005
Anne-Marie Mineur
Einddatum 4-3-2005 *
Inleiding Informatiekunde I
Sofi 692306674 147258369
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Relationele operaties select selecteert alle werknemers die aan een bepaald criterium voldoen (horizontaal). NIEUW ← SELECT from WERKNEMER where WerknID = "04NGHX" project selecteert alle criteria die aan een bepaald format voldoen (verticaal). LIJST ← PROJECT Naam, Adres from WERKNEMER join voegt selecties samen die aan een combinatie van criteria voldoen. COMBI ← JOIN Omschrijving AND Einddatum where Omschrijving = chef bordkrijt Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
SQL
SQL (Structured Query Language) Ontwikkeld door IBM ANSI-standaard Zeer populair, en basis voor veel db query systemen Bondig en effici¨ent
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
SQL (2)
Opdracht: Geef me alle sofi-nummers van huidige werknemers met hun afdeling. SQL-Format: select WerknID, Afd, from ASSIGNMENT, BAAN where ASSIGNMENT.WerknID = BAAN.BaanID and ASSIGNMENT.Einddatum = ’*’
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Voordelen van het relationele model
Het relationele model is intu¨ıtief; Een goed geconstrueerde (niet-redundante) relationele database is gegarandeerd consistent; Alle informatie kan worden uitgedrukt met drie operaties: select, project, join; Deze drie operaties bieden flexibele kijk op de data; Er zijn goede, declaratieve talen, bedoeld voor interactie met databases, die toegang mogelijk maken vanuit computerprogramma’s (bijvoorbeeld javascript).
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Beperkingen van het relationele model
Sommige soorten data zijn slecht te modelleren in dit soort vaste relaties. recursieve structuur bijvoorbeeld: de voorouder-relatie, de transitieve afsluiting teksten van onbepaalde lengte. Ook lastig voor de meeste database-systemen: string-operaties geografie landkaarten
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Andere database-modellen Hi¨erarchisch
weerspiegelt de hi¨erarchie in een organisatie redundantie is onvermijdelijk kleine opleving in web LDAP (Light Directory Applications)
Netwerk
omzeilt problemen met hi¨erarchische systemen complexiteit groeit snel
Logica (uitbreiding op de relationele kern) biedt oplossing voor transitieve afsluiting is nooit populair geworden Object-geori¨enteerd experts zijn enthousiast over betere integratie verlies data-onafhankelijkheid? Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Database-toepassingen in Groningen Taalkundige toepassing: taalkundige data organiseren. Achtergrond: in de eerste helft van de twintigste eeuw verzamelden taalkundigen data in corpora, grote hoeveelheden tekst. Chomsky introduceerde een meer laboratorium-achtige benadering: moedertaalsprekers vragen om hun oordeel. (Chomsky, N., Syntactic structures, Mouton, Den Haag, 1957) In 1957 was de corpus-aanpak traag en duur. Chomsky kwam dan ook met veel meer data. Tegenwoordig is de situatie compleet omgedraaid.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Taalkundige databases Wilbert Heeringa (Groningen) heeft een database van Nederlandse dialecten opgezet, mede met input van het P.J. Meertensinstituut. Op basis daarvan kan hij dialectkaarten genereren.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Historische databases George Welling (Groningen) heeft de handelsbestanden van Amsterdam van 1771–1817 gedigitaliseerd en georganiseerd (de Paalgeld bestanden). Gebruikte computationele methoden voor de organisatie van de data (database), de verificatie ervan (consistentie), en de het onderzoeken ervan (nominal record linkage) historische resultaten: Oudere schattingen van handelswaarde zijn omvergegaan door schepen te tellen en vertrekpunt te negeren Handel met de Baltische staten (“moedernegotie”) werd al in 1771 verdrukt door Amerikaanse handel (Isra¨el, De Vries) Amerikaanse scheepvaart nam Nederlandse handel over bij blokkade in Vierde Engelse Oorlog (1780-1784). Werd toen razendsnel over de hele wereld een goede tweede. Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Achtergrond: nut en noodzaak Database Management Systems (DBMS) Breder perspectief Groningse toepassingen
Architectuur-databases
Elwin Koster (Groningen) heeft stadsplattegronden gedigitaliseerd en georganiseerd. Heeft dankzij computationele methoden architecturaal werk kunnen reconstrueren waarvan de bouwtekeningen (en de gebouwen zelf) niet meer toegankelijk waren.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.1 Procedure
Bij onduidelijkheden: meld je tijdig (via e-mail, of op het spreekuur) Ook als je niet alles weet: werk met wat je wel hebt. Je wordt beoordeeld op wat je kunt weten. (Dus houd de instructies goed in de gaten.)
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.2 Inhoudelijk
De stelling waarop je moest reageren was: “Door het WWW zal de ICT veel letterenstudies nog sterker be¨ınvloeden.” Veel genoemd: e-mail electronische bibliotheken publicaties via websites
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.2 Inhoudelijk (2)
Niet of nauwelijks genoemd: specifieke ontwikkelingen in de letterenstudies. Corpusonderzoek naar taalgebruik Onderzoek naar mens-machine interactie We komen hier in volgende colleges nog op terug.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 LaTeX \documentclass[11pt]{article} \title{Opdracht 2} \author{Anne-Marie Mineur} %—————————————————————– \begin{document} \maketitle \section*{Inleiding} \section{Een kleine digitale revolutie} Ik onderschrijf de stelling die wordt geponeerd in (Netter et al. 1983), ... \section*{Conclusies} %—————————————————————– \end{document} Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 LaTeX (2)
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 BibTeX
Een hoofdbestand: LaTeX-bestand met verwijzingen (xxxx.tex) Drie hulpbestanden: Bibliografie (yyyy.bib) Bibliografie-settings (harvard.sty, jmr.bst) Resultaat: PDF- of DVI-bestand (xxxx.pdf of xxxx.dvi) met selectie uit bibliografie
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 BibTeX (2) \documentclass[11pt]{article} \usepackage{harvard} \bibliographystyle{jmr} \title{Opdracht 2} \author{Anne-Marie Mineur} %—————————————————————– \begin{document} \maketitle \section*{Inleiding} \section{Een kleine digitale revolutie} Ik onderschrijf de stelling die wordt geponeerd in \cite{Nerbonne:1993}, ... \section*{Conclusies} \bibliography{oratie} \end{document} Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 BibTeX (3)
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 BibTeX (4)
Benodigde bestanden: biboefening.tex oratie.bib harvard.sty jmr.bst Beschikbaar via de cursus-website.
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.3 LaTeX-Software
Kile Voor LaTeX kun je gebruik maken van Kile http://kile.sourceforge.net/. JabRef Voor BibTeX is er JabRef http://jabref.sourceforge.net/
Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Procedure Inhoudelijk LaTeX / BibTeX Stijl
1.4 Stijl Typefouten Leesbaarheid Passief Academisch wij Schrijftaal Superlatieven D’s en t’s Consequent zijn met de tijden Afkortingen Herhaling Meervouden Echter Opsommingen Titulatuur Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Opdracht 3 Opdracht: schrijf een betoog van 500 `a 1000 woorden over de volgende stelling. “Een simpel ascii bestand is meer dan voldoende om informatie te organiseren. Het adressenbestand van mijn hockeyclub dat ik als secretaris in een Word-tabelletje bijhoud is voldoende duidelijk. Ik kan het aan wie dan ook versturen, en ik hoef geen ingewikkelde programma’s te hebben om het te gebruiken. Databases zijn misschien modieus, maar overbodig. Doe maar gewoon.” Mail een URL van een PDF’je naar [email protected] Deadline: maandagochtend 20 november, 9.00u. Anne-Marie Mineur
Inleiding Informatiekunde I
Databases Bespreking opdracht 1 Toelichting opdracht 3
Opdracht 3 (vervolg) Inhoudelijke eisen: 1
Leg uit hoe databases werken, en gebruik dat als motivatie voor je antwoord.
2
Toon m.b.v. een voorbeeld hoe een tekstbestand tekort schiet.
LATEX-eisen: 1
Maak gebruik van het \maketitle-commando.
2
Maak gebruik van de tabular-omgeving. Zie Wilkins: http://www.maths.tcd.ie/∼dwilkins/LaTeXPrimer/.
3
Lees ook wat hij schrijft over de verbatim-omgeving.
4
Maak gebruik van diacritische tekens (¨ı, æ, ß). Zie Wilkins http://www.maths.tcd.ie/∼dwilkins/LaTeXPrimer/ TextAccents.html. Anne-Marie Mineur
Inleiding Informatiekunde I