Resource Description Framework (RDF)
Probléma a Web-es kereséssel Szemantika hiánya
Jelentés helyett szöveges alakkal dolgozunk Függ az információ reprezentációjától Nyelvi korlátok Képekhez, hangokhoz semmilyen jelentést nem tudunk társítani Nem tudunk következtetni (szinonimák, taxonómiák)
Szemantika megragadása Kézi indexelés
Katalógust készítünk (YAHOO) Ember szolgáltatja a szemantikát Garantált minőség ☺ Lassú Melléktémák kimaradnak Következtetés továbbra is hiányzik
Szemantika megragadása Helyezzünk el metainformációt a Weben!
Információ, mely információról szól link egy másik oldalról, szerző neve, stb.
Jelenleg a metainformáció is heterogén A különféle formátumú adatforrásaink
számára tegyük lehetővé, hogy metaadatot szolgáltassanak magukról
A metaadat legyen egységes, strukturált Géppel fel tudjuk dolgozni
Szemantikus Világháló Célkitűzés:
Oldalakhoz metainformáció társítása Következtetéshez szükséges háttértudás leírása
Mindezeket egységesen és automatikusan
feldolgozható módon
Metainformáció társítása Tetszőleges webes erőforrás Tetszőleges mondanivaló Nagyon általános keretrendszer kell RDF: Resource Description Framework
RDF RDF segítségével erőforrásokról tehetünk
kijelentéseket
Erőforrás bármi lehet Lényeg, hogy egyértelműen azonosítható legyen A számítógép nem erőforrás, de az én számítógépem már az
Erőforrások Erőforrásokra egyértelmű azonosítóval
hivatkozunk (például URL) Általánosabb: Universal Resource Identifier (URI)
http://www.cs.uwyo.edu/index.html mailto:
[email protected] file:///c:/examples/cat.rdf uuid:BDC6E3F0-6DA3-11d1-A2A300AA00C1C14882
URI Abszolút URI: egyértelműen azonosít Relatív URI: adott környezetben azonosít,
azon kívül csak egy bázis URI-val együtt
Bázis segítségével feloldjuk a relatív URI-t és abszolút URI-t kapunk Komplex honlap részei könnyen tudnak egymásra hivatkozni
URI Ugyanarról az erőforrásról több különböző
helyen is tehetünk kijelentéseket Bárki bármit mondhat – csak a megfelelő URI kell hozzá Más helyről származó információtöredékek kombinálhatóak
RDF Erőforrások kapcsolatrendszerét tudjuk
leírni Általános séma:
(Erőforrás1, Kapcsolat, Erőforrás2) (www.cs.bme.hu, tulajdonosa, SZIT) (SZIT, típusa, Tanszék) (SZIT, vezetője, Katona Gyula)
Egy RDF leírás megfeleltethető egy
gráfnak
RDF-gráf www.cs.bme.hu
Katona Gyula
tulajdonosa vezetője SZIT
típusa
Tanszék
RDF adatmodell Erőforrások: bármi aminek URI-ja van Tulajdonságok:
Speciális erőforrás Erőforrásokhoz kapcsolható jellemzők Bizonyos tulajdonságok jelentése előre meghatározott
Literálok: karaktersorozatok
RDF adatmodell Kijelentések: hármasok
(alany, állítmány, tárgy) (erőforrás, tulajdonság, erőforrás | literál)
RDF leírás: kijelentések halmaza (sorrend
nem számít) Jelentés: a kijelentések igazak RDF segítségével bináris relációkat írhatunk le
RDF szintaxis RDF adatmodell nem rögzíti a formátumot Tényleges modellezéshez kell valamilyen
szintaxis 3 adatmodell reprezentáció
Hármasok halmaza Címkézett, irányított gráf XML formátum
RDF gráf Csomópont: erőforrás vagy literál Él: tulajdonság (URI-val ellátott) Csak abszolút URI szerepelhet Tulajdonságról is lehet állítást
megfogalmazni
RDF gráf
A Magányos Cédrus festője Csontváry Kosztka Tivadar. {[http://…/cedrus.html], festője, „Cs. K. Tivadar”}
festője [http://…/cedrus.html]
Csontváry Kosztka Tivadar
RDF gráf És ha azt is modellezni szeretnénk, hogy
Csontváry 1853-ban született? Literálokról nem tudunk kijelentéseket tenni. Bevezetünk egy köztes erőforrást: neve
Csontváry Kosztka Tivadar
festője [http://…/cedrus.html] születési éve
1853
Köztes erőforrás Köztes csomópontnak nincs URI-ja Információ strukturáltságát növeli Több csomópont, de könnyebb gépi
feldolgozás Komplex lterál szétbontható (cím)
XML szintaxis RDF gráf linearizálása Valódi XML dokumentum Bizonyos XML elemek speciális
jelentéssel bírnak Alkalmazások közti adatcserére alkalmas
Példa „Kis Ádám (aki ember) email címe
[email protected]”. http://www.thing.org/rdf/schemas/simple#Ember rdf:type http://cs.bme.hu/~kis/#about s:levélcíme
mailto:
[email protected]
s:neve
Kis Ádám
XML szintaxis
<s:neve>Kis Ádám <s:levélcíme rdf:resource=mailto:[email protected]/>
XML szintaxis
<s:festője> Csontváry Kosztka Tivadar
XML szintaxis Tulajdonság is erőforrás – URI xmlns:s=http://www.utils.org/utils# … <s:festője>Csontváry K. Tivadar
http://www.utils.org/utils#festője
XML szintaxis Megosztott alany használata
<s:festője> Csontváry Kosztka Tivadar <s:helye>Magyar Nemzeti Galéria
XML szintaxis Erőforrás tárgypozícióban
<s:helye> http://www.mng.hu/index.html
Rossz megoldás
XML szintaxis Erőforrás tárgypozícióban rdf:resource attribútum
<s:helye rdf:resource=http://www.mng.hu/index.html/>
Típusmegadás egyszerűbb szintaxissal
<s:neve>Csipkerózsika
<s:mesehos rdf:about=s:csiprozs> <s:neve>Csipkerózsika
XML szintaxis Rdf:parsetype attribútum –
tulajdonságelem interpretációjának megváltoztatása
Ez az én gépem! Compaq
XML szintaxis Rdf:parsetype attribútum – köztes
erőforrások leírása
<s:festője rdf:parseType=“Resource”> <s:neve>Csontváry Kosztka Tivadar <s:születésiÉve>1853
XML szintaxis
Köztes erőforrások leírása lokális azonosító segítségével: rdf:nodeID attribútum
<s:festője rdf:nodeID=“lokális_azonosító1”/> <s:neve>Csontváry Kosztka Tivadar <s:születésiÉve>1853
XML szintaxis Új URI bevezetése: rdf:ID attribútum Egy azonosító csak egyszer szerepelhet
<s:neve>Szép Hajnalka <s:fizetése>220 Abszolút URI: bázis URI + # + ID: www.bazis.hu/bazis.html#munkatárs1
RDF gráf vs. XML szintaxis
Gráf Elméleti vizsgálódásokhoz kényelmes Szemléletesen megjeleníthető a kapcsolatrendszer
XML Hordozható Géppel jól feldolgozható Gyakran automatikusan generálják (ontológiakészítő programok: Protege, Lore)
Nem bináris relációk Köztes erőforrás bevezetésével több
bináris relációra bontjuk Pithagoraszi számhármasok: 3
köztes erőforrás 4
5
Magasabbrendű kijelentések Kijelentések kijelentésekről Magasabb metaszinten levő információ Egy kijelentés mint erőforrás Reifikált kijelentés – rdf:Statement osztály
egy példánya Van alanya, állítmánya és tárgya
Magasabbrendű kijelentések
1755
Magasabbrendű kijelentések http://.../22-rdf-syntax-ns#Statement rdf:type
rdf:subject
http://festok.hu#csontvary
rdf:predicate http://.../szulinap
rdf:object
1755
Konténerek és kollekciók Egy csoportra vonatkozó állítások A csoport egyedeire nem feltétlenül igaz! Nyílt végű: rdf:bag, rdf:seq, rdf:alt Zárt végű: rdf:list
rdf:Bag Sorrend nem számít Egy elem többször is előfordulhat
<s:fajtája>Deuter 28
rdf:Seq Rendezett, sorrend számít
Ági Kati Zita
rdf:Alt Az elemek lehetséges alternatívákat
jelölnek Legalább 1 elemű, az első elem az alapértelmezett
rdf:List Zárt végű kollekció
Nagy Géza Kis Ádám
Típusos literálok RDF nem ismer beépített típusokat rdf:datatype attribútum XML séma definiál ilyen típusokat, az RDF
pedig ajánlja a használatukat
Típusos literálok
<s:festője rdf:parseType=“Resource”> <s:neve> Csontváry Kosztka Tivadar <s:szülinap rdf:dataType= http://www.w3.org/2001/XMLSchema#date> 1853-07-05 <s:festője>