Resource Description Framework
Mi a baj a jelenlegi világhálóval? (2) ●
Nagyon változatos az elérhető tartalmak megjelenési formája –
Jeszenszky Péter Debreceni Egyetem, Informatikai Kar
[email protected]
● ●
Statikus és dinamikus weblapok, csak lekérdezéssel elérhető adatbázis tartalmak, nem szöveges állományok
A legtöbb tartalom ellenőrizetlen Nehéz az információk automatikus feldolgozása, mivel a legtöbb tartalom emberi fogyasztásra készül
Mi a baj a jelenlegi világhálóval? (1) ●
●
●
Becslések a World Wide Web méretére:
●
A keresőrendszerek által beindexelt oldalak száma megközelítőleg 11.5 milliárd (2005. január) ●
Mi a baj a jelenlegi világhálóval? (3)
Hatalmas mennyiségű tartalom, amelynek a legjobb keresőmotorok is csak egy részét fedik le –
Antonio Gulli, Alessio Signorini: The Indexable Web is more than 11.5 billion pages http://www.cs.uiowa.edu/~asignori/web-size/
3
●
2
A jelenlegi keresőrendszerek kulcsszavas indexelést használnak A keresőrendszerek problémái: –
Nyelvi problémák
–
Nem szöveges tartalmak kezelése
–
Nincs következtetés
A felsorolt problémák oka a szemantika hiánya
4
Mély web (1) ●
●
●
Mély web (3)
Az alábbi esetekben használják mély web (deep web) kifejezést: –
Weben elérhető adatbázis tartalmak, amelyekhez hozzáférni csak lekérdezésekkel lehet
–
Nem szöveges állományok
●
●
●
Gyakran – helytelenül – a „l áthatatlan web” kifejezést használják
A keresők integrálhatnak bizonyos tartalmakat a mély webről – lásd Google, PDF állományok tartalmának indexelése – , de csak egy kis részhez férnek hozzá –
Az ilyen tartalmak általában elérhetetlenek a keresőrendszerek számára
A web statikusan elérhető részét sekély webnek nevezik (surface web)
Mély web tartalmakra specializált keresőrendszerek –
5
Tipikus elérhető mély web tartalmak: telefonkönyv adatok, szótár szócikkek, on-line boltokban eladásra kínált áruk
CompletePlanet http://www.completeplanet.com/
Mély web (2) ●
Keresőrendszer központú, holott nem csak a keresőrendszerekkel lehet valamit megtalálni
–
Az információ soha sem láthatatlan, legfeljebb nehéz megtalálni
–
Szinte mindenki használ különféle adatbázisokat – gondoljuk csak a könyvtári katalógusra – , az ezekben lévő információk nem láthatatlanok
–
●
Mély web (4)
Azért rossz a láthatatlan web elnevezés, mert –
●
CompletePlanet: –
Több mint 70000 kereső elérését teszi lehetővé egy tematikusan rendszerezett katalógusban
–
A 60 legnagyobb mély webes adatbázis tartalma összesen megközelítőleg 750 TB ●
A kereső rendszerek is adatbázisokkal dolgoznak, a keresés ugyanolyan módon lekérdezéssel történik, mint például egy könyvtári rendszerben
A mély weben elérhető tartalmak mennyisége egyes becslések szerint 500-szorosa is lehet a hagyományosan elérhető tartalmaknak
7
●
6
Ez összesen megközelítőleg 85 milliárd rekordot és dokumentumot jelent Ez megközelítőleg 40-szer több a sekély weben elérhető információk mennyiségénél
8
A szemantikus web alapjául szolgáló technológiák, szabványok
Szemantikus web ● ●
●
●
A web evolúciójának következő szintje
●
Olyan környezet, amelyben megvalósul az információk automatikus feldolgozhatósága, lehetővé téve intelligens információs szolgáltatások megvalósítását A kulcs automatikus feldolgozásra szánt metaadatok egységes formában rendelkezésre állása
9
●
–
Resource Description Framework (RDF) (több W3C ajánlás)
–
OWL Web Ontology Language (OWL) (több W3C ajánlás)
●
Sokszor nincs éles határ adat és metaadat között, általában alkalmazásfüggő, hogy mi metaadat
●
Metaadatok társítása a világhálón elérhető erőforrásokhoz
●
Strukturált metaadatok leírása egységes módon (RDF)
●
Következtetni kell tudni a metaadatok alapján
●
●
A legkülönfélébb felhasználási lehetőségek
●
11
RDF specifikációk
A metaadatok adatokra vonatkozó adatok
–
XML
Metaadatok ●
–
Az elgondolás kitalálója Tim Berners-Lee
●
A három alappillér:
10
RDF Primer (W3C ajánlás, 2004. február 10.) Resource Description Framework (RDF): Concepts and Abstract Syntax (W3C ajánlás, 2004. február 10.) RDF/XML Syntax Specification (Revised) (W3C ajánlás, 2004. február 10.) RDF Semantics (W3C ajánlás, 2004. február 10.) RDF Vocabulary Description Language 1.0: RDF Schema (W3C ajánlás, 2004. február 10.)
12
Jellemzők ●
●
Egyszerű adatmodell, amely független a szerializációs szintaxisoktól Formális szemantika definiált, amely lehetővé teszi a következtetést
●
Bővíthető URI-alapú szótár használata
●
XML szerializációs szintaxis
●
W3C XML Schema adattípusok használata
●
Alapfogalmak
Bárki megfogalmazhat kijelentést bármely erőforrásról
13
●
URI, URI hivatkozás
●
RDF URI hivatkozás
●
Erőforrás
●
Tulajdonság
●
Literál
●
Kijelentés
Mire jó az RDF? ●
●
●
A kijelentések erőforrások tulajdonságainak értékeit specifikálják (például: http://www.inf.unideb.hu/~jeszy/index.html has a creator whose value is Péter Jeszenszky)
Nagyon fontos szerepe van a webes erőforrások azonosítására szolgáló URI-knak –
●
A hagyományos tudásreprezentációs rendszerek általában centralizáltak, a világháló nem ilyen
●
14
Az RDF-ben mindent URI-k azonosítanak
Uniform Resource Identifier (Egységes Erőforrásazonosító) (URI) –
Tudásreprezentáció –
URI-k (1)
Lehetővé teszi kijelentések megfogalmazását erőforrásokról –
15
Uniform Resource Identifiers (URI): Generic Syntax http://www.ietf.org/rfc/rfc2396.txt
Két fajta URI: –
Uniform Resource Locator (URL)
–
Uniform Resource Name (URN)
16
URI-k (2) ●
●
●
URI-k (4)
URL:
●
–
Egységes Erőforrás-helymeghatározó
–
Az erőforrások azonosítása az elérés módjával
–
http://www.ietf.org/rfc/rfc1738.txt
Abszolút és relatív URI: –
Abszolút URI a használat környezetétől függetlenül azonosít erőforrást
–
Relatív URI adott környezetben értelmezett, ha rendelkezésre áll egy úgynevezett bázis URI
URN: ●
–
Egységes Erőforrás-név
–
Erőforrások helytől független tartós azonosítása
–
http://www.ietf.org/rfc/rfc2141.txt
●
Különböző URI sémák használata (bizonyos fajta sémák esetében bárki szabadon létrehozhat URI-t) 17
●
Relatív URI-k elejéről hiányzik az úgynevezett séma azonosító Relatív URI feloldása abszolút URI-vá Az RDF gráfokban kizárólag abszolút URI-kat lehet használni
URI-k (3) ●
●
URI-k (5)
Néhány különböző sémát használó URL: –
http://www.w3.org/RDF/
–
ftp://ftp.mozilla.org/pub/mozilla.org/firefox/releases/
–
file:///usr/share/doc/HTML/index.html
–
mailto:
[email protected]
●
Bázis URI meghatározása: –
urn:isbn:9639261440
–
urn:ietf:rfc:2141
–
urn:oid:1.3.6.1
–
urn:uuid:f81d4fae-7dec-11d0-a765-00a0c91e6bf6
Bizonyos fajta dokumentumok definiálhatják a saját magukon belül érvényes bázis URI-t ●
18
XML dokumentumok esetében lásd: XML Base (W3C ajánlás, 2001. június 27.)
–
Ha nincs definiált bázis URI és a dokumentumot egy másik entitás – például egy másik dokumentum – foglalja magában, akkor a bázis URI a befoglaló entitás bázis URI-ja
–
Ha nincs ilyen befoglaló entitás sem, akkor a bázis URI az az URI lesz, amelyen a dokumentumot elérték (átirányítás esetén az utolsó használt URI)
–
Egyébként a bázis URI alkalmazásfüggő
Néhány különböző URN: –
19
20
URI hivatkozások ●
RDF URI hivatkozások (2)
Egy URI és egy opcionális erőforrásrész azonosító alkotja –
Példa: http://www.w3.org/2004/02/image-regions#Polygon
●
Az erőforrásrész azonosító '#' karakter után adható meg
●
Csak erőforrásrész azonosítóból álló URI relatív URI
●
●
●
●
Az erőforrásrész azonosító jelentése az erőforrás MIME tartalom típusától függ Egymástól teljesen független erőforrásokat azonosítanak olyan erőforrásrész azonosítót tartalmazó URI hivatkozások, amelyek URI része megegyezik
●
21
Két RDF URI hivatkozás azonosnak tekinthető akkor, és csak akkor, ha mint Unicode sztringek karakterről karakterre megegyeznek Az RDF URI hivatkozások kompatibilisek a W3C XML Schema beépített anyURI típusával, azonban csak abszolútak lehetnek Noha az RDF gráfokban csak abszolút URI-kat lehet használni, a szerializációs szintaxisok lehetővé teszik relatívak használatát
RDF URI hivatkozások (1) ●
–
●
Nem tartalmaznak vezérlő karaktereket (#x00 – #x1F, #x7F – #x9F)
●
Az RDF erőforrások leírását teszi lehetővé
●
Minden erőforrást RDF URI hivatkozás azonosít
Az alábbi módon kódolva őket olyan érvényes URI karakterláncokat kapunk, amelyek abszolút URI-kat reprezentálnak egy esetleges erőforrásrész azonosítóval
A kódolás: –
A karakterlánc UTF-8 kódolása, oktettek formájában
–
Az US-ASCII karaktereknek nem megfelelő oktettek levédése ●
Erőforrások
Az RDF gráfokban az RDF URI hivatkozások olyan Unicode karakterláncok, amelyek: –
Minden nem megfelelő oktett helyettesítése %HH-val, ahol HH az számjegyből álló hexadecimális 22 oktett értékének megfelelő két szám
23
●
–
Nem feltététlenül hálózaton elérhető dolgokat – például weblapokat, elektronikus dokumentumokat, szolgáltatásokat – azonosítanak
–
URI-kat hozzá lehet rendelni akár fizikai objektumokhoz, fogalmakhoz is
Az adatmodellben adott az erőforrások halmaza
24
Tulajdonságok ●
●
●
Adattípusok (1)
Az adatmodellben adott a tulajdonságok halmaza, amely részhalmaza az erőforrások halmazának
●
●
A tulajdonságok értékei erőforrások és literálok lehetnek Ontológiák definiálják a tulajdonságok jelentését, hogy milyen erőforrásokhoz lehet őket kapcsolni, milyen értékeket vehetnek fel, és hogy milyen viszonyban vannak más tulajdonságokkal
Az adattípusokat az értékek halmaza, a literálok halmaza és a literálok értékeknek való megfeleltetése jellemezi Az RDF mindössze egyetlen adattípust definiál, amelyet a http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral URI hivatkozás azonosít –
●
URI hivatkozással azonosított adattípusok használata –
25
A W3C XML Schema adattípusainak használata
Literálok
27
Adattípusok (2)
●
Az adatmodellben adott a literálok halmaza
●
A literálok tulajdonságok értékeit reprezentálják
●
Két fajta literál van, típus nélküli és tipizált
–
Értékek: {T, F}
●
Típus nélküli (plain) literálok:
–
Literálok: {"true", "false", "0", "1"}
–
Literálok megfeleltetése értékeknek: {<"true",T>, <"false",F>, <"0",F>, <"1",T>}
●
Ezt a típust jelöléseket tartalmazó szöveg megadására lehet használni
●
–
Unicode karakterláncok, amelyekhez egy opcionális nyelv címke tartozik
–
Természetes nyelvű szöveg reprezentálása
Például a W3C XML Schema beépített boolean típusa:
Tipizált (typed) literálok: –
Unicode karakterláncok, amelyekhez egy adattípust azonosító RDF URI hivatkozás tartozik
–
Az adattípus megfelelő értékét reprezentálja
26
28
Adattípusok (3) ●
Adatmodell
Nem lehet használni a W3C XML Schema beépített adattípusai közül az alábbiakat: –
A duration típust, mert az értékek halmaza nem elegendően pontosan definiált
–
A QName, ENTITY típusokat, mert ezeket csak adott XML dokumentumon belül lehet értelmezni
●
Az adatmodell jelentése az, hogy a kijelentések halmazába tartozó hármasak igazak –
●
Lényegtelen a hármasok sorrendje
●
A kijelentések bináris relációkat képesek ábrázolni
●
Három különböző szerializációs szintaxis:
–
Az ID, IDREF típusokat, mert ezek kereszthivatkozásokra szolgálnak XML dokumentumokban
–
A NOTATION típust
–
Ábrázolás hármasok halmazaként
–
Az IDREFS, ENTITIES, NMTOKENS típusokat, mert a listák nem illeszkednek az RDF adattípus modelljébe
–
Ábrázolás irányított gráffal
–
XML szintaxis (RDF/XML)
29
Kijelentések ●
–
Alany (subject): egy tetszőleges erőforrás lehet
–
Állítmány, predikátum (predicate): egy tetszőleges tulajdonság lehet
●
●
Tárgy (object): egy tetszőleges erőforrás vagy literál lehet
Azaz egy kijelentést három összetartozó RDF URI hivatkozás alkot, vagy pedig két RDF URI hivatkozás és egy literál 30
31
Gráf modell (1)
A kijelentések rendezett hármasok, amelyek az alábbiakból állnak:
–
●
A hármasok között konjunkció
●
Kijelentések ábrázolása irányított gráfokkal –
A csomópontok erőforrásokat és literálokat reprezentálnak
–
Az élek tulajdonságokat reprezentálnak
Az élek a kijelentések alanyául szolgáló erőforrásokat reprezentáló csúcsokból mutatnak a tárgy funkciót betöltő erőforrásokat és literálokat reprezentáló csúcsokba Grafikus ábrázolásnál ellipszisek jelölik az erőforrásokat, téglalapok a literálokat
32
Gráf modell (2)
Példa (2) Az előbbi RDF gráf hármasokkal reprezentálva:
●
Alany
Alany
Predikátum
"Jeszenszky Péter honlapja"@hu .
–
"2004-10-23"^^ .
–
.
Predikátum
Tárgy
–
Tárgy
33
Példa (1) ●
35
Példa (3) Az előbbi RDF gráf XML-be szerializálva (RDF/XML):
Egy RDF gráf:
Jeszenszky Péter honlapja 2004-10-23
34
36
Üres csomópontok (1) ●
●
●
●
Üres csomópontok (3)
Olyan köztes csomópontok, amelyek strukturált tulajdonság értékek megadásánál használatosak
●
Az alábbi RDF gráf hármasokkal reprezentálva: –
_:A0 .
–
_:A0 "Jeszenszky" .
–
_:A0 "Péter" .
–
_:A0 <mailto:[email protected]> .
Szerepük tulajdonságok hordozása Az üres csomópontok névtelen erőforrásokat azonosítanak, amelyeket semmilyen módon nem tudunk azonosítani, de erre nincs is szükség Hármasokkal reprezentáláskor az üres csomópontok azonosítása úgynevezett üres csomómpont azonosítókkal, amelyeket _:azonosító alakban jelöljük –
Olyan azonosítók, amelyek különböznek az összes URI-tól és literáltól
37
Üres csomópontok (2) ●
RDF/XML (1)
Üres csomópont azonosítók csak alanyként és tárgyként jelenthetnek meg
●
Lokális azonosítók
●
Lehetővé teszik:
●
Egy RDF/XML dokumentumban az XML-be szerializált gráfot általában egy rdf:RDF elem tartalmazza: ...
–
n-ér relációk reprezentálását
–
Olyan erőforrások leírását, amelyek maguk ugyan nem azonosíthatók URI-val, de jellemezhetők más – URI-val azonosítható – erőforrásokkal való kapcsolataikkal
●
●
●
39
38
Általában az rdf:RDF elem nyitó címkéjében adunk meg minden szükséges névtér deklarációt Az rdf:RDF elem elhagyható, amennyiben benne csak egyetlen elem szerepel A továbbiakban a http://www.w3.org/1999/02/22-rdf-syntax-ns# névtér név hozzárendelt az rdf előtaghoz
40
RDF/XML (2) ●
●
●
●
RDF/XML (4)
Az RDF gráfok csomópontokból és csomópont párokat összekötő címkézett irányított élekből állnak
●
●
A gráfot hármasok halmazával ábrázolhatjuk, a hármasok mindegyike tartalmaz egy alany és egy tárgy csomópontot, valamint egy predikátumot
●
●
A csomópontok RDF URI hivatkozások, literálok vagy üres csomópontok
Az RDF URI hivatkozást a minősített névből a névtér nevet és a lokális részt egymás után illesztve kapjuk meg A predikátumok és bizonyos csomópontok esetében használható ez a rövidítés Az alany és tárgy csomópontokat azonosító RDF URI hivatkozásokat attribútum értékekként adhatjuk meg Az RDF literálokat – amelyek csak tárgy csomópontok lehetnek – XML elemek szöveges tartalmaként vagy attribútumok értékeként használhatjuk
A predikátumok RDF URI hivatkozások
41
RDF/XML (3) ●
●
●
●
Az RDF URI hivatkozások ábrázolása minősített nevekkel
–
RDF/XML (5)
Hogy XML-be kódolhassuk a gráfot, a csomópontokat és éleket az XML-ben használható elem nevekkel, attribútum nevekkel, elem tartalommal és attribútum értékekkel kell ábrázolni
–
A gráf tekinthető olyan utak halmazának, amelyek lefedik az egész gráfot Ezek XML-ben egymásba ágyazott elemek sorozataként jelennek meg, amelyben az elemek felváltva ábrázolnak csomópontokat és éleket –
Minden minősített névnek van névtér neve – ami egy URI hivatkozás – és egy rövid lokális neve A névtér nevet helyettesítheti a minősített névben egy rövid előtag, ennek hiányában alapértelmezett névtér deklaráció adja meg névtér nevet
43
●
42
Az elemeket megfelelő módon csomópont elemeknek és tulajdonság elemeknek nevezzük
Az úton az első csúcsot a legkülső elem ábrázolja, az ebből induló éleket ennek a gyermekei ábrázolják, és így tovább 44
RDF/XML (6)
Üres csomópontok azonosítása (1)
●
●
Péter Jeszenszky
●
45
47
Péter Jeszenszky
2004-10-23
Csomópont elemen az rdf:about attribútum, tulajdonság elemen pedig az rdf:resource attribútum helyett használható az rdf:nodeID attribútum, amelynek értéke az üres csomópont azonosító
Hogy ne kelljen állandóan ismétlődő URI hivatkozásokat kiírni, érdemes entitásokat használni:
Ezért az üres csomópontnak egy üres csomópont azonosító adható, amely a csomópontot a dokumentum belül azonosítja
Üres csomópontok azonosítása (2)
]>
Az RDF/XML időnként megköveteli az ugyanarra az üres csomópontra való többszörös hivatkozást –
RDF/XML (7) ●
Az RDF gráfokban különbözőnek tekintünk minden üres csomópontot, azonban nincs azonosító RDF URI hivatkozás
46
48
Tipizált literálok ●
●
●
XML literálok használata (2)
Tárgy csomópontként lehet tipizált literálokat használni predikátumoknál
<math xmlns="http://www.w3.org/1998/Math/MathML"> <declare type="function"> f x <sin/> x
Ugyanúgy adjuk meg őket, mint a sztring literál csomópontokat a tulajdonság elemek belsejében, azonban a tulajdonság elemen megjelenik az rdf:datatype attribútum Az attribútum értéke az adattípust azonosító RDF URI hivatkozás
49
XML literálok használata (1) ●
●
XML literálok megadása tulajdonság elemek tartalmaként lehetséges
●
A tartalmazó tulajdonság elemen meg kell adni az rdf:parseType="Literal" attribútumot
51
Az xml:lang attribútum
●
●
50
A szokásos módon használható csomópont és a tulajdonság elemeken a tartalom nyelvének jelzésére A hatáskörben vonatkozik tulajdonság elemek sztring literál tartalmára és a tulajdonság attribútumok értékére Azonban az XML literálokat tartalmazó tipizált literálokra nem vonatkozik az értéke
52
Rövidítési lehetőségek ●
●
Üres tulajdonság elemek (2)
Az RDF/XML számos lehetőséget ad rövidítésre: –
Üres tulajdonság elemek
–
Tulajdonság attribútumok
–
Üres csomópontok elhagyása
–
Tulajdonság attribútumok üres tulajdonság elemeken
–
Tipizált csomópont elemek
–
RDF URI hivatkozások rövidítése
További rövidítési lehetőségek is lesznek később a konténereknél, kollekcióknál és a reifikációnál
53
Péter Jeszenszky
Üres tulajdonság elemek (1) ●
Tulajdonság attribútumok (1)
Ha az RDF gráfban egy predikátum él egy olyan tárgy csomópontba vezet, amelyből nem vezetnek ki további predikátum élek, és amely egy üres csomópont elemként jelenik meg, akkor az alábbi rövidítéssel élhetünk: –
●
●
A predikátumnak megfelelő tulajdonság elem legyen üres és az rdf:resource attribútumban adjuk meg a tárgy csomópontot azonosító RDF URI hivatkozást
55
54
●
Ha egy tulajdonság elem tartalma sztring literál, akkor a tartalmazó csomópont elem attribútumaként is megadhatjuk a tulajdonságot Ezt csak abban az esetben lehet megtenni, ha: –
A tartalmazó csomópont elem gyermekeként az adott tulajdonság elem legfeljebb egyszer szerepel
–
A csomópont elemen és a tulajdonság elemen érvényben lévő xml:lang értékek megegyeznek
A rövidítéssel élni lehet az rdf:type tulajdonság esetében, amelynek rdf:resource attribútumának értéke egy RDF URI hivatkozás
56
Tulajdonság attribútumok (2)
Üres csomópontok elhagyása (2)
Péter Jeszenszky
57
Tulajdonság attribútumok üres tulajdonság elemeken (1)
Üres csomópontok elhagyása (1) ●
●
Üres csomópontokat meg lehet adni az rdf:Description elemet elhagyva
●
●
Az elhagyás úgy történik, hogy a tartalmazó tulajdonság elemen meg kell adni az rdf:parseType="Resource" attribútumot –
Az attribútum azt jelenti, hogy a tulajdonság elem egy új üres csomópont leírását tartalmazza
Ilyen módon a tulajdonság elem tulajdonság és csomópont elemmé válik, amelyen tilos megadni tulajdonság attribútumokat és az rdf:nodeID attribútumot
59
Ha egy üres csomóponthoz tartozó tulajdonság elemek mindegyike csak sztring literálokat tartalmaz, és mindegyik legfeljebb egyszer fordul elő, akkor az ezeket meg lehet adni az üres csomópontot tartalmazó tulajdonság elemen tulajdonság attribútumokként, elhagyva az üres csomópontot –
●
●
58
Ezt csak akkor lehet megtenni, ha a hatáskörben lévő xml:lang értékek megegyeznek
Ekkor az üres csomópontot tartalmazó tulajdonságból üres elem lesz Ha van legfeljebb egy rdf:type tulajdonság, akkor ennek esetében is élni lehet a rövidítéssel
60
Tulajdonság attribútumok üres tulajdonság elemeken (2)
Tipizált csomópont elemek (2)
●
Az előbbiek értelmében az alábbi kettő ekvivalens:
–
Péter Jeszenszky
–
Péter Jeszenszky
61
Tipizált csomópont elemek (1) ●
●
●
●
URI-k rövidítése (1)
RDF gráfokban alany csomópontoknál gyakran megjelenik az rdf:type predikátum
●
Ezeket a csomópontokat tipizált csomópontoknak nevezzük, a megfelelő elemeket RDF/XML-ben pedig tipizált elemeknek A tipizált csomópontoknál az rdf:Description csomópont elem nevét helyettesíteni lehet az rdf:type predikátum értékét képviselő RDF URI hivatkozásnak megfelelő elem névvel Több rdf:type tulajdonság esetén bármelyik választható a helyettesítéshez, de csak egyetlen egy
63
●
62
A dokumentumban szereplő relatív URI-k feloldása abszolúttá: –
Ha van xml:base attribútum a dokumentumban, akkor annak értéke a bázis URI a feloldás során
–
Egyébként a bázis URI az az URI, amelyen a dokumentum elérése történt
Csomópont elemeken az rdf:about attribútum helyett lehet az rdf:ID attribútumot használni (tulajdonság elemeken más a jelentése)
64
URI-k rövidítése (2) ●
Az rdf:ID attribútum csomópont elemeken egy relatív RDF URI hivatkozást ad, amely ekvivalens az attribútum '#' karakter után illesztett értékével –
●
●
●
●
Azaz rdf:ID="name" ugyanaz mint rdf:about="#name"
●
Az rdf:ID attribútumok értékei egyediek kell hogy legyenek egy xml:base érték hatáskörében, annak hiányában a dokumentumban –
URI-k rövidítése (4)
Lehetővé teszi különböző, de összetartozó kifejezések definiálását ugyanahhoz az RDF URI hivatkozáshoz 65 relatívan
. . . .
URI-k rövidítése (3)
Konténerek (1)
● ●
●
●
67
66
Lehetővé teszik csoportok leírását Olyan erőforrások, amelyek dolgokat – tagokat – tárolnak A tagok erőforrások – beleértve az üres csomópontokat – és literálok lehetnek 3 fajta: –
rdf:Bag
–
rdf:Seq
–
rdf:Alt
68
Konténerek (2) ●
●
●
Konténerek (4)
A Bag olyan konténer, amely erőforrások és literálok csoportját reprezentálja, amelyben
●
RDF/XML-ben az rdf:_n tulajdonságok helyett használni lehet az rdf:li tulajdonságot –
–
ismétlődés lehet
–
lényegtelen a tagok sorrendje
●
A Seq olyan konténer, amely erőforrások és literálok csoportját reprezentálja, amelyben –
ismétlődés lehet
–
lényeges a tagok sorrendje
Az Alt olyan konténer, amelynek tagjai – erőforrások és literálok – alternatívák (általában egy tulajdonság alternatív értékei)
●
69
Megjegyzés az Alt konténerhez: –
Minden Alt konténernek legalább egy tagja van
–
Az rdf:_1 tulajdonsággal azonosított tagnak kitüntetett szerepe van, ez az alapértelmezett, a többi tag sorrendje lényegtelen
Az RDF nem követeli meg „ jólformáltsági” megszorítások teljesülését a konténer szótár használatánál –
Konténerek (3) ●
●
●
●
●
A konténert reprezentáló erőforrás lehet URI hivatkozással azonosított csomópont és üres csomópont
71
Szemantika szempontjából semmiféle különbség nincs a különböző fajta konténerek között –
A tagok leírása úgy történik, hogy mindegyik számára definiálunk egy konténer tagság tulajdonságot, amelynek alanya a konténer, tárgya pedig az éppen definiált tag
●
A konténer tagság tulajdonságok neve rdf:_n alakú, ahol n vezető nullák nélküli pozitív egész szám
A konténer erőforrásnak lehetnek további tulajdonságai, amelyek magát a konténert írják le
Például leírható olyan konténer, amely Bag és Seq is egyben
Konténerek (5)
Egy konténer egy olyan erőforrás, amelynek van rdf:type tulajdonsága rdf:Bag, rdf:Seq vagy rdf:Alt értékkel
–
XML-ben lényeges ezeknek a sorrendje!
A bemutatott szótár segítségével leírni lehet konténereket, nem pedig létrehozni, mint egy programozási nyelvben –
70
Csupán az emberi olvasó számára van jelzésértéke annak, hogy a Bag, Seq és Alt konténer közül éppen melyik használt
Csak részleges információk adhatók a tagokról (létezhetnek további tagok)
72
A Bag konténer (1)
A Bag konténer (3) A szemantikus világháló elmélete és gyakorlata Benkő Tamás Lukácsy Gergely Nagy Zsolt Szeredi Péter
73
A Bag konténer (2) ●
75
A Seq konténer (1)
Az előbbi RDF gráf hármasokkal reprezentálva: –
.
–
"A szemantikus világháló elmélete és gyakorlata"@hu .
–
_:A0 .
–
_:A0 .
–
_:A0 "Benkő Tamás" .
–
_:A0 "Lukácsy Gergely" .
–
_:A0 "Nagy Zsolt" .
–
_:A0 "Szeredi Péter" .
74
76
A Seq konténer (2)
Az Alt konténer (1)
Az előbbi RDF gráf hármasokkal reprezentálva:
●
–
_:A2 .
–
_:A2 "Waiting - Phase One" .
–
_:A2 "Waiting - Phase Two" .
–
_:A2 "The Sound of No-one Listening" .
–
_:A1 <"http://musicbrainz.org/mm/mm-2.1#Artist"> .
–
_:A1 "Porcupine Tree" .
–
_:A0 .
–
_:A0 "Waiting" .
–
_:A0 _:A1 .
–
_:A0 _:A2 .
77
A Seq konténer (3)
Az Alt konténer (2)
Az előbbi RDF gráf hármasokkal:
●
<mm:Album> Waiting http://musicbrainz.org/mm/mm-2.1#Artist Porcupine Tree <mm:trackList> Waiting - Phase One Waiting - Phase Two The Sound of No-one Listening
79
78
–
_:A0 .
–
"hu"^^ .
–
_:A0 .
–
_:A0 "A gyűrűk ura"@hu .
–
_:A0 "Le Seigneur des Anneaux"@fr .
–
_:A0 "The Lord of the Rings"@en .
–
_:A0 "El seńor de los anillos"@es .
80
Az Alt konténer (3)
RDF kollekciók (2)
●
El seńor de los anillos Le Seigneur des Anneaux The Lord of the Rings A gyűrűk ura hu
81
●
●
A listákat üres csomópontok reprezentálják
–
A lista csomópontok mindegyike az rdf:first és rdf:rest tulajdonságok alanya
–
Az rdf:first tulajdonság adja meg a lista fejét, tárgya a kollekció megfelelő tagja
–
Az rdf:rest tulajdonság adja meg a lista farkát, tárgya egy listát reprezentáló üres csomópont
–
A lista végének jelzésére az rdf:nil erőforrást kell használnia az rdf:rest tulajdonság tárgyaként
–
A lista szerkezetet alkotó üres csomópontok implicit módon rdf:List típusúak, azaz mindnek implicit módon van rdf:type
83
RDF kollekciók (3)
Nem lehet a konténereket bezárni –
●
–
tulajdonsága rdf:List értékkel
RDF kollekciók (1) ●
Kollekciók ábrázolása a Lisp programozási nyelv listáihoz hasonlóan:
Létezhetnek a konténernek további tagjai a leíráskor megadottakon túl
Az RDF kollekciókkal olyan csoportokat lehet leírni, amelyek kizárólag az adott tagokat tartalmazzák Az RDF kollekciók dolgok olyan csoportjai, amelyeket a gráfban listák reprezentálnak A kollekciók leírásához használható szótár: rdf:List, rdf:first, rdf:rest, rdf:nil
82
84
RDF kollekciók (4) ●
●
RDF/XML-ben rövidebben is ábrázolni lehet a kollekciókat: –
Ha egy tulajdonság elemen megjelenik az rdf:parseType="Collection" attribútum, akkor a tartalmazott csomópont elemek a kollekció tagjai
–
Lényeges XML-ben a tartalmazott csomópont elemek sorrendje
Graham Chapman
Az RDF nem követeli meg „ jólformáltsági” megszorítások teljesülését a kollekció szótár használatánál –
RDF kollekciók (6)
Például egy csomópontnál két különböző értéket is meg lehet adni az rdf:first tulajdonságnak
85
John Cleese
RDF kollekciók (5)
87
RDF kollekciók (7) Terry Gilliam Eric Idle Terry Jones
86
Michael Palin
88
RDF kollekciók (10) Eric Idle Terry Jones Michael Palin
89
RDF kollekciók (9)
Reifikáció (1)
A reifikáció kijelentések leírását jelenti kijelentésekkel
●
–
Graham Chapman John Cleese Terry Gilliam
91
90
Például hogy mikor lett létrehozva egy adott kijelentés, vagy hogy ki a létrehozó
Például az alábbi kijelentés azt fejezi ki, hogy az angol font váltási árfolyama az USA-dollárhoz képest 0.5628:
●
–
"0.5628"^^ .
Ezt a kijelentést tulajdoníthatjuk például egy valutaárfolyamok közlésére szakosodott adott szájtnak
●
92
Reifikáció (2) ●
●
●
Reifikáció (4)
Az RDF egy szótárat ad a kijelentések ilyen módon leírásához
Korábban az rdf:Description elemeken RDF URI hivatkozások rövidítéséhez használtuk az rdf:ID attribútumot
●
Egy kijelentés leírását a kijelentés reifikációjának nevezzük
Az rdf:ID attribútum használható tulajdonság elemeken, azonban más a jelentése:
●
A reifikációt lehetővé tevő szótárat az rdf:Statement típus és az rdf:subject, rdf:predicate, rdf:object tulajdonságok alkotják –
–
Azért van ezekre szükség, mert kijelentések alanya csak erőforrás lehet, a leírandó kijelentésből velük speciális erőforrást lehet csinálni
93
A tulajdonság elem által generált hármas reifikációját adja automatikusan (ehhez az attribútum feltüntetésén kívül nem szükséges semmi egyéb)
Reifikáció (3) ●
●
_:A0 .
–
_:A0 .
–
_:A0 .
–
_:A0 "0.5628"^^ .
●
_:A0 .
–
_:A0 "2005-11-26"^^ .
Tekintsük az alábbi RDF/XML dokumentumot:
Az ezekkel a hármasokkal modellezett kijelentésre vonatkozó információkat adnak az alábbi hármasok: –
95
Reifikáció (5)
Az előbbi kijelentés reifikációja a szótárral: –
94
<ex:hasUSDExchangeRate rdf:ID="triple" rdf:datatype="http://www.w3.org/2001/XMLSchema#double"> 0.5628
96
Reifikáció (6) ●
rdf:value (1)
A RDF/XML-be szerializált modell az alábbi hármasokkal írható le: –
●
"0.5628"^^ .
–
–
–
–
–
"0.5628 "^^
Bizonyos tulajdonságok literál értékének értelmezéséhez további információk lehetnek szükségesek
●
97
Például hogy a tulajdonság értékét milyen mértékegységben kell érteni
Megoldás a problémára strukturált tulajdonság értékek használata –
A tulajdonság értékét reprezentálja egy erőforrás, amelynek rdf:value tulajdonsága hordozza a tényleges értéket, a többi pedig az értelmezéshez ad információkat
Reifikáció (7) ●
●
Egy állítás és az állítás reifikációja teljesen mást fejez ki, egyikből sem következik a másik! Nem biztos, hogy együtt van jelen a reifikált kijelentés, és a benne leírt kijelentés! –
●
●
rdf:value (2) <po:Item rdf:about="urn:isbn:0099448599"> <po:price rdf:parseType="Resource"> 15.77 <po:currency rdf:resource="http://www.daml.ecs.soton.ac.uk/ont/currency.owl#USD"/>
A példánál maradva nem azt állítjuk, hogy 0.5628 az angol font váltási árfolyama az USA-dollárhoz képest, hanem azt, hogy valaki ezt állította
Feltevés szerint a reifikáció által generált hármasok alanya egy konkrét hármast azonosít egy konkrét dokumentumban (számos olyan hármas lehet számos különböző dokumentumban, amelyekben ugyanaz az alany, a predikátum és a tárgy) Azonban az RDF nem ad arra lehetőséget, hogy a generált hármasok alanyához hozzárendeljük egy konkrét dokumentum egy98 konkrét hármasát
99
100