• Világháló része az internetnek! 2012. Március 1-8.
Web szolgáltatás: korszakok • Web1: az adatok megjelenítése (statikus oldal) (sekély web) • Web2: közösségi cselekvés (közös és közzétett tartalmakról: WIKI, IWIW, …) (folkszonómia) • Web3: tartalom (mély web és tartalmi összefüggés) „szemantikus web” irányzat (RDF, OWL, tématérképek) • Web4: „Felhő”: igények helyben, erőforrás a felhőben (a felhasználó mentesítése) 2012. Március 1-8.
Hozzáférés a hálóhoz: böngészők (leggyakrabban használtak) ₋ Microsoft Internet Explorer (Netscape Firefox és az Internet Explorer motorja az alapja)
₋ Opera (zárt forráskód) (biztonságos, kis méret, gyors, kényelmes) ₋ Mozilla (nyílt forráskód) (összetett: böngésző, levelező, szerkesztő; már nem frissítik)
₋ Firefox (nyílt forráskód) (biztonságos, testre szabható, gyors, kényelmes) Netscape Firefox és az Internet Explorer motorja
₋ Google Chrome (Google) (folyamatosan fejlesztik) (gyors) ₋ Safari : Apple fejleszti a Mac OS X op. rendszeréhez (Windowshoz is) ₋ Konqueror : Unix és Unix-szerű (mint pl.: Linux) operációs rendszerekre fejlesztették. Windows rendszereken nem használható. 2012. Március 1-8.
Böngészők népszerűségi listája Usage share of browsers for February 2011
Source
Source
1.Internet Explorer 2.Firefox 3.Google Chrome 4.Safari 5.Opera
Net Applications
StatCounter
Median
W3Counter
Wikimedia
http://en.wikipedia.org/wiki/ (megtekintve: 2011.és 2012 márc..) 2012. Március 1-8.
Napjaink fejlesztései 2011
Lynx
Jan
2.8.8.dev 8
Chrome
Opera
IE
Camino
SeaMonkey Firefox
Safari
Maxthon Lunascape
9.0
Mar
10.0
Apr
11.0
9.0 9.0
4.0
10.0
11.10
2.7
May
6.5 12.0
11.50
2.1
July
5.0
2.2
Aug Sep
13.0 14.0
Oct
15.0
Nov Dec
Iron
6.4.1
Feb
June
NetSurf
2.0.9
3.1.1 5.1
12.0
6.0 7.0
11.52 2.1
16.0
2.4.1
11.0
11.60
2.5 2.6
8.0 9.0
11.61
2.7.1
10.0
2.8 5.1.1
3.2
6.5.7
5.1.2
3.2.1
6.5.8
13.0 14.0 15.0
2012 Jan
3.3.3.1 000
http://en.wikipedia.org/wiki/Timeline_of_web_browsers 2012. Március 1-8.
Webtartalom elérésének lehetőségei ₋korlátozott mélységi feltárás ₋ adatformátumok: részleges feltárás (.pdf, .ppt, .jpg, .tif, stb.) ₋ gyakran változó weboldalak, valós idejű adatok (pl. hírek) ₋ navigációs rendszeren kívül vannak (nincsenek belinkelve)
₋ private web: ₋ intranet ₋ jelszóval védett oldalak ₋ regisztráció útján ₋ IP-cím szükséges a belépéshez (könyvtári szolgáltatások, EISZ, … ) ₋ kizárva a kereshető lapok kategóriájából (Robots Exclusion Standard) (robot.txt) (szabadalmazott) (Keresőket elutasító meta-tag: noindex (ne indexálja), nofollow (linkeket ne kövese), noimageindex (képekket ne indexálja) ) 2012. Március 1-8.
A gépi feltárás problémái: Web „rétegek” • Web (szolgáltatás): hipertext pókháló ₋ „felszíni web” (surface web) (nyitott) (statikus) (szemantika?)
Google Keresőszó: PageRank • PageRank (dokumentumokhoz számok a „jóság” mérésére) • Meta tag • Alak és képfelismerés • … • Befolyásolja még (metaadatok és matematikai logikai alkalmazások) – szemantika – kódrendszerek, katalógusok, tezauruszok, .. – ontológiák
2012. Március 1-8.
Google: képkeresés (desktop!) Keresőszó: PageRank
2012. Március 1-8.
Kulcsszó: stroke tünetei (Google)
2012. Március 1-8.
Kulcsszó: stroke tünetei (Yahoo)
2012. Március 1-8.
Kulcsszó: stroke tünetei (Bing)
2012. Március 1-8.
Kulcsszó: stroke tünetei (Polymeta)
2012. Március 1-8.
Orvosi információk keresése • Felszíni web: szakmai portálok, wikipedia, webbeteg, weborvos, ESKI, kormányzati szervek… • Egészségügyi irodalmi adatbázisok: – – – – – –
Medline (MeSH) MDConsult Web of Science Magyar Orvosi Bibliográfia Külön-gyűjtemények (WHO, EU, függőségek, …) Szakfolyóiratok linkgyűjteményei …
http://www.eisz.hu/ !!! 2012. Március 1-8.
Témakörök II. • A tartalomelérés problémái, metaadatok szerepe • Metaadatok lokális és globális megközelítése a tárolásban • Metaadatok a tartalom leírására: kódrendszerek, tezauruszok, ontológiák
2012. Március 1-8.
A webes keresés háttere: metaadatok
• Metaadatok – Könyvtáraknál – Informatikában
• Metaadatok szerepe a webes keresésekben – Keresőszó szerinti keresések (Tematikus keresés) – Szemantika hozzáadása a kereséshez
2012. Március 1-8.
Metaadatok Metaadatok: adat az adatról. (Adatokat ír le, jellemez, értelmez és összeköt) - helye: fájlon kívül; fájlnévvel együtt; fájlon belül (tulajdonságok; .jpeg) - elérhetősége (felsőbb rétegekbe) - értelmezhetősége: - speciális (GeoTiff), egy konkrét felhasználásra - szabványos (kódrendszerek, tématérképek, tezauruszok, ontológiák, …) Például: - Adatbázist leíró adathalmazok (pl. táblaszerkezet, relációs információk, stb.). -Programozási nyelvek. - DICOM - Annotációk 2012. Március 1-8.
Adatbázis rendszerek
data + metadata
Model: data +database writing data +scheme +execution rules and operations
Database Management System
Storage structure Syntactic and semantics fitting
data +data links +operations
2012. Március 1-8.
The structure of information content
Adattárház (metadata)
data warehouse (data + metadata)
data
databases (data+metadata) (data + metadata)
2012. Március 1-8.
Filekezelő rendszerek file (data)+ metadata (system)
file system (e.g. FAT) .
file system manager (directory service . . and registry)
regular attributes + extended attributes
regular attributes
extended attributes
extended attributes
programs
2012. Március 1-8.
data
databases
other type files
Web „adattárház” (idealizmus!) data + metadata system
„web” search (metadata)
„web” warehouse (data + metadata)
data
2012. Március 1-8.
database (data + metadata)
URI (Uniform Resource Identifier) URI: data + metadata
Kód: valamely objektumhalmaz elemeit egyértelműen azonosítja - valóságos objektum ( tárgyak, személyek ...) - fogalmi kategória ( politikai pártok, társadalmi kategóriák …) - adathalmazok ( DRG …) - néma kód ( TAJ-szám ...), mnemonikus kód ( USD = USA Dollar … ) - informatív kódok ( személyi számok …)
2012. Március 1-8.
Információszervezés gyakori formái Struktúra típusok: - egyedi (folkszonómia) (Szemantikai rés (semantic gap)) - lineáris ( szekvenciális ) - hierarchikus
Kódrendszerek, Tezauruszok, Ontológiák: jelentőségük az egészségügyben!
Code system
2012. Március 1-8.
Thesaurus
Ontology
(tezaurusz)
2012. Március 1-8.
2012. Március 1-8.
2012. Március 1-8.
Tartalomleírás
Ontológia Ontológia: közmegegyezésen alapuló fogalomrendszer Felhasználási területei: egészségügyi, geológia, … - hierarchikus fogalmi rendszerek
- leíró logikai formalizmusok - OWL ( Web Ontology Language )???
Protégé - Ontology Newspaper 2012. Március 1-8.
Témakörök III. • A webes keresés általános lépései
• Metaadatok a webes keresők számára • Példa metaadatok közlésére a közzétételben • Honlapelemzés
2012. Március 1-8.
A webes keresés menete • Crawlers (spiders or bots) – robot.txt
• Page repository
• Indexing – link index, text index, … – inverted index list (invertált index tábla)
• Válasz! Rangsor! PageRank value 2012. Március 1-8.
Kereső(motoro)k Web site indexing by engines Inverted index list
Index Document files
Crawlers Surface web
Deep web
2012. Március 1-8.
Keresés felszíni weben Intelligent information
Web site indexing by engines Inverted index list
Web search result Query Index Document files
Surface web Crawlers
Deep web
2012. Március 1-8.
Keresés a mély weben Intelligent information Web site indexing by engines
Web search result Query Index Surface web Deep web Crawlers
2012. Március 1-8.
Document files
Keresés metaadatok segítségével felszíni weben Web search result
Web site indexing by engines
Query Inverted index list Index Document files
Metadat a
Surface web Crawlers
Metadat a Metadat a
Deep web
Keresés metaadatok segítségével a mély weben Web site indexing by engines
Web search result
Query
Index
Metadata Metadata Metadata
Document files Surface web
Deep web Crawlers
2012. Március 1-8.
Metasearch engine (metakeresők) Web site indexing by engines
Relevant results
Relevant results sets Inverted index list search engines 1.
search engines 2.
search engines 3.
Surface web
Deep web
2012. Március 1-8.
Tartalomleírás
Metaadatok tartalmának reprezentálása:
Windows: Tulajdonságok
.JPEG: Exif
(Fájlon kívül)
(Fájlban tárolt)
2012. Március 1-8.
Szabadszöveges információ
Információminőség
Metaadatok reprezentálásának módja: DUBLIN CORE A metaadatok mezői:
http://www.mek.oszk.hu/dc/
1. Cím / TITLE 2. Létrehozó / CREATOR 3. Közreműködő / CONTRIBUTOR 4. Kiadó / PUBLISHER 5. Azonosító / IDENTIFIER 6. Forrás / SOURCE 7. Kapcsolat / RELATION 8. Dátum / DATE 9. Formátum / FORMAT 10. Típus / TYPE 11. Téma / SUBJECT ! 12. Tartalmi leírás / DESCRIPTION 13. Tér-idő vonatkozás / COVERAGE 14. Nyelv / LANGUAGE 15. Jogok / RIGHTS 2012. Március 1-8.
Honlapelemzés •Google ingyenes webhely tesztelő! •Alkalmazások ( AWStats, Webalizer) és szolgáltatók (Google Analytics, freeaudit, MyStat, StatSector) - honlapon belül oldalletöltések száma - látogatók száma (IP cím) - logfájlok: dátum, IP cím, oldal cím, oldalak száma, idő és milyen weblap, milyen kereső, és kereső szó)
2012. Március 1-8.
Honlapelemzés • Megtalálja-e a honlapot az érdeklődő? (kereső: tematikus, kulcsszó; PageRank )
• Megtalálja-e a honlapon az érdeklődő azt, amit keres? (visszafordulások aránya (bounce rate), idő, lap: ahol rendszeresen abbahagyják) (jól tagolt?)
• Szerepel-e egyáltalán a honlapon az, amit az érdeklődő keres? (használhatóság:usability) (szakmailag helyes és megfelelő?)
• Fizikailag, szellemileg, szakmailag képes-e a tartalmat felfogni, feldolgozni? (Akadálymentesítés) http://www.haloszem.hu/honlap_elemzes 2012. Március 1-8.
Honlapelemzés (részletes) Keresőoptimalizálási javaslatok a honlap keresőbarátabbá tételére: ‒Saját és más „jó lapok” (Alexa, Statbrain) (pontosság?) vizsgálata ‒Kulcsszó kutatás: a weblapra jellemző kulcsszavak és előfordulási gyakoriságai (kulcsszó sűrűség); a kulcsszavak keresettsége a Google-ban; a honlap Google helyezései a kulcsszavakra ‒A honlapra mutató külső hivatkozások (linkek) - hivatkozó weboldalak, weblapok Google PageRank (GPR) értéke; a hivatkozások szövegei ‒A honlap kora, oldalainak száma, struktúrája stb… . stb.
2012. Március 1-8.
Kulcsszó: stroke
2012. Március 1-8.
2012. Március 1-8.
2012. Március 1-8.
2012. Március 1-8.
Kulcsszó: stroke
2012. Március 1-8.
Ellenőrző kérdések I.
‒Mit nevezünk Internetnek és világhálónak? ‒Melyek a leggyakrabban használt böngészők? ‒Mi jellemző a keresők számára rejtett vagy részlegesen elérhető tartalmak típusaira?
‒Mi a felszíni web előnye és hátránya a mély webbel szemben? ‒Melyek a leggyakrabban használt keresők?
2012. Március 1-8.
Ellenőrző kérdések II. ‒Mit nevezünk metaadatnak? ‒Miért van különösen nagy jelentősége az adatok tárolási módjának a világhálón?
‒Mi a szerepe a kódolásnak, kódrendszereknek, tezauruszoknak és ontológiáknak az információszervezésben?
2012. Március 1-8.
Ellenőrző kérdések III. ‒Miért szükséges a metaadatok jelenléte a tartalmi keresések
során? ‒Miben különböznek a metakeresők az általános keresőktől? ‒Milyen típusú leíró adatokat szabványosít a DUBLIN CORE? ‒A honlap mely tulajdonságait próbáljuk optimalizálni, ha ismertté akarjuk tenni?