BME VIK MÉDIAINFORMATIKA SZAKIRÁNY
Médiainformációs rendszerek Dr. Magyar Gábor Dr. Szűcs Gábor Dr. Tóth László BME Távközlési és Médiainformatikai Tanszék
1
2
3
4
Milyen műszaki környezetben lehetséges ilyen szolgáltatásokat létrehozni?
5
6
7
alapfogalmak
8
Adat, információ, tudás • Adat: a valóság nem értelmezett (de értelmezhető) tükörképe Az adat nyers (feldolgozatlan) tény, ami valakinek vagy valaminek a jellemzéséhez hozzásegít.
• Információ: értelmezett adat • Tudás: az ember által kontextusba helyezett információ
Adat + értelmezés
Információ + kontextus
Tudás
9
Adat és információ négy dimenzió: ismerni kell a tárgyat illetve jelenséget amelyre az adat vonatkozik - általában és konkrétan; + a tárgy bizonyos tulajdonságát, jellemzőjét - általában és konkrétan. Példa: „X autótípus az NCAP biztonsági teszten ****
minősítést ért el, általában tudni kell, hogy mi az autó, konkrétan tudni kell, hogy mi a mondatban említett autótípus; általában tudni kell, hogy mit értsünk az autók biztonságán, és konkrétan ismernünk szükséges az NCAP tesztet
Adatkezelés • Adatkezelés: a nyers adatok tárolásának, lekérdezésének és manipulálásának feladatai. [adatmodellek, adatbázis-lekérdező és adatmanipulációs nyelvek,stb.]
10
Információmenedzsment • Információmenedzsment: az információk előállításának, rendszerezésének, értékelésének és visszakeresésének feladatai.
tudásmenedzsment • Tudásmenedzsment: a szervezeti tudástőke növelését célzó törekvések összessége. (A tudástőke a vállalati vagyon része. Három összetevője: piaci kapcsolatok tőkéje, strukturális tőke, emberi tőke. Az információmenedzsment megoldható kizárólag IT eszközökkel, a tudásmenedzsmentben kritikus az emberi szerep. A gyakorlatban a tudásmenedzsment egyik fontos eszköze az információmenedzsment.
11
Tartalom menedzsment (content management)
Tartalomjegyzék 1) Mi is az a tartalom? 2) Tartalom menedzsment 3) Tartalom menedzsment projekt 4) Tartalom menedzsment rendszer (CMS) tervezése 5) Tartalom menedzsment rendszer (CMS) megvalósítása 6) A médiainformációs rendszerek tartalom-szervezési problémája 7) Esettanulmányok, példák
12
1) Tartalom (content)
Adat
+ értelmezés
Információ
+ kontextus
Tudás
Definíciók • Adat: a valóság nem értelmezett (de értelmezhető) tükörképe • Információ: értelmezett adat • Tartalom: egy vagy több célra felhasználható formátumban adott információ ≈ elnevezett információ • Metaadat: „adat az adatról” a jelentés szűkített kifejezési térben A tartalom menedzsment lényege: adattechnológiák segítségével tárolni, kezelni és megjeleníteni a tartalmat „A tartalom menedzsment feladata nevet adni az információknak”
13
A tartalom formátumai Formátum-kategóriák • Az adatok kódolása szerint. Pl.: • Bináris, Unicode, stb. • Belső szerkezet szerint • bekezdés, oldal, alpublikáció, publikáció, szuprapublikáció • Megjelenítési formátum (megjelenítőre leképzés) szerint • Konzisztens formátum egy publikáción belül • Formátum és tartalom elkülönítése • Tipográfiai hatások, Pozícionálási (layout) hatások, Háttér hatások, … • Érzelmi hatás alapján • Kiemelés, fontosság, olvashatóság, érdekesség, környezet normái • Alkalmazás típusa szerint
A tartalom struktúrája 1 Struktúra: a tartalom egyes egyedi részei között definiált kapcsolatok halmaza • A struktúra elemei: – Kategória (komponens osztály) – Komponens példány – Elem – Reláció A jól struktúrált tartalom jól szervezhető.
14
A tartalom struktúrája 2 A struktúrakészítés nehézségei • • • • •
A teljes tartalmat át kell látni Többféle tartalom kezelése Rugalmas megoldás szükséges Saját szabályok érvényesítése, ellenállók meggyőzése A struktúra működésének megértése (metator – metaadat struktúra alapján módosíthatja a tartalmat) • Többféle egymást átfedő struktúra készítése különféle felhasználóknak
A tartalom struktúrája 3 Kategóriák • Cél szerint – Egyetlen publikációra specializált struktúra – Több publikációra specializált struktúra • Típus szerint – Osztott struktúra (tartalom felosztása): szegmensek, elemek – Hozzáférési struktúra: hierarchiák, indexek, kereszthivatkozások, sorozatok – Menedzsment struktúra: követhetőségi és kezelhetőségi attribútumokat tartalmaz – Tartalmazási struktúra: mely komponens tartalmaz másokat • Hatókör szerint – Keresési: csak lényeges elemeket emel ki – Belső: komponensen belüli struktúra – Külső: komponensek közötti struktúra
15
2) Tartalom menedzsment (content management) A tartalom menedzsment a tartalomgyűjtés, -kezelés és -megjelenítés folyamatát foglalja magába. • Gyűjtés – Meglévő forrásból információ megszerzése – Konvertálás a fő formátumra (pl. XML) – Darabolás, beépítés a rendszerbe, metaadat hozzáadása • Kezelés: – Repository előállítása (adatbázis és/vagy fájlok) – Tartalom komponensek és adminisztratív információk tárolása • Megjelenítés – Komponensek kinyerése a repository-ból – Publikáció előállítása a komponensekből és funkciókból
2.1 A tartalomkezelés funkciói Funkció: számítógép interakciós képessége arra, hogy egy adott feladatot elvégezzünk • Monolitikus programok → objektumok – Funkció darabokban – Könnyen megtalálható és használható a funkció – Nem kell ismerni a belső működést, csak az interfészt • A tartalom tartalmazza a funkciót is • Hol válik el az információ és a funkció? – Gyűjtés során: információ ill. kód – Kezelés során: tartalom metaadat kapcsolat ill. működés – Megjelenítés során: releváns tartalom elemek, navigáció ill. kódrészletek közötti integráció
16
Gyakorlati szempontból a tartalom:
Képek, videók, hang
Irodai dokumentumok
Weboldalak
Elektronikus Formok Nyomtatási kimenetek Fax
Email
Papír alapú dokumentumok, mappák
A problémák forrásai:
tárolás...
hozzáférés...
verziókezelés...
terjesztés
riportok, auditok
17
Spagetti effektus
2.2 Tartalom menedzsment rendszer CMS: Content Management System
Három fő részből áll:
18
2.2.1 Gyűjtő rendszer 1 Gyűjtő rendszer: a tartalom bejuttatása a rendszerbe, továbbá tartalom előállítás Lehetséges fő folyamatai: • Írás • Beszerzés – Forrásfájlok: meglévő mmédia-információk, melyeket számítógép tárol (képek, videók, stb) – Újrafelhasználásra tervezett források • Általános szállítható bináris formátum • Metaadattal bővített információ • Átalakítás – Kibontás: lényeges információ kinyerése – Formátum átalakítás: CMS által támogatott formátumra – Struktúra átalakítás
Gyűjtő rendszer 2 • Csoportosítás: különálló média tartalmak struktúrába szervezése – Szerkesztői folyamat: helyesség, kommunikációs szabályok, CMS-nek való megfelelés vizsgálata – Tartalom komponensekbe szervezése (komponenshatárok jelölése) – Metatorial folyamat: metaadat és információ összerendelésének ellenőrzése • Kiegészítő szolgáltatások: tartalom repository-ba töltése – Kész komponensek betöltése egyenként vagy csoportosan Példa: eLearning CMS rendszer --- GYŰJTŐ alRENDSZER • • • •
Tanulási objektum előállítása és szerkesztése (Szerzői funkció) Tanulási objektum export/import (szabványos formátum) Tanulási objektum formátum-átalakítása Tanulási objektum metázása
19
2.2.2 Menedzsment rendszer 1 A Repository feladata: hosszú távú tárolás és erőforrások kezelése • Tartalom komponensek tárolása • Konfigurációs és vezérlő fájlok tárolása – Minták – Hozzáférési információ – Metaadat lista – Szabályok – Napló – Szkriptek és karbantartó rutinok
Menedzsment rendszer 2 Adminisztrációs rendszer: CMS struktúra és paraméterek kezelése • Gyűjtő rendszer adminisztrálása – Munkatársak hozzáférése, metaadat és rendszerkonfiguráció kezelése • Menedzsment rendszer adminisztrálása – Felhasználó kezelés, biztonsági másolat, munkafolyamatok kezelése, metaadat ellenőrzés • Megjelenítő rendszer adminisztrálása – Hardver és szoftver eszközök kezelése, amelyek a megjelenítéshez kapcsolódnak
20
Menedzsment rendszer 3 Munkafolyamatkezelő rendszer: Koordináció, ütemezés, munkatársak feladatainak kezelése • Gyűjtő rendszer munkafolyamatai – Tartalom gyűjtés készítés és csoportosítás - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. • Menedzsment rendszer munkafolyamatai – Archiválás, tartalom ellenőrzés, adatbányászat - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. • Megjelenítő rendszer munkafolyamatai – Kimeneti formátumra alakítás, tartalom-egyesítés/jelölés, kimeneti eljárások - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. (különös tekintettel a kimeneti időzítésekre, menetrendekre, szinkron/aszinkron megoldásra, push/pull megoldásra; forgalom-naplózás, eseménykezelés, stb.)
Menedzsment rendszer 4 A Repository feladata: hosszú távú tárolás és erőforrások kezelése Az adminisztrációs rendszer feladata: CMS struktúra és paraméterek kezelése A munkafolyamatkezelő rendszer feladata: Koordináció, ütemezés, munkatársak feladatainak kezelése
21
Menedzsment rendszer 5 A menedzsment rendszer kapcsolatai • • • •
Szervezet LAN, WAN környezetével Felhasználók kezeléséért felelős rendszerrel („HR”) Metaadat rendszerekkel Vállalati adatbázisokkal
Példa: eLearning CMS rendszer --- MENEDZSMENT alRENDSZER • • • •
Tanulási objektumok tárolása, hozzáférése; sablon-kezelés eLearning workflow menedzsment (szerző, designer, szerkesztő, tanár, stb.) Konfiguráció-kezelés (rendszer és tananyagok) Külső kapcsolatok (HR, külső forrás, …)
2.2.3 Megjelenítő rendszer Feladata: Tartalom komponensekből publikáció készítése (automatikusan/félautomatikusan/…) Részei: •Publikációs minta (publikációt építő logika) – Statikus elemek – Szolgáltatások hívása – CMS-en kívüli szolgáltatások hívása •Publikációs szolgáltatás (tartalomból és metaadatból építi fel a publikációt) – Minta letöltés és végrehajtás – Publikáció specifikus szolgáltatások biztosítása – Kapcsolatot biztosít a nem CMS-hez kapcsolódó szolgáltatásokkal
22
Megjelenítő rendszer
Példa: eLearning CMS rendszer --- MEGJELENÍTŐ alRENDSZER • • • •
Publikációs sablonok kezelése Megjelenítő alkalmazás(ok) illesztése Interaktivitás biztosítása (pl. hallgatói tesztek) Portál funkció
Pl.: Webes publikáció • • • •
Minta letöltés Paraméterek átadása Minta kódjának végrehajtása Kész oldal visszaadása
23
2.2.4 A CMS szükségessége 1 Sok tartalom
Sok szerző
- Tartalom elemek -Tartalom típusok
- Különféle szerzők - Komplex források
Sok változás
Sok megjelenítési forma
- Tartalom átvitel - Terv ellenőrzés
- Tartalom csatornák - Testreszabás
• Tartalom mennyiségének mérése (sok, sokféle tartalom) • Tartalom előállító források menedzselése (szabályok betartatása) • Változások mennyiségének becslése – Komponens áteresztőképesség (változtatott komponensek száma/idő) – Kostrukció változtatásának gyakorisága • Publikációk száma (publikáció típusok, testreszabhatóság)
A CMS szükségessége 2 A tartalomkezelési feladat komplexitásának becslése: szerzők*források*komponensek*típusok*áteresztőképesség*publikáció*testreszabhatóság*újratervezés • • • • • • •
Szerzők: 1-20 → 1 amúgy x/20 Források: 0-1 →1 amúgy x/2 Komponensek: 1-500 →0.5 501-1000 → 1 utána x/1000 Típusok: 1-3 → 0.5 4-5 → 1 utána x/5 Áteresztőképesség: 1-25 → 0.5 26-50 → 1 utána x/50 Publikáció száma Testreszabhatóság: – 1 → nem szabható testre – 2 → kevés nagy felhasználócsoport – 3 → sok kis felhasználócsoport – 4 → minden felhasználóhoz külön • Újratervezés: 1-2 → 1 utána x/2
24
A CMS szükségessége 3 Komplexitás kiértékelése: • • • • • • •
- 0.25: nincs igazi igény CMS-re 0.25 – 0.5: növekedés esetén lehet igény CMS-re 0.5 – 0.75: növekedés esetén kell CMS 0.75 – 1: növekedés esetén fel kell készülni a bevezetésre 1 – 1.5: ha nincs növekedés kis rendszer szükséges 1.5 – 10: ajánlott a CMS bevezetése 10 - : CMS mindenképpen szükséges
2.2.5 A CMS gyökerei 1 • A kiadók tudásbázisa – Publikáció – Tartalom gyűjtés – Folyamatok általánosítása • Dokumentum kezelés szabályai – Fájlokban van a tartalom – Fájlokban bináris objektumok vannak • Publikáció egy fájl • Dokumentum és tartalom kezelés különbségei – Fájlokkal – tartalom komponensekkel dolgozik – Más alkalmazásokkal készített fájlokkal dolgozik – vezérli a készítést is – Fájlokhoz való hozzáférés – több komponenshez való hozzáférés
25
A CMS gyökerei 2 • (Multi)média ipar hagyatéka – Elektronikus publikáció – Első tartalom menedzsment rendszerek • Könyvtárak hagyatéka és információs tudomány – Kategorizálás és információ keresés – Információ struktúrája • Szoftverfejlesztés – – – –
Gyűjtési technikák Menedzsment technikák Megjelenítési technikák Funkciók az elektronikus publikációkban
A CMS gyökerei 3 Dokumentálási feladatok nehézségei – Hatalmas információs bázis – Párhuzamos publikációk Marketing előfeltételek – – – –
Cél meghatározása Érték meghatározása Üzenet Célközönség analízis
26
2.2.6 A CM fő területei képkezelés
dokumentumkezelés
rekordkezelés
tartalom tároló
Web-tartalom kezelés
A CM ágazatai • Weboldalak (bonyolult webhelyek készítése, karbantartása) • Sokféle publikáció kezelése – Információ feldarabolása publikációs igényektől függetlenül – Terv elkülönítése a tartalomtól – Publikációkhoz a megfelelő tartalom kiválasztásához szabályok • Elektronikus kereskedelem (katalógusok) • Tudás menedzsment – Szintézis és információ megtalálása – Kategorizálás – Tudás portálok • Online közösségek • Testreszabás
27
CM ágazatai – Online közösségek
• CMS szerepe: – – – –
Tagok aktívan hozzáférhessenek a tudáshoz Repository növekedésének biztosítása Finom kategorizálás, nagyfokú testreszabhatóság Munkafolyamatokat támogat
2.2.7 Testreszabás • Típusai: – Profil alapú: jellegzetességek csoportba foglalása – Viselkedés alapú: korábbi viselkedés alapján – Hosszútávú: tervezett tartalom a tervezett közönségnek • Feladata: – Információ gyűjtése a felhasználóról – Adatok és tartalom összeegyeztetése – Normál környezetben szállítjuk a tartalmat
28
2.3 CMS típusok • WCMS: Web CMS (pl. portál, wiki) • DAM: Digitális vagyonkezelő rendszer • DM: Dokumentumkezelő rendszer (Document Mamagement) • KM: Tudáskezelő rendszer (Knowledge Mamagement) Integráltan: ECMS (vállalati információs rendszer). • Szokás idesorolni az un. tranzakciós CMS (e-business) rendszereket is.
Web CMS • Web szerveren közzétett tartalom kezelésére (Æ vegyes „internetes” médiaformátumhasználat: HTML, XML, PDF, JPG, GIF, PNG, BMP, WAV, MP3, MPEG2, MP4, SWF, stb.) • Laikus tartalom-kezelés (feltöltés, formázás is!) – tipikusan sablon, template alapú
• Üzemeltetés, fenntartás – nem kifejlesztés • Gyakran DB alapú, de lehet dokumentum alapú is
29
DAM • Digitális vagyonkezelő (Digital Asset Management) • Szervezeti/üzleti környezetben a digitális formájú tartalom kezelése a szervezeti célok szolgálatában (a szervezeti munkafolyamatok támogatására).
DMS • Dokumentumkezelő (document management system) • Elektronikus dokumentumok kezelése (e-dokumentum: szövegfájl, multimédia fájl, e-levél, hangfájl, videófájl, eLearning tananyag; papír dokumentum képe, …) • Dokumentum kezelési munkafolyamat támogatása („iktatórendszer”)
• Bemenet, tárolás, keresés, indexelés, metázás, verziókezelés, biztonság, archiválás, stb.
30
KM • Tudáskezelő rendszer (Knowledge Mamagement) • Szervezeti tudás kezelésére (gyűjti, szervezi, szétosztja a tudást). • Összetett alkalmazás(ok) – pl. e-learning, kollaborációs eszközök - hatékonyságának javítására.
ECM Szervezeti folyamatokkal kapcsolatos tartalom leképzésére, kezelésére, felhasználására, tárolására, megőrzésére és terjesztésére Strukturált és félig-strukturált tartalmak Lehet DB vagy dokumentum alapú újabban wiki architektúra kísérletek - Digitális vagyon kezelése (DAM) - Dokumentumkezelés (DMS) - Rekordkezelés - Webtartalom kezelése (WCM) - Együttműködés kezelés (csoportmunka, wiki, blog, …)
31
Tranzakciós CMS • Zárt, vállalati CMS • DB alapú • Üzleti folyamatok támogatására
Tudás-portál Web alkalmazások
virtuális FTP
Portál Szerver
Alkalmazás szerver
Web szolgálat CRM Üzleti folyamat kezelés (BPM)
Tartalom-tár
fájlrendszer
CIFS WebDAV
Indexelés, katalogizálás tároló
Metaadat DBMS
32
Egyszerű szemléltető példa Felhasználói interfész
Szerzői sablonok
Alkalmazás szerver
publikációs sablonok
HTML oldalak
adatbázis
Az egyszerű szemléltető példa folyamatai Felhasználók elemzése
Üzleti stratégia
Kiadói folyamatok elemzése
Inf. architektúra tervezése
munkafolymat
tartalom/metaadat modell
Szerzői sablonok
Megjelenítési sablonok
tartalom
Tartaom audit
megjelenítés
Web oldalak
33
eRekordkezelés szabványosan Például: ISO 15489:2001 • Rekordkezelési politika és szabályok • Felelősségek és feladatkörök • Eljárások • Rekordkezelési alapszolgáltatások • Adminisztrációs feladatok és eljárások • A rekordkezelés integrálása üzleti folyamatokba
Néhány példa: Termék neve
Platform
Támogatott DB
Documentum
J2EE
SQL Server, Oracle
FatWire
Java
Oracle, Microsoft SQL Server, IBM DB2, Sybase, MySQL
I-ON Content Server4
Java/J2EE
Oracle, MS-SQL
Interwoven
Windows, Solaris
Oracle, Microsoft SQL Server, IBM DB2, Sybase, Informix, MySQL
Jadu
PHP
SQL
Microsoft Sharepoint Portal Server
.NET.
SQL Server
Vignette
Java/J2EE, Solaris, Linux, AIX, Windows 2003
Oracle, SQL Server, DB2
34
2.3 CMS típusok A CMS típusok közül részletesen foglalkozunk a
Web Content Management rendszerekkel.
Meghatározás Web Content Management System (WCMS): egy web alapú alkalmazás tartalom létrehozásra, áttekintésre, kezelésre és megjelenítésre.
35
WCMS építésének lehetséges céljai • • • • • • • • •
ECM kialakítási lehetőség Egyszerűsödő használat Költség megtakarítás Archiválás, verzió követés Külső rendszerek beintegrálása Használati statisztika készítési lehetőség Tartalom keresés Training Folyamatos support a felhasználóknak
WCMS építésének lehetséges céljai • • • •
Platform és browser kompatibilitás megoldása Multiple formátum (HTML,PDF, stb.) Web-oldal sablonok módosításának lehetősége Tartalom frissítésének gyors lehetősége
36
WCM rendszerek kialakulása
37
WCMS előnyei 1 • Tartalmat elérhetővé és kontrolálhatóvá teszi a nem technikai szakértők számára is. • Lecsökkenti a nagy számú weboldal fejlesztési és support összköltségét. • Kontrolt biztosít a publikálás, a workflow és a tartalom pontosságára. • Megoldja a tartalom újrahasznosítását oly módon, hogy megengedi új kontextusba helyezni és így többszörösen publikálni.
WCMS előnyei 2 • • • •
Megkönnyíti a webfelelős frissítési munkáját. Templete-k használatával meggyorsítja a weboldalak fejlesztését. Személyre szabottságot biztosít. Decentralizált környezetben egységesítéssel megkönnyíti a munkát.
38
WCM rendszer fejlesztők • Vendors: Microsoft, IBM, Vignette, FileNet stb. • WCM rendszerből sok van a piacon, de nincs ezek között olyan, mely jelenleg piac vezető lenne (sok piaci és sok nyílt forrású is van).
WCMS vendors csoportok • Nyílt forrású • Piaci termékek • Saját fejlesztés (nem kifizetődő)
39
WCM szállítók Enterprise
Vignette, Documentum, Interwoven, FileNet, Stellant
High End
Microsoft CMS, IBM WCM, Day Software, Percussion, MediaSurface
Mid Market
PaperThin, RedDot, Ingeniux
Low End
Macromedia
Open Source
Zope, OpenCMS
Mikor kell WCM-et alkalmazni a hagyományos portál helyett? Meg kell vizsgálni, hogy: • mennyi weboldalt tartalmaz a teljes portál • milyen gyakran történik a frissítés • milyen okok akadályozzák a frissítést • …
40
Mennyi weboldalt tartalmaz a web-site?
Milyen médiaformátumban található a WCMS tartalma?
41
Milyen gyakran történik a frissítés?
Milyen okok akadályozzák a frissítést?
42
Frissítésnél mit kell frissíteni: tartalmat, kinézetet vagy mindkettőt?
Van-e külső forrás vagy alkalmazás a web-site-hoz kapcsolva?
43
Költségek • • • •
Beszerzési ár Fenntartási költségek Személyre szabás költsége További hardver és szoftver költségek, pl. adatbázis licenszek és szerverek
WCM rendszerek jellemzői I. Általános jellemzők II. Tartalom létrehozásának jellemzői III. Tartalomkezelő tulajdonságok IV. Tartalom terjesztésének jellemzői V. Életciklus tulajdonságok
44
I. WCM rendszerek általános jellemzői • • • • • •
a. Alapadatok b. Technológiai jellemzők c. Verzió d. Marketing adatok e. Installálási jellemzők f. Support
I. a és b. (Alapadatok, Technológiai jellemzők) • a. Alapadatok (név, cég) • b. Technológiai jellemzők – Licensz (nyílt forráskódú-e) – CMS típus (általános, User Interfész, Portál, Wiki, stb.) – Platform (Windows, Linux, Mac.) – Web szerver (Apache, stb.) – Alkalmazás framework (Perl, .NET, J2EE, PHP, stb.) – CMS keret (AxKit, Cocoon, Midgard, Zope, etc.) – Nyelv (Perl, VB, Java, PHP, Python) – Adatbázis (Oracle, MySQL, PostgreSQL, ODBC)
45
I. c.-f. • • • •
c. Verzió d. Marketing adatok (ár, licensz/CPU vagy /user, On-line eladás-e) e. Installálási jellemzők (ideje, dokumentumai) f. Support – Online Help – Tutorials – Training – Help Desks
II. Tartalom létrehozás • a. Akvizíció • b. Aggregáció • c. Authoring
46
II. a. Akvizíció – – – – – –
Támogatott fájl típusok Fájl transzfer (FTP, site import) Konverziós eszközök (pl. Word-ből XML-be) Jogok menedzselése Tagging (struktúra, szemantika) Támogatott RDF ontológiák (pl. Dublin Core)
II. b. Aggregáció – Metaadat menedzsment (bejövő metadatok olvasása) – Integrált Web szolgáltatások – UDDI eszközök
47
II. c. Authoring – Tartalomelemek editora (kezdő és haladó felhasználónak is) • WYSIWYG • XML Editor • Helyesírás ellenőrzés • kép, hang, Flash, video, etc. – Template editor • WYSIWYG • Template Gallery • XML Editor – Tag Editor (szemantika és stílus) • Legördülő menük • Metaadat tezaurusz • Taxonómia / Ontológia online
III. Tartalom menedzsment jellemzők • • • • • • • • •
a. Workflow b. Verziókövetés c. Perszonalizáció d. Lokalizáció e. Report (jelentés) készítés f. Tárolás g. Biztonsági másolat h. Biztonság i. Minőségbiztosítás
48
III. a. Workflow – Hozzáférési engedélyek finomsága • Engedélyek szintjeinek száma • Engedély felhasználónként, alkönyvtáranként, szerepenként (létrehozó, szerkesztő, stb.), elemenként • Létrehozó automatikusan jogosult lesz-e • Felhasználói csatlakozás a munkafolyamatokhoz – Ki és bemeneti ellenőrzés • Aktuális lapot a Weben megnyithatjuk-e editálásra • Automatikus fájl lokkolás szerkesztésre való megnyitáskor • Konfliktus feloldás (kié a jogosultság?) – Workflow üzenetek • E-mail érkezésének jelzése • Megjegyzések a munkafolyamatokhoz • Workflow log
III. b. Verziókövetés – Ütemezés, lejárat – Minden elem, minden sablon időbélyeggel lesz ellátva – Archiválás visszaállítási lehetőséggel (fájlonként, site-onként?)
49
III. c. Perszonalizáció – Akciók nyomkövetése – Viselkedés analízis – Egyedi látogatói azonosító (cookie)
III. d. Lokalizáció – Többnyelvű szerver, többnyelvű szoftver – Mértékegységek adott országra (pénznem, idő, stb.) – Lokalizáció adott helyre (egyetemi campus, stb.)
50
III. e. Jelentés készítés – Kronológiai munkafolyamat dolgozó személyenként – Web-stílus a teljes site-ra – Monitorozás
III. f. Tárolás – Forma (szöveg, HTML, XML) – Adatbázis – Fájlok és adatbázis
51
III. g. Biztonsági másolat (backup) – – – –
Onsite és offsite Fájlok és adatbázisok Másolat időtálló médiára Visszaállítási terv
III. h. i. Biztonság, minőségbiztosítás • h. Biztonság – Tűzfal szabályok – Biztonsági kódolás • i. Minőségbiztosítás – Tesztelési módszerek
52
IV. Tartalom terjesztés • a. Publikálás / terjesztés • b. Syndication
IV. a. b. Terjesztés, Syndication • a. Publikálás / terjesztés – Terjesztés szétválasztása a létrehozástól (replikáció, tükör siteok szinkronizációja) – Többszörös publikáció különböző kliensekre (PDA, Handicap elérhetőség/508, print) – Publikációs standardok • b. Syndication – Web szolgáltatásokkal
53
V. Életciklus támogatás • • • • • • •
a. Biztonság b. Üzleti szabályok c. Integráció d. Metaadatok menedzsmentje e. Asszociációk f. Analízis g. Keresés
V. a. b. Biztonság és szabályok • a. Biztonság – Könyvelés – Felhasználók – Rendszer – Hálózat (autentikációval) • b. Üzleti szabályok – Titoktartási politika
54
V. c. d. Integráció, metaadatok • c. Integráció – Egyszeri autentikáció – Vállalati portál – Adattárház • d. Metaadat menedzsment – Digitális jogok – Digitális szabályok
V. e. f. g. Összefüggések, analízis, keresés • e. Asszociációk, összefüggések – Hierarchia – Taxonómia – Index – Keresztreferencia • f. Analízis – Analitikus eszközök – Minta felismerés • g. Keresés
55
Tartalom életciklusának 2 része Felépítési fázis: • Template • Globalizáció • Tartalomírás • Transzformáció • Aggregáció • Tag-ekkel való ellátás • Workflow
Terjesztési fázis: • Lapgenerálás • Perszonalizáció • Többszörös publikáció • Tükrözés • Újrafelhasználás • Analizálás
Tagging • Pl.
Sor
(tag id, határoló, hatáskör) • Tartalomhoz hozzáadunk értéket, mely vonatkozhat a jelentésre vagy kapcsolatokra • Segít a keresésben • Meg kell találni a kompromisszumot a befektetett munka és az általa hozott nyereség között • Limitált szókészlet
56
Portál funkciók • • • • • • •
Autentikáció és biztonság Testreszabhatóság Csatornák Perszonalizáció Alkalmazás integrálás Közösség és kollaboráció Elérés és keresés
Autentikáció és biztonság • Felhasználó csak azokat az információkat láthatja, módosíthatja, melyhez engedélye van • Előfutára az aláírásnak • Funkciók, szerepek szerinti csoportosítás
57
Testreszabhatóság (egyedi igényekre szabható) • Információk (hírek, események, hirdetések, információ kategóriák) és szolgáltatások saját szerep (hallgató, munkatárs, vagy vásárló, cég, stb.) szerint láthatók. • Információk és szolgáltatások saját választás szerint kezelhetők (könyvtári adatbázis, hír szolgáltatás). • Felhasználó saját profile-t készíthet, szerkeszthet.
Csatornák • Ablakszerű területek, melyek információkat és/vagy alkalmazásokat tartalmazhat • Portál számos csatornából épül fel • Hívhatjuk ezeket: “pagelet” (Oracle: portlet; Blackboard: Module.)
58
Példák csatornákra • • • • • •
Chat Hírek Tanfolyamok E-mail Munkafolyamat alkalmazás stb.
Weblap elemei • • • • • •
Főoldal Felhasználói oldal Kapcsolat felvétel Gyakran Ismételt Kérdések Hírlevél jelentkezés Tegye az oldalt a kedvencei közé link elhelyezése a nyitólapon, stb.
59
Perszonalizáció • • • •
Választás menüből (szín, pozíció, méret, stílus, témák, kinézet) Fel és leiratkozás csatornákra Hozzáad és eltávolít linkeket Csatornák perszonalizálása (szín, pozíció, méret, stílus)
Alkalmazás integrálás • • • •
Alkalmazások adatokat oszthatnak meg Műveletek végrehajtásának lehetősége Napi munka: ütemezés, naptár, e-mail, könyvjelző E-commerce: on-line fizetés
60
Kommunikáció, közösség és kollaboráció • Információ feltöltés • • • • •
E-mail, naptár, ütemezés Fórumok Azonnali üzenetek (instant) Tábla (whiteboard) Videokonferencia
Elérés, keresés • • • •
World wide web Fájl rendszerek Relációs adatbázisok Repository-k
61
WEB 2.0 olyan második generációs internetes szolgáltatások gyűjtőneve, amelyek elsősorban a közösségre épülnek – vagyis a felhasználók közösen készítik a tartalmat vagy megosztják egymás információit. Webkettes szolgáltatásoknál a szerver gazdája csak a keretrendszert biztosítja, a tartalmat maguk a felhasználók töltik fel vagy hozzák létre.
WEB 2.0 tipikus szolgáltatások • • • • • • • • • •
Közösségi oldalak (Social networking, például: iWiW, orkut) Képmegosztó oldalak(Például: Flickr) Videómegosztó portálok (Például: YouTube) Blogok Online irodai alkalmazások (Például: Google Calendar, Google Docs & Spreadsheets) Fórumok Wikipédia Aukciós oldalak (Például: eBay) Linkmegosztó szolgáltatások: (Például: del.icio.us) RSS (webes tartalmak rövid leírására használják, ami rendszerint egy hivatkozást is tartalmaz a cikk teljes verziójára) Pl. Podcast hang, majd video közzétételre.
62
Web 1.0 --> Web 2.0 • • • • • • • • • • • • • •
DoubleClick --> Google AdSense Ofoto --> Flickr Akamai --> BitTorrent mp3.com --> Napster Britannica Online --> Wikipedia personal websites --> blogging evite --> upcoming.org and EVDB domain name speculation --> search engine optimization page views --> cost per click screen scraping --> web services Publishing --> participation content management systems --> wikis directories (taxonomy) --> tagging ("folksonomy") stickiness --> syndication
Web2.0 WCM rendszereknél • Az új technológiák, mint pl. a Flash és az AJAX sokkal nagyobb interaktivitást biztosítanak, ugyanis sokkal hatékonyabb a kommunikáció a browser és a host között. • A browser azonnal elküldi az információkat, így rugalmas tartalomváltoztatásra van lehetőség akár többször is a WCM-nél.
63
WCMS modell
Oktatással kombinált WCMS általános szerkezete
64
WebCT • Tanfolyam menedzsment rendszer • Courses Tool: E-learningben használatos tanfolyam oktató eszköz. Fő funkciói: – Vita tábla – Levél kezelő rendszer – Chat – Különböző tartalmak (dokumentumok, weblapok) megvitatásának, cseréjének lehetősége
Adatbázisokban keresve legtöbbször csak hivatkozást és absztraktot kapunk vissza eredményként. Ilyenkor az SFX nyújthat segítséget egy link-kel úgy, hogy az SFX direkt linkkel egy másik adatbázisban található teljes szövegre (full text) mutat.
SFX
65
Galileo • GeorgiA LIbrary LOarning Online (GALILEO) egy virtuális könyvtár, a Georgia Egyetem rendszere. • Számos adatbázis elérhető benne absztraktokkal és teljes szövegekkel. • http://andromeda.galib.uga.edu
GIL • GIL (GALILEO Interconnected Libraries) katalógus • https://gil.gsu.edu/
66
Template elemei 1. • Mester-cím
• Nyomkövető
• Főcím
Template elemei 2. • Menü • Tartalom • Szerző / dátum / egyéb megjelenítési forma
67
WCMS szintjei • WCMS jelöltek • Dinamikus web-site-ok • Teljes WCM rendszerek
68
WCMS jelöltek • Ezek a rendszerek tudnak kezelni template-eket, rendelkezik vázlat funkcióval, link menedzserrel. • Van publikáció menedzser opció, mely az újonnan készített részeket frissíti a web szerveren. • Ilyen pl. Microsoft FrontPage és a Macromedia Dreamweaver
Dinamikus web-site-ok • Nem WCM rendszerek, hanem web-alapú alkalmazások.
69
Teljes WCM rendszerek • Több, mint egy dinamikus Web-site.
DAM és WCM összehasonlítás ECM Vendor
Enterprise DAM
WCM
Documentum
ígéretes
ígéretes
Interwoven
pozitív
nagyon pozitív
OpenText
pozitív
ígéretes
Hummingbird
-
pozitív
IBM
ígéretes
ígéretes
Vignette
-
nagyon pozitív
Stellent
ígéretes
nagyon pozitív
70
Régi és új WCM funkciók
Fejlesztési és integrációs eszközök Development and Integration • Egységes platform (standard): – J2EE Unixhoz – .NET Windowshoz • Web service lehetővé teszi az interoperabilitást laza kapcsolattal • JSR (Java Specification Request) útmutatót ad az API (Application Programming Interface) építés számára – JSR168 tartalom konverziója a portálhoz – JSR170 más repositoryból való tartalom átvétel
71
Jelentéskészítés / Analízis Reports / Analytics • Alapfunkciók, mint pl: létrehozás, szerkesztési nyomkövetés minden egyes tartalom egységre • Bővített funkciók: statisztika a tartalom használatáról (dinamikája, hányszor nézték meg, stb.)
Biztonság menedzsment Security Management • Hozzáférés a WCM alkalmazásokhoz, tartalomhoz. pl: – üzleti felhasználó csak létrehozhat tartalmat, – szerző, szerkesztő változtathat is tartalmakon, de nem a kódon, – dizájner a sablonon változtathat csak – menedzsmentnél történhet a végső jóváhagyás • Dinamikus engedélyeztetés a szerepek gyors változtatásához
72
Perszonalizáció Personalization • Ebbe beletartozik a szerepeken alapuló általános profile készítéstől a felhasználói viselkedésen alapuló weboldal testre szabás is. • Célja lehet: – Web marketing – Kontextus függő információ megjelenítés – Megjelenítési felület testre szabása
Dinamikus tartalom Dynamic Content • A tartalom automatikusan publikálható emberi beavatkozás nélkül • A tartalom élő adatokból (pl. adatbázisból) aggregálva összeállítható és a weblapra frissítve kirakható.
73
Replikáció (többszörözés) Deployment and Replication • Replikáció transzfert biztosít a – WCM rendszer és a Web szerver között – Szerver és a tükör site-ok között • Deployment szerver tudja – Transzfert ütemezni és nyomon követni – Biztosítani a konzisztenciát a tükör site-ok között (automatikusan szinkronizál)
Frissítés menedzsment Change Management • Nem csak a tartalom, hanem a kód frissítéséért is felelős – Milyen tartalmat kell frissíteni – Milyen ütemezéssel (real-time-tól a heti gyakoriságig)
74
Alapszolgáltatások Library / Services • Egyszerre csak 1 felhasználó férhet hozzá módosításkor egy adott tartalom-elemhez (lockolás segítségével). • A változtatásokat feljegyzik és a régi verziók archiválásra kerülnek. • Ezek segítségével oldható meg a verziószám nyomon követése és a könyvelés karbantartása.
CMS típusok összehasonlítása Ismétlésként:
• • • • •
WCM DM DAM KM ECM
• (Workflow, Record Management, dokumentum-centrikus kollaborációs szoftver)
75
ECM Enterprise Content Management • Tartalom tipikusan: üzleti dokumentumok, elektronikus tranzakciók vállalatirányítási rendszereken (ERP - Enterprise Resource Planning) belül. • Közös tulajdonságaik: XML képesség, portál támogatás, munkafolyamat és üzleti folyamatok menedzselése, keresés és kategorizálás.
WCM Web Content Management • Közös tulajdonság: tartalmak Web-formátumban (HTML, XML, PDF, kép, audio, video, stb.) • Intranet kezelés, Web menedzselése. • Template-eket használ a tartalom létrehozására, publikálására. • Támogatja a Web perszonalizációt.
76
DM Document Management • Kezdetben nyomtatott és digitális dokumentumok közti interfész szerepét töltötte be. Ma: elektronikus dokum. kezelése a feladata, így tárolás, archiválás, indexelés, visszakeresés, verzió követés, bekimeneti ellenőrzés, szétosztás. (biztonság) • Erős kapcsolat az üzleti folyamatokkal.
DAM Digital Asset Management és Digital Rights Management (DRM) • Tartalomból származó bevételre fókuszál. • Digitális vagyon pl. média fájlok (kép, mozgókép, hang) • Feladata: rendszerbe betöltés, kategorizálás, tartalom védelem, tartalom értékének maximalizálása • DRM harmadik személynek való átadást kontrollálja
77
KM Knowledge Management • Szervezeti tudás maximalizálására törekszik. • Szervezeti tudással töltik fel, organizálja és szétosztja a tudást. • Ezen kívül: E-learning, adatbányászat, kollaborációs eszközök (üzenetek, interaktív párbeszéd, online megbeszélések, csoportmunka).
Összehasonlítás 1 ECM
WCM
DM
DAM
KM
Tartalomírás
0
+
-
-
0
Transzformálás
+
0
+
0
0
Aggregáció
0
0
-
-
+
Szegmentáció
+
0
+
+
+
Újrahasznosítás
-
+
-
+
-
78
Összehasonlítás 2 ECM
WCM
DM
DAM
KM
Repository
+
+
+
+
0
Munkafolyamat
+
+
+
0
-
Keresés
+
+
+
+
+
Verzió követés
+
+
+
+
-
Tartalom életcikl.
+
+
+
+
-
Rekordkezelés
0
-
+
0
-
ECM
WCM
DM
DAM
Személyre szab.
+
+
-
0
0
Webes publ.
+
+
-
+
0
Sablon tám.
+
+
-
-
-
Többszörös publ.
+
0
0
+
-
Többszörös site
+
+
-
-
-
Tartalom terjesztés
+
0
-
+
-
Összehasonlítás 3 KM
79
Összehasonlítás 4 ECM
WCM
DM
DAM
Kollaboráció
+
0
+
-
+
Dig. vagyon bizt.
+
0
+
+
-
Alkalmazás integ.
+
-
-
-
-
Dinamikus Web
+
+
-
-
-
Jelentés, statisztika
+
+
0
+
0
+ van, - nincs,
KM
0 lehet
3) Tartalommenedzsment projekt A tartalom menedzsment projekt alapja szabályok definiálása a következők között: – Környezet elemei – Tartalom elemek – Hozzáférés típusok • Szabályok szintjei: – Szöveges („szabad” – primer igényből) – Specifikációs (formális) – Algoritmikus („programozás”)
80
Feladatok osztályozása • Menedzser • Üzleti folyamat elemző • Információ építő • Infrastruktúra tagok • Szoftver fejlesztők • Megjelenítéssel foglalkozó csapat • Tartalom feldolgozó csapat • Tartalom előállító csapat (ezek tipikus feladatkörök, egy konkrét CMS-ben nem feltétlenül van mindegyik, nem pont ezek, illetve mások is lehetnek)
Feladatok - Menedzser • Tartalom menedzser – Teljesen átlátja a CM lényegét – Megtervezi és vezeti a CM bevezetését – A CMS igényeit vázolja cégen belül és kívül • Projekt menedzser – A projekt résztvevőit és erőforrásait kezeli – Elkészíti és betartatja a projekt tervet • Termelés menedzser – – – –
A termelés résztvevőit kezeli Megtervezi a termelési folyamatot Betartatja az ütemezést Minőségi és gyorsasági paraméterek készítése és betartatása
81
Feladatok – Folyamat elemző • Kigondolja hogyan illeszkedik a CM projekt a szervezet stratégiájához • Megállapítja a határidőt • Támogatási és együttműködési stratégiát készít a szervezeten belül • Felügyeli az üzleti folyamatot • Projekt követelményeit meghatározza és kihírdeti • Kigondolja a stratégiát • Együttműködik a projekt csapatával
Feladatok – Információ építő • Megtervezi a struktúrálás folyamatát, az információ megjelenítését és a hozzáférést és ezeket meg is valósítja • Tartalom elemző – Összegyűjti a tartalmi követelményeket – Logikai tervet alkot – Fizikai tervet készít az implementációs előírásokhoz – Megbecsüli a ráfordítást – Megtervezi a rendszert • Metator – – – –
Ellenőrzi a komponensek metaadat mezőinek helyességét Ellenőrzi a tartalom átalakítás helyességét Kitölti a metaadat mezőket Elkészíti és frissíti a metatorial kézikönyvet
82
Feladatok – Infrastruktúra tagok • CMS adminisztrátor – CMS beállítása – Input tartalom ellenőrzése – Felhasználók és folyamatok karbantartása – Hibák felismerése, javítás – Adatkezelés optimalizálása • Telepítés elemző – – – – –
Szoftver, hardver, konfigurációs és platform igények felmérése Intergráció kigondolása más rendszerekhez Telepítés és bevezetés megtervezése Szükséges munkatársak becslése Szükséges tanulás és támogatás meghatározása
Feladatok – Szoftver fejlesztők 1 • Szoftver elemző – Fejlesztői környezet megválasztása – Specifikáció írás – Eldönti mit kell egyedileg megírni – Munkatársak számának becslése • Minta (template) és CMS fejlesztő – Publikációs és bemeneti minták írása – Kisebb programozási feladatok • Egyedi alkalmazás fejlesztő – Gyűjtési, menedzsment és megjelenítési feladatokhoz programok írása
83
Feladatok – Szoftver fejlesztők 2 • Szoftver integrátor – Összeköti a gyűjtő rendszert és a CMS-t más erőforrásokkal – Összeköti a CMS publikációkat más külső erőforrásokkal – Összeköti a megjelenítést a kiszolgálóval • Teszt elemző és mérnök – – – –
Tesztek kifejlesztése és végrehajtása Különféle felhasználói beállítások mellett dolgozik Lazán összefüggő gyűjteményeken is tesztel Publikációk minőségét biztosítja
Feladatok – Megjelenítő csapat 1 • Megjelenítés elemző
•
– Tervező eszköz és környezet kiválasztása – Általános megjelenítési specifikáció készítése – Tartalom megjelenítésére terv kidolgozása – Munkatársak számának becslése Megjelenítés tervező – Megjelenítés specifikáció elkészítés – Oldal fejlesztővel és minta programozóval együttműködik – Tartalom elemzővel is kapcsolatot tart
84
Feladatok – Megjelenítő csapat 2 • Oldal fejlesztő – Megjelenítés tervező specifikációiból kódot készít – Megjelenítés tervezőnek többféle prototípus készítés – Minta fejlesztővel együtt terv és kód összefűzése • Felhasználói felület specialista – – – –
Webes űrlapok tervezése Webes alkalmazás tervezés Oldal használhatóság és olvashatóság biztosítása Szöveg és egyéb médiák beágyazása az alkalmazásba
Feladatok – Tartalom feldolgozó csapat • Átalakítás elemző – Tervező eszköz kiválasztása, infrastruktúra tervezése – Specifikáció írás az átalakítást végző programokoz – Eljárás kidolgozása, amelyet a csapat használ majd – Csapat megtervezése, erősségeik megbecslése • Eszköz fejlesztő – Átalakító és komponens előállító modul programozása – Tartalom feldolgozókhoz többféle automatikus feldolgozási lehetőség készítése • Tartalom feldolgozó – Ellenőrzi az automatikus feldolgozás jóságát – Kézzel elvégzendő feladatok, metaadat hozzárendelés • Tartalom QA specialista – Minőségi követelmények ellenőrzése
85
Feladatok – Tartalom előállító csapat • Beszerző menedzser – Egyezkedik és megállapodást köt a forrásokkal – Lépést tart a beszállítókkal • Forgalom ellenőr – Felügyeli a beszállítást – Lépést tart a CMS munkafolyamatokkal – Torlódások megoldása – Vita feloldása • Írók és más tartalom előállítók • Szerkesztő – Írók helyes útra terelése
CMS illesztése a szervezethez 1 • CM és a szervezet kapcsolata – Részlegek és feladattípusok egységes rendszerbe szervezése – Információ összegyűjtése a szervezetről – Kommunikáció a szervezeten belül és kívül – Illeszkedés a meglévő információ kezelő infrastruktúrához • Szervezeti egységek – Üzleti részleg (tartalom és funkciók eljuttatása a közönséghez) – Kommunikációs vagy szerkesztői csapat (tartalom előállítás és szállítás) – IT csoport (kérések egyszerű rendszeren keresztüli feldolgozása) – Marketing csoport
86
CMS illesztése a szervezethez 2 • Információfolyam követése a szervezeten belül – Felfelé irányuló – Lefelé irányuló – Adott szinten terjedő • Információ értelmezése • Funkciók értelmezése
Szervezeti modellek – Gyűjtési mód
87
Szervezeti modellek – Megjelenítési mód
Szervezeti modellek – Kezelés módja Minden adatforrásra és tartalomra: – Egységes tartalom struktúra – Egységes szervezés – Egységes hozzáférés
88
Gyűjtés és megjelenítés a gyakorlatban 1 Gyűjtő rendszerek és megjelenítések szervezése típus szerint
Gyűjtés és megjelenítés a gyakorlatban 2 Csapatok szervezése
89
Csapatok szervezése 1 • CMS irányító bizottság – CMS szabványok kiválasztása – Együttműködik az új csapatokkal – Tartalom megosztási problémák kezelése és megoldása – CMS felügyelet • CMS csapat – – – – – –
Készültség becslése Megbízások kezelése Logikai tervezés Segitségnyújtás az implementálás során Telepítés segítése Karbantartás segítése
Csapatok szervezése 2 • Repository csapat – CMS rendszer kezelése – Tréningek és CMS frissítés (komponens osztályok és elemek) – Gyűjtő és megjelenítési interfészek • Gyűjtő csapat – Gyűjtési igények logikai analízise – Konverziós folyamatok megtervezése – Implementálja, telepíti és karbantartja a hozzá tartozó rendszereket • Megjelenítő csapat – Megjelenítési igények logikai analízise – Megjelenítés megtervezése – Implementálja, telepíti és karbantartja a hozzá tartozó rendszereket
90
A CMS projekt áttekintése „CMS folyamat”
Felkészülés a CMS-re - Teendők • Szervezet analizálása • Problémák felderítése – Kategorizálás, összegyűjtés – Központi témák megkeresése • Jelenlegi állapot felmérése • Szervezeti követelmények felmérése • Közönség felmérése • Publikációs követelmények felmérése • Tartalom követelmények felmérése • Rendszer követelmények felmérése
91
Felkészülés a CMS-re - Dokumentumok • Készenléti állapot becslése • Dokumentum könyvtár és analízise • Rendszer állapotjelentés • Oktatási terv • Projekt terv egyes előzetes elemei – Készültség – Költség és idő – Feladatok osztályozása, elosztása • Kockázatelemzés
Követelmények és logikai terv • Követelmények – Tartalomra vonatkozó (milyen tartalmakat, hogyan gyűjtjük és szervezzük) – Megjelenítésre vonatkozó (milyen kimeneti struktúrát akarunk előállítani, hogyan célozzuk meg a közönséget) – CMS-re vonatkozó (szoftver, hardver követelmények) • Logikai terv : hogyan találkozik a CMS a célokkal és követelményekkel – Folyamatok megtervezése – Megfelelő kapcsolatokkal dolgozni – Tartalom struktúra kitalálása
92
Tippek 1 • Követelmények összegyűjtése • Követelmények feldolgozása • Széleskörű közvéleménykutatás • Mindent kategorizálni kell • Tartalomra vonatkozó igények – Milyen tartalmat akarunk szállítani – Hogyan lehet előállítani a tartalmat – Hogyan lehet összegyűjteni az információt
Tippek 2 • Rendszer igények – Integráció más rendszerekkel – Hardver, szoftver – Fejlesztői környezet – Telepítési környezet, telepítés – Hatékonyság – Karbantartás • Logikai terv készítés – Közönség, szerzők és források analízise – Megjelenítés és komponens tervezés – Hozzáférési struktúra tervezés – Munkafolyamatok és feladatok tervezése
93
A követelményektől a rendszerig
Követelmények és logikai terv elemei • Gyűjtési terv – Szerzők és források felmérése – Milyen komponensekre lesz szükség – Milyen konverziókra lesz szükség • Kezelési terv • Megjelenítési terv • Elhelyezési terv • Kockázatelemzés és projekt terv – Lehetséges kockázatok – Rendszer követelmények – Tartalom komponensek – Hozzáférések, munkafolyamatok és szerepek megtervezése
94
Kezelési terv • Komponens séma • Hozzáférési struktúrák – Kereszthivatkozások – Indexelés • Komponensek kezelése – Szerkesztői ellenőrzés – Metatorial ellenőrzés – Archiválás – Verziókezelés – Törlés
Megjelenítési terv • Publikációs stratégia – Megjelenítés elemzése – Minta tervek • Oldal tervek – Prototípusok – Makettek • Testreszabási stratégia – Üzenetek – Testreszabás • Megjelenítés adminisztráció – Publikációs menetrend – Szerepek és folyamatok terve
95
Elhelyezési terv • Közönség típusok • Publikációs típusok • Szerző csoportok • Munkafolyamatok és szerepek • Hozzáférés máshonnan (egyszerű fordítás?) • Telepítés • Támogatás
CMS kiválasztása (1) • Magas szintű áttekintés (követelmények, logikai analízis) • Piac áttekintése – Ajánlások, vélemények áttekintése – Speciális igények figyelembevétele – Kérdések írása minden termékhez • Bemutatók megtekintése – Megértés a cél – Követelményekről és igényekről lehet beszélni – Kapcsolattartó emberek keresése • Választási kritériumok elkészítése
96
CMS kiválasztása (2) • Technikai elemzés – Üzletemberek (szerződés) – Szerkesztők, információ építész (gyűjtés, metaadat eszköz) – Programozók (rendszer fejlesztés) – IT (architektúra és telepítés) – Publikációs csoport (kimeneti, megjelenítési képességek) • Projekt igények – Külön fejlesztési igény? – Fontosabb integrációk • Referenciák áttekintése (konferenciák, folyóiratok)
CMS kiválasztása (3) • Szállítók (forgalmazók) bemutatója – Megválaszolatlan kérdések feloldása – Szerződés feltételeinek megbeszélése – Költségbecslés • Jelentés a végső döntésről • Kockázatelemzés frissítése • Projektterv frissítés
97
CMS választási kritériumok • Üzleti érdekek • Fejlesztési környezet • Környezetfüggőség kezelése • Képzési igények • Technikai segítségnyújtás minősége • Telepítési folyamat • Gyűjtési, menedzsment és megjelenítési igények támogatása
Implementálás előzményei • Áttekintés – Logikai terv újragondolása – Követelmények újragondolása – Célok áttekintése • Több alprojektre bontás előnye – – – – –
Komplexitás kezelése Külső erőforrások bevonása lehetséges Izolálja a problémákat Hatékonyabb megbeszélések Felkészít a későbbiekre
98
Implementálási folyamat részei (1) • Specifikáció készítése – Gyűjtő, menedzsment, megjelenítő rendszerhez • Rendszer installálása – Dokumentálás – Összes lehetőség kipróbálása – Tesztekre is fel kell készülni • Konfigurálás – – – –
Rendszer regiszter Eszközök XML fájlok Saját programok segítségével
Implementálási folyamat részei (2) • Tartalom feldolgozás – Bemeneti adatáramlás figyelembevétele – Kimenet ellenőrzése • Minta (template) kódolás – Input minta – Megjelenítési minta • Egyedi alkalmazás fejlesztés – – – –
Ha a CMS nem tudja a funkciót A CMS interfészeit kell használni Külön projektben kell csinálni Saját programok segítségével
99
Implementálási folyamat részei (3) • Integráció – Egyedi objektumok – Minták – Tároló rendszeren változtatni kell
Rendszertelepítés lépései • Tervezés • Dokumentumok készítése • Kezdeti és folyamatos oktatás • Rendszer beindítása és tesztelés • Folyamatos tartalom készítés • Hibák javítása • A CMS konfiguráció felülvizsgálata • A megjelenítő minták átnézése • Új komponens osztályok és elemek hozzáadása • Új szerző típusok és források hozzáadása
100
Tesztelés • Tesztelés – Tranzakciók növelése – Adatbázisba új oldalak elhelyezése menet közben • Publikációs teszt – Mi van ha valami adat hiányzik? – Szöveg ellenőrzés – Komponensek • Használhatósági teszt (mennyire érthető és használható a felhasználói felület) • Béta teszt – Belső csopotnak kell végeznie – Először üres futás – Határidők tartása fontos
Oktatás • Tréning típusok – Tartalom menedzsment – Szerzői – Tartalom feldolgozás – Adminisztrátor – Weboldal fejlesztő – Minta fejlesztő – Helyfüggő elem kezelő – Telepítés • Formái – Dokumentáció olvasás – Öntanulás – CMS szállító/gyártó oktatása – Gyakorlás – Gyors intenzív tanfolyam
101
Rendszer beindítása • Fokozatai – Egyszerű, különálló környezet, egyszerű csomagokkal – Egyszerű csomaggal valós környezet – Progresszív tartalom hozzáadás és megjelenítés különálló közegben – Progresszív tartalom hozzáadás és megjelenítés valós közegben – Béta teszt – Végső megbízható rendszer • Általános install – – – – –
Egy-két gép használata Szervezetbe illesztés Példa adatbázis struktúra felépítése Nem csatlakozik más külső rendszerekhez CMS minden funkciója installálva van
Fontos dokumentumok 1 • Gyűjtési specifikációk – Komponens források – Felelősségek és munkafolyamatok – Gyűjtőeszközök listája – Tartalom konverziós specifikációk – Integrációs paraméterek részletei • Menedzsment specifikációk – – – – – –
Közönség analízis Minta analízis Szerzők és más munkatársak Gyűjtés forrásai Menedzsment munkafolyamatok Tartalom hozzáférés struktúrája
102
Fontos dokumentumok 2 • Megjelenítési specifikációk – Publikációs terv – Minták terve – Testreszabhatósági terv • Projekt terv • Kockázat elemzés – – – – –
Kockázat felismerése Előzmények Valószínűség Hatás Enyhítés
Fontos dokumentumok 3 • Telepítési specifikáció – CMS rendszer architektúra – Integrációs terv – Gyűjtő rendszer elindítási terv – Publikációs rendszer elindítási terv – Béta teszt terv – Várható és elérhető méretek – Elosztott rendszer terve – Installálási és konfigurációs adat • Csapat terv • Oktatási terv • Dokumentációs terv • Karbantartási terv
103
Dokumentálási tippek 1 • CMS áttekintő (minden résztvevő elolvassa) – Projekt jelenlegi állapota, követelmények – CMS magas szintű diagrammja – Csapat felépítése, felelősségek – Komponensekről és megjelenítésről áttekintő • Termék dokumentáció • Szerzői ismertetők – – – –
Eszköz használat Munkafolyamat leírása Szerkesztői és metaadat leírások Használati útmutató
Dokumentálási tippek 2 • Gyűjtési útmutató – – – – – – – – –
Megállapodás a forrásokkal kapcsolatban Munkafolyamatok Feldolgozási utasítások Eszközök a feldolgozáshoz Metaadat követelmények Szerkesztői követelmények Kimeneti és bemeneti minták Feldolgozó csapat felépítése Szükséges minőségi és teljesítmény mértékek
104
Dokumentálási tippek 3 • Metaadat útmutató (Részetezi a folyamatos tartalom készítés és visszavonás folyamatát) • Szerkesztői útmutató – Elemek, komponensek és típusok szerint szervezve – Minden információ hozzáférhető legyen – Helyfüggő elemek tervezése • Adminisztrátori útmutató – Rendszer diagramm – Hozzá tartozó szoftverek dokumentációja – Megállapodások – Teljes dokumentáció • Minta útmutató
4) Tartalom menedzsment rendszer tervezése (CMS tervezés)
105
CMS kör
CMS entitások • • • • • • • •
Célok és követelmények Közönség Kiadványok Tartalom komponens osztályok Szerzők Gyűjtő források Munkafolyamatok és emberek Hozzáférési struktúrák
106
CMS entitások - Célok • Szoros az összefüggés: – – – –
Követelményekkel Közönséggel Tartalom komponens osztályokkal Publikációs oldallal
• Felmerülő fontos kérdések: – Kinek szól? – Konzisztensek az egyes elemek? – Hogyan lesz a követés és a mérés?
CMS entitások - Közönség • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Publikációval •Mire számít? Mire figyel fel? Testreszabhatóság – Tartalom komponens osztályokkal •Mire számít? Hogyan osztályoz? Testreszabhatóság – Szerzőkkel •Megértik őket? Hitelesen írnak? – Forrásokkal •Értékes? Hiteles? Közel áll a közönséghez?
107
CMS entitások - Kiadványok • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Munkafolyamatokkal, munkatársakkal •Milyen feladatok, események és munkák? – Tartalom komponens osztályokkal •Melyik mintában melyik? Milyen formátum? Mely elemek? – Közönséggel •Mire számít? Mire figyel fel? Testreszabhatóság – Hozzáférési struktúrákkal •Melyik struktúra? Hogyan tároljuk? Hogyan jelenítjük meg?
CMS entitások – Komponens osztályok • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Publikációval •Melyik mintában melyik? Milyen formátum? Mely elemek? – Közönséggel •Mire számít? Mire figyel fel? Testreszabhatóság – Szerzőkkel •Milyen eszközzel? Mely metaadatokat? Melyikeket, milyen arányban? – Forrásokkal •Metatorial és szerkesztői lehetőségek? – Hozzáférési struktúrával •Melyik struktúra? Hogyan tároljuk? Hogyan jelenítjük meg? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák?
108
CMS entitások – Szerzők • Szoros kapcsolat: – Közönséggel •Megértik őket? Hitelesen írnak? – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen eszközökkel használják? Mely metaadatokkal? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák?
CMS entitások – Gyűjtő források • Szoros kapcsolat: – Közönséggel •Megértik őket? Hitelesen írnak? – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen eszközökkel használják? Mely metaadatokkal? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák?
109
CMS entitások – Hozzáférési struktúrák • Szoros kapcsolat: – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen eszközökkel használják? Mely metaadatokkal? – Publikációval •Melyik struktúrában? Hogyan tároljuk? Hogyan jelenítjük meg?
CMS entitások – Munkafolyamat • Szoros kapcsolat: – – – –
Publikációval Tartalom komponens osztályokkal Szerzőkkel Forrásokkal
• Felmerülő fontos kérdések: – Milyen feladat? – Milyen munka? – Milyen események?
110
Munkafolyamat (workflow) Feladatok sorozata, amit munkatársak végeznek el, s amit esemény(ek) triggerelnek. Minden feladatra (task-ra): - a CMS mely részét érinti? - változást hoz-e tartalomban, kiadványban, CMS struktúrában vagy konfigurációban? - ki végzi el? - mely esemény(ek) hatására? - mikor, milyen hosszan tart?
Gondolkodj, tervezz, integrálj! Van ebben a megközelítésben – bizony – „tyúk és tojás” probléma. A nagy egymásra hatásban melyiket vegyük elsődlegesnek? A közönség elemzése (időben) korán szükséges. A további sorrend többféle lehet. Célszerű a komponensekkel kezdeni. (A hagyományos szemléletű emberek számára inkább az kézenfekvő, hogy a kiadványból indulnak ki.)
111
Mi a CMS? • Szoftverek együttese, amelyek számítógépeken futnak? • Entitások dinamikus egyensúlya a szervezetben?
• A rendszer célja(i) • Az eredeti tartalom forrás(ok - szerzők, gyűjtők • A kiadvány(ok), amit készíteni akarunk • Emberek és munkafolyamatok • Hozzáférési struktúrák
Intézkedés, amikkel a célok elérhetők Tartalom-komponensek
Rendelkezésre álló komponensek vs. a közönség érdeklődése Munka és feldolgozási igény Hozzáférhetőség, navigáció
• A rendszer célja(i) • Reális intézkedések, amelyekkel • Az eredeti tartalom forrás(ok • A célok elérhetők - szerzők, gyűjtők • A kiadvány(ok), amit készíteni akarunk
112
Metaadat kezelése (1) • Metaadat típusok – – – –
Struktúra alapján csoportosítjuk (karakter, bekezdés ...) Formátum (megjelenítés) Hozzáférés (hierarchiák, hozzáférési struktúrák) Menedzsment (nyomonkövetéshez, adminisztráláshoz szükséges adatok) – Beillesztő (jelöli hogy hová illesztünk adott tartalmat) • Metatorial keretrendszer elemei – Metaadat rendszer – Meta metaadat rendszer – Program kód • Metaadat behatárolása – Egyszerűen kezelhető – Nevek egyértelműek legyenek – Útmutatóban elmagyarázni a metaadat nevét és értékét
Metaadat kezelése (2) • Meta metaadat szabályok (hogyan változtassuk és formáljuk a metaadatot) – Összefűzés és szétdarabolás (hogyan, milyen metódusokkal) – Fentről le vagy lentről fel (tartalomból metaadat vagy fordítva) – Mit tölthet ki a szerző és mit a metator? – Teljes szabadság vagy megszorítások – Opcionális vagy ajánlott • Metaadat és kollekció – – – – – –
Komponens osztályok Komponens elemek Elem típusok Elem értékek Használat szabályai Változási szabályok
113
Metaadat kezelése (3) • Metaadat és menedzsment – Ellenőrzési folyamatok – Komponensek archiválása, visszavonása – Növekedés • Metaadat és megjelenítés – Komponensek (melyeket használja minden megjelenítés?) – Minták – Választás (melyik komponenst használjuk választásra? pl. dátum) – Testreszabási elemek
Közönség felmérése • Fontos kérdések – Tartalmat differenciáljuk a különböző személyeknek? – Felhasználói profilokat akarunk készíteni, karbantartani? • Helyfüggő elemek – Kultúra – Folyamat • Mit kell helyhez igazítani? – Kifejezések, metafórák – Többletjelentés – Referenciák • Helyfüggő elemek és CM – Kollekciók (helyfüggő és helyfüggetlen tartalom) – Menedzsment – Megjelenítés (megfelelő tartalom a megfelelő helyen)
114
Közönség analizálás szempontjai • Azonosítás (viselkedés alapján) • Népesség • Magatartás • Összevetés másokkal • Értékítélet • Használat • Profilok • Helyfüggő elemek • Integráció
Megjelenítés tulajdonságai • Cél • Publikáció előállító csapat – Menedzsment – Szerkesztő – Technikai – Alkotó (kinézet kialakítása) – Architektúra (rendszer struktúra és tartalom) • Közönség • Üzenetek • Tartalom • Struktúra • Frissítés gyakorisága
115
Minták szerepe (1) • Általában – Összeköti a publikációt a CMS-el – Statikus és dinamikus részek összerakása – Publikációs részeket készít (oldal, szekció) – Többféle megjelenítés ugyanabból a tartalomból – Logikát használ (tartalom kiválasztás, feldolgozás, hozzáadás) – Más minta is beilleszthető • Repository szempontjából – – – – –
Lekérdezés Használja a tartalom sémáját Hozzáférési struktúrákat is használ Adatot tárol a felhasználóról CMS szolgáltatásokat használ
Minták szerepe (2) • Publikáció szempontjából – Tartalom környezetét állítja elő – Formázza a tartalmat – Struktúrát alakít ki – Testreszabás alapján a publikáció közönségét célozza meg • Külső rendszerek szempontjából – Csatlakozás – Lekérdezés – Adat küldés
116
Testreszabás • Típusai – Profil alapú – Viselkedés alapú – Hosszú távra tervezett • Testreszabás a mintában – Eltérés az alapértelmezettől – Más a minta • Megjelenés helye szerint – Oldalon belüli minta – Navigációs minta – Komponensen belüli minta
Megjelenítés analízis szempontjai • Alaptulajdonságok • Használati esetek • Üzenetek • Formátumok • Struktúra • Frissítési közök • Helyfüggő elemek • Feladatok • Integráció
117
Minta analízis szempontjai
• Oldal/szekció elemzés • Minta felmérés • Navigációs minta felmérés • Komponens minta elemzés • Helyfüggő elemek • Feladatok • Integráció
Testreszabás analízis szempontjai • Profilok • Viselkedés • Jelölésrendszer kidolgozása • Szabályok • Egyszerű nyelvi szabályok • Minták • Extra adat • Helyfüggő elemek • Feladatok • Integráció
118
Komponensek tervezése • Komponens vagy oldal – Tartalom és kinézet külön változik – Elosztott tartalom (több oldalon ugyanaz a tartalom) – Oldal készítés gyakran automatikus – Nemcsak web oldalakat kell előállítani • Komponens és objektum – Osztályai és példányai vannak – Elemei vannak (típusuk és értékük van) • Tárolás – – – –
Egyszerű fájlok Struktúrált fájlok Relációs adatbázis Objektum orientált adatbázis
Komponens és funkció kapcsolata
• Funkciók céljai – Csatlakozás más rendszerekhez – Navigáció segítése – Kommunikáció • Osztályok és példányok – Egy példány/osztály – Néhány általános osztály – Osztály több példánnyal
119
Komponens elemzés szempontjai • Információ komponensekre osztása • Azonosítás • Megvalósítás • Életciklus • Elemek • Helyfüggő elemek • Feladatok • Integráció
Szerzők kezelése • Szerző: információt, funkciót állít elő • Tartalom megváltoztatása: hogyan kell az eredeti tartalmat a CMShez igazítani • Szerzők megváltoztatása – – – – – –
Tudniuk kell, hogy mit kell elkészíteniük Tudniuk kell ki a megcélzott közönség Visszacsatolás szükséges a saját csoportjától Visszacsatolás szükséges a közönségtől Érdeklődési körének megfelelő téma Jutalom az extra teljesítményért
120
Szerzők csoportosítása • Metaadat szerint • Technikai hozzáállás (ismeretek, eszközök) • Befolyásolhatóság szerint – Csapaton belül – Szervezeten belül – Szervezeten kívül – Beosztott – Önkéntes • Serkentés szempontjából – Haszon – Érdeklődés – Önzetlenség
Szerzők elemzési szempontjai
• Tartalom források • Azonosítás • Szerzők értékelése • Helyi szerzők (helyfüggő és helyfüggetlen tartalom ellenőrzése, készítése) • Komponensek és szerzők • Feladatok • Integráció
121
Hozzáférés meglévő forrásokhoz • Források keresése – Dokumentumok – Táblázatok, bemutatók – Képek, nemszöveges média – Adatbázisok • Újrafelhasználásra készített források – – – – –
Folyamatos utánpótlás Letöltés Szállítás Összefésülés Feltöltés
Funkciók tervezése
• Közönség igényei • Hogyan kombinálod és osztod fel? • Teljesítmény és méretezhetőség • Kiterjeszthetőség • Sikeresség mérőszámai • Tervezésnél figyelembe kell venni: – Milyen folyamatot akarunk használni – Milyen változtatásokat kell a funkción csinálni – Hogyan jelöljük a funkciót
122
Forrás analízis szempontjai • Azonosítás és áttekintés • Viszony a forrásokkal • Tulajdonságok és jogok • Átalakítás, konverzió • Funkció • Lokális források • Kapcsolódás más forrásokhoz • Feladatok • Integráció
Hozzáférési struktúra tervezése
• Hozzáférési struktúra (nehéz karbantartani és drága) – – – –
Hierarchiák Indexek Kereszthivatkozások Sorozatok
123
Hierarchiák • TOC • Vázlat • Osztályozás • Egymásba ágyazás • Osztály struktúra és objektum modell • Figyelembe kell venni: – – – – –
Természetes felosztást Általánosan érthető legyen Max. 7 kategória/szint Erős megkülönböztetés A legegyszerűbb a legjobb
Indexek és kereszthivatkozások • Index – Kulcsszó – Nagyszótár • Figyelembe kell venni: – A megjelenítési technikák előnyeit ki kell használni – Belső vagy külső szótár • Kereszthivatkozás (link) • Figyelembe kell venni: – – – –
Következetes szabályok Egyértelmű elnevezés Közelség Ne duplikáld a hierarchiát
124
Hozzáférési struktúra elemzés szempontjai • Tartalom tárgyköre • Közönség hozzáférés • Hierarchia • Indexek • Kereszthivatkozások • Sorozatok • Szöveges keresés • Publikációs navigáció • Tartalom modell
Munkafolyamat diagram • Elemei – – – – –
Trigger Objektum Lépés Aktor Feladat (egyetlen személy, egységnyi idő alatt végzi el)
• Feladat típusai – Push (mi adjuk ki a feladatot) – Pull (betesszük a tárolóba a feladatot típus és prioritás szerint, aki akarja kiveszi)
125
Munkafolyamat elemzés szempontjai • Munkafolyamat elemzés – – – –
Feladatok előkészítése Feladatokból munkafolyamat Lépések szabályozása Integráció
• Szerepkör elemzés – – – –
Jártasságok és idő felmérése Jártasságok és feladatok munkákra osztása Szerepkörök becslése Integráció
5) Tartalom menedzsment rendszer megvalósítása
126
XML és tartalom menedzsment (1) • XML – Adatcsere formátum – Tag-ek (elemek), alelemek, attribútumok • DTD (Document type definition): struktúra betartatása – Tag nevek – Engedélyezett alelemek – Megengedett attribútumok • Kinézet hozzáadása – Kinézetre utaló tag-ek az XML-be – Transzformáló program írás – XSLT (Extensible Stylesheet Language Transformation) használata
XML és tartalom menedzsment (2) • Gyűjtési folyamat – Szerzők közvetlen hozzáférése a CMS-hez XML-el – Átalakítás más formátumról és DTD ellenőrzés – Szabályok betartatása (DTD) – XML gyűjtés és konvertálás komponenssé • Menedzsment – Objektum repository – Relációs adatbázis repository (XML egy rekord mező) – Fájl rendszer • Megjelenítés – XSLT • Integráció – Parancs és adatcsere formátum
127
Tartalom feldolgozása • Hosszú távú előnyökre optimalizálás – – – – – –
Automatizálás Kevesebb kézimunka Kisebb emberi erőforrás szükséglet Széleskörű felhasználói mintára tervezni Jó felhasználói felület Mindenféle kivétel lekezelése
• Rövid-távú előnyökre optimalizálás – Kamikaze mód (mindig csak azt kell kifejleszteni, amire feltétlenül szükség van)
Tartalom feldolgozás kezelése • Célok meghatározása • Könyvtár létrehozása tartalommal • Specifikációk elkészítése • Végleges projektterv • Fejlesztés megkezdése (alap algoritmusok, folyamatok) • Szimuláció • Fejlesztés befejezése • Munkatárs felkészítés előkészítése (dokumentumok) • Munkatársak felvétele, képzése, folyamat elindítása • Folyamatok ellenőrzése, eszközök
128
Feldolgozási folyamat • Feldolgozási folyamat dokumentálása – – – – – –
Forrás specifikáció Cél specifikáció Folyamat specifikáció Minőség ellenőrzési megoldás kidolgozása Munkatársak specifikálása Üzleti szempontok
• Tartalom összekapcsolása komponensekkel – – – – –
Direkt (egyező elemek) Indirekt (valamilyen szabály alapján) Többértelmű (1 elemhez több célelem) Célelemek között nincs megfelelő Forrásban nincs jelölve, vagy rosszul van jelölve
Gyűjtő rendszer szolgáltatásai • Web alapú űrlapok – – – – – – –
Egyszerű szöveg beírás Nyelvhelyesség ellenőrzés Fájl feltöltés Hivatkozás mezők (meglévő komponensekre) Kereszthivatkozás Hierarchikus viszonyok kezelése DTD alapú űrlapok
• Fájl alapú • Több komponens egyidejű betöltése
129
Gyűjtő eszközök kiválasztása
• Szerző eszköz – Szöveg, kép, animáció, hang • Gyűjtő eszköz – Begyűjtött fájlok prioritizálása – Formátum megfelelőség vizsgálata – Szűrés – Transzformálás • Konverziós eszköz • Összefűző eszköz (tartalom és repository szinkronizálása)
Szerzői rendszer fizikai terve • Integráció a szerző környezetbe – CMS indítja a szerző eszközt – Eszköz közvetlenül a CMS-ből nyílik meg – Bemeneti minta az eszközbe – Check in és Check out (verizókezelés) – Integrált munkafolyamat kezelés • Fájok beküldése • Visszacsatolás – Publikációs minták és nézetek – Munkafolyamat tervezéshez minták – Célközönség visszacsatolása
130
Gyűjtő rendszer fizikai terve • Oldalak migrálása – Oldalak komponensekké alakítása – Komponensek és környezetük szétválasztása – Elemek felderítése (komponensek szétbontása) • Jogosultság és használat kezelése – Extra metaadatok – Minta logika (publikációs) – Használati megszorítások, testreszabás – Jelentések • Automatikus tartalom gyűjtés – Kapcsolat, lekérdezés, leképezés, hibakezelés
Aggregációs rendszer fizikai terve
• Metaadat gyűjtés és megosztás – Import és export metaadat lista – Metaadatok alkalmazása • Metaadat kezelés – – – –
Összevonás Szétválasztás Ellenőrzés Opcionális és kötelező elemek
131
Repository funkciói • Alapfunkciók – Tartalom betöltése, tárolása, törlése – Tartalom megtalálása – Tartalom visszaadása tetszőleges formátumban • Kiegészítő funkciók – – – – – –
Tartalom követése (jelentések, statisztikák) Integráció a munkafolyamat kezelő modulhoz Keresés a repository-ban Egyszerre több komponens kezelését is támogatja Minden fájltípust kezeljen Szervezeti szabványokhoz igazodjon
Tartalom tárolása
• Relációs adatbázis – Tábla = komponens osztály – Sor = komponens példány – Előnye: könnyű megérteni, jó teljesítményű – Hátrány: nem flexibilis, nem szabályos infó kezelése nehéz • XML alapú repository • Fájl alapú repository • Keresési stratégiák – Komponens alapján – Elem alapján
132
Menedzsment rendszer fizikai terve • Teljes repository DTD-je (document type definition) • Link vizsgálat – Szerző linkek komponensekre, elemekre, szövegekre – Struktúra (linkek kezelése, ID, típus) – Menedzsment (rossz linkek kezelése, javítása) – Megjelenítés (többféle link megjelenítési mód) • Média ellenőrzés – Referenciák ellenőrzése (ott van-e ahol kell) – Áthelyezésnél • Keresés és áthelyezés – Bizonyos helyeken keres vagy egész tartalomban – Reguláris kifejezéseket támogat – Struktúrakövető – Programozható • Menedzsment integráció
Megjelenítő rendszer részei • Publikációs platform – Webes, nyomtatás, disztribúció, e-mail … • Publikációs minták – Célformátum szintakszisa – Céloldali struktúra – Komponensek elhelyezése – Egyszerű szövegek támogatása – Funkciók hívása • Programkód – Hozzáférés repository-hoz, fájlokhoz, külső objektumokhoz – Dinamikus tartalom feldolgozás és kezelés – Fájl és könyvtár létrehozás
133
Hozzáférési struktúrák és navigálás
• Hierarchiák – Kategóriák használata (statikus, dinamikus) – Szűrés (alrészek) – Többszörös hierarchiák • Indexek • Kereszthivatkozások • Sorozatok
6) A médiainformációs rendszerek tartalom-szervezési problémája
134
1980s:
1970s: ISIL
BookMaster, IPF
Printed books
Printed and online books, online help
Limited reuse Single purpose
1990s: SGML, HTML
Need for change in 1990s
Online information, webs, printable & printed books
Alternatives to books
One book-centered DTD Information architecture
Shorter cycles, fewer people versus monolithic DTDs, long learning curves. Need for faster, cheaper. Reuse.
2000+ XML-based semantics
Components, multiplatform, open systems
Web-deployed products and information Partner and OEMuse of information
A (gyakorlati) igény Egyszeres forrás XML topic 1 XML topic 2 XML topic 3
Többszörös kontextus Information web A: 1, 2, 3
1 3 2
Print A: 1, 2
2 XML topic 4
Information web B: 2, 3, 4
4 3
135
Az XML igérete •
Igéret – A tartalom és a forma leírásának szétválasztása (a tartalom újrafelhasználhatósága különböző média összeállításokban) – Specifikus jelölő készletek a tartalom leírására – Standard megoldások a könnyű információ-cserére
•
A valóság – generikus XML – Egyszerű szintakszis – A generikus megoldás nem mindig gazdaságos a specifikus igényekhez – A tudásreprezentáció a szervezeti kultúrán alapul (a fix sémák sokáig hordozzák a múltat) – Minél hasznosabb specifikus jelölő nyelvet alkalmazunk, annál többe kerül (kevesebben osztoznak a költségen)
Egy válasz a problémára: DITA • Darwin: öröklődési és specializációs elv • Information Typing: alaptípusok: fogalom, feladat, hivatkozás az információ architektúrához (műszaki dokumentumokhoz)
• Architektúra: modell a tervezés és az eljárások kiterjesztésére
136
Darwin Information Typing Architecture: DITA • DITA 1.0 specifikáció (OASIS szabvány)
•
– Vállalatok (BMC, Boeing, IBM, Intel, Lucent, Nokia, Sun, …) – Szervezetek (könyvtárak, stb.) – XML tool vendors (Arbortext, Blast Radius, Idiom, Rascal, Syntext) – Tanácsadók (Comtech, Innodata, Mulberrytech) Open Toolkit (DITA-OT): – http://dita-ot.sourceforge.net
Az OASIS • Organization for the Advancement of Structured Information Standards • not-for-profit, nemzetközi konzorcium a strukturált információkezelési szabványok fejlesztésére és adaptálására • 1993-ban alakult • több, mint 5000 tagja van (>600 szervezet)
137
Mi a nyílt szabvány? • Nyilvánosan elérhető, folytatólagos verziókkal • Átlátható folyamatban készült • Nyitott a külső véleményekre (észrevételek, köz-szervezetek, nincs kizárólagos jogosult alany) • Tekintettel van a szerzői jogra
OASIS műszaki szabványok ASAP, BTP, ebXML-BP, WSBPEL, WSCAF
CIQ, CGM, DocBook, OpenDocument, UBL
ORCHESTRATION & MANAGEMENT
DATA CONTENT
DCML (x3), WSDM, WSRF, WS-Notification SPML, XACML, (DSML)
AVDL, eGOV, Election, eProc, Emergency, Legal XML, Materials, PLCS, PPS, TaxML, TransWs, WAS, XLIFF, (Auto Repair) ABCM, (Conformance), ebSOA, FWSI, SOA Blueprints, SOA-RM
SECURITY & ACCESS
SOA
DESCRIPTION ebXML CPPA, HumanML, UIML, WSRP
DSS, PKI, SAML, WS-Security, XCBF
DITA, EntityRes, Topic Maps, Pub. Subj, XDI, XRI
MESSAGING ebXML MSG, ebXML IIC, WS-Reliability, WS-RX
DISCOVERY
COMMON MESSAGE (XML) COMMON TRANSPORT
ebXML, RegRep, UDDI
Relax NG, XSLT Conformance
138
DITA • Szabványos keret XML dokumentumtípusok kezelésére és kiterjesztésére • XML menedzsment: – Interoperabilitás és eszközfüggetlenség – Újrafelhasználhatóság – Szerzői együttműködés (collaborative authoring)
DITA • Információ strukturálás XML alapon (jobb információ csere)
• • • • •
Téma orientáltság Szemantikus cimkézés (tagging) Újrafelhasználhatóság (tartalom, tervezés, eljárás) Feltételes feldolgozás, automatikus linkelés és link ellenőrzés A tervezés, feldolgozás, szótárak inkrementális specializációja
139
A DITA tervezése elvei •
Téma orientáltság
•
Téma granularitás
•
Típusok
•
Specializáció
– Jelentéssel bíró információ-egység (a célnak megfelelő specifikus tárgy) – Self-contained topics combine with other topics into information sets – DTD és séma: a DITA típusok specifikus információ struktúrákat követnek – Architectúra az alaptípusok kiterjesztésére, új típusok (akár adott információkészleten belüli specifikus felhasználásra) •
Közös osztályok
– A legfelső-szintű "generikus" alaptípusok alá csatlakoznak a specifikusak
Alapkoncepció
Témák
DITA térképek
Termékek
140
DITA információ típusok
téma
fogalom
hivatkozás
feladat
DITA dokumentum umentum típusok
Other
DITA for Software
DITA for eLearning
DITA for Hardware
Base DITA
DITA keret
`
Other
Other
SGML
XML Elements, attributes, entities, DTDs, schemas
XHTML
S1000D
DocBook
DITA Architecture Topics, Maps, Content Reuse, Specialization
Hagyomá Hagyományos doc típusok
141
Újra-felhasználhatóság • tartalom • tervezés • eljárások
A tartalom újrafelhasználhatósága • „téma-granularitás” elve
142
A könyv, mint „témagyűjtemény”
Part II
Part I
Part III
Chapter 1 overview
Chapter 2 overview
Chapter 3 overview
Chapter 4 overview
Chapter 5 overview
Chapter 6 overview
Topic A
Topic A
Topic A
Topic A
Topic A
Topic A
Topic B Topic C
Topic B Topic C
Topic B Topic C
Topic B Topic C
Topic B Topic C
Topic B Topic C
A tartalom újrafelhasználhatósága • A téma alapúságból következik • Különböző kontextusokban • Több-komponensű témák integrált megoldásban
143
Témák újrafelhasználása termékekben • Témák termékekhez egy készletből (pool). – „A” termék: 1. és 4. témákat – „B” termék: 2. és 4. témákat használja
„A” termék
„B” termék Téma 1
Téma 2
Téma 3
Téma 4
A DITA térképek szerepe • A DITA térkép kontextusba helyezi a témákat • Egy témacsoportot hierarchiába és sorrendbe szervez Különböző termékekhez különböző szervezés (nem csak a forma különbözik) Egy téma különböző csoportokban szerepelhet Többféle nézet (multiple views) lehet ugyanarról: termék szerint, feladat szerint, … • Témajellemzőket állít be a hierarchia pozícióihoz Jellemzők: cím, más metadatok A szülő témára hivatkozás
144
Architect
Build
Write
Eclipse help JavaHelp HTMLHelp Web pages Books & PDFs Learning
Information Architecture Map
Topics
Build Maps
Outputs
A tervezés újrafelhasználhatósága • A specializáció elve
145
A tervezés újrafelhasználhatósága • Az általános típus ritkán elegendő – Alaposabb követelmény specifikáció indokolt
• A követelményeknek való megfelelés új elemekkel – Az új elem specializálja a létező elemet – Az új tartalom az alap-tartalom subset-je
• Különbséget kezel – az alap-tartalomhoz képest • Moduláris
Specializáció: témából feladat topic
task title
title
prolog
prolog
metadata
metadata
body
taskbody
related-links
related-links
Small DTD additions to enforce document structure. May have no CSS or XSL process changes.
prereq
result
context
taskxmp example
steps
postreq
step cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | |xmp choices|choicetable)*, | choices)*, result? stepresult?
146
Feladatból üzleti teendő task
businesstask title
title
prolog
prolog
metadata
Additional structure changes.
metadata
taskbody
btaskbody
related-links
related-links
prereq
result
prereq
result
context
taskxmp example
context
example
steps
postreq
bsteps
postreq
step
step
appstep
cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | |xmp choices|choicetable)*, | choices)*, result? stepresult?
appdesc
Topic
Reference
Task
Concept
minitask
bctask
manpages
UI help
APIs
Messages
A téma (topic) a gyökér. A tervezés különbség-alapú (inkrementális): különbség egy speciális feldolgozás is.
Java APIs
C++ APIs
147
Eljárás újrafelhasználhatósága • A specializáció elve
Eljárás újrafelhasználhatósága • •
Az alap-eljárás: XSLT Osztály-szerű eljárás-öröklődés (class-like inheritance of processes)
– A standard eljárás testre szabható – Új elemek specifikus viselkedésűek lehetnek •
Az alap-elemek eljárásait „alapból” alkalmazzák a specializált újakra
– de új eljárás is írható azokra
148
XSLT
DITA Task
Lehetséges kimenetek Lista, szeparátorral
task title
web
prolog metadata taskbody
PDF dokumentum
related-links prereq
result
context
taskxmp example
steps
postreq
Varázsló (wizard)
step cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | |xmp choices|choicetable)*, | choices)*, result? stepresult?
Automatikus végrehajtás Automatikus validálás
Specializált eljárások A specializált eljárás a specializált téma típus különbségeit kezeli Alap és különbségi DTDk
Alap és különségi feldolgozók
Alaptéma Alap feldolgozó
Task
bcTask
fogalom
hivatkozás
Specializált feldogozó
bcHivatkozás
149
ESETTANULMÁNYOK, PÉLDÁK
Web tartalom-menedzsment rendszer 1 példa nem CMS DB nem CMS DB
File feltöltés Médiafolyamkonverter ftp szerver Blog-tér
File szerver Admin Naplózás Workflow metaDB
böngésző IBM Compatible
Külső forrás Külső forrás
CMS DB
150
Web tartalom menedzsment rendszer 2 A rendszer az általános CMS architektúrát követi, menedzsment munkafolyamat kezelés, adminisztráció A rendszer részei: • Gyűjtő: tartalom begyűjtése (szerzőktől és külső DB-ből) • Menedzsment: tartalom-komponensek tárolása, adminisztrációs adat, munkafolyamatok támogatása, metaadatok, stb. • Megjelenítő: HTML kimenet (multimédia tartalommal) CMS által előállított adatbázis: a dinamikus kimenethez szükséges információk tárolása Minták (template): a kimenet dinamikus részeit illesztik a statikus részbe
esettanulmány
Hosszú távú megőrzésre szolgáló dokumentum archiváló rendszer
151
Mi a „digitális dokumentum”? • Nincs konvencionális definicíó • eredetileg: file, amit szövegszerkesztővel hoztunk létre → a kifejezés textuális objektumra vonatkozott • megváltozott: a digitális dokumentum tartalmazhat grafikát, képet, hangot, animációt, videót
A „papír” rekord
• Közvetlenül olvasható az ember számára
A digitális rekord • egyes formái nem is fejezhetők ki a hagyományos „hard-copy” médiában – pl. interaktív web lapok, dinamikus web lapok, GIS alapú lapok, stb. • Egy alkalmazás kombinálhat sok komponenst
Gyűjtés • Gyűjtő alrendszer: dokumentumokat gyűjtünk azzal a céllal, hogy megőrizzük az utókornak - nem tudjuk mennyi ideig („akármeddig”) - nem tudjuk, kik lesznek a jövőbeli felhasználók (nem ismerjük a felhasználás módját)
152
MS Word page layout nézet
Formázott text nézet •Key Technical Problems of Long-term Digital Archiving of Documents •Dr. Gabor Magyar •Budapest University of Technology and Economics •Dept. of Telecommunications and Media Informatics •Budapest, Hungary •email:
[email protected] •Abstract •The paper analysis the technical aspects of long-term archiving of digital documents, based on functionality and fundamental categories. The long-term archiving of digital documents is a very challenging task, because of policy, legal, intellectual property rights, metadata, semantic support and other issues. The variety and complexity of digital documents as IT objects brings up a basic question: does it necessary to preserve the variety and complexity of the original objects? (What is äoriginalö in the space of digital documents?) The answer in general ĺnoĺ, essential attributes of a document are preserved when the document is transformed to different platforms. There are many reasons to change the format of a document, crossing technological boundaries (eg. platforms, operating systems, applications). •The paper uses the categories of physical, logical, and conceptual layers in order to define generic properties that are true of all digital documents. The paper overviews the basic requirements in all three layers of categories, than describes the typical relationships among the properties of any object at these three layers. This approach gives an overall framework for general preserving strategy managing technical obsolescence and semantic mutations.
153
Word file forrás •\fs24\lang1038\langfe1038\cgrid\langnp1038\langfenp1038 {\b\fs32\insrsid15163865\charrsid15689867 Key Technical Problems of Long-term Digital Archiving of Documents •\par }\pard \qc \li0\ri0\sb240\nowidctlpar\faauto\rin0\lin0\itap0 {\fs28\insrsid15163865 Dr. Gabor Magyar •\par }\pard \qc \li0\ri0\nowidctlpar\faauto\rin0\lin0\itap0 {\fs28\insrsid15163865 Budapest University of Technology and Economics •\par Dept. of Telecommunications and Media Informatics •\par Budapest, Hungary •\par }{\i\fs28\insrsid15163865 email:
[email protected] •\par }\pard \qc \li0\ri0\sb120\sl360\slmult1\nowidctlpar\faauto\rin0\lin0\itap0 {\fs28\insrsid15163865 •\par }\pard \qj \li0\ri0\sb120\sl360\slmult1\nowidctlpar\faauto\rin0\lin0\itap0 {\b\fs28\insrsid15163865\charrsid2762722 Abstract •\par }{\fs28\insrsid15163865 The paper analysis the technical aspects of long-term archiving of digital documents, based on functionality and fundamental categories. The long-term •archiving of digital documents is a very challenging task, because of policy, legal, intellectual property rights, metadata, semantic support and other issues. The variety and complexity of digital documents as IT objects brings up a basic question: does •it necessary to preserve the variety and complexity of the original objects? (What is \'84original\'94 in the space of digital documents?) The answer in general \rquote no\rquote •, essential attributes of a document are preserved when the document is transformed to different platforms. There are many reasons to change the format of a document, crossing technological boundaries (eg. platforms, operating systems, applications).
• Az „olvasás” összetett folyamattá válik: szöveg – megjelenés – forma jel – formátum – struktúra tartalom – megjelenés - struktúra
154
Mi az „eredetiség”? a digitális dokumentumok terében? Tökéletesen másolható – bit by bit.
Másolni kell … a digitális dokumentumokat • mert – nem időtálló • és változik a formátuma
155
Meg kell őrizni az eredeti objektum változatosságát? Az alkalmazási céltól függ. Általában autentikus dokumentumok megőrzése a cél. Kommunikációs csatorna, ami információt továbbít a jövőbe.
Hogy megőrizz fizikai doku-t Őrizd jól
egy digitális dokumentumot Légy képes előállítani a tárolt adatokat, újraépíteni komponenseiből, interpretálni szintaktikáját
156
Hogy megőrizz fizikai doku-t Őrizd jól
egy digitális dokumentumot biztosítsd a képességet a reprodukcióra
A modell A digitális dokumentumok leírásának 3 szintű modellje • fizikai • logikai • fogalmi
157
Conceptual layer
Logical layer
Physical layer
CVs
CV1
CV2
-Word files or -PDF files or -scanned pages -…
158
Embedded image R E P O S I T O R Y Output: - Printed (PDF, etc.) - Web - data
Construction info
Prof. Will Good E-mail: will.good @goodwill.eu URL: http://www.good.eu Positions: University of City 1990Dept. of Informatics Senior lecturer Education: PhD in Informatics 1990 Thesis: Emerging Digital Archiving Systems MSc. in Computer Science 1987 Thesis: Statistical Programming Experienced in: EIS, development methods and tools Recently focusing on: New Media Archives Positions, memberships
159
Construction info
Prof. Will Good E-mail: will.good @goodwill.eu URL: http://www.good.eu Positions: University of City 1990Dept. of Informatics Senior lecturer Education: PhD in Informatics 1990 Thesis: Emerging Digital Archiving Systems MSc. in Computer Science 1987 Thesis: Statistical Programming Experienced in: EIS, development methods and tools Recently focusing on: New Media Archives Positions, memberships
esettanulmány
Az Open Archives Initiative-től Nemzeti Digitális Adattárig
160
• A tartalom menedzsment rendszer részei: gyűjtő, tároló, megjelenítő --- az OAI ezt követi • Az OAI elvek és technikák alkalmazása a Nemzeti Digitális Adattár (NDA) projektben • Az Open Archive Initiative (OAI) elvei és ajánlásai a dokumentumok elosztott elérésére – Archívum modell – Elosztott architektúra – Protokoll
Esettanulmány: az NDA • A rendelkezésre álló hagyományos és elektronikus anyagok elérhetősége • Együttes kereshetőség biztosítása • Ennek érdekében – Szabványok, protokollok, ajánlások készítése – A digitalizálás támogatása, prioritások kidolgozása • Az NDA a nyílt archívumok modelljét követi (OAI) • Az NDA technológiai alapja az OAI-PMH
161
Az NDA hármas szerepe • NDA, mint mozgalom: Önálló intézmények önkéntes kapcsolódási formája, melynek alapját a közösen elfogadott szabvány, szabály, ajánlás adja. • NDA, mint szervezet: Az NDA mozgalom koordinálására, működtetésének technológiai, anyagi támogatására létrejött szervezet. • NDA, mint műszaki rendszer: Az NDA-ban definiált funkciók egy részét, vagy egészét megvalósító rendszer, mely mintául szolgál a csatlakozni kívánók számára.
NDA szolgáltatásgazda funkciók 1. • Adatgazdák regisztrációja – Kapcsolatfelvétel az adatgazda és az NDA között űrlapos támogatással, az adatgazda regisztrációja. Megegyezés az elérhetőségben (OAI-PMH szerver címe), sémában (XML séma), szótárak használatában (XML névtér). • Metaadatok begyűjtése/ellenőrzése • Metaadatok tárolása • Kereső felület biztosítása
162
NDA szolgáltatásgazda funkciók 2. • Adatgazdák regisztrációja • Metaadatok begyűjtése/ellenőrzése – Az NDA alkalmazásszerverén fut egy háttérfolyamat, amely rendszeresen végiglátogatja a regisztrált adatgazdákat és az OAI-PMH szerint begyűjti az előző futtatás óta készült rekordokat. • Metaadatok tárolása • Kereső felület biztosítása
NDA szolgáltatásgazda funkciók 3. • Adatgazdák regisztrációja • Metaadatok begyűjtése/ellenőrzése • Metaadatok tárolása – A jónak talált rekordok bekerülnek az NDA adatbázisba és kereshetővé válnak. • Kereső felület biztosítása
163
NDA szolgáltatásgazda funkciók 4. • • • •
Adatgazdák regisztrációja Metaadatok begyűjtése/ellenőrzése Metaadatok tárolása Kereső felület biztosítása – Az NDA feladata, hogy hatékony, egyre bővülő komplexitású visszakeresést biztosítson. Regisztrált felhasználók elmenthetik a keresőprofiljaikat, igényelhetnek ez alapján „push” szolgáltatást. Tárolhatók, szűkíthetők, állományba exportálhatók a találati listák.
NDA adatgazda funkciók 1. • Digitalizálás, média tárolás – Dokumentumok (képi, szöveges, esetleg hang) digitalizálása szabványos formátumokba, szabványos eljárásokkal. – A digitalizálás során keletkezett dokumentumok biztonságos (redundáns, nagy rendelkezésre állást biztosító) tárolása. • Katalogizálás, metaadat tárolás • Metaadat szolgáltatás
164
NDA adatgazda funkciók 2. • Digitalizálás, média tárolás • Katalogizálás, metaadat tárolás – A digitális dokumentumhoz rendelendő, a kiválasztott séma szerinti (lásd PP funkció) metaadatok felvitelére szolgáló felület biztosítása, a metaadatok ellenőrzése. – A keletkezett metaadatok biztonságos tárolása. • Metaadat szolgáltatás
NDA adatgazda funkciók 3. • Digitalizálás, média tárolás • Katalogizálás, metaadat tárolás • Metaadat szolgáltatás – A metaadatbázis rekordjainak OAI-PMH kompatibilis szolgáltatása a szolgáltatásgazdák (többek között az NDA-SP) felé.
165
Mi hiányzik még? • Az OAI-PMH szemantikailag „csak” a Dublin Core követésére szólít fel • Az integrációhoz a modell finomítására (Qualification), illetve a mezők kitöltési szabályainak megadására (Encoding scheme) is szükség van! • Szükség van még: – Névterekre (személy, testület, földrajzi) – Dokumentumtípus függő sémákra (film, kép, szöveg, weblap, tv/rádió műsor stb.
Új funkció: Protokollgazda (PP) • Séma gyűjtemény – Az NDA által regisztrált sémák katalogizált, letölthető gyűjteménye. A sémák tartalmazzák az egyes sémaelemek definícióját, kitöltési szabályait. • Névtér gyűjtemény – Az NDA által regisztrált tulajdonnév tárak, szótárak, tezauruszok, osztályozási rendszerek, esetleg szakontológiák katalogizált, letölthető gyűjteménye, mely a potenciális adatszolgáltatók számára rendelkezésre áll.
166
NDA Architektúra PP SP
DP
DP
PP
SP
Internet DP
SP
DP DP
SP
Tűzfal
Protokollgazda architektúra
Szöveges (XML)
Séma (XML séma)
Szótár (XML névtér)
Protocol Provider (PP)
167
OAI előzmények • • • • • • • •
1945 Vannevar Bush – Memex (Hypertext) 1989 Tim Bernes Lee – HyperText and CERN 1994 WWW Consortium (w3c.org) 1994 ERCIM Technical Reference Digital Library (EU) 1998 Networked Computer Science Tech. Ref. Library 1999 Universal Preprint Service 1999 Open Archives Initiative 2002 OAI Protocol for Metadata Harvesting 2.0
OAI elvek • Eleinte: Tudományos publikációk közzététele, szabad elérésének biztosítása (preprints - content) • Később: Dokumentumok elérhetőségének, megtalálhatóságának biztosítása (metadata harvesting) • Data Provider – Service Provider elkülönülés • Olcsó (low barrier), egyszerű technológia
168
OAI archívum modell
OAI architektúra SP
DP DP
DP
DP
SP
Internet DP
SP
DP DP
SP
169
Adatgazda - Data Provider (DP) • Olyan intézmény, amely az általa őrzött valóságos vagy digitális objektumokat leíró adatbázissal (katalógussal) rendelkezik, és azt az OAI-PMH protokoll előírásainak megfelelően azt szolgáltatni tudja és akarja.
Tűzfal
Adatgazda architektúra
OAI szerver Meta szerver
URI
Média szerver
Backup
Digitalizáló állomás
Data provider (DP)
170
Az adatgazdák feladatai • Nyílt, mindenki számára elérhető adatszolgáltatás (metaadatok) az az OAI-PMH protokoll szerint. • Hagyományos archívumi (repository) funkciók ellátása – Biztonságos tárolás – Szükség esetén migráció – Katalogizálás, feldolgozás – Jogkezelés
Szolgáltatásgazda - Service Provider • Olyan szolgáltató, amely az adatgazdáktól az OAI-PMH protokoll segítségével begyűjtött adatok alapján értéknövelt szolgáltatást, legegyszerűbb esetben közös kereshetőséget biztosít.
171
Tűzfal
Szolgáltatásgazda architektúra
OAI kliens
Alkalmazás
Meta szerver
Service provider (SP)
A szolgáltatásgazdák feladatai • Közös kereshetőség biztosítása, azaz több DP adatainak összefésülése, esetleg valamilyen specifikus szempont szerinti szűrése, csoportosítása, keresőfelület biztosítása. • Tartalom kereskedelem/felhasználás elősegítése • OAI-PMH interfész biztosítása (pl. Z39.50-ről) • További metaadatok biztosítása – Pl. Learning Object Metadata – Automatikus tartalomelemzés
172
Protocol for Metadata Harvesting • Kommunikációs protokoll: HTTP – Egyszerű, támogatott, elterjedt, internet barát, tűzfal-tűrő kommunikációs protokoll • Szintaxis: XML – Elterjedt, a struktúra megadását, önleíró állomány készítését is biztosító szintaxis • Szemantika: DC – Elfogadott szabvány/ajánlás a változatos tartalom szemantikai egységességének biztosítására.
OAI-PMH Kommunikációs protokoll HTTP GET, POST – kérdések • HTTP / XML válaszok Kérdések • Identify • ListSets • ListMetadataFormats • ListRecords • ListIdentifiers • GetRecord
173
OAI-PMH adatcsere szintaxis • XML, XML séma
OAI-PMH adatcsere szemantika • Dublin Core, RDF, RDF séma
174
Megjegyzések • Az OAI-PMH alkalmazása az adatgazdák érdekeit (látszólag) sértheti, lehetetlenné teszi a felhasználói szokások monitorozását (logging) • A DC meglehetősen primitív tartalmi leírást tesz lehetővé (ebből fakad az elfogadottsága), de az OAI lehetővé teszi más formátumok alkalmazását is (MARC, METS) • Az adatgazdáknak informatikai fejlesztést kell végeznie (OAI-PMH interfész, adatok leképezése)
esettanulmány
NAVA: Nemzeti Audiovizuális Archívum
175
NAVA folyamatmodell Digitalizáló Átmeneti tároló
Transzkódoló
Média tároló rendszer
NAVA olvasóterem
Darabolás
Szelekció
Feldolgozás
Tűzfal
Sugárzott műsorfolyam
Zárt hálózat
6 5 4
Gyártói metaadatok
3 2 1
Internet
Metaadatbázis
Magyarázat a NAVA folyamatmodellhez A metaadatok keletkezésének menete 1.
Műsorkészítőktől begyűjtött metaadatok (a NAVA törvény alapján)
2.
A digitalizálás során automatikusan keletkező metaadatok (formátum, időkódok stb.)
3.
Az előfeldolgozás, darabolás során keletkező metaadatok
4.
A szelekció eredményei (igen/nem, feldolgozás szintje)
5.
A transzkódolás során automatikusan keletkező metaadatok (kulcsképek, vágólisták)
6.
A tartalmi feldolgozás során keletkező metaadatok
Automatikus, és emberi folyamatok •
A szaggatott vonalak az automatikus folyamatokat jelzik
•
A folytonos vonalak az emberi közreműködéssel vezérelt folyamatokat jelzik
A hozzáférési szintek (a tűzfal, illetve az adatbázis biztosítja) •
Az interneten csak a meta érhető el
•
A zárt hálózaton a meta és a böngésző minőségű videó (technológiai korlát)
•
A NAVA olvasóterem full extra (de természetesen read only)
176
Felhasználók
Szolgáltatás
Metaadat hozzárendelés
(lekérdezések, médiafolyam)
Média tárolás Archívum
Bemenet
(digitalizálás, kódolás)
Műsorszolgáltatók
NAVA OAIS modell
Munkafolyamat vezérlés
NAVA
Bemeneti alrendszer Televízió vevők
Digitalizáló/kódoló munkaállomások
Bemeneti átmeneti tár
Transzkódoló munkaállomások
Bemeneti fájlszerver
Kábeltévé végpont, és/vagy DVB-T antenna
Archívum alrendszer LAN
177
Archívum alrendszer Háttértár + Mentés
SDTV gyorsítótár
Szalagos háttértár
FC
SDTV médiaszerver
Adatbázis szerver LDTV médiaszerver
Szolgáltató alrendszer
Bemeneti alrendszer LAN
Szolgáltató alrendszer Feldolgozó munkahelyek
Intenet proxy
Olvasótermi munkaállomások
Zárt hálózat
Internet (csak katalógus!)
Alkalmazás szerver Proxy szerver OAI –PMH szerver
LAN
LAN
Tűzfal Router Archívum alrendszer
178