Digitális dokumentumok formátumai és az XSLT-FO Bednarik László Miskolci Egyetem Comenius Tanítóképző Főiskolai Kar
Miről lesz szó ► Háttér ► XML
nyelv ► Szövegfeldolgozás dokumentum formátumai: TEI, DocBook ► DITA XML dokumentum formátum ► DITA információs típusok ► DITA modell ► XSLT-FO
DITA XML dokumentum-formátum Háttér ►Az
adatok, információk hordozhatósága ►Digitalizált dokumentumaink többféle formátumai ►A Web általánosan használt adatformátuma: ►HTML nyílt szabvány, bárki szabadon elolvashatja, letöltheti ►PDF a formátum specifikációját a Adobe közreadta, fejlesztése nagy szaktudást igényel.
DITA XML dokumentum-formátum Háttér Mi az oka, hogy platform-független tárolási formátumokként mégsem ezeket szokták emlegetni? Válasz: a formátumok nem választják szét a tartalmat a formától. Kísérletek a tartalom és forma szétválasztására
DITA XML dokumentum-formátum Az SGML nyelv: a dokumentumok formai jellemzőit mindig egy, az SGML állományokon kívüli fájlban tárolja. A tartalom és a forma szétválik. Hátrányai ►a dokumentum több fájl -ból áll, ►szükséges hozzá egy dokumentumtípus (DTD) definíciót tartalmazó fájl és XSL fájl.
DITA XML dokumentum-formátum Szövegfeldolgozás XML alapokon Mi az XML? Az XML, vagyis eXtensible Markup Language: bővíthető jelölő nyelv. ►bővíthető (eXtensible), saját elemeket lehet deklarálni, ►jelölő (Markup), az elemek - egy megadott módon - jelöléssel különböztethetőek meg egymástól, ►nyelv (Language), rögzíthető a szókincs és a szabály.
DITA XML dokumentum-formátum Szövegfeldolgozás XML alapokon A szöveges dokumentumok esetében egyre nagyobb teret hódítanak az XML alapú formátumok. Az XML dokumentumok alapvetően elemekből épülnek fel. ►elemek: jelölőkódokkal vannak körülvéve. ►attribútum: az elem paramétere, ►entitások: olyan „változók”, amelyek más szöveg elemekre mutatnak.
DITA XML dokumentum-formátum Szövegfeldolgozás XML alapokon Az XML alapú dokumentumok újítása a tartalom modularizálásban áll. Az XML nyelv jellegéből fakadóan a leíró dokumentum elemei nemcsak formátumozási információkat tartalmaznak, hanem a tartalom jellemzésére vonatkozó elemeket is. Ilyen elemek lehetnek többek között a Definíció, Utasítás, Kérdés elemei is.
DITA XML dokumentum-formátum Szövegfeldolgozás dokumentum formátumai
TEI A TEI (Text Encoding Initiative Szövegkódolási Kezdeményezés) fontos nemzetközi projekt, 1987-ben egy angolszász tudományos társaság indított el. A TEI-t elsősorban általános tartalmú szövegek, szépirodalmi művek, kritikai kiadások, történeti források, illetve élőszöveg elektronikus feldolgozására alkalmazzák.
DITA XML dokumentum-formátum Szövegfeldolgozás dokumentum formátumai
DocBook OASIS szervezet által kidolgozott DocBook szabvány. A szövegfeldolgozás területének másik nagy, nemzetközileg elismert jelölésrendszere a DocBook általános XML alapú dokumentumformátum, melyet az 1990-es évek közepén fejlesztettek ki, és azóta használnak általános témájú dokumentumok és technikai leírások tárolására.
DITA XML dokumentum-formátum Szövegfeldolgozás dokumentum formátumai
A DocBook előnyei ►Logikus szerkezeti felépítésű, gép által értelmezhető, feldolgozható, valamint platformés nyelv-független, testre szabható és bővíthető ►Meglévő és testre szabható szoftvereszközökkel a DocBook forrásfájlból konvertálhatunk: (X)HTML, HTMLhelp, PDF, PostScript, RTF, TeX, TXT formátumokba
DITA XML dokumentum-formátum Szövegfeldolgozás dokumentum formátumai A DocBook rendszer sajátossága, hogy a megjelenítési elemeknél elsődlegesen a Web-es megjelentést támogatja. DocBook szabvány főbb jelölőelemei: ►dokumentum hierarchia definiálása (könyv, fejezet, alfejezet,..) ►egyéb információs elemek (pl. szerző adatai,..) ►DTD definíciós elemek ►karakterkészlet definíciók ►meta-információk
DITA XML dokumentum-formátum Szövegfeldolgozás dokumentum formátumai
DITA A DITA szabvány 2001-ben jelent meg az IBM cég által. A Darwin Information Typing Architecture, egy XMLalapú, end-to-end architektúra a készítő, előállító, szállító - a technikai dokumentációhoz. ►Darwin: öröklődési és specializációs elv, ►Információs típusok: fogalom, feladat, hivatkozás ►Architektúra: modell a tervezés és eljárások kiterjesztésére.
DITA XML dokumentum-formátum Digitális tankönyv megtervezése
A tananyag tartalmának kiválasztása A tananyagok tagolását kétféle módon kell elvégezni. ►Didaktikai tagolásnál a tananyag logikai összefüggésrendszerét vesszük alapul. ►Technikai tagolásnál a tananyag strukturálása, hatékony programozása a cél.
Digitális oktatási anyagok készítése Digitális tankönyv megtervezése
Technikai tagolásnál a tananyag elemeket a szövegén belül meg kell különböztetni. Ilyen elemek: ►a szöveges elemek, ►az adattábla-elemek, ►a képi elemek, ►az akusztikai elemek, és ►párbeszédes elemek.
DITA XML dokumentum-formátum Digitális tankönyv megtervezése
DITA információ típusok ►Fogalom (definíció) ►Feladat (tevékenység, leírás) ►Hivatkozás (link)
A téma egy önálló feldolgozási egységet is jelent. A téma típusok tartalmazzák a szakterületek alap osztályát
, ahonnan öröklik az egységes központi struktúrát.
DITA XML dokumentum-formátum DITA XML dokumentum formátum
Téma elemek A témának három eleme van. ►Az id jellemző a fő téma tag-ben ►A cím ►A törzs
Ennek lehet több választható eleme, amelyek közül sok, nagyon hasonló a HTML elemekhez.
DITA XML dokumentum-formátum DITA XML dokumentum formátum
A DITA 24 elem kategóriát különböztet meg. Legfontosabb elemek ►Topic (11 elem) ►Task (25 elem) ►Concept (2 elem) ►Reference (12 elem) ►Bookmap contents elements (27 elem) ►Bookmap metadata elements (33 elem)
DITA XML dokumentum-formátum DITA XML dokumentum formátum A teljes dokumentum szerkezeti modellje (Topic) A dokumentum tájékoztató-apparátus ►Elő-utószó ►Mottó ►Tartalomjegyzék ►Mutató ►Hivatkozás ►Felhasznált irodalom
OL, UL, DL: rendezett, rendezetlen, definiciós lista Szövegen belüli szerkesztési eljárás
DITA XML dokumentum-formátum DITA XML dokumentum formátum
Fogalmi témák A fogalmi típus egy speciális téma elemnek a neve és téma szerkezete ► Rövid leírás: fejezet címen belüli alcím ► Előszó: adott rész kereshetőségei ► Adott szakasz tájékoztató-apparátus • Elő-utószó • Mottó • Tartalomjegyzék • Mutató • Hivatkozás • Felhasznált irodalom
A modell a teljes szövegre vonatkozik, akár ismétlődhet a törzsen belül.
DITA XML dokumentum-formátum DITA XML dokumentum formátum
Feladat témák A feladat típusok speciális téma elem nevek és téma szerkezet. Egy feladat előfeltételét és egy összefüggést követnek a lépések (egy sorrendbe helyezett lista specializációja). Minden egyes lépésnek van egy parancsa, egy választható információja, egy példa lépése és eredmény.
DITA XML dokumentum-formátum DITA XML dokumentum formátum
Témák szervezése a térképekkel Az első DITA térkép az 1, 2 és 3 témát szervezi web-es (HTML) felületté. A második térkép az 1, 3 és 5 témákat szervezi nyomtatható (PDF) felületté. A harmadik térkép mind a hat témát szervezi súgó felületté. A DITA a téma tartalmat újrafelhasználja, egyedi forrásokká téve azokat.
DITA XML dokumentum-formátum Előnyök
DITA XML dokumentum-formátum Modell
DocBook és DITA összehasonlítása
DITA XML dokumentum-formátum A szöveges dokumentumok megjelenítéséhez stíluslap-nyelveket használunk. A HTML nyelvhez elsősorban CSS (Cascading Style Sheet) stíluslap-nyelvet használunk. Az XML dokumentum formázásához az XSL stíluslap-nyelv terjedt el. Az XSLT az XML struktúrák közti átalakításokra használható, míg XSL-FO, egy hagyományos stíluslap lehetőségeit kínálja.
DITA XML dokumentum-formátum E két technológiát egészíti ki egy harmadik, az ún. XPath (XML Path Language), amely nyelvi kifejezéskészlet XML dokumentumokban való keresésre, kapcsolódások kialakítására. E három nyelv együttesen alkotja a bővíthető stíluslap-nyelv családot.
DITA XML dokumentum-formátum 1. Egy XML and XSLT dokumentum behelyezése XSLT átalakítóba. 2. Meghatározott szabályok segítségével XSLT dokumentumokat, az XSLT átalakítja FO dokumentummá. 3. Az FO dokumentumot az FO motor tárolja a memóriában. 4. Az FO átalakító a formázási szabályoknak megfelelően nyomtatható PDF dokumentumot készít.
DITA XML dokumentum-formátum Megvalósítás
DITA XML szerkesztők ►Oxygen Editor XML szerkesztő ►Syntext Serna Enterprise ►Adobe FrameMaker 9 ►XMetal Author Editor
Köszönöm a figyelmet!