A fejlesztendő tananyagok formai követelményei
Bevezető • A pályázatban a tankönyvtár által preferált DocBook formátumot vállaltuk • A tankönyvtár kissé „speciális” DocBook formátumot vár (pl. a képletek esetén) • A korábbi pályázat során számos fejlesztési (technikai) tapasztalatot gyűjtöttünk: – szerkesztők – konverterek
Miért a DocBook? • Erről a kérdésről több leírás is van, pl. a tankönyvtár oldalán • Talán a legfontosabb indok, hogy olyan formátum kell: – Szabványos, nyílt, időtálló – Megjelenítéstől független, pl. képernyő, kivetítő, eBook olvasó, tablet, mobil, nyomtatott forma… – Nagy tömegben könnyen kezelhető (kötegelt feldolgozás)
A DocBookról röviden I. • XML, jól strukturált, mint egy jó könyv • book – bookinfo – [part]/chapter/sect1[/…/sect5]/para
• A part/…/sect5-nek kötelező title -> ebből lesz automatikus tartalomjegyzék • Lehet az elején dedication, preface, végén glossary, appendix, kell bibliography (lehet fejezetenként is, minél több adattal)
A DocBookról röviden II. • A tényleges szöveg para-ba kerül (néhány kivétel, pl. táblázat enrty-jébe nem kell). • Kiemelés, felsorolás, táblázat, ábra, kép, egyenlet, lábjegyzet, hivatkozás… • Felsorolás, ábra, kép, képlet lehet cím, informal esetén nem kerül bele jegyzékbe • A megjelenítést stílus fájl írja le (tankönyvtár), pl. tartalomjegyzék, irodalomjegyzék stb.
Tankönyvtár formai követelményei
• 4.4-es verzió, UFT-8 • Képek images könyvtárba kerüljenek • Videók esetén állóképet és szöveges leírást is kell megadni • A képletek a DocBook XML-ben id-vel ellátottak, a math könyvtárban lévő képekre hivatkoznak, valamint kellenek MathML fájlok szöveges leírással • A meta könyvtárba: Dublin Core, Marc
Videók, képek • Miért kell több formában megadni? – – – –
Egyszerű HTML: videó Nyomtatott forma: (nagy felbontású) kép Egyszerű szöveg, felolvasás: szöveges leírás Kereshetőséget javítja, ha van jó leírás
• Több felbontású / formátumú videó / kép közül elvileg az adott megjelenítőhöz optimális választható (monitor / tablet / mobil)
A képletek • Miért kell három formában megadni? – Egyszerű HTML: képként – Létezik MathML plugin a böngészőkhöz (HTML5) – PDF, MS Word elvileg lehet MathML-ből képlet – Egyszerű szöveg, felolvasás esetén a szöveges
• Egyszerű szövegközi képleteket DocBook formázásával (+Unicode) is le lehet írni pl. x1≥0
MathML I. • XML formátum, Unicode • Nyílt, fejlődő (jelenleg 3-as verzió) • Képletek megjelenítését (Presentation) vagy tartalmát (Content) adja meg • Használhatók extra formázási paraméterek, kiemelés (keretek, színek, betűstílus), igazítás
MathML példa: ax2+bx+c Presentation*
<mrow> <mi>a <mo> <msup> <mi>x <mn>2 <mo>+ <mi>b <mo> <mi>x <mo>+ <mi>c
Contnet
a <power/> x 2 b x c
MathML II. • Hol használják? – OpenOffice, LibreOffice, HTML5, … – MS Word 2007+ OMML, de vágólapra MML
• Hogyan lehet szerkeszteni? – FireMath (Firefox plugin) – Formulator MathML Weaver – MathType (Design Science), MathMagic
• Hogyan lehet képpé (png) konvertálni? – JEuclid, MathMagic, FireMath
DocBook készítése • Szövegszerkesztővel, majd valid., konv. • XML szerkesztővel (dtd, xsd alapján automatikus ellenőrzés) • DocBook (WYSIWYG) szerkesztő – Serna – XMLmind – Oxygen
• MS Word, OpenOffice, LibreOffice, LaTeX, majd konvertálás, majd javítás
Konvertálás I. • MS Word – Jól és egyszerűen formázott dokumentum • Stílusok használata: Cím, Címsor1, Címsor2, … • Nincsenek üres sorok (két enter), több szóköz • Színeket, hasábokat, kép körbefuttatásokat, átfedéseket, tartalomjegyzéket el kell távolítani
– – – –
RTF-en keresztül bővített, javított Majix Kis probléma a nagy képekkel Képletek 2007, 2010 OMML -> MML konverzió Sok javítás
Konvertálás II. • LibreOffice /OpenOffice – Képletek MathML-ben vannak – Elvileg tud menteni DocBook XML-be, de alapesetben igen rossz eredményt ad – Fejlesztés alatt? – Pluginek?
Konvertálás III. • LaTeX (tex4ht) – LaTeX alapú (nem pdfLaTeX), lényegében a csomagokat „újraírva” -> hiányos lehet – Két konvertálási mód (beágyazott MathML és .png), de nem 1-1 megfeleltetés van köztük! – Kevésbé rugalmas képletek esetén (rekurzív?), mint a LaTeX, azaz jól formázott / leírt „képletek” kellenek
Képletek LaTeX-ből I. • A tex4ht „rekurzívan” elemez, így gond, ha mincsenek párban a zárójelek pl.: – $\langle x^{\prime}|$
• Helyette: – $\left\langle x^{\prime}\right\vert$
• Vagy pl. $\langle x$ $\rangle$ helyett: $\langle x \rangle$ kell, stb. • Általában ilyen WYSIWYG szerkesztők, vagy többszöri átírás miatt keletkeznek
Képletek LaTeX-ből II. • Kisebb LaTeX hibák warrningot adnak, és nem okoznak látványos hibát, de konvertálást elrontja pl.: x_{0}{}^{2} • Math és nem math környezet keveredése: – \[ ... \] math környezetben egy tabular
• Subequation (számozással van gond, mert DocBookban nincs ilyen, habár…) • Align (számozással van gond)
Mi mit várunk? • Amit a tankönyvtár (ld. minta_2005.zip): – UTF-8 kódolású, validált 4.4-es DocBook XML-t • Kitöltött bookinfo blokkal
– images könyvtárban képek (jpg, png, gif) – images vagy videos* könyvtárban videók (avi, mpg, …), ha van – math könyvtárban eq_xxxx.math eq_xxxx.png párokat, ha van – meta könyvtárban kitöltött dc.xml, marc.xml fájlokat
Linkek • http://www.tankonyvtar.hu/ • http://www.docbook.org/ • http://www.w3.org/Math/ – http://www.w3.org/XML/ – http://www.w3.org/Style/XSL/