ongrEsvErslagEn
>
publiceren in het tijdperk Van google, apple en aMazon: geen woorden Maar daden? Verslag XMl holland 2009 Door Gert-Jan van Lochem en Theun Fleer, met aanvullingen van Diederik Gerth van Wijk,
[email protected] |
[email protected] |
[email protected]
XML Holland 2009 viel op dezelfde dag en locatie als de Nationale Uitgeefdag. Vanuit de Nationale Uitgeefdag werden de bezoekers van XML Holland echter direct doorgeloodst naar hun eigen congresruimte, en ze spraken pas weer bij de borrel de uitgevers. Een analogie met de realiteit van vandaag?
We moesten een “rode” draad volgen door de catacomben van de Kuip, om met ongeveer 50 mensen aan het congres te beginnen. Tenminste 1 Ajaxfan wilde per se niet naar de Kuip komen en liet zich liever door dit verslag op de hoogte brengen. Voorzitter Jan-Willem de Koning opende het congres, met de constatering dat de crisis niet aan XML Holland voorbij is gegaan.
<> PAG 30 16
n
nr 3
Keynote “Publiceren in het tijdperk van Google, Apple en Amazon” Grimbert Rost van Tonningen, consultant, auteur en oprichter van PlusPost (www.pluspost.nl), zeg maar de “liberale GeenStijl”, gaf een aantal inzichten die wel bekend voorkwamen, maar zo op een rijtje de problemen van uitgevers aardig samenvatten. Het
Inventa risatie Email Calendaring
+
Concept ontwik keling
Creatie
+
+
+
+
Instant messaging (chat)
+
Wiki
+
Realisatie
Marke ting/ sales
Publice ren
Eindge bruiker +
+
+
+ +
+
+
Bookmarking
+
Social networks & blog
+
+
Document beheer
+
+
+
+
Versiebeheer
+
+
+
Taakbeheer
+
+
+
+ +
+
+
+
Figuur 1: Stappen in het uitgeefproces gekoppeld aan samenwerkingsfuncties was een keynoteverhaal waarin het grote gebaar niet werd geschuwd. Een aantal uitspraken: n Gebruik als ICT-er begrijpelijke taal. n Papier is dood, maar Content blijft King. n Nieuws en andere “minderwaardige” content zal gratis blijven, maar “vakinformatie” niet. n Het advertentiemodel werkt op het internet compleet anders. n Verschuiving naar Pull Marketing, de kunst van verleiding. n Opkomst van Cloud / SOA. n Selfservice als goedkoopste vorm van service krijgt de overhand. n Als website moet je je profileren om je te onderscheiden. Die laatste uitspraak bevat wellicht het belangrijkste punt: de waarde van selectie. Alles is te vinden op het internet, maar tijd is beperkt; een goede selectie is geld waard. Een mooie opstap derhalve naar de business tracks.
Geld verdienen op het internet Erik Stevens van Phaff heeft een onderzoek gedaan naar Online Adverteren bij uitgeverijen. Een korte rondvraag leerde dat van de 30 toehoorders er 2 betalen voor content. Dit blijkt zelfs veel te zijn. Content in het abonnementenmodel verliest steeds meer terrein. In veel gevallen gaat content een marketinginstrument worden, bedoeld om op een andere manier geld te verdienen, zoals via diensten of advertenties.
Vrijwel iedereen is in zee gegaan met AdSense, dat de advertentiemarkt definitief heeft veranderd. Maar AdSense blinkt niet uit in transparantie. Inkomsten blijken niet erg hoog: in een heel gunstig geval met de helderste doelgroep levert dit €7,50 per 1000 pageviews op. Bij grote publieksites zal dit niet gehaald worden. Veel adverteerders zijn erg gericht op hun conversies, dus de accountability wordt steeds belangrijker. Lag vroeger de nadruk op bereik, nu is het meer op het aansporen tot actie. Net zoals Rost van Tonningen constateert Stevens dat alleen sites met een duidelijke doelgroep en boodschap nog iets zullen verdienen. Dit kan op kleine schaal middels advertenties, webwinkels, teamen met anderen en het verkopen van die informatie die nog wél waardevol is.
Publiceren met Google Anja van der Lans en Floris Weegink van VLC bespraken wat de rol van Google in het publicatieproces kan zijn. Ze gaven een overzicht van Enterprise Informatiemanagement en de stappen in het uitgeefproces, om vervolgens te proberen deze stappen aan samenwerkingsfuncties te koppelen (zie figuur 1). Vervolgens passeerden aantal samenwerkingstools te revue, waarin Van der Lans en Weegink specifieker keken naar de Google. Google biedt voor vrijwel alle samenwerkingsfuncties inmiddels een (gratis) oplossing. Google is nog steeds druk bezig zijn palet aan dien-
<> 30 PAG 17
n
NR 3
Google
Amazon
Apple
Sony
eBoeken
Google Books
Goede contacten middels Amazon shop
-
-
eReader
-
Kindle
Als ze de iPhone iets groter maken…
Aantal goede eReaders
Store
Geen, maar sterk in de Cloud
Amazon
App Store
Mislukt project.
Standaarden
Geen, maar komen wellicht met Android en Chrome
Geen, maar heeft wel de Kindle en wil aansluiten bij anderen
Geen, maar wellicht verder bouwend op OSX
Ondersteunt ePub
Figuur 2: Sterkten en zwakten van eBook-aanbieders
sten uit te breiden. Een van de nieuwste producten is Google Wave, dat de potentie heeft een aantal van de bovenstaande samenwerkingstools in het publicatieproces te verenigen c.q. te vervangen. De auteurs van dit artikel hebben deze uitdaging opgenomen en zijn begonnen dit verslag in Google Wave te schrijven. Onze voorlopige conclusie: de e-mail-functie en documentbeheer à la Wiki kan het vervangen, maar dit verslag is uit Wave gehaald en in een Officepakket afgrond. Daarvoor bood Wave nog te weinig.
eBoeken Een aantal sprekers behandelde samen het onderwerp eBooks. Het bleek direct nodig te zijn de terminologie goed te definiëren: n eBooks / eBoeken zijn de digitale bestanden met de content. n eReaders zijn de apparaten. De lezers van
Oplossingen Henk Gingnagel ging in op de verschillende componenten die nodig zijn om een eBoek respectievelijk een eReader succesvol te maken: n Het scherm moet onder alle omstandigheden goed leesbaar zijn en niet te veel stroom verbruiken. n De eReader moet een bruikbaar softwareplatform hebben. n De eReader moet een verbinding met PC of het internet kunnen maken om boeken te downloaden. n Er moeten voldoende eBoeken beschikbaar zijn via een online winkel.
<> PAG 30 18
n
NR 3
n De eBoeken moeten aan standaarden voldoen om ze voor meerdere eReaders geschikt te laten zijn. De verschillende aanbieders hebben ieder zo hun sterkten en zwakten (zie figuur 2). Conclusie is dat ieder wel een aantal sterke punten heeft, maar er is niet één partij die alles goed heeft opgelost.
Reflowable Pieter Masereeuw besprak de mogelijkheden om eBoeken te genereren. eReaders zijn er in heel veel formaten. Van de bekende Sony’s tot de (i)Phone en de Laptop (tip: Adobe Digital Editions). Van belang is hoe er met de rechten (DRM, Digital Rights Management) wordt omgegaan. Er zijn een aantal formaten voor eBoeken: PDF, HTML, Word, Amazons Mobipocket, en ePub. PDF is natuurlijk al een veelgebruikte standaard, maar het grote nadeel van PDF is dat het niet goed “Reflowable” is: de opmaak kan zich niet goed aanpassen aan de verschillende schermformaten van de eReaders. Het formaat in opkomst lijkt dan ook ePub. ePub bestaat weer uit drie standaarden: n OPS, de Open Publication Structure met daarin dtbook, xhtml, css, svg, xml-islands, Dublin Core. n OCF, het OEBPS Container Format. n OPF, het Open Packaging Format. n En eigenlijk ook nog een beetje XSL-FO in de template.xpgt. Om een ePub te maken kun je InDesign gebruiken, maar ook het Open Source Calibre. Gebruik dan als bron HTML of RTF en liever niet PDF. Je kunt ook zelf aan de slag met XML en XSLT + tools.
Leeservaring Jacob Molenaar ging in op de leeservaring van eBoeken. Allereerst de constatering dat je naar een drietal lagen kijkt: n De besturing van de eReader, n een “browser” en n de content zelf. Op de vormgeving van de content heeft de ontwikkelaar invloed, zij het een beperkte: in kaal HTML is de vormgeving immers beperkt. PDF kent veel meer mogelijkheden, maar werkt weer niet altijd goed samen met het beperkte scherm (kleur en Reflow). De manier waarop het eBoek werkt in de eReader is sterk afhankelijk van de soort content. Een roman gaat makkelijk, maar complexere content als vakinformatie of tijdschriften zullen moeilijk te ondersteunen zijn met nuttige interactie. Jacob vatte het samen met: “ePub: it’s like the Web in ’96”. Overigens mogen XML-adepten blij zijn met eBoeken, want het is een extra argument om je bronnen in XML te realiseren.
Technical Tracks Maar een XML Holland zou niet compleet zijn als alleen op de zakelijke kanten van publiceren en toepassen van standaarden zou worden ingegaan. Voor de mensen die hun leven wijden aan de processen onder de motorkap (of althans een significant deel van hun leven) was er op XML Holland gelukkig dan ook weer voldoende te genieten.
What's hot and not in XML related Standards Pim van der Eijk van Sonnenglanz Consulting, tevens Europees vertegenwoordiger van OASIS, gaf de stand van zaken in een vijftal standaarden van OASIS.
OASIS Codelists Iedereen kent de problemen rondom definiëring en onderhoud van waardenlijsten van een vocabulaire. OASIS tracht met GeneriCode een standaard te ontwerpen voor de uitwisseling van codelijsten. De Technical Committee zelf zegt hierover: “Code lists, or enumerated values, [..] should be well understood easily dealt with by now. Unfortunately, they are not. [..] Everybody has their own unique view of what the problem is and how it should be solved. If code lists were really so simple and obvious, there would already be a single, well-known and accepted way of handling them in XML. There is no such agreed solution, though. The problem is that while code lists are a well understood concept, people don't actually agree exactly on what code lists are, and how they should be used. The OASIS Code List Representation format, “genericode”, is a single model and XML format (with a W3C XML Schema) that can encode a broad range of code list information. The XML format is designed to support interchange or distribution of machine-readable code list information between systems. Note that genericode is not designed as a run-time format for accessing code list information, and is not optimized for such usage. Rather, it is designed as an interchange format that can be transformed into formats suitable for run-time usage [..].” GeneriCode is eigenlijk een XSD voor codelijsten. Voor validatie van XML met codelijsten stelt de TC twee trappen voor: n normale validatie tegen de XSD; n daarna Context Value Association (CVA) tegen de codelijsten, die opgeschreven zijn volgens GeneriCode. Er schijnt reeds een implementatie hiervan met Schematron te zijn. Eigenlijk een heel simpel idee, maar het lijkt inderdaad goed hiervoor een standaard te ontwikkelen en gebruiken. GeneriCode is sinds eind 2007 in versie 1.0, de First Draft van CVA is nu “under public review”.
Content Management Interoperability Services CMIS is een standaard voor het uitwisselen van informatie tussen Content Management Systemen (CMS). Even weer de definitie van de TC: “The OASIS CMIS TC works to standardize a Web services interface specification that will enable greater interoperability of Enterprise Content Management (ECM) systems. CMIS uses Web services and Web 2.0 interfaces to enable rich information to be shared across Internet protocols in
<> 30 PAG 19
n
NR 3
Figuur 3: Schematische voorstelling over hoe CMIS zou kunnen werken
vendor-neutral formats, among document systems, publishers and repositories, within one enterprise and between companies.” Deze interface (zie voor een schematische weergave figuur 3), maakt gebruik van webservices, andere technologieën hierbij zijn natuurlijk SOAP en REST. Grote leveranciers zoals EMC (Documentum), IBM en Microsoft doen mee, en de public review van de first draft is geopend.
DITA De Darwin Information Typing Architecture (DITA) is een belangrijke nieuwe ontwikkeling. Onderwerpen (Topics) worden gescheiden van structuren (Maps) om componentgebaseerd te kunnen werken. In een negental subcommissies wordt gewerkt aan specialisaties voor sectoren, processen en documentsoorten. Belangrijkste mededeling: DITA1.2 met onder andere ondersteuning voor onderwijsprocessen is nog steeds niet klaar.
DocBook en OpenDocument Over DocBook en OpenDocument kon weinig nieuws worden genoteerd, behalve dat versie 5.0 van Doc-
<> PAG 30 20
n
NR 3
Book net uit is, en er inmiddels diverse editors zijn waarin je er aardig WYSIWYG mee kunt werken, terwijl er ondertussen ook door Microsoft hard gewerkt wordt aan versie 1.2 van ODF. Pim herinnerde ons er nog eens aan dat onze Users Group lid is van OASIS, zodat je als lid desgewenst kunt meedoen met de diverse Technical Committees. Je hebt zodoende invloed en vergaart in een vroeg stadium informatie. Neem voor inlichtingen contact op met Jan-Willem de Koning of met Pim van der Eijk – een aanbeveling die inmiddels door Birgit Strackenbrock is opgevolgd, die zodoende DITA gaat volgen.
Lean Translation Machine Marc Grootel van iCtrl legde uit hoe hij denkt dat het vertaal- en localisatieproces door middel van open standaarden strakker en minder afhankelijk van één specifieke leverancier van vertaalgereedschap gemaakt kan worden. Denk bij vertalingen niet alleen aan boeken of helpbestanden, maar ook alle tekst die een programma u voorschotelt; en bedenk verder dat het niet altijd om één op één vertalingen kan gaan. Wie een Nederlandse variant van een Amerikaanse sportencyclopedie wil maken zal immers heel wat
voetbal- en hockeyweetjes moeten toevoegen, ten koste van baseball en American football. De systemen die nu voor grote vertaalprojecten gebruikt worden zijn vaak star; zo is de workflow vaak keihard ingebouwd, en is de granulariteit vaak te grof, zodat je om een enkele zin te corrigeren een heel document opnieuw alle reviewstappen moet laten passeren. Hij voorziet een netwerk, waarin ad hoc services in een mashup samengebracht worden om zo een specifieke taak beter te verrichten. Doorlopend worden teksten dan uitgewisseld, en door ze telkens te valideren zul je eerder fouten zien en kunnen herstellen. Dat open uitwisselingsstandaarden daar een belangrijke rol in zullen spelen spreekt voor zich, en hij besprak er enkele: n ITS (Internationalization Tag Set): een W3C-aanbeveling om gemakkelijker locale varianten van XML-documenten te maken. Je kunt daarmee bijvoorbeeld aangeven dat bepaalde elementen (al dan niet in een XPath-context) altijd wel of juist nooit vertaald moeten worden. n XLIFF (XML Localization Interchange File Format): een OASIS-standaard om gegevens die in een localisatieproces aangepast moeten worden uit te wisselen. n TMX (Translation Memory eXchange): een standaard van de Localization Industry Standards Association om vertaalgeheugens (zinnen en fragmenten in diverse talen) uit te wisselen. Meer informatie is te vinden op de site van I18n, zoals het W3C zijn internationalisatieactiviteiten noemt: http://www.w3.org/International/.
Van Looseleaf Publishing in Word naar Content Engerineering in XML Kees de Grauw van Eluxis (de nieuwe naam van Axis) uit Enschede gaf een Casebeschrijving van het project Content management dat ze bij de Luchtverkeersleiding Nederland op Schiphol hebben gerealiseerd. De klassieke problemen in Content Management kwamen aan bod: rollen, rechten, verschillende typen handleidingen, hergebruik van teksten en andere content, strakke publicatiedata, versiebeheer met autogenerated lists of changes, output in verschillende media. Eluxis heeft in dit project niet gekozen voor DITA, maar wel voor een vergelijkbaar systeem van “component based topic writing”. DITA kent voor deze case te weinig mogelijkheden voor “secties in secties”, iets wat voor dit project wel noodzakelijk was. Het eindresultaat is gerealiseerd in de auteursomgeving XMetal, de Repository Tamino, RenderX om van XSL-FO PDF te maken, en een eigen ontwikkelde “glueware” IDS. Al met al een zeer succesvol project dat op tijd, binnen 3 maanden opgeleverd en met de juiste functionaliteit. Deze klant was ook de juiste
opdrachtgever voor deze oplossing: een beperkt aantal gedisciplineerde gebruikers op één locatie, legacy content was zeer makkelijk te converteren en al het mediabeheer ligt bij maar één persoon.
Toepassing van DITA bij NedTrain Birgit Strackenbrock van iCtrl gaf een presentatie over een project bij NedTrain, de onderhoudspartner van al het rollend materiaal van bijvoorbeeld de NS. Verspreid over een aantal locaties in Nederland voeren zij technisch onderhoud op treinen en aanverwante zaken. De daarvoor benodigde handleidingen zijn nu in Word gemaakt, maar dat moet natuurlijk anders. iCtrl heeft gekozen voor een gespecialiseerde DITADTD. Deze specialisatie was nodig omdat DITA helaas niet een goed standaard stramien voor taakbeschrijvingen kent. Hiermee konden alle specifieke elementen die niet relevant waren dus uit de DTD, en konden een aantal zeer specifieke topicspecialisaties en “composite topics” voor bewerking voor NedTrain worden toegevoegd. De huidige implementatie is op basis van XMLMind als auteursomgeving met voorlopig SVN (!) als Repository, Prins als PDF-renderer en de TCToolbox van Ovidius.
Tenslotte Ter afsluiting was er een forumdiscussie waarin de sprekers werden uitgenodigd in te gaan op een aantal vragen en stellingen. Allereerst was de vraag hoe om te gaan met het gratis worden van veel informatie. Zou dit het uitsterven van de journalist c.q. schrijver betekenen? Nee, maar wellicht zullen er wel minder zijn. Uitgeven zal steeds moeilijker worden. Informatie zal steeds vaker gratis worden verstrekt als marketingtool. Veel informatie wordt gratis, maar we constateren toch ook dat gratis informatie niet bestaat. Je moet altijd vragen: “Wie betaalt dit?”. Eigenlijk vinden we met zijn allen dat de tarieven zouden moeten veranderen, terwijl aan de andere kant niemand kan of wil veranderen. Van de uitgeverij zal vooral het merk en de signatuur overblijven. We verwachten dan ook andere bedrijven met een sterk merk of signatuur als uitgeverij. Asics publiceert inmiddels een interactief trainingsschema. Dat hoeft een uitgever niet meer te proberen. De constatering dat het “geliefde” Google slechter met standaarden omgaat dan het “gehate” Microsoft kon het panel niet ontkennen. Zou er meer wetgeving moeten komen over formaten? Eluxis kreeg tijdens borrel de “XML Award 2009” uitgereikt voor de hierboven beschreven case Content management bij de Luchtverkeersleiding Nederland op Schiphol. Zoals de traditie wil, zullen we de win-
<> 30 PAG 21
n
NR 3
naar vragen om de casus terzijnertijd uitgebreider te behandelen in dit blad.
<> PAG 30 22
n
nr 3
En daarmee kwam er een eind aan het congres, wat qua inhoud en focus zeker meer bezoekers had verdiend. Voor de ongelukkigen die er niet bij waren: de presentaties van XML Holland 2009 zijn te downloa-
den via www.xmlholland.nl. Uiteraard ook toegankelijk voor de bezoekers die wel present waren.
Gert-Jan van Lochem en Theun Fleer zijn consultants bij Daidalos. Diederik Gerth van Wijk ontwerpt XML-applicaties bij Doxatrix.<<<4
3<<<