ONGRESVERSLAGEN
>
VERSLAG XML HOLLAND CONGRES 2006 door Roelof Janssen en Bieke van der Korst,
[email protected] |
[email protected]
Op 23 november 2006 vond de 22ste XML Holland plaats. De Users Group heeft dit jaar haar evenementen meer thematisch opgezet. Eerder dit jaar waren er al sucesvolle seminars over XML en prepress en XML en technische documentatie en een mini-congres Overheid en XML (ook in 2007 weer op het programma overigens). Het XML Holland congres richtte zich daarom dit keer met name op publishing-processen, -projecten en -concepten.
De lokatie, het Kluwer Uitgevershuis op het Plein te Den Haag bood voor de ongeveer 120 bezoekers een op maat gesneden en sfeervolle ambiance. Het was alleen jammer dat zowel de trein als het wegverkeer die ochtend niet mee wilden werken, waardoor menigeen Den Haag pas later dan gepland kon bereiken. Dan het programma zelf: een keynote, 12 parallelsessies, een workshop en afsluitend een verhalenverteller, zie daar het programma in vogelvlucht. Hieronder treft u een impressie van een aantal lezingen, die redactieleden Bieke en Roelof bijgewoond hebben. Vanwege de parallelsessies is het onmogelijk gebleken voor de twee verslaggevers om alle sessies te bespreken, dus heb er begrip voor als u uw favoriete lezing er niet bij aan treft. Ook van de workshop AddXML, gegeven door Gert van der Steen en Pieter Masereeuw, is geen verslagje gemaakt, maar tijdens de borrel aan het einde van de dag deden diverse workshop-bezoekers kond van een intensieve, maar zeer leerzame workshop, met veel hands-on activiteiten.
Sneller, beter, samen De belangrijkste boodschap van keynote-spreker Radboud de Groot, Twynstra The Bridge, was dat de tijd van in een rechte lijn uitgevoerde, top-down georganiseerde projecten over is. Organisaties veranderen zo snel dat het niet meer mogelijk is om uitgangspunten en doelstellingen lang van tevoren vast te leggen; het is meer regel dan uitzondering dat omstandigheden tijdens een project zo wijzigen dat de marsroute bijgesteld moet worden: “Alles gebeurt tegelijk, en daar moet je tegen kunnen”. Een andere typerende oneliner was: “maak je fouten snel”, waarmee hij bedoelt, dat het willen voorkomen van verandering nutteloos is en het beter is om snel te leren en bij te sturen als een bepaalde aanpak niet blijkt te werken. De Groot stelt daarom een nieuw type manager voor, de Startup Manager, die op een eerder moment actief
is dan een project manager. Deze krijgt verregaande bevoegdheden en moet met de diverse stakeholders een goede relatie op kunnen bouwen. Dit moet het lastige pad tussen concept en realisatie overbruggen, waar in de praktijk eigenlijk het meeste fout gaat. De titel van de presentatie (Sneller, Beter, Samen) werd direct in de praktijk gebracht door de aanwezigen te vragen om in kleine groepen in 5 minuten een oplossing te bedenken voor het bevorderen van innovaties in de uitgeverijwereld. Samenwerking leidt volgens De Groot sneller tot innovatie.
Mind the gap! Roberto Nagel, Document Dialog, schetste eerste enkele trends in de wereld van documentgeneratie en -management. Volgens Gartner zullen in 2009 de investeringen voor het beheer van ongestructureerde content de helft zijn van die in gestructureerde data (dat is nu nog een veel kleiner aandeel). Dat leidt dan tot een marktomvang van 1.5 miljard Engelse ponden. Verder stijgt de interesse voor (on-line) samenwerken bij documentcreatie en -tracking. Document Dialog gebruikt voor bepaalde situaties
<> PAG 30 25
n
NR 4
de d2e software van Xenos, waarmee documenten kunnen worden geconverteerd naar data en vice versa, zelfs op basis van de printeruitvoer, die door een legacy systeem wordt gegenereerd. Intern wordt dat omgezet naar XML en kan daarna weer naar allerlei andere formaten omgezet worden of worden gecombineerd met database informatie. Daarbij kan op verschillende niveaus intelligentie worden toegepast, mede gestuurd door business rules. Volgens Nagel zullen deze rules steeds vaker door een ‘power user’ kunnen worden ontwikkeld, een programmeur is daar niet meer bij nodig. Toepassingen van dit soort technieken worden gevonden bij dienstverleners die hun printer uitvoer ook weer als verkoopinstrument kunnen gebruiken door aan contracten en afschriften commerciële boodschappen toe te voegen, afgestemd op het profiel van de consument. Een andere mogelijkheid is het bieden van EDI-achtige functionaliteit zonder de bijbehorende investeringen in infrastructuur. Daarvoor wordt Xenos Terminal One gebruikt, dat data kan transformeren en gecontroleerd kan verzenden via diverse delivery mechanismen. Zij hebben dit succesvol ingezet bij het Rotterdam Port Community System, waarin 1 miljoen douanedocumenten per maand uitgewisseld moeten worden in uiteenlopende formaten. Met deze automatiseringsslag werden uiteindelijk 3000 fte’s bespaard….
Next Generation Publishing (“Don’t Manage Your Content”) Volgens Michel de Ru van Daidalos is het tijd voor een omslag in het uitgeefproces. De gangbare oplossing is gebaseerd op mediumneutrale opslag van alle content in een repository. Deze aanpak brengt met zich mee dat alle content vaak meerdere malen getransformeerd moet worden. Allereerst moet alle content omgezet worden naar een normaalformaat. Vervolgens kan de content vanuit dit normaalformaat uitgeleverd worden in het gewenste publicatieformaat. Het omzetten van de content naar het opslagformaat loopt al gauw in de papieren, vooral omdat er vaak een redactionele verrijkingsslag mee gemoeid is. Michel de Ru rekende ons voor dat het bij grote hoeveelheden content dan al gauw gaat om hoge kosten en lange doorlooptijden. Volgens hem moet het allemaal goedkoper en efficiënter kunnen, vooral als je je realiseert dat maar een klein deel van de totale hoeveelheid daadwerkelijk gebruikt wordt (3-20%). Hij stelt een oplossing voor die gebaseerd is op publicatie on-the-fly en die gebruik maakt van nieuwe technologie. Deze nieuwe aanpak wordt gerealiseerd in de zogenaamde Content Integrator Architecture. In deze architectuur is een belangrijke rol weggelegd voor business rules. De content wordt niet voorbewerkt, maar op aanvraag geassembleerd en uitgeleverd via pluggable componenten, waaronder input adapters om bestaande bronnen in verschillende formaten te kunnen verwerken en output adapters om verschillende publicatieformaten te kunnen genereren. Het
<> PAG 30 26
n
NR 4
was jammer dat er na afloop van deze revolutionaire presentatie geen tijd meer was voor vragen.
Het SAP XML documentatieproject Ingrid van Gilst, PTC, besprak een door hen voor SAP ontwikkeld documentatiesysteem waarmee on-line trainingsprogramma’s en handleidingen samengesteld kunnen worden. De gebruiker (meestal een trainer) kiest taal, vestiging en geeft zijn ID-gegevens. Op basis daarvan wordt de content gefilterd en de layout bepaald. Vervolgens kan men de onderdelen kiezen die in de opleiding moeten komen, de content aanpassen en de naam van de klant opgeven die de training gaat volgen. Het systeem bepaalt de tijdsduur van de training en presenteert de content in de vorm van XML. Na eventueel on-line aanpassen daarvan kan het volledige trainingsmateriaal worden gegenereerd, inclusief inhoudsopgave en outline. Dit kan in diverse verschijningsvormen worden gegenereerd: een handleiding voor de trainer, het handboek (met of zonder notities), de outline etc. Het resultaat is een PDF die via e-mail verzonden wordt. Op deze manier ontstaat een zeer efficiënte werkwijze met korte doorlooptijd.
Eenvoud in complexe XML-applicaties met Cocoon Nico Verwer, Be value, gaf een gedreven en heldere presentatie waarin hij uitlegde wat Cocoon is en liet zien hoe het in de praktijk gebruikt kan worden. Cocoon is een raamwerk voor het ontwikkelen van XMLverwerkende applicaties, oorspronkelijk ontworpen voor webapplicaties. Er zijn verschillende problemen bij het ontwikkelen van grootschalige XML-gebaseerde applicaties. Het lage abstractieniveau en de beperkte uitdrukkingskracht van programmeertalen als Java zorgen ervoor dat voor iedere nieuwe toepassing identieke of vergelijkbare stukken (“boilerplate”) code opnieuw moeten worden geschreven. Dit geldt ook voor modellen als SAX en DOM. Voor de transformatietaal XSLT geldt dat die vaak als niet krachtig genoeg en te traag wordt ervaren om grootschalige XML-gebaseerde applicaties te ontwikkelen. Een andere complicerende factor is dat XML-applicaties vaak ook moeten communiceren met andere applicaties. Apache Cocoon is een open source project. Cocoon is ontwikkeld om beter gebruik te kunnen maken van XML, XSLT en gerelateerde technologieën en daarmee om het ontwikkelen van XML-applicaties te vereenvoudigen. Door een grote verscheidenheid aan interfaces met externe componenten kan het dienen als integratielaag tussen diverse (commerciële en open source) applicaties. Cocoon maakt gebruik van SAX-events ten behoeve van de performance: de XML wordt tijdens het proces niet geserialiseerd maar als een compact binair object doorgegeven. De architectuur van Cocoon is gebaseerd op pipelines. Een pipeline wordt gerepresenteerd als een XML document waarin een proces beschreven worden als een reeks bewerkingen (transformaties). Een standaard-pipeline bestaat uit een generator, 1 of meer transformators
en een serializer. Een ander concept is de sitemap: een sitemap kan gebruikt worden om meerdere gerelateerde pipelines te bundelen. Door een aantal eenvoudige concepten en verbindingsmogelijkheden kunnen complexe applicaties gebouwd worden. Je kunt meer met Cocoon dan alleen een conversiestraat bouwen. Complexe applicaties kunnen opgebouwd worden door een hiërarchie van sitemaps te definiëren. Het feit dat de applicatiestructuur functioneel in XML uitgedrukt wordt biedt ook weer mogelijkheden om automatisch stylesheets en code te laten genereren, zelfs sitemaps.
XML de X (cross) Media Language Roelof Janssen, Screens & Pages, gaf aan dat het gebruik van XML ook in de creatieve sector (reclamebureaus, ontwerpers van interactieve applicaties, vormgevers etc.) toeneemt. Met name de applicaties van Adobe, dat recent Macromedia (bekend van de Flash animatiesoftware) heeft overgenomen, worden in die wereld veel gebruikt. Via een aantal voorbeelden liet Janssen zien hoe XML gebruikt kan worden in combinatie met Adobe InDesign om een volledige black-box opmaakstraat te realiseren met hoge kwaliteit en de mogelijkheid om nog interactief de puntjes op de i te zetten. Verder liet hij zien hoe men met XML kan bewerkstelligen dat in een Flash animatie dynamisch content getoond wordt inclusief animaties. Het lijkt erop dat Adobe meer belang gaat hechten aan het gebruik van Flash; hun nieuwste eBook reader applicatie Digital Editions is bijvoorbeeld gebaseerd op FlashPlayer 9, en men werkt aan een nieuw eBook formaat dat een combinatie zal zijn van XML, Flash en PDF. Verder zien zij veel in de toepassing van Flash bij interactieve mobiele applicaties. In creatieve omgevingen zijn steeds vaker ook programmeurs werkzaam waarvoor het werken met XML geen probleem is. Wel gaat het dan om het basale gebruik van XML als content- en interface element, en is er minder aandacht voor ingewikkelder zaken zoals DTD’s en Schemas, namespaces etc. Dat zien we ook terug in de software die dit soort zaken vaak nog niet perfect ondersteunt.
de verschillende bronnenbanken (productendatabase, CMS met accommodatie-informatie en beeldbank). Het bronbestand bevat XML, opmaakinformatie en beeldmateriaal. Met Pectora wordt de XML in een InDesign template geplaatst. Als alle informatie in InDesign staat moet de tekst waar nodig passend gemaakt worden op de pagina’s. Dit gebeurt met een script door delen van de inhoud weg te laten op basis van prioriteitsinformatie die in de XML is vastgelegd. In de presentatie werd duidelijk dat het gaat om een semi-automatische print-publishing oplossing. De opmaak kan in InDesign nog handmatig bewerkt worden. Ook in de Planner zijn voorzieningen ingebouwd om op verschillende momenten in het proces en op verschillende manieren handmatig aanpassingen te kunnen doen.
InDesign CS2 in Word2XML2PDF Martijn Wabeke, Veen Bosch & Keuning, legde uit hoe zij met hulp van Fidder & Löhr een op XML gebaseerde publicatie-workflow hebben opgezet voor educatieve boeken in de categorie Welzijn. Daarbij zijn eerst vooraf zogenaamde leerobjecten opgesteld, iets wat vrij bijzonder is omdat men in de regel de auteurs alvast laat schrijven, terwijl nog niet helemaal bekend is hoe het resultaat eruit moet gaan zien.
Reisbrochures: productie eenvoudig gemaakt met XML Tina Kos, GrafiData, presenteerde en demonstreerde een praktijkcasus die eenvoudig lijkt, maar genoeg complexiteit bevat om interessant te zijn: een project voor de semi-automatische productie van reisbrochures voor TUI Nederland. In dit Publicator-project worden XML, Webservices en standaardpakketten geïntegreerd. De architectuur bestaat uit drie hoofdonderdelen: Planner, Transformator en Formatter. De Planner biedt een interface waarmee een productmanager een brochure kan samenstellen. De productmanager bepaalt welke producten op welke pagina komen en kan kiezen voor specifieke opmaakinstellingen. De Transformator wordt aangestuurd vanuit de Planner op basis van XML-berichten. De Transformator stelt een bronbestand samen met de benodigde informatie uit
Nu konden de auteurs aan het werk met gestandaardiseerde Word-sjablonen, en werd het coderen en redigeren voor een deel ook door Fidder & Löhr uitgevoerd. De Word-kopij wordt geconverteerd naar XML en opgeslagen in het Documentum CMS. Na redigeren wordt deze XML ingelopen in InDesign templates. Volgens William van Hees van Fidder & Löhr verloopt dat 93 % automatisch, zodat ook daar tijdbesparing bereikt kan worden. Het werkboek en de docenten-
<> PAG 30 27
n
NR 4
handleiding worden in één keer gemaakt, inclusief register, inhoudsopgave en lijst van afbeeldingen. De beeld-workflow is belangrijk omdat die soms de hele workflow kan ophouden. Nu voert de auteur de beeldlijst al in Word in als een tabel, inclusief instructies en de naam van de fotograaf. Door deze nieuwe werkwijze kon de doorlooptijd sterk verkort worden, van ongeveer 6 maanden naar 6 weken.
Zachte semantiek leidt naar harde functionaliteit Chris Scholten, Saxion Hogescholen, gaf een historisch en soms filosofisch overzicht van de ontwikkelingen in de wereld van datamanagement en vergeleek die met de wereld van documentmanagement. De focus in de wereld van datamanagement is in de loop van de tijd verschoven van techniek (waarmee?), via syntax (hoe?) en semantiek (wat?) naar pragmatiek (waarom?). De aandacht voor semantiek is sinds kort weer opgeleefd. Voor 1970 werden datamodellen ontworpen met een technische bril op, in termen van implementatieconstructies. Vanaf 1970 werd er gemodelleerd op basis van het logisch relationeel model; de focus verschoof van implementatiedetails naar een conceptueel model met formeel gedefinieerde logische structuren. Volgens Chris Scholten is de betekenis van het logisch relationeel model voor datamodel-ontwerp te vergelijken met de betekenis van XML voor documentontwerp: in beide gevallen gaat het om een simpele logische structuur waarvan de syntax te valideren is met behulp van een simpele set integriteitsregels. Hierna kwam het inzicht dat het belangrijk is om ook de betekenis (semantiek) te modelleren. Er zijn verschillende scholen in de semantische modelleringstalen. UML is een voorbeeld van de objectivistische benadering, waarbij de werkelijkheid vertaald wordt naar structurele concepten zoals objecten, eigenschappen en relaties. Het talige, feitgebaseerde FCO-IM is een voorbeeld van de constructivistische benadering. FCO-IM is een informatiemodelleringsmethode ontwikkeld door de Hogeschool van Arnhem en Nijmegen. Deze methode is gebaseerd op de gedachte dat modelleren van de werkelijkheid niet mogelijk is, maar wel het modelleren van de communicatie over een overeengekomen beeld van de werkelijkheid. In deze benadering wordt de relevante communicatie in taal vastgelegd, verwoord. In de wereld van documentmanagement en publicatie is semantiek ook een hot issue. Hierbij wordt gezocht naar een expliciete definitie van semantiek om relevante content vindbaar en herkenbaar te kunnen maken, bijvoorbeeld met behulp van ontologieën. Een ontologie is een semantisch classificatieschema dat de kennis van een bepaald domein representeert
De innovatieve standaardmens Aad Kamsteeg, Diderot Track, ging in op de omstandigheden waaronder organisaties innoveren. Dit proces is wezenlijk anders dan leren, wat een duidelijke en gerichte activiteit is. Innoveren verloopt veel meer
<> PAG 30 28
n
NR 4
associatief, en vergt een zekere ‘overhead’: mensen moeten de tijd hebben om te reflecteren en op nieuwe ideeën te komen. Een dialoog ontstaat als mensen elkaar zien. Verder is een consensus-cultuur vaak niet bevorderlijk voor innovatie. Controverses zijn juist nodig en moeten niet koste wat kost worden gladgestreken. Aad probeerde het innovatieproces ook toe te passen op zijn lezing en de toehoorders te prikkelen en aan het eind van zijn lezing kwam de dialoog in de zaal inderdaad op gang.
Dynamic Publishing on Demand binnen Social Networks Roger Dols,Morpheus Software, sprak over Dynamic Publishing On Demand, en ging daarbij in op Web 2.0 trends zoals user generated content: Thinkature, MyWorkspace, YouTube, Wiki’s etc. Contentleverancier en lezer zijn daar vaak dezelfde persoon, en onderling beoordeelt men de kwaliteit via peer reviews. De time to market is extreem kort en er wordt niet geïnvesteerd in ballast. Dit model zou ook interessant kunnen zijn voor uitgevers, die niet als een Dagobert Duck op hun content moeten zitten maar een rol moeten gaan spelen in het faciliteren van deze mechanismen. Essentie is dat de klant participeert in het innovatietraject. Semantische samenhang in de informatie is belangrijk; de Google zoekmachine kan dit niet bieden, en laat het aan de gebruiker over om de resultaten te beoordelen. Volgens Dols zijn er wel degelijk software tools voor semantische analyse, Morpheus gaat die inzetten bij een project dat voor de politie wordt uitgevoerd. De software moet alleen ingeregeld worden door experts met domeinkennis.
Een ander verhaal Omdat een eerder geplande keynote presentatie van Philips niet door kon gaan was het aan verhalenverteller Eric Borrias om het congres af te sluiten. Nadat hij had verteld dat hij na eerdere ervaringen met de introductie van ‘Software Against People’ had besloten zijn carrière een andere wending te geven ging hij van start met een tweetal met verve voorgedragen sprookjes waarin helden met de nodige zelfverloochening,
is het programma compleet, want naast de technische uitwisselingsstandaarden zelf is er aandacht voor een Gegevenswoordenboek Strafrechtsketen, ontwikkelmethoden en een (keten)procesarchitectuur.
een dosis geluk en wat bovenmenselijk ingrijpen uiteindelijk toch hun doel bereiken. Dit als spiegel voor hen die de dag recepten hadden willen horen voor succesvolle en innovatieve ontwikkeling van hun bedrijf, organisatie en/of projecten.
Het programma was aangemeld door de voorzitter van de stuurgroep van het programma, de heer Van Brummen, procureur-generaal van het Openbaar Ministerie. De prijs werd echter uitgereikt aan Brian Dommisse, die als programmamanager van dit programma de honneurs waarnam van zijn stuurgroepvoorzitter Uiteraard werden door Brian alle betrokkenen, zowel programmamedewerkers als alle strafrechtsketenpartners, bedankt voor hun inzet en vertrouwen in de afgelopen jaren. “De award komt op een mooi moment”, vond hij, “net nu de transitie van ontwikkelprogramma naar een staande dienstverlenende ketenorganisatie in gang is gezet. Het is in feite een beloning voor het werk van de afgelopen jaren, waarvan we in de strafrechtsketen, en zelfs in andere overheidsdomeinen, nu de vruchten willen gaan plukken”.
XML Award 2006 Voorzitter Jan-Willem de Koning reikte dit jaar de XML Award uit aan het Programma Elektronische Berichtenuitwisseling in de Strafrechtsketen. Dit programma draagt sterk bij aan een zo efficiënt en eenvoudig mogelijke informatieuitwisseling in de strafrechtsketen. Dat wordt vormgegeven door het ontwerpen en implementeren van elektronisch berichtenverkeer in de strafrechtsketen, gebaseerd op open (XML)standaarden. In dit nummer van
Roelof Janssen is directeur van Screens & Pages. Bieke van der Korst is informatieanalist bij Ambrac.
<> PAG 30 29
n
NR 4