1 ELIS Mul*media Lab Uitgeverij van de Toekomst Werkzaamheden MMLAb Gebruikersgroep 10 september 2015 Ben De Meester Hajar Ghaem Sigarchian Frank Sall...
Uitgeverij van de Toekomst Werkzaamheden MMLAb Gebruikersgroep 10 september 2015
Ben De Meester Hajar Ghaem Sigarchian Frank Salliau Ghent University – iMinds – MMLab
Inhoud 1. Advanced e-‐books 2. Open Refine 3. Rapport ePub2 vs ePub3
Scope
Interac6viteit Widgets, oefeningen...
Adap6viteit
Updaten inhoud gebaseerd on diverse criteria
Tracking
Tracking & logging gedrag gebruikers
Doelen (1/2) Onderzoek naar • hoe functionaliteiten toepassen in eboeken in ePUB formaat & e-readers
• in kaart brengen (technologische) obstakels (metadatering, online vs offline)
Doelen (2/2) Ontwikkelen POC in 2 use cases • Educatief • Non-fictie (bvb. toeristische gids) - TBD
Interactiviteit (reeds behandeld in eerdere deliverables) • Widgets • Puzzel, kwis, oefeningen, media • Inter Widget Communicatie • Hybride boek • Augmented Reality • Aansturen externe devices via e-boek
Adaptiviteit Real-time updaten van de inhoud van een e-boek, gebaseerd op criteria zoals: •
Personalisatie
•
Context
•
Data analyses
Academisch onderzoek Hoofdzakelijk educatief georienteerd: • Dynamic Educational Content Viewer & Big Data Analytics • GALE: adaptieve leeromgeving • Adaptive Hyperbook • SERS: Semantic Educational Recommendation System
Voorbeelden uit de industrie Eveneens hoofdzakelijk educatief georienteerd: http://www.impelsys.com/
http://www.everlearn-technology.com/
http://www.knewton.com/
Tracking •
Loggen wat een gebruiker doet met/in een e-boek: •
Bladeren
•
Interactie met bepaalde media (video, audio)
•
Interactie met oefeningen, kwis etc
•
Voortgang
•
Tijdsbesteding
• “Google Analytics” in een e-boek
Nut
Inzicht verwerven in
• Kwaliteit content • Hoe gebruikers interageren met de content • Kennisniveau student (in educatieve use case)
Standaarden
Sterk educa6eve insteek, maar bij Tin Can API mogelijkheid tot veralgemening
Voorbeelden industrie (1/2)
Voorbeelden industrie (2/2)
Proof of Concept (1/4) Ontwikkelen e-book in ePUB3 formaat waarbij inhoud bepaald wordt door aantal criteria, waaronder analyse van gegevens verkregen uit tracking van gedrag gebruikers 2 use cases: • Educatief • Non-fictie (te bepalen)
Proof Of Concept (2/4) Aanpak • Tracking gedrag gebruikers mbv Tin Can API • Selecteren en metadateren granulaire content • Code inbouwen in zowel ePUB en compatibel maken met zowel gangbare e-readers in de markt + generieke e-reader
Proof of concept (3/4) Obstakels • Online vs Offline lezen • Metadatering content • Welke functionaliteiten horen thuis in een ePUB en welke in de e-reader? • Privacy issues (niet technisch, maar wel belangrijk)
Proof of concept (4/4) Vraag voor de uitgevers • (Potentieel) granulaire Content • Metadata • Meedenken over waardevolle use cases
Inhoud 1. Advanced e-‐books 2. Open Refine 3. Rapport ePUB2 vs ePUB3
Open Refine (1/3) • Open source tool om te werken met vervuilde data • Ontwikkeld door (o.a.) researchers MMLab • Geschikt voor tabulaire data (excel, csv) • Webgebaseerde “Excel on steroids” • http://www.openrefine.org
Open Refine (2/3) Features • Importeren & exporteren data • Krachtige filter- en sorteermogelijkheden • Behandelen cellen met meerdere waarden • Detectie & cleanup van “fuzzy doubles”
Open Refine (3/3) Toegepast op boekenmetadata • Tryout door mensen Meta4Books op DANTE data • Opkuisen auteursnamen, titels, reeksnamen • Minder performant met grote datasets (> 50.000) • Tutorial workshop op 3 december voor uitgevers die dit willen toepassen op eigen metadata
Inhoud 1. Advanced e-‐books 2. Open Refine 3. Rapport ePUB2 vs ePUB3
Rapport ePUB2 vs EPUB3 1. Wat is EPUB? 2. Verschillen tussen EPUB 2 and EPUB 3 3. Ondersteuning 4. Conclusies
Wat is EPUB? stelde voor in 2009, en in 2011
Wat is EPUB (2 en 3)? HTML pagina’s
met eventuele aUeeldingen s6jl-‐ informa6e (CSS), etc.
Een index-‐bestand (OPF) dat OPF
de volgorde van de pagina’s bepaalt en de metadata bevat
Gezipt, en hernoemd naar .epub
Verschillen tussen EPUB 2 en EPUB 3: Algemeen EPUB 2 werkte op basis van XML-‐bestanden, met een beetje HTML maakte nieuwe standaarden EPUB 3 werkt op basis van HTML5-‐bestanden*, met een beetje XML gebruikt de huidige web standaarden
* HTML5 is de laatste versie van HTML, met mogelijkheid tot audio, video en interactiviteit
Een voorbeeld: de inhoudstafel <meta name="dtb:uid" content="9789401400145" /> <docTitle> Vos en HaasVos en HaasHet ij van UilWat is er mis met het ei?De kou komt
EPUB 2 (toc.ncx)
<meta name="viewport" content="width=886, height=1417"/> Vos en Haas