januari
2013
TTNWW
Handleiding
TST tools voor het Nederlands als Web services in een Workflow
M e e r t e n s I n s t i t u u t , J o a n M u y s k e n s w e g 2 5 , 1 0 9 6 C J A m s t e r d a m
Table of Contents Inleiding................................................................................................................. 3 Gebruik van de applicatie....................................................................................... 4 Algemene informatie ........................................................................................................................................ 4 Uploaden van files.............................................................................................................................................. 4 File display ............................................................................................................................................................ 5 File download ...................................................................................................................................................... 6 Starten van processen...................................................................................................................................... 7
TTNWW – TST Tools voor het Nederlands als Web services in een Workflow
2
Inleiding Het TTNWW (TST Tools voor het Nederlands als Web services in een Workflow) heeft tot doel tekst en spraak technologie ter beschikking te stellen aan geesteswetenschappelijke onderzoekers met weinig tot geen technische bagage. De tekst en spraak technologie is vanuit eerdere projecten, waaronder CGN en STEVIN, ontwikkeld en is om gewerkt om als web service gebruikt te kunnen worden. Voordeel voor de eindgebruiker is dat deze geen installatie procedures meer hoeft te verrichten en deze vanuit een centraal punt, de CLARIN centra, ter beschikking worden gesteld. Deze web services kunnen vervolgens gecombineerd worden tot complexere workflows die een afbeelding vormen van de werkprocessen voor tekst en spraak taken. De eindgebruiker stuurt door middel van selectie van een bepaalde taak welk werkproces wordt opgestart en kan, waar nodig, via parametrisering de bewerking sturen. De eindgebruiker controleert alle taken vanuit één user interface waar zowel begin-‐ als eindresultaten verzameld worden.
Figuur 1: TTNWW user interface
TTNWW 3
Gebruik van de applicatie
Algemene informatie
De TTNWW applicatie is momenteel zo opgezet dat de informatie gedurende beperkte tijd beschikbaar blijft voor de eindgebruiker. In de praktijk betekent dit dat nadat alle processen klaar zijn de informatie gedurende 20 minuten binnen de interface behouden blijft.
Uploaden van files. Tekst en spraak files die bewerkt moeten worden kunnen via de Upload File knop op het scherm of via het menu File Open geselecteerde file(s) binnen de applicatie beschikbaar maken.
Vanuit het eigen systeem kunnen nu files geselecteerd worden die binnen de Workspace van de applicatie zichtbaar gemaakt worden.
TTNWW – TST Tools voor het Nederlands als Web services in een Workflow
4
File display
Om de inhoud van de files te bekijken kan de file in de Workspace geselecteerd worden. Aan de rechterkant van het scherm worden de details van de file en de file inhoud getoond. Op dit moment wordt alleen de inhoud van tekstuele files ondersteund. Voor audio en XML files wordt de rauwe inhoud getoond, met uitzondering van files die door via het Named Entity proces verwerkt zijn. Voor demonstratie doeleinden is hiervoor ook een aparte viewer beschikbaar welke toegankelijk is via het file detail scherm
. TTNWW 5
File download
Alle files in de Workspace kunnen gedownload worden door de file te selecteren en via het menu File Save te selecteren of in het File details gedeelte de Download knop te gebruiken .
TTNWW – TST Tools voor het Nederlands als Web services in een Workflow
6
Starten van processen Tekst en spraak anaylse processen kunnen gestart worden door in het menu Tools te selecteren, gevolgd door Text of Spraak . Text processen kunnen toegepast worden op alle tekst files (met extensie .txt) , Spraak processen kunnen worden toegepast op audio files( (met extensie .wav). Door een proces te selecteren zal een tussenscherm geopend worden waarin, afhankelijk van het proces, extra informatie gevraagd kan worden van de eindgebruiker.
TTNWW 7
De voortgang van het proces kan gevolgd worden via de Processes tab. In de tabel wordt de relevante informatie, zoals naam, creatie datum en naam van de bijbehorende workflow getoond. De tabel wordt automatisch ververst, maar indien tussentijds verversen van de gegevens gewenst is kan op de Refresh knop gedrukt worden. Alle tussen-‐ en eindresultaten die tijdens het proces gegenereerd worden komen automatisch in de Workspace terecht.
TTNWW – TST Tools voor het Nederlands als Web services in een Workflow
8
Architectuur De architectuur ten behoeve van het TTNWW project bestaat uit meerdere componenten verspreid over meerdere systemen en volgt de principes van SOA( Service Oriented Architecture).
Het geheel omvat een front end Flex module welke communiceert met de TTNWW web applicatie. Deze laatste draagt zorg voor de scheiding van de gegevens op sessie niveau en het verzamelen van de (tussen) resultaten vanuit de tekst-‐ en spraak processen. Daarnaast wordt binnen TTNWW de lijst van workflows bijgehouden die gebruikt kan worden. Als vanuit het user interface (Flex module) een werkproces geselecteerd wordt, dan wordt vanuit TTNWW de workflow file en de bijbehorende parameters en file(s) naar de WorkflowService gestuurd. Binnen de WorkflowService vindt een evaluatie van de workflow file plaats om te bepalen of hierin tekst of spraak services zitten die dynamisch gedeployed moeten worden. Indien dit het geval is wordt via de DeploymentService gevraagd de tekst-‐ of spraak services op te starten. Nadat de services beschikbaar zijn wordt de workflow files doorgestuurd naar de Taverna Server waar het proces verder begeleid wordt. Tussen-‐ en eindresultaten van de verschillende processtappen worden ter beschikking gesteld aan de eindgebruiker.
TTNWW 9