HoGent Uitgebreid voorstel Masterproef Informatica Titel van het project: Optimalisatie & ontwikkeling van een gegevenstransfertool voor Business Intelligence-gebruikers Datum : 01/11/2012 Naam student : Matthieu Van Langenhove Interne promotor: Tim De Pauw In samenwerking met: Bedrijf Algemene informatie voor extern bedrijf: Naam van het bedrijf : ARCELORMITTAL GENT Adres: John Kennedylaan 51 B-9042 Gent Is dit de 1e masterproef in het bedrijf in samenwerking met onze opleiding? Nee Is er in het bedrijf inhoudelijke en technische begeleiding mogelijk ? Ja Kan de student in het tweede semester (februari-mei) 3 dagen per week in het bedrijf/onderzoekscentrum aanwezig zijn om te werken aan de masterproef? Ja
Begeleiding : Externe promoters – andere begeleiders : Ken WAUTERS –
[email protected]
Bespreking door de werkgroep (niet invullen bij indienen van een voorstel) Beslissing: goedgekeurd Minimale uitbreidingen:
Opmerkingen:
Advies van collega’s:
- herwerken tegen
…/…
Doelstelling van het project Het onderzoeken, optimaliseren en ontwikkelen van een nieuwe gegevenstransfertool (MF2PC) tussen de centrale computer (MainFrame) en het Windowsplatform (PC).
Bestaande situatie en probleemstelling ArcelorMittal Gent (het vroegere Sidmar) behoort tot de groep ArcelorMittal, de grootste staalproducent ter wereld. ArcelorMittal Gent produceert jaarlijks 5 miljoen ton ruw staal en stelt meer dan 5000 mensen te werk. Als onderdeel van zijn Business Intelligence-landschap beschikt ArcelorMittal Gent over een datawarehouse. Dit datawarehouse bevat gegevens over klanten, personeel, bestellingen, productiegegevens, etc. Analisten van verschillende afdelingen consulteren deze gegevens dagelijks via een query- en rapporteringstool. Hierna exporteren ze deze gegevens met de MF2PC-tool naar diverse bestandsformaten (Word, Excel, HTML, pdf, csv …) op PC. Dit gebeurt zowel interactief als geautomatiseerd. Het datawarehouse bevindt zich op de centrale computer, een IBM mainframe waarop het z/OSbesturingssysteem draait. Het mainframe is beschikbaar via ISPF, een grafische shell, en via query’s in DB2 QMF (Query Management Facility) kan data opgevraagd en geëxporteerd worden. Om de connectie tussen een .NET-programma en de QMF-export-commando’s te leggen, wordt er gebruikgemaakt van een component in REXX. REXX is een interpretertaal speciaal ontworpen door IBM voor gebruik op een mainframe. De huidige MF2PC-tool steunt voor de conversie op verouderde technologieën. Zo maakt deze nog steeds gebruik van Microsoft Office Automation, en draait daarom op de voorgrondsessie van een server. De tool is geschreven in VB6, een programmeertaal uit het pre-.NET-tijdperk. Er wordt nog gebruikgemaakt van een assembler-component, welke verwijderd dient te worden aangezien assembler-programmeurs schaars zijn. Deze verouderde technologieën bemoeilijken verdere uitbreidingen en staan evoluties in de weg. Zo is er onder andere een compatibiliteitsprobleem met Office 2007. Er is ook nood aan uitbreidingen, bv. ondersteuning van pdf- en XML-formaat. Op figuur 1 ziet u een voorbeeldverloop van de MF2PC-tool. Data in QMF wordt via de MF2PC-interface geëxporteerd door middel van de MF2PC-mainframe-component. Dit levert een mainframe-bestand op met de geëxporteerde data in een specifiek formaat. Hierna wordt dit bestand getransfereerd onder initiatief en controle van de MF2PC-mainframe-component vanop het mainframe naar de pc van de eindgebruiker of naar MF2PC-applicatie-server. Op deze machine verwerkt de MF2PC-workstation-component of MF2PCserver-component dit bestand en creëert uiteindelijk een Excel- of Word-bestand.
Figuur 1 Voorbeeld van de werking van MF2PC
Gedetailleerde omschrijving van de opdracht die minimaal moet worden verwezenlijkt Dit project is gericht op het onderzoek en de optimalisatie van integratiemethodes, -technieken en -tools voor de transfer van relationele data tussen het MainFrame en het Windows PC-platform. Er dient onderzocht te worden welke commerciële (of open-source) API kan helpen voor het creëren en aanpassen van pdf-, XML-, Word 2007- en Excel 2007-bestanden vanuit het .NET-framework en dit zonder Office Automation. Deze productevaluatie gebeurt aan de hand van diverse criteria. De noden van de eindgebruikers dienen duidelijk in kaart gebracht en beschreven te worden. Dit kan door middel van een gebruikersenquête of door persoonlijke gesprekken met de verschillende key-users. Deze resultaten bepalen de requirements en functionaliteiten van de nieuwe MF2PC-tool. Er wordt gestreefd naar een MF2PC-tool die zoveel mogelijk de huidige functionaliteiten behoudt, evenals enkele extra opties toevoegt. Enkel de mogelijkheiden van de huidige tool die niet meer gebruikt worden of zeer verouderd zijn, worden niet overgenomen. Nieuwe methodes en technieken worden geëvalueerd, en op basis van voorgaand onderzoek en de reeds opgebouwde ervaring inzake intern ArcelorMittal Gent, wordt een analyse en architectuur van de toepassing uitgewerkt. De nieuwe MF2PC wordt from scratch opgebouwd omdat niet alle problemen kunnen weggewerkt worden door de huidige tool uit te breiden. Tevens is er ook nood aan een technologieupdate. Zo dient de VB6-codebase geüpgraded te worden naar .NET (C#). Verder dient de focus van de tool te verschuiven van mainframe naar Windows-zijde en dient ook de assembler-component verwijderd te worden. De huidige lay-out van de rapporten dient wel strikt behouden te blijven. Eveneens wordt gekeken naar een meer rapportgerichte oplossing die toelaat dat de eindgebruiker de gewenste lay-out specifieert en er automatisch printklare documenten worden gegenereerd. Rechtstreeks afdrukken of een e-mail van gegenereerde rapporten opmaken behoort ook tot de verwachte functies. Aan de hand van deze analyse en architectuur wordt een prototype ontwikkeld dat de eindgebruiker toelaat op een gebruiksvriendelijke, vlotte en betrouwbare manier de opgevraagde gegevens te exporteren naar de PC werkomgeving (MS Office, HTML, XML, pdf, csv …). De uitgewerkte oplossing wordt duidelijk gedocumenteerd. Dit prototype en de documentatie moeten de uiteindelijke implementatie goed ondersteunen. Deze implementatie behoort niet tot de masterproef.
Problemen die moeten opgelost worden (niet te gedetailleerd)
Ontwerpen van een analyse en architectuur Wegwerken van verouderde technologieën o Wegwerken van Microsoft Office Automation o Codebase-upgrade van VB6 naar C# in .NET o Wegwerken van assembler-component Ondersteuning van Office Open XML-bestandsformaten (o.a. Office 2007 en verder) Ondersteuning van nieuwe bestandsformaten (o.a. XML en pdf)
Technologieën die aan bod komen
Kennismaking met het Mainframe platform (QMF, ISPF, REXX) Ontwikkeling in Microsoft .NET (C#) Integratietechnologieën (middleware) tussen het IBM Mainframe en het Microsoft Windowsplatform
Mogelijke uitbreidingen en opties
Uitgebreide opmaakspecificaties voor Word, HTML en pdf (bv. templates) Implementatie van een server-layer ter ondersteuning van de geautomatiseerde datatransfers Ontwikkeling van mainframe-componenten (REXX)
Vernieuwende aspecten
Analyse (d.m.v. enquête) Mainframe Ontwikkeling in .NET (bv. Log4Net) Middleware