Vysoká škola ekonomická v Praze Fakulta informatiky a statistiky Podnikové informační systémy
Projekt – Tým I
Digitální repozitář Pražské skupiny školní etnografie
Zadavatel: PhDr. Miroslav Klusák, CSc. řešitelský tým: Ondřej Liška - vedoucí týmu Rudolf Kvapil - zástupce vedoucího týmu Petr Holata Tomáš Kašpar Tomáš Vyskočil
Harmonogram 13.10.2011 – První schůzka se zadavatelem 14.10.2011 – Začátek týmové práce, rozdělení rolí 21.10.2011 ‐ Scanování prvních titulů 7.11.2011 – Převod starého dokumentu z formátu pro editor T602 8.11.2011 – Scanování dalších titulů 20.11.2011 – Začátek prací na webovém rozhraní 22.11.2011 – Shromáždění všech dostupných hotových podkladů a jejich organizace 12.11.2011 – Ukončení práce na webovém rozhraní 19.12.2011 – Druhá schůzka se zadavatelem, požadavek na redakční systém CMS Sunlight 26.12.2011 – Začátek práce na novém webu 1.1.2012 – Sepsání dokumentace o průběhu prací včetně této hierarchie 2.1.2012 ‐ Nefunkčnost poskytovatele webových služeb, hledání nového 3.1.2012 – Žádost o posun termín závěrečného odevzdání projektu 15.1.2012 – Instalace redakčního systému k novému poskytovateli 18.1.2012 – Přechod na nejnovější verzi systému CMS Sunlight (starší měla výpadky) 22.1.2012 ‐ Doplněna dokumentace o vývoji 23.1.2012 – Třetí schůzka se zadavatelem, závěrečná prezentace návrhu 23.1.2012 – Odsouhlasení návrhu a příprava implementace 28.1.2012 – Kontaktování paní Ing. Kristýny Tučkové 31.1.2012 – Předány paní Ing. Kristýně Tučkové požadavky na server 6.2.2012 – Přístupy a nastavené serveru obdržel PhDr. Miroslav Klusák, CSc. 10.2.2012 – Osobně Ondřej Liška vyzvedl přístupy 11.2.2012 – Problémy se zpřístupněním serveru pomocí FTP protokolu 13.2.2012 – Vyřešeno pomocí FTP s paní Ing. Kristýnou Tučkovou 14.2.2012 – Počátek implementace a spuštění redakčního systému
14.2.2012 – Problémy s přihlášení, žádost o přístup k databázi pro vytvoření hlavního administrátora 15.2.2012 – s paní Ing. Kristýnou Tučkovou definitivně vyřešeno 16.2.2012 – začátek prací na implementaci odsouhlaseného návrhu a původních webových
stránek
18.2.2012 – Nefunkční vnořený rozcestník 20.2.2012 – Po 2 dnech rozcestník vyřešen vytvořením skrytých oddílů a nalinkováním 20.2.2012 – Dokončena základní implementace 21.2.2012 – Nahrány moduly WYSIWYG editoru pro snadnou úpravu stránek 22.2.2012 – Rozdělení zbývajících knížek na kapitoly a ladění detailů 23.2.2012 – Dokončení prací, doladění drobný detailů a odkazů 24.2.2012 – Předávání zadavatelům
Postup scanování a konverze do pdf s rozpoznáváním textu Vedoucí týmu Ondřej Liška začal tímto úkolem. Bylo zapotřebí určit postup a rozdělit práci. Jednalo se o dva typy svazků a to knihy a skripta, která se dala rozložit a která se nesměla zničit. Knihy jsme se rozdělily i ve spolupráci s druhou skupinou. V naší skupině byla jedna kniha, která se nesměla zničit. Tuto knihu dostal na starost Tomáš Vyskočil a scanoval stránku po stránce bez podavače a to zabralo přibližně 8 hodin. Následná úprava stránek v PC jako ořez a kontrast zabrala 7 hodin. U 2 knížek, které se šli rozložit se Ondřej Liška zabýval nejjednodušším postupem. Tyto knihy rozebral tím, že opatrně odstranil hřbet žiletkou a stránku po stránce odlepoval. Nakonec stránky bylo potřeba začistit a pak se po 50 kusech daly scanovat pomocí podavače. Na kombinovaném kopírovacím stroji Samsung CLX‐ 3185 nascanoval všechny stránky a jednu po druhé pojmenoval. Bohužel při konverzi do PDF software k tiskárně nedokázal správně rozeznávat českou znakovou sadu a výsledek byl téměř nepoužitelný. Dalším pokusem byly volně dostupné programy na internetu, které rozpoznávají text. To ovšem také nepřineslo sto procentní úspěch. Po konzultaci vedoucích obou týmu, jsme předali naskenované stránky a Martin Michl nám s jeho programem pomohl k úspěšné konverzi. Ondřej Liška tímto úkolem strávil 25 hodin. Martin Michl přibližně 4 hodiny.
Převod knihy z formátu t602 do formátu doc a poté export do pdf Používání formátu t602 bylo velmi rozšířené ještě před 15 lety, dnes se s ním setkáme spíše jen výjimečně. Občas ho používají programátoři a lidé kolem linuxu, ale spíš jen z recese. T602 jde číst například příkazem nano nebo gedit, ale formátování dokumentu je nepoužitelné pro jakýkoli převod do jiného formátu, protože ani nano ani gedit nezvládají číst české znaky. Proto jsme hledali na internetu jednoduchý freewarový program pro čtení a formátování t602 souborů. Našli jsme filtr pro kancelářský balík OpenOffice.org, ten sice dokázal soubory otevřít, i s nimi pracovat, nedokázali jsme však přenastavit znakovou sadu tak, aby byla čitelná. Další možností byl program t602VW od Milana Brože, který pod Windows běžel naprosto skvěle a když jsme při překlápění nastavili velikost písma na 12p, tak přesně vycházely i jednotlivé stránky z původního t602 formátování. Bohužel se nám nepodařilo sehnat program, který by byl schopný hromadné konverze souborů t602 do jiného formátu, což by u 400 stránkové knihy bylo jistě užitečné. Ve výsledku jsme museli postupovat část po části a vše nakonec spojit. Na tomto úkolu se podílel hlavně Petr Holata a celkově hledání programů a konverze zabrala 18 hodin práce. Vedoucí týmu Ondřej Liška se podílel 2 hodinami na hledání vhodného programu ke konverzi.
Web první verze (statická) Na naší první schůzce se zadavatelem, nám byly zadány požadavky na redesign starého webového rozhraní, které se nacházelo na adrese http://userweb.pedf.cuni.cz/~www_kpsp/
etnografie/frame.htm. Za tímto účelem jsme založili jinou, zatím prozatímní doménu na stránkách http://www.psse.ic.cz. Požadavkem byla hlavně modernizace stávajícího systému, zpřehlednění menu a aktualizace vydané literatury o nově nascanované knihy. Začali jsme tedy pracovat na webu se stejným schématem rozložení a hierarchie, ale s jiným designem, přehlednějším a modernějším. Ve chvíli, kde už byl celý web hotov a blížil se konec termínu odevzdání práce, se uskutečnila druhá schůzka se zadavatelem, na které nám bylo řečeno, že v novém webovém rozhraní má být zahrnuta i administrace a redakční systém, oproti prvnímu požadavku na pouze statický web. Zadavatel to odůvodnil častou aktualizací webu, která by si tak vyžádala externího pracovníka, který by stránky musel pokaždé opravovat. Vzhledem ke zkušenostem zadavatelů jsme společně vybrali FREE administrační systém s názvem CMS Sunlight dostupný na stránkách http://sunlight.shira.cz/ a pokusili jsme se implementovat na námi vytvořený web, avšak to nebylo možné. Začali jsme tedy vytvářet web nový i s administračním systémem a momentálně již jsme ve fázi dokončení. Práce na původním statickém webu téměř všechny zastal Rudolf Kvapil. Dohromady práce na původním webu čítala 40 hodin u Rudolfa Kvapila a 10 hodin za ostatní členy týmu. Ponz. Původní statický web naleznete na adrese www.psse.ic.cz
Webové rozhraní s redakčním systémem CMS Sunlight První web s redakčním systémem byl vytvořen na serveru Internet centrum, kam se dodatečně doinstaloval redakční systém Sunlight CMS. Ze začátku vše fungovalo, ale potom z neznámých důvodů přestala fungovat administrace a tak jsme museli přejít na jiný server. Celá databáze serveru a administrace byla více než 2 dni nedostupná, nahrané informace nešli použít a nové server nepřijímal. Byl problém i s přihlašováním a s propojením databáze s webovým rozhraním. Kvůli tomu jsme také byli nuceni přesunout termín odevzdání projektu. Dále jsme si tedy vybrali server Endora, kde jsme pomocí instalace vytvořili redakční systém Sunlight CMS. Aplikace, která je na stránkách Endora je starší a tak jsme museli danou aplikaci aktualizovat. Proces aktualizace je složitý, protože nelze aktualizovat hned na nejnovější verzi ale musíme postupovat verzi po verzi a to je časově náročné. Když verze aplikace je 7.4.2 a nejnovější je 7.5.1 . Při první aktualizaci vše probíhalo v pořádku, ale na konci procesu selhala aktualizace a to nás zdrželo, protože celý systém jsme museli vytvářet znova. Na druhý pokus se vše povedlo a aplikace Sunlight CMS nyní běží na nejnovější verzi a to 7.5.1(rev 0). Toto zajišťoval hlavně Tomáš Kašpar a časová náročnost nakonec dosáhla 32 hodin. Dále jsme pokračovali jako tým a každý dostal za úkol naplnit obsah redakčního systému a napsat si svoje připomínky. Na tom se nejvíce podílel vedoucí týmu Ondřej Liška a Tomáš Vyskočil. Práce zabrali dohromady 15 hodin. Nové stránky se nacházejí na adrese http://psse.hys.cz
Časová náročnost projektu K výše neuvedeným pracím patří ještě práce vedoucího projektu na řízení a kontrole ve výši 30 hodin. Celý tým dále strávil 4 hodin na sepisování dokumentace. Celkový počet hodin, který jsme věnovali projektu byl tedy 191 hodin. Dále je očekávána 20 hodinová náročnost na práci týmu pro implementaci konečného projektu. Celkový počet hodin bude přes 200, což je přes 40 hodin práce na jednoho člena týmu.
Pokračování ‐ Implementace V harmonogramu jsou rozepsány jednotlivé úkony, které bylo potřeba vyřešit. Všechny se vyřešily, ale vzhledem k více komplikacím zabrala implementace celkově 60 hodin oproti předpokládaným 20 hodinám. Na implementaci se podíleli všichni členové týmu. Nejvíce Ondřej Liška jako koordinátor a vedoucí a Tomáš Kašpar v roli implementátora.
Umístění stránek Nové stránky jsou nyní umístěny na serveru zadavatele. Adresa pro přímý přístup je http://userweb.pedf.cuni.cz/~www_kpsp/psse
Další postup Dne 24.2.2012 proběhne předání projektu. V další fázi po finálním odsouhlasení bude zapotřebí přesměrovat odkazy ze stránek Katedry psychologie. Starý odkaz směřuje na http://userweb.pedf.cuni.cz/~www_kpsp/etnografie a je zapotřebí přesměrovat na http://userweb.pedf.cuni.cz/~www_kpsp/psse. Dále navrhuji na staré stránky umístit proklik na nové, tak aby i lidé přicházející skrz google dostali informaci o nových stránkách. Za zvážení stojí také automatické přesměrování.
Počítadlo Počítadlo je společné pro starou i novou verzi stránek a napočítává přístupy z obou webů.
Celková náročnost projektu Celkový počet hodin, který jsme věnovali projektu včetně implementace, byl 251 hodin. Po zaokrouhlení připadá 50 hodin práce na jednoho člena týmu.
Vypracoval: Ondřej Liška vedoucí týmu