XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
397
Web Content Management System and their Application in Portal e-Automatizace Webové redakční systémy a jejich aplikace v portálu e-Automatizace SMUTNÝ, Pavel Ing., Katedra ATŘ-352, VŠB-TU Ostrava, 17. listopadu, Ostrava - Poruba, 708 33,
[email protected] Abstrakt: Klíčovým prvkem výukových webových prezentací je jejich obsah. K dosažení funkčního efektu je nutné respektovat specifika tohoto média, které se svou povahou liší od tištěných výukových materiálů. Publikování na webu se řídí odlišnými pravidly a autoři výukových textů jsou s těmito specifiky dostatečně seznámeni. Při nasazení publikačních systémů (Content Management Systems) se autoři textů soustředí plně pouze na obsah. Publikační systémy zjednodušují a zrychlují proces vytváření i publikace prezentace a zvyšují míru abstrakce – uživatelé pracují s články na místo s HTML soubory, jsou více odstíněni od technologie. Díky rozdělení uživatelů do skupin jsou možnosti realizace potřeb uživatelů výrazně usnadněny v jedné oblasti, ale omezeny, či dokonce znemožněny v ostatních. Publikační systémy sebou přinesly důsledné oddělení obsahu a grafického vzhledu. Texty jsou uloženy do databáze a struktura stránek, navigace a grafický vzhled je udržován odděleně v šablonách. Šablony mají podobu HTML stránek které jsou naplňovány obsahem dle kritérií stanovených odpovědnou osobou či týmem spravující danou webovou prezentaci. Klíčová slova: content management system, portál
1 Content Management System Anglickým výrazem Content Management System (CMS) je označován systém pro správu obsahu. Dnes se běžně užívá také zkratka WCM z anglického Web Content Management a značí tu část CMS, která přímo souvisí s publikováním na webu. Definice CMS je velice široká, neboť nároky jejich uživatelů jsou značně odlišné. Některým stačí možnost vkládat na web pouze novinky, jiní očekávají i správu firemních dokumentů, multimédií nebo dokonce softwaru. Neexistuje ani žádný standardní systém, který by splňoval všechny požadavky. Aplikace CMS pro publikování na webu přinesly oddělení grafické úpravy a obsahu. Obsah stránek je uložen v databázi zatímco grafická úprava a struktura stránek jsou uloženy zvlášť v šablonách. Šablony jsou vzorové HTML dokumenty, do kterých se vkládá na předem označená místa obsah z databáze. Drtivá většina CMS se skládá z částí, tzv. modulů. Po přihlášení do CMS má uživatel možnost si vybrat modul, prostřednictvím kterého vloží článek nebo informaci (např. modul přehled konferencí, modul novinky atd.). Samotný článek přitom může být vytvořen mimo CMS nebo v editoru, který bývá součástí CMS. Obsah článku se po uložení (publikaci) naplní do šablon a zobrazí návštěvníkům stránek. Výhodou šablon není jen to, že zaručují stejný vzhled všech stránek, ale významně také zjednodušují údržbu webu. Když je třeba provést úpravu na všech stránkách, např. výměna loga, stačí ji provést v jedné šabloně namísto úpravy všech stránek. Některé CMS umožňují zobrazovat stejný obsah přes různé šablony a tak ho
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
398
publikovat v různých formátech. Lze tak provozovat kromě standardní HTML verze i verze pro přenosná zařízení či exportovat data do XML pro další zpracování.
2 Požadavky na CMS Ačkoliv každá webová prezentace je jedinečná s specifická, přesto lze najít několik základních charakteristik publikačních systémů, které je nutné zvážit. [SMĚLÝ, 2003] Platforma – důležitým a mnohdy rozhodujícím faktorem při výběru již existujícího systému může být platforma, na které je aplikace schopná běžet. Obecně platí, že na linuxových platformách je větší podíl publikačních systému dostupných pod volně šířenou licencí (open source) s důrazem na použití skriptovacího programovacího jazyka PHP a databáze MySQL, zatímco komerční aplikace jsou postavené na operačních systémech řady Windows a MS SQL serveru. Publikování bez znalosti HTML – aplikace by na straně autora obsahové části webu měla vyžadovat minimální nebo ideálně žádné znalosti značkovacího jazyka HTML. Ideální je tzv. WYSIWYG editor s nástroji na formátování textu (ukazuje už při úpravě textu jeho výslednou formu). Vhodný je rovněž náhled výsledků editace zasazený do designu celé stránky. Šablony – publikační systémy přinesli důsledné oddělování obsahu od grafického vzhledu stránek. Obojí by mělo být spravováno zvlášť. K tomu slouží šablony, s jejichž pomocí je čistý text výsledně formátován. Správa uživatelů – velkou předností publikačních systémů je, že se na tvorbě obsahu webu může podílet více uživatelů. V optimálním případě lze uživatelům přidělovat jak kompletní role, tak také vymezovat konkrétní práva k jednotlivým částem funkcionality aplikace či práva ke konkrétním datům. Rozšířený pohled na práva lze aplikovat i na běžné návštěvníky. Ti jsou z určitého pohledu také uživatelé – mají však práva pouze pro čtení. Pokud systém umožňuje i jejich registrace, lze pozorovat jací návštěvníci sledují které části webu nejvíce. Workflow – workflow publikačního procesu úzce souvisí s možnostmi práv uživatelů. Tok dokumentu přes několik osob v průběhu jeho vytváření, schvalování a fyzického umísťování do konkrétní rubriky je dán navrženou architekturou publikačního systému a při výběru již hotových řešení je třeba brát zřetel na tento aspekt. Funkcionalita – otázka funkcionality je nejširší a v tomto bodě záleží na konkrétních požadavcích daného webu. Publikační systém by však měl rozhodně umět některé základní funkce, jakými jsou například fulltextové vyhledávání, tiskové verze článků, možnost vzájemného odkazování článků mezi sebou nebo možnost diskuze či komentářů. Mezi další nadstandardní funkce patří například automatické generování mapy serveru, dotazníkový modul, zasílání novinek emailem, adresář, katalog, elektronický obchod apod. Archivace – publikační systém musí disponovat propracovanou archivací. Ať už z hlediska exspirace zveřejňovaných informací, tak i z hlediska práce s archivy a možnost jejich prohledávání. Statistiky – webové stránky jsou živým médiem a jejich obsah musí být neustále přizpůsobován potřebám uživatelů. Aby bylo patrné, které informace uživatelé hledají nejčastěji, jakých chyb se při hledání a pohybu v rámci webu dopouštějí je nutné chování uživatelů sledovat a zpracovávat do formy přehledu statistik. I tyto funkce publikační systémy poskytují.
3 Workflow při tvorbě a správě obsahu Při publikování s využitím CMS je práce rozdělena do několika rolí a podprocesů. V první fázi autor napíše článek a předá jej korektorovi. Korektor opraví pravopisné chyby a předá jej případně ke konzultaci další kompetentní osobě. Na konci celého procesu stojí osoba
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
399
Administrátoři webu a databáze
Tvůrci obsahu a korektoři
Tvorba šablon a rozhraní pro bázi dat
Tvorba a úprava obsahové části pomocí webových šablon
WEBOVÝ PORTÁL
zodpovídající za obsah webu, která má konečné slovo a článek buďto schválí a pustí na web nebo jej vrátí zpět autorovi. Autor textu je klíčovým prvek z pohledu kvalitního obsahu. Jsou na něj kladeny tyto nároky: • samostatnost – musí rozumět tomu, co se po něm chce a zajistit si potřebné materiály, • organizovanost – musí si umět rozvrhnout a zorganizovat postup práce, měl by dodržovat časový harmonogram, • spisovatel nebo editor – asi nejdůležitější charakteristická vlastnost - musí umět psát zajímavě, věcně a hlavně podle potřeb daného webu, • zkušenosti s HTML značkami – nemusí dokonale zvládat HTML specifikace, ale měl by vědět, jak docílí odkazu či nadpisu, jak udělá odstavec nebo silnější text, • zběhlost v informačním designu – měl by znát, kdy je dobré text podtrhnout, kdy zvýraznit nebo kde raději udělat nový odstavec.
Koncoví uživatelé
Obr. 1 Rozdělení rolí v procesu publikování informací na webu
4 Výhody a nevýhody open source a komerčních řešení V současné době jsou k dispozici až stovky různých publikačních systému s rozdílnou jazykovou podporou a licenční politikou. Na jedné straně jsou k dispozici komerční systémy s různou modularitou, na druhé straně se rozrůstá nabídka publikačních systémů šířených pod otevřenou licencí (open source). [KRÜGER, 2004] Nevýhody komerčních řešení oproti open source řešení: Náklady – pro využívání komerčních publikačních systémů je nutné zakoupit dostatečný počet licencí, dále je nutné počítat se stejně vysokými náklady na implementaci a v některých případech i s poplatky za periodickou údržbu publikačních systémů. Bezpečnost – zdrojové kódy komerčních systémů jsou většinou nepřístupné a tudíž případné bezpečnostní díry nemohou být snadno odhaleny na straně zákazníka a ten je odkázán na zásah poskytovatele publikačního systému. Stabilita a výkon - open source řešení jsou testovány a instalovány na širším spektru různě nakonfigurovaných počítačových systémů a tudíž jsou lépe optimalizovány pro širší použití. Podpora – podpora u komerčních řešení úzce souvisí s licenční a cenovou politikou daného dodavatele. Open source programy disponují širokou základnou členů sdružených v diskusních fórech nebo emailových konferencích.
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
400
Výhody komerčních řešení oproti open source řešení: Výhled do budoucnosti – vývoj open source řešení může být kdykoliv zastaven neboť vývojáři budou zaneprázdněni dalším vývojem nebo ztratí zájem pokračovat na nových verzích. Nákupem komerčního řešení se dodavatel obvykle zavazuje, že po určitou dobu bude dále pracovat na dalším rozvoji, což je dáno i nepřímo tlakem na udržení zákazníků. Záruka - open source řešení neposkytují žádnou formu záruky. Podpora - v případě, že je licenční smlouvou u komerčních produktů stanovena zákaznická podpora a ta není provedena v dohodnutém čase nebo kvalitě, vzniká dodavatelské firmě hrozba penalizací. Stabilita a výkon – menší a střední open source projekty často nejsou vyvíjeny profesionálními programátory a nepodrobují se dlouhodobému testování. Mohou tak vzniknout problémy vlivem nešikovného zásahu neprofesionálního programátora.
5 Proces implementace CMS 1. 2. 3. 4. 5. 6. 7.
Definice obsahu - jsou to konkrétní informace, data, služby, které jsou uživatelům poskytovány prostřednictvím webu. Rozčlenění obsahu – rozvržení obsahu do logických celků, kapitol apod. Obstarání hardwarového části – nákup webového serveru s podporou platformy vyžadovanou publikačním systémem. Grafický návrh - návrh vhodné kombinace grafických a textových prvků, tak aby byla návštěva stránek pro uživatele esteticky přitažlivá a zároveň se neztrácela výsledná funkčnost. Implementace – vytvoření databázové struktury, tvorba HTML šablon, oživení publikačního systému, definice skupin uživatelů. Migrace starého a nového obsahu – naplnění databáze novým obsahem, případně převod starších dat do nového formátu. Zaučení do systému – seznámení kompetentních uživatelů s fungováním a pravidly publikace obsahu pomocí publikačního systému.
definice obsahu
rozčlenění obsahu
obstarání hardwarové části
grafický návrh
implementace
migrace starého obsahu a naplnění novým obsahem
zaučení do systému
Obr. 2 Proces implementace publikačního systému (CMS)
6 Využití CMS v portálu e-Automatizace Při hledání vhodného publikačního systému pro informační portál e-Automatizace byly posuzovány možnosti, zda-li vybudovat takovýto systém úplně od začátku nebo již vzniklé a dostupné řešení adaptovat pro potřeby projektu. Při výběru dostupných řešení byl výběr zúžen díky použité technologii. Portál e– Automatizace je provozován na webovém serveru postaveném na platformě Windows 2000 a Internet Information Services (IIS) s podporou skriptovacího jazyka Active Server Pages (ASP). Jako nejvhodnější řešení byl zvolen publikační systém společnosti Iatek (http://www.iatek.com/), která pod volně šířenou licencí nabízí webovou aplikaci pod názvem PortalApp Basic Edition 2.21 (ASPapp.com), která obsahuje i správu odkazů formou katalogu. Tento systém je postaven na technologii skriptovacího jazyka Active Server Pages (ASP), data jsou ukládána do databáze Microsoft Access 2000. PortalApp je zpracován v anglickém jazyce, byla proto provedena lokalizace do českého jazyka.
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
401
Obr. 3 Úvodní stránka webové aplikace PortalApp
Přizpůsobení aplikace ASPapp potřebám portálu e-Automatizace Při úpravách a přizpůsobení aplikace ASPapp potřebám portálu e-Automatizace bylo zjištěno, že bude nutné některé části publikačního systému přepracovat tak, aby splňovala kritéria přístupnosti a použitelnosti webu. Webové stránky ASPapp jsou napsány v jazyce HTML verze 4.0. V záhlaví každé stránky je opomíjená specifikace typu dokumentu DTD, která definuje normu, podle níž se dokument zpracovává. V nové verzi jazyka XHTML je tato specifikace povinná. Výrobci nejpoužívanějších prohlížečů vyšli vstříc autorů v období přechodu k přísným standardům jazyka XHTML – prohlížeče nepřestaly tolerovat chyby a zastaralé konstrukce v dokumentech, ale pracují v několika režimech, které se aktivují právě podle použitého typu dokumentu. Prohlížeč Microsoft Internet verze 6 pracuje ve dvou módech – nestandardním, který přehlíží chyby v dokumentu a standardním režimu, který se daleko více řídí příslušnými specifikacemi. Prohlížeče na bázi Mozzily mají režimy dokonce tři – nestandardní se podobá chováním Netscape 4.x, v režimu standardním jsou specifikace dodrženy bezvýhradně. Třetí režim tzv. převážně standardní je mezistupněm – s co největší kompatibilitou se staršími konstrukcemi v dokumentech se současně snaží maximálně dodržovat standardy. Rozvrstvení dat na stránce (layout) je provedeno stylem několikanásobně vnořených tabulek. Tento způsob tvorby layoutu se zaměřuje více na popis výsledného vzhledu než na přehlednou strukturu dokumentu. Oddělením obsahu a formátovacích značek do zvláštního souboru využitím kaskádových stylů (CSS) dosáhneme snížení velikosti souboru, tím i rychlejší natahování webové stránky a větší spokojenost návštěvníků. CSS formátování dokumentu umožňuje připravit a uzpůsobit různé grafické uspořádání tak, aby vyhovovalo např. rozličným typům prohlížečů nebo verzi typově stejných prohlížečů, taktéž pro specifická zařízení přistupující k webovému obsahu. Se stále širším použitím Internetu přibývá případu využívání WWW stránek i jinými způsoby, než když si je čtenáři pouze prohlíželi ve svých (obvykle nejmodernějších) prohlížečích: stále častější je přístup k webu z nestandardních zařízení (mobilní telefony, palmtopy, webTV, hlasové výstupy, slepecké browsery), stránky jsou "čteny" roboty (vyhledávácí automaty, indexování stránek na vyhledavačích, rešeršní systémy) a navíc s časem přibývá reziduálních starých prohlížečů (ne co do počtu, ale co do šíře druhu) - tedy té
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
402
části uživatelů, kteří zůstávají mnoho let u stejné verze svého browseru. A v neposlední řadě se HTML formát začíná využívat také pro interní výměnu informací, které je potřeba následně zpracovávat. Ve všech těchto případech jsou dokumenty, zahlcené převážně formátovacími příkazy (na stránce zformátované pomocí vnořených tabulek tvoří příkazy bez informační hodnoty až tři čtvrtiny objemu stránky), prakticky nepoužitelné. Navíc se zde příkazy HTML aplikují mimo svůj původní účel: místo k definování logických vazeb obsahu k vymezení jeho vzhledu. Dokument tak ztrácí svou strukturu - ta už je viditelná pouze lidským očím při zobrazení ve vhodném prohlížeči; při jiném zpracování jsou podstatné informace utopeny hluboko v kódu stránky a často jsou související texty roztrženy a rozsypány na mnoha nesouvisejících místech. Formátování pomoci vnořených tabulek je nejčastější příčinou jejího totálního selhání na vyhledávačích. Zřejmé jsou nevýhody proprietárních řešení a formátování pomocí tabulek: několikanásobné větší objem dat (zvlášť pokud majitel webu platí za objem přenesených dat), pomalé vykreslování stránek, nekompatibilita a především rozpad struktury dokumentu. Provozovatel webu navíc musí hradit vyšší náklady za vytváření speciální verze webu pro malé procento uživatelů - pokud se web vytvoří kompromisně pro většinu prohlížečů, platí za to všichni: uživatelé lepších browserů nedostanou tolik, kolik by mohli využít; pro uživatele těch horších je zase stránka většinou nepoužitelná (jedině společné všem prohlížečům je HTML verze 1, ve všem dalším už dochází k nekompatibilitám). Přesným opakem jsou pak výhody použití strukturovaného HTML. [STANÍČEK, 2002] Z těchto vyjmenovaných důvodů již začal proces přepracování zdrojových kódů redakčního systému PortalApp Basic Edition, tak aby výstupem byly stránky, které odpovídají normě organizace W3C dle standartu XHTML verze 1.0 Strict. Jedná se konkrétně o odbourání tabulkového vzhledu stránek, oddělení obsahu a formátovacích příkazů s využitím kaskádových stylů, používání XHTML značek dle normy.
Obr. 4 Přepracovaná úvodní stránka portálu e-Automatizace podle normy XHTML 1.0 Strict
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
403
Struktura katalogu e-Automatizace Informace o odkazech, jejich popis, hodnocení, návštěvnost, zařazení do stromové struktury a další statistické údaje společně s informacemi o registrovaných uživatelích a v neposlední řadě anglicko-český slovník pojmů z oblasti automatizace jsou uloženy v databázi Microsoft Access 2000. Použití této databáze byla dáno výběrem redakčního systému PortalApp Basic Edition 2.21 a umožňuje na jednu stranou jednoduchou údržbu pomocí lokální aplikace Microsoft Access (nebo prostřednictvím webového rozhraní), nižší softwarové požadavky na straně webového serveru (postačí základní verze Internet Information Services (IIS) verze 5.0 a výše), na stranu druhou se potýká s vyšším bezpečnostním rizikem a limitovaným použitím – databáze Microsoft Access je schopna pracovat pouze s určitým limitovaný počtem uložených záznamů (max. do výše 2GB). Z těchto důvodů se počítá s přesunem dat na databázový server MS SQL. K prosinci 2004 katalog obsahuje 196 odkazů na stránky, které jsou rozděleny do 35 tématických kategorií souvisejících s oblastí automatizace. Doplňování dalších odkazů není odkázáno pouze na administrátora, odkaz může po registraci a uvedení kontaktních údajů zapsat jakýkoliv uživatel. Administrátor si ale vyhrazuje právo schválit odkaz před jeho zveřejněním, případně jej přeřadit do jiné, vhodnější kategorie tak, aby byla zachována přehlednost katalogu.
7 Nové požadavky na CMS Jak již bylo zmíněno, publikační systémy přinesly důsledné oddělení obsahu a formy. Oddělením obsahu a formátovacích značek do zvláštního souboru využitím kaskádových stylů (CSS) umožňuje větší flexibilitu a nasazení nového grafického vzhledu webových stránek lze aplikovat ve velice krátkém časovém úseku. Požadavky na novou generaci CMS se týkají i důslednějšího dodržování standardů stanovených konsorciem W3C, tak aby kód webové stránky byl plně validní. Generování jednoduchých URL je další novou potřebou pro publikační systémy. Jednoduché URL je takové, které neobsahuje otazník, za kterým si script předává tzv. parametry. Příkladem "klasického" URL je např. http://www.priklad.cz/clanek.php ?clanek=1506. Zde parametr identifikuje, že se má zobrazit článek číslo 1506. Jednoduché URL potom může být třeba http://www.priklad.cz/nadpis-clanku.html. Důvody pro užívání jednoduchých URL jsou následující: • většina vyhledávačů totiž vyhledává klíčová slova také v URL a přikládá jim významnou váhu, • vyhledávače většinou neindexují stránky s mnoha parametry (například Google nevyhledává ve stránkách s více jak třemi parametry a do ledna 2004 dokonce nevyhledával ve stránkách s více jak dvěmi parametry a ještě k tomu se ani jeden parametr nesměl jmenovat id), • menší riziko, že se při ručním přepisování někdo překlepne, • to, že z odkazů je ihned patrné, o čem stránka je. Dalším novou službou publikačních systémů jsou takzvané kanály RSS (Really Simple Syndication). RSS umožňuje publikování seznamu odkazů spolu s dalšími informacemi, které blíže popisují daný odkaz. RSS je uloženo na serveru (případně může být generováno dynamicky) a je přístupné návštěvníkům webu. RSS kanál se stal v současnosti nedílnou součástí téměř každého zpravodajského serveru nebo weblogu.
XXX. ASR '2005 Seminar, Instruments and Control, Ostrava, April 29, 2005
404
8 Závěr Využívání publikačních systémů pro zveřejňování informací na webu je v dnešní době více rozšířené v komerční oblasti a funkcionalita těchto systému je i tomu přizpůsobena. Postupně se tyto aplikace prosazují i v jiných oblastech včetně vzdělávání. Původní idea vzešlá ze strany zpravodajských serverů, které iniciovali vznik publikačních systémů jako pomůcky pro zobrazení informací formou článků, následnou archivaci včetně funkce prohledávání dostává širší rozměr při použití v jiných oblastech. S rozšiřováním základny nasazení těchto webových aplikací a rozdílnými požadavky uživatelů nutí tvůrce publikačních systémů reagovat na tyto nové výzvy.
9 Použitá literatura CAJTHAML, M. Dokonalejší správa obsahu. [online]. Praha: Symbio, 1.4.2004 [cit. 200504-25]. Available from www:
DUDEK, D.T. & WIECZOREK, H.A. A Simple Web Content Management Tool as the Solution to a Web Site Redesign. SIGUCCS ’03, San Antonio, Texas, September 21–24, 2003, p. 179-181. KRÜGER, J.D. Open source vs. commercial CMS. [on-line] Feig&Partner, Leipzig 4.3.2004 [cit. 27.4.2004]. Available from www: SMĚLÝ, R. Profesionálové hovoří o publikačních systémech. Computerworld 5/2003. p. 9-11 ISSN 1210-9924 STANÍČEK, P. Nastal Bod Zlomu webdesignu?. [on-line] Internet Info s.r.o., Praha 21.3.2002 [cit. 14.1.2004]. Available from www: