Bankovní institut vysoká škola Praha Katedra matematiky, statistiky a informačních technologií
Wiki systémy – zkušenosti a možnosti praktického využití Bakalářská práce
Autor:
Jan Dobrovodský BIVŠ ITP Informační technologie
Vedoucí práce:
Praha
Ing. PhDr. Antonín Pavlíček, Ph.D.
Duben 2012
Prohlášení Prohlašuji, že jsem bakalářskou práci zpracoval samostatně a v seznamu uvedl veškerou použitou literaturu. Svým podpisem stvrzuji, že odevzdaná elektronická podoba práce je identická s její tištěnou verzí, a jsem seznámen se skutečností, že se práce bude archivovat v knihovně BIVŠ a dále bude zpřístupněna třetím osobám prostřednictvím interní databáze elektronických vysokoškolských prací.
V Táboře dne 20. 4. 2012 Jan Dobrovodský
Poděkování Na tomto místě bych chtěl poděkovat hlavně Ing. PhDr. Antonínu Pavlíčkovi, Ph.D. za přínosné nápady a typy pro vylepšení při tvorbě práce a celkově velmi prospěšné konzultace. Jeho odborné znalosti a zaujetí pro téma byly pro mne významnou hnací silou.
Anotace Bakalářská práce se zabývá obecnými pravidly a zákonitostmi tvorby webového obsahu na principu wiki. Popisuje hlavní charakteristiky, výhody a nevýhody takových systémů a jejich funkci v praxi. Dále jsou zde popsány oblasti tvorby, pro které je tento typ webu užitečný a může vést k výraznému zvýšení vytvářené hodnoty. Podstatná část práce se zabývá problémem vandalismu na veřejně přístupných wiki systémech, a to především na encyklopedickém serveru Wikipedia.org. Součástí práce je i testování samo-opravné funkce české a anglické verze Wikipedie dle samostatně navržených metodik. Tento test se zabývá jak sledováním a vyhodnocením již proběhlých vandalismů, tak i sledováním oprav nově vzniklých vandalských úprav článků. Součástí těchto testů je také porovnání informačního rozsahu dvou zmiňovaných verzí. Klíčová slova: Wiki, Wikipedia, wiki vandalismus
Annotation My Bachelor thesis describes the general rules and regularities of creating web content on the wiki principle. It also describes what are the main characteristics, advantages and disadvantages of such systems and how these attributes work in practice. There are areas for which this type of site is useful and can lead to a significant increase of created value. A substantial part of this thesis deals with the problem of vandalism on public wiki systems, and especially on the encyclopedic server wikipedia.org. The work also includes testing of self-repair function of Czech and English version of Wikipedia, according to self-designed methodologies. This test is concerned with monitoring vandalism that has already been done and monitoring vandalism newly created by editing articles. Part of these tests is also the comparison of informational extent of two mentioned versions. Keywords: Wiki, Wikipedia, wiki vandalism
Obsah Úvod ........................................................................................................................................... 9
1.
2.
3.
4.
Zvolené metody zpracování ........................................................................................... 10 1.1
Metody v obecné části ............................................................................................... 10
1.2
Metody v praktické části ............................................................................................ 10
Princip fungování a tvorby wiki systému ..................................................................... 11 2.1
Charakteristika wiki systému ..................................................................................... 11
2.2
Editování wiki stránek ............................................................................................... 11
2.3
Základní syntaxe wiki-textu....................................................................................... 13
2.4
Navigace .................................................................................................................... 13
2.5
Kontrola změn............................................................................................................ 14
2.6
Diskuze mimo zobrazovaný text ................................................................................ 14
2.7
Spory .......................................................................................................................... 15
Hlavní myšlenka při zakládání...................................................................................... 16 3.1
Důvěryhodnost ........................................................................................................... 16
3.2
Bezpečnost ................................................................................................................. 17
Oblasti vhodné pro tento druh webu ............................................................................ 19 4.1
Návody, postupy, manuály ........................................................................................ 19
4.2
Vzdělávání ................................................................................................................. 19
4.2.1
Výhody používání wiki systémů ve vzdělávacím kolektivu .............................. 19
4.2.2
Kolektivní autorství ............................................................................................ 19 5
5.
6.
4.2.3
Změna práce s informacemi ............................................................................... 20
4.2.4
Způsoby využití .................................................................................................. 20
Zvážení alternativ ........................................................................................................... 23 5.1
Redakční systém (CMS) ............................................................................................ 23
5.2
Pokročilé diskuzní fórum ........................................................................................... 23
Aplikace pro tvorbu a správu ........................................................................................ 24 6.1
Dělení wiki softwaru podle užití ................................................................................ 24
7.
Druhy uživatelů wiki systému ....................................................................................... 25
8.
Shrnutí výhod a nevýhod wiki systémů ........................................................................ 26
9.
Wikipedia- Informační fenomén dneška ...................................................................... 27 9.1
Základní informace .................................................................................................... 27
9.2
Provozní údaje ........................................................................................................... 27
9.3
Česká verze Wikipedie .............................................................................................. 28
9.4
Porovnání dvaceti nejrozsáhlejších verzí Wikipedie ................................................. 28
9.5
Základní myšlenka neutrálnosti Wikipedie ............................................................... 31
9.5.1
Dosahování neutrality ......................................................................................... 32
9.5.2
Pojmenovávání ................................................................................................... 33
9.5.3
Struktura článku.................................................................................................. 33
9.5.4
Správné rozložení uváděných pohledů ............................................................... 34
9.5.5
Estetické názory.................................................................................................. 35
9.5.6
Nedoporučované výrazy ..................................................................................... 35 6
10.
Wiki vandalismus ........................................................................................................ 36
10.1
Nejčastěji se vyskytující druhy vandalismu ............................................................... 36
10.2
Motivace vandalismu ................................................................................................. 37
10.3
Hledání pozornosti ..................................................................................................... 37
10.4
Neprospěšná editace s dobrým úmyslem ................................................................... 38
10.5
Emoční stránka dlouhodobého vandalismu ............................................................... 38
10.6
Autoritářství ............................................................................................................... 39
10.7
Ostatní motivy............................................................................................................ 39
10.8
Prevence ..................................................................................................................... 40
10.9
Wiki boti .................................................................................................................... 40
10.9.1
11.
ClueBot NG ........................................................................................................ 40
Praktický test ............................................................................................................... 42
11.1
Volba metodiky testování .......................................................................................... 42
11.2
Pozorování reálné situace .......................................................................................... 44
11.3
Analýza nejčtenějších článků..................................................................................... 45
11.3.1
Statistické hodnocení historie editací článku Václav Klaus ............................... 48
11.3.2
Výsledky pozorování historie editací českých článků ........................................ 49
11.3.3
Shrnutí a závěry české části průzkumu............................................................... 56
11.3.4
Sledování opravování vandalismu na anglické verzi Wikipedie ........................ 58
11.3.5
Shrnutí a závěry anglické části průzkumu .......................................................... 68
11.3.6
Doplňující druhá část testu ................................................................................. 70
11.3.7
Rozsah ekvivalentních článků na jednotlivých verzích ...................................... 75
11.4
Test s pomocí záměrného vkládání chyb ................................................................... 78
11.4.1
Škodlivé editace v české verzi ............................................................................ 79
11.4.2
Škodlivé editace v anglické verzi ....................................................................... 85 7
11.4.3 11.5
Vyhodnocení testu pomocí vkládání vlastních chyb .......................................... 92
Celkové shrnutí praktického testu dvou verzí Wikipedie .......................................... 94
11.5.1
Možnost tvorby oficiální informační databáze ................................................... 94
Závěr ......................................................................................................................................... 97 Seznam použité literatury ......................................................................................................... 99 Seznam použitých tabulek ...................................................................................................... 101 Seznam použitých grafů ......................................................................................................... 102 Seznam použitých obrázků ..................................................................................................... 102
8
Úvod Vstup wiki systémů na internetovou scénu umožnilo zavedení webu 2.0, jenž nabízí uživateli internetu aktivně se podílet na tvorbě jeho obsahu. To znamená zásadní změnu v zažitém principu uveřejňování informací, kde je vyřazen prvek ověřovací autority, který je nahrazen samotným konzumentem obsahu. Ten by měl v ideálním případě upozorňovat na informační nedostatky nebo je rovnou opravovat. V mé práci se budu zabývat teoretickými stránkami fungování wiki. Popíši principy a pravidla, která se musí dodržovat pro správné fungování systému, a také nastíním způsob, jakým probíhá jeho editování. V rozsahu celé bakalářské práce se budu snažit popisovat významné výhody, ale také nevýhody, jež tento druh webu nabízí. Významná část práce bude věnována problematice vandalismu na veřejných wiki webech a možnostech jeho omezování. V praktické části práce bude mým cílem ověřit, jestli kontrolní mechanismy serveru wikipedia.org mohou předcházet úmyslnému poškozování článků a zda je uživatelská komunita dostatečně rozsáhlá pro to, aby dokázala účinně bojovat s vandalismem. Možnost výskytu zvandalizovaných informací je jeden z hlavních důvodů, proč jsou wiki weby terčem kritiky. Zda je tato kritika oprávněná jsem se rozhodl ověřit analýzou historických záznamů editací a také vkládáním vlastních vandalismů a sledováním, jak bude probíhat jejich oprava. Počáteční předpoklad je, že široká komunita uživatelů dokáže účinně eliminovat většinu záškodných editací. V průběhu testování opravných mechanismů bude také probíhat srovnání anglické a české verze Wikipedie z hlediska vandalismu i kvality obsahu. Závěry těchto testů by měly zodpovědět otázku, zda vandalismus představuje reálnou hrozbu pro fungování Wikipedie jako zdroje kvalitních a ověřených informací.
9
1. Zvolené metody zpracování 1.1 Metody v obecné části V obecné části bakalářské práce jsem se pokusil čtenáři poskytnout komplexní náhled na oblast wiki systémů. Vzhledem k horší dostupnosti tištěných publikací zabývajících se danou problematikou, jsem postupoval hlavně metodou rozsáhlé rešerše zdrojů dostupných na webu. Načerpané informace jsem poté použil při tvorbě samotného textu práce. Jako hlavní a důležitý zdroj informací mi sloužil server wikipedia.org. Díky obrovské komunitě uživatelů a správců systému se zde tvoří unikátní databáze informací u fungování wiki. Tuto techniku jsem zvolil právě z důvodu velkého množství dostupných online zdrojů, abych postupným čtením syntetizoval ty informace, jež jsou z mého pohledu nejdůležitější pro tuto bakalářskou práci. Snažil jsem se poskytnout čtenáři také informace, které nejsou běžně dostupné v českém jazyce.
1.2 Metody v praktické části V této části jsem se snažil sledovat skutečnou situaci na úkor většího množství statistických dat. Pro ilustraci fungování „samoopravné“ funkce Wikipedie v reálném prostředí jsem se soustředil na menší množství sledovaných hodnot, ve snaze podrobněji je popsat. Data jsem sbíral bez použití speciálního softwaru. Data jsem získával převážně z historických záznamů provedených editací jednotlivých článků a následně jsem je analyzoval.
10
2. Princip fungování a tvorby wiki systému Hlavním cílem této kapitoly je popsat fungování a smysl tvorby wiki systému. Jsou zde uvedeny základní pravidla uživatelské editace a navigace.
2.1 Charakteristika wiki systému Wiki systém (dále jen WS) je nejčastěji web, kde uživatelé mohou přidávat, upravovat nebo mazat jeho obsah jednoduše s pomocí jejich internetového prohlížeče. WS většinou využívají určitého wiki softwaru a jsou tvořeny mnoha uživateli. Nejčastější oblasti použití jsou komunitní a znalostní weby, firemní intranety a stránky pro sdílení poznámek (britannica.com, [online]). Za zakladatele wiki filosofie se považuje Ward Cunningham, který tento systém poprvé použil na stránce s názvem WikiWikiWeb. Slovo Wiki pochází z havajštiny a překládá se jako „rychlý“ nebo „hbitý“ (Cunningham, 2002). Jednotlivé články na webu se nazývají „wiki page“ nebo „wiki entry“ („wiki stránka“) a celá jejich kolekce se potom nazývá souhrnným názvem Wiki systém nebo jen Wiki. Je to v podstatě databáze pro tvorbu, prohlížení a hledání informací (Black, Delaney, Fitzgerald, 2007). Hlavní charakteristiku určuje snadnost, s jakou mohou být jednotlivé stránky tvořeny a aktualizovány. Většinou platí, že aktualizace nemusí být před jejím zveřejněním nijak ověřována nadřazeným uživatelem. Mnoho WS umožňuje anonymní editaci bez nutnosti registrace uživatelského účtu (Ebersbach, 2007). Úpravy jsou zpravidla okamžitě přístupné on-line. Všechny tyto faktory mohou vést ke zneužívání těchto systému- tzv. wiki vandalismu. Na soukromých (např. firemních) WS je samozřejmě vyžadována autentizace uživatele před možností editace a někdy i před samotným čtením.
2.2 Editování wiki stránek Existuje několik možností editace. Ve většině případů se struktura a formátování vytváří pomocí zjednodušeného značkovacího jazyka, někdy také nazývaným wiki-text nebo wikimarkup. Styl a syntaxe wiki-textu se může lišit podle implementace WS. Některé z nich
11
povolují začlenění syntaxe HTML1. Jelikož editace pomocí HTML by mohla být pro některé uživatele až příliš složitá, povětšinou se používá plain-text2 editor s jednoduchým ovládáním. Toto omezení také přispívá ke snadnějšímu přístupu pro editory, protože různé kaskádové styly nebo JavaScript by mohl některé z nich limitovat. Celková jednoduchost také vede k jednotnosti vzhledu a konzistenci všech příspěvků. V poslední době také tvůrci WS zařazují možnost editace WYSIWYG3, jež převádí vytvořený vzhled to syntaxe wiki-textu nebo HTML značek. To může usnadnit práci editorům, kteří nemají s formátováním pomocí tagů žádné zkušenosti. Ideální řešení je nabídnout obě možnosti. Jedna z významných vlastností většiny WS je ukládání veškerých přechozích verzí textu, včetně výčtu všech editací. Je to důležité hlavně z hlediska oprav a předcházení tzv. wiki vandalismu. Autor nebo oprávněný editor může kdykoliv tzv. revertovat předchozí verzi nebo smazat část příspěvku, která je chybná, nepřísluší k danému tématu nebo nesplňuje podmínky určené pravidly daného WS. Každý wiki příspěvek má tedy svůj seznam, kde jsou vedeny všechny historické změny spolu s časovými údaji, jmény editorů nebo IP adres4, ze kterých editace proběhla. Ke každé položce je také možno napsat komentář, proč autor právě tuto změnu provedl, aby nedocházelo ke zbytečným nedorozuměním mezi jednotlivými přispěvateli. Dále se uvádí rozsah každé úpravy v počtu slov nebo v bitech.
1
HTML (HyperText Markup Language) je jedním z jazyků pro vytváření stránek v systému World Wide Web, který umožňuje publikaci dokumentů na Internetu. 2 Plain-text je v informatice označení uložení textu do souboru ve formě, kdy jsou uloženy pouze jednotlivé znaky (resp. čísla odpovídající kódům použité znakové sady, např. ASCII nebo Unicode) bez formátovacích informací. 3 WYSIWYG je používaná zkratka pro anglické „What you see is what you get“. To znamená česky „co vidíš, to dostaneš“. Tato zkratka označuje způsob editace, při kterém je verze zobrazená během editace vzhledově totožná s výslednou podobou dokumentu (například MS Word). 4 IP adresa je v informatice číslo, které jednoznačně identifikuje síťové rozhraní v počítačové síti, která používá IP (internetový protokol).
12
2.3 Základní syntaxe wiki-textu V následující tabulce č. 1. jsou uvedeny základní pravidla pro formátování wiki-textu. Tabulka základní syntaxe wiki-textu Požadovaný textový element
syntaxe
Nadpisy (2x =)
==Nadpis jednotlivé sekce==
Podnadpisy (3x =)
===Podnadpisy===
Další podnadpis (4x =)
====Další podnadpis====
Podnadpis mimo obsah ( ; )
;Podnadpis, který nebude v obsahu
Oddělovací čára
----
Zalomení řádku
Tento text bude začínat na nové řádce
Odsazení ( : )
:tento text bude odsazen 1x
Položka nečíslovaného seznamu
*toto bude nová položka seznamu
Nová položka číslovaného seznamu
#toto bude nová položka číslovaného seznamu
Zvýraznění textu
'''Tento text bude zvýrazněn'''
Kurzíva
''''Tento text bude napsán kurzívou''''
Nezalomitelná mezera
Odkaz
[[odkazovaný článek]]
Odkaz s jiným názve
[[Odkazovaný článek|zobrazený text odkazu]]
Vložení obrázku
[file:wiki.png|alternativní text]
Tabulka č. 1. Základní přehled syntaxe wiki-textu | Zdroj: en.wikipedia.org
2.4 Navigace Pohyb mezi jednotlivými články je řešen pomocí odkazů v samotném textu. Každý příspěvek může obsahovat velké množství odkazů na související články, jež mohou vhodně doplňovat informace k článku, ve kterém je umístěn tento odkaz. Tento nelineární systém navigace je mnohem intuitivnější a pro uživatele jednodušší než strukturovaný formalizovaný způsob. Každý tvůrce článku tedy může vytvořit v textu odkazy na jiné příspěvky nebo dokonce odkazy na články, které zatím neexistují nebo jsou velmi stručné (tzv. Pahýl5). Tím vlastně vybízí ostatní uživatele, aby tyto neúplné články vylepšovali. Navigace pomocí stromového členění dle témat a vyhledávání však také patří mezi standardní funkce.
5
Pahýl je článek, který vyžaduje další pozornost editorů, protože neobsahuje dostatek informací. K tomu aby se tento základ stal plnohodnotným článkem, je potřeba doplnit další údaje.
13
2.5 Kontrola změn WS jsou vytvářeny s myšlenkou jednoduché opravy chyb namísto prevence jejich tvorby. Významná část wiki příspěvků je jejich „stránka posledních změn“, což je speciální seznam všech provedených změn nebo změn, kterými prošel příspěvek za určité časové období. Pro lepší přehlednost je často přístupná funkce filtrování minoritních a automatických oprav, jež jsou většinou prováděny pomocí tzv. wiki botů6 (Ebersbach, 2007). Tzv. change log může poskytovat další varianty užitečných funkcí, které vylepšují možnost orientace v provedených změnách a usnadňují cestu k předchozím variantám textu. Přístupné mohou být kompletní vývojové verze příspěvku nebo mohou být zvýrazněné pouze rozdílnosti mezi dvěma verzemi (Ebersbach, 2007). Přehled historického vývoje je velice důležitý pro editora, jež se díky nim může lépe rozhodovat, zda je provedená změna důležitá a zaslouží si tak ponechat, nebo zda je lepší vrátit příspěvek do předchozí podoby. Tomuto vrácení článku do původní podoby se v prostředí wiki systémů říká „revert“. Pro důmyslnější kontrolu editací obsahuje mnoho wiki systémů takzvaný watchlist. Ten slouží editorovi k rychlé kontrole zvolených editovaných textů, které chce sledovat. Může tak každou provedenou změnu v co nejkratším časovém úseku zkontrolovat (Ebersbach, 2007). Popřípadě může být systém nastaven tak, aby každá změna nejdříve prošla přes editora, který jí musí schválit ještě před tím, než se začne zobrazovat běžným uživatelům.
2.6 Diskuze mimo zobrazovaný text Většina WS podporuje funkci, jež umožňuje diskutovat o provedených editech (anglický výraz pro změnu v článku). To je užitečné zvláště při vedení sporů o tom, zda je daná editace správná či nikoliv. Každý revert zpravidla umožňuje diskuzi, v níž mohou uživatele napsat, která verze je dle jejich názoru nejvhodnější. Poté může dojít ke zpětnému uveřejnění editace nebo jejímu definitivnímu zamítnutí. Často se toto řešení vyskytuje při vzniku tzv. wiki války, kdy se několik uživatelů není schopno dohodnout jaká verze článku je správná. Pokud je téma závažné, může dojít i k dočasnému zamknutí možnosti editace, aby se vše „v klidu“ vyřešilo.
6
Bot je počítačový program, který opakovaně vykonává nějakou rutinní činnost na internetu - obvykle sbírá data, odesílá a zpracovává požadavky.
14
2.7 Spory Nežádoucím jevem jsou tzv. wiki války. Jedná se o neustálý souboj dvou či několika uživatelů, při němž jeden subjekt edituje stránku, zatímco druhý subjekt tyto změny opakovaně odmítá a vrací stránku do původního stavu. Tyto spory se řeší funkcí zamknutí obsahu, která umožňuje dočasné omezení možnosti provádět změny na daném článku. Poté zpravidla následuje rozhodovací období, jež například na české Wikipedii probíhá způsobem hlasovaní několika uživatelů s nejvyššími právy o tom, jaká verze článku bude upřednostněna (tyto ankety jsou součástí wiki softwaru).
15
3. Hlavní myšlenka při zakládání Ward Cunningham a spoluautor Bo Leuf popsali v knize „The Wiki Way: Quick Collaboration on the Web“ principy wiki konceptu následovně (Leuf, Cunningham, 2001): WS umožňuje všem uživatelům měnit kteroukoliv stránku nebo vytvořit novou stránku uvnitř wiki webu pouze za pomocí jejich prohlížeče bez použití jakýchkoliv doplňků nebo modifikací. Wiki umožňuje smysluplnou asociaci mezi tématy prostřednictvím odkazů na související témata. Snaží se zapojit návštěvníka do probíhajícího procesu tvorby a spolupráce, která přispívá k neustálému rozvoji stránky. Maged N. Kamel Boulos, Cito Maramba a Steve Wheeler popsali takzvaný Darwikinismus, což je pojem, který připodobňuje proces vyvíjení WS k darwinovskému vývoji ve volné přírodě. Otevřenost wiki a rychlost, s níž se wiki stránky mohou měnit, přispívá k tomu, že nezpůsobilé věty a sekce v článcích jsou bez milosti odstraněny nebo předělány tak, aby vyhovovali. To, dle této teorie vede, k vyšší kvalitě každé wiki stránky. Tedy otevřenost může vést k vandalismu, ale zároveň umožnuje jeho okamžitou nápravu nebo navrácení do původní „vývojové linie“ (Boulos, Maramba, Wheeler, 2006).
3.1 Důvěryhodnost Kritici veřejně editovatelného WS namítají, že ty systémy mohou být často manipulovány, a současně zastánci argumentují tím, že široká komunita uživatelů dokáže bleskově rozpoznat závadný obsah a opravit ho (britannica.com, [online]). Lars Aronsson, systémový specialista, přirovnal wiki systém k veřejně přístupné šedé zdi s neomezeným přístupem k barvám pro všechny kolemjdoucí. Jediným možným výsledek by měly být chaoticky počmárané zdi a všechny umělecké pokusy by měli být nemilosrdně pohřbeny. Naproti tomu ale upozornil, že tento předpoklad se zdá milný a většina WS funguje (Ebersbach, 2007).
16
3.2 Bezpečnost Otevřená filozofie většiny WS povolující volnou změnu obsahu nezajišťuje dobromyslnost všech editorů. Vandalismus může být kritický problém. Na rozsáhlých wiki webech může vandalismus zůstat neodhalen po velice dlouhou dobu, a proto zde často fungují speciálně vytvoření softwaroví roboti, kteří automaticky identifikují vandalismy a opravují je. Tímto způsobem může být velká část vandalismů eliminována na jen nepodstatné minoritní změny obsahu, které nenarušují informační hodnotu článků. Množství vandalismu je přímo úměrné otevřenosti každého wiki systému. Ve většině případů je uživatel identifikován jen pomocí IP adresy a není nutné provádět registraci před samotnou editací (Ebersbach, 2007). Na druhou stranu registrace může často uživateli přinést řadu výhod a dodatečných oprávnění. Dalším prvkem při ověřování důvěryhodnosti uživatele před udělením důležitých práv může být předem daná časové perioda, která musí uběhnout před plnou aktivací funkcí. Například po jednoduché registraci může následovat dvoudenní čekací lhůta, po níž dojde k dokončení registrace. Toto je opatření hlavně proti spamovacím botům7 a náhodným „škůdcům“. Na anglické Wikipedii může uživatel přejmenovat článek až po uplynutí čtyř dnů od registrace. Pokročilejším stupněm kontroly editací je ověřování uživatele na základě dobře provedených změn. Stupeň oprávnění se postupně zvětšuje s přibývajícími kladně hodnocenými editacemi. Každý takový systém ochrany přispívá ke zvyšování důvěryhodnosti informací na wiki, avšak stejnou měrou na druhé straně zpomaluje její růst. Proto systémy s téměř nulovou ochranou rostou výrazně rychleji, i když s větší pravděpodobností výskytu chyb, ať už způsobených úmyslně či jen vložením nesprávné informace s dobrým úmyslem. Nebezpečnost vandalismu nemusí nutně spočívat jen ve vkládání špatných informací, ale také v odkazování na závadný software nebo na jiné weby obsahující škodlivý kód, jenž může provést nevyžádané změny na zařízení uživatele. Tento druh vandalismu je naštěstí relativně dobře
kontrolován
automatickým
rozpoznáváním
závadných
odkazů
nebo
jejích
porovnáváním s již vytvořeným seznamem zakázaných stránek (wikimedia.org, [online]). Wiki software většinou také blokuje JavaScript nebo jiné druhy skriptů, které by se uživatel pokoušel vložit přímo do stránky během editace.
7
Spam bot je označení pro robota, který automaticky vkládá nevyžádaný obsah (nejčastěji reklamní text nebo jiné komerční sdělení).
17
Rozvoj wiki vandalismu je do značné míry ovlivňován také stupněm anonymity. Proto se úmyslné záškodnictví vyskytuje převážně na veřejně dostupných informačních WS, kde se anonymita blíží stoprocentní hranici, na rozdíl například od korporátního nebo školního wiki systému, v němž může být téměř každá závadná editace vystopována a uživatel potrestán i mimo rámec samotného wiki systému (Augar, Raitman, Zhou, 2004).
18
4. Oblasti vhodné pro tento druh webu Tento druh tvorby webu je vhodný hlavně pro hromadění informací z co nejvíce zdrojů (lidí). Proto se používá při vytváření rozsáhlých vědomostních databází. V následující sekci jsem popsal další specifické oblasti, pro které je vhodné použití WS, zejména jsem se zaměřil na oblast vzdělávání.
4.1 Návody, postupy, manuály Tvorba velkého množství rad a návodů je ideální půda pro využití wiki systému. Každý uživatel může jednoduše vložit svůj malý návod, jak zrovna on danou věc dělá a tím poskytnout své zkušenosti ostatním bez vynaložení většího úsilí. Nejpopulárnější wiki s touto tématikou je server wikihow.com. Nabízí přes 130,0008 návodů ze všech oblastí lidské činnosti. Vhodná oblast pro využití wiki je také cestování. Mezi nejpoužívanější weby z této patří stránka wikitravel.com. Zde uživatelé vkládají svoje rady a tipy pro návštěvu míst z celého světa. Ostatní si pak mohou přečíst informace, které mohou být významně blíže realitě než například informace z oficiálních turistických průvodců.
4.2 Vzdělávání 4.2.1 Výhody používání wiki systémů ve vzdělávacím kolektivu Používání wiki ve třídě dává studentům příležitost pracovat ve fungujícím týmovém kolektivu. Hlavní benefity tohoto přístupu spočívají v učení se od sebe navzájem, rozvoji kritického myšlení, prohlubování kreativních dovedností a vytváření správných návyků pro práci v kolektivu s co nejvyšší účinností (bc.edu, [online]).
4.2.2 Kolektivní autorství Kolektivní autorství dovoluje jednotlivcům čerpat znalosti z práce ostatních studentů nejen vstřebáváním informací, ale také hodnocením kvality a porovnáváním s vlastní prací. V tradičním modelu předává student svou práci učiteli, ten ji hodnotí a poté opět vrací studentovi. Studenti mají málokdy možnost nahlédnout do prací svých spolužáků a tím 8
Zdroj: http://www.wikihow.com/wikiHow:About-wikiHow
19
rozšířit svoje vědomosti. O další stupeň dál může postoupit princip sledování práce kontinuálně od jejího vzniku až do dokončení. Studentovi tím dává větší možnost porovnávání a impuls k vlastnímu zlepšování. Tento přístup přináší studentům příležitost k objektivnímu způsobu kritiky a učení toho, jak na druhé straně obhajovat svoje závěry před kritikou ostatních. V případě vyvrácení svých závěrů je poté nucen hlubšího výzkumu pro další obhajobu nebo pro jejich změnu. Při spolupráci na jednom dokumentu studenti často narazí na názorové konflikty, se kterými se musí naučit pracovat a řešit je ve svůj prospěch. V neposlední řadě také dochází k rozvoji sociálních vztahů a interakcí, ze kterých můžou těžit i v ostatních aspektech studia (bd.edu, [online]).
4.2.3 Změna práce s informacemi V zažitých studijních procesech dává učitel žákům většinu materiálů, ti z nich čerpají a interpretují jejich obsah. S pomocí wiki systémů dostávají možnost vypracovat a poskytovat více materiálů sami sobě. Pokud jsou výsledné práce dobré kvality, mohou dále sloužit jako podklady pro následující studenty, kteří je opět mohou vylepšovat. Studenti tak mohou těžit z určité touhy předchozích vytvořit informační hodnotu pro ostatní. Profesor zde funguje jako korektor a editor jednotlivých kreací a udává jim směr pro co největší užitek. Realizace výuky s pomocí WS také připravuje studenty pro budoucí praxi v korporátním světě, kde se WS také hojně využívají a mohou tak zaměstnavateli poskytnout důležitou zkušenost s touto metodou kolektivní tvorby. Ve studijním prostředí WS poskytují také inspiraci, zábavu a občas také prvek provokace a soutěživosti. Wiki dokáží vzbudit v lidech kreativitu, odstraňovat limity studijního času, dávají profesorům prostor k lepšímu porozumění potřeb a zájmů. Nutí studenty ke psaní, přemýšlení a k pokládání otázek (bd.edu, [online]).
4.2.4 Způsoby využití (smartteaching.org [online]) Zajímavé způsoby a nápady jak využit WS jako informační zdroje: Motivovat studenty k psaní vlastní wiki knihy, kterou mohou využít další studenti. Odpovědi na nejčastěji kladené otázky pro daný kurz, ve kterém najdou užitečné rady a tipy pro co nejefektivnější studium. Vytvoření jednotlivým průvodců ke studijním materiálům nebo studijním lekcím. 20
Řešení složitých problémů například v oblasti matematiky, kde mohou na výpočtu spolupracovat všichni najednou. Tvorba slovníků pojmů k danému předmětu či oboru. Vytvoření vlastní encyklopedie ke studijnímu oboru. Vytváření podkladů pro nově vzniklý předmět či obor. Wiki kalendář kam může každý přidávat významná data více či méně související s předmětem. Vlastní třídní noviny, které budou zachycovat nejnovější události. Síň slávy kde budou umísťování studenti, kteří dosáhli významného úspěchu. Vytvoření pravidel a předpisů pro daný předmět. Využití WS k lepšímu a aktivnímu způsobu výuky: Zhodnocení testů na wiki vybízí k diskuzi a k lepší přípravě na další zkoušky. Komentované názory na své práce a psaní připomínek k jejich dalšímu vylepšování. Tvorba vlastních portfolií prací pro svou prezentaci a diskusi o ní. Různé soutěže- například umístění materiálu s chybami a vyhlášení souboje o to kdo najde více chyb a správně je opraví. Vzájemné gramatické a faktické opravy ostatních prací dle daných pravidel. Motivovat studenty k hledání frází a slovíček v textu, kterým nerozumí. Sdílení poznámek tak aby ve výsledku měli všichni kvalitní podklad ke studiu. Využití WS ve skupinových projektech: Skupinové autorství- zaručuje uniformní podobu všech vytvořených dokumentů. Tvorba a zápis nápadů a myšlenek podobný brainstormingu a jejich následná organizace a odstraňovaní duplicit. Vytváření stránek například o oblíbených osobnostech historie a sběr informací, fotografií, citátů a dalších detailů. Tvorba „to do9“ listů a spolupráce na jejich plnění i vyprazdňování. Sledování úrovně participace jednotlivých členů wiki týmu.
9
Anglický výraz pro vyjádření činností, které je třeba vykonat.
21
Širší projekty pro vytvoření komunity: Vytvoření průvodce školou, kterou navštěvují. Vypsání charakteristik jednotlivých míst a oddělení. Tento projekt může výrazným způsobem přispět k rychlejší aklimatizaci nově příchozích studentů. Mezinárodní sdílení práce a informací o kultuře a každodenním životě se studenty z jiných škol a zemí. Tvorba atraktivního průvodce historií školy kam mohou přispívat například dávní studenti a popisovat události ve škole z jejich pohledu. Pomocí WS mohou však spolupracovat také samotní vyučující mezi sebou. Mohou lehčeji spolupracovat na vytváření osnov předmětů, sdílet tipy pro výuku, tvořit mechanismy pro ověřování studentských znalostí nebo třeba sdílet nápady na to jak lépe zapojit wiki do výuky (smartteaching.org [online]). .
22
5. Zvážení alternativ Pokud se subjekt rozhoduje, zda je wiki systém ideální prostředek k realizaci jeho potřeb, nabízí se mu následující alternativy:
5.1 Redakční systém (CMS) Jedná se o software pro správu webového obsahu, který se zpravidla soustřeďuje hlavně na práci s dokumenty. Přidávání a editace obsahu probíhá většinou na bázi wysiwyg. Na rozdíl od wiki systému je v případě CMS kladen větší důraz na správu přístupů k aplikaci. Tento způsob řešení webu se nejvíce hodí pro uzavřené společnosti, které chtějí jednoduše editovat obsah svého webu (nejčastěji přidávat články) a chtějí se vyhnout výskytu nevhodného obsahu.
5.2 Pokročilé diskuzní fórum Tento způsob tvorby webového obsahu uživatelem je do značné míry podobný wiki systému. Na rozdíl od něj se však tolik nedbá na dodržování pravidel. Pokud uživatel žádá informace, založí diskuzní vlákno a ostatní do něj libovolně přispívají a tím tvoří informační databázi, ze které můžou čerpat další návštěvníci fóra, aniž by se do něj přímo zapojili. Nabízené informace zpravidla nemají tak propracovanou informační strukturu jako obsah vytvořený pomocí wiki. Na rozdíl od WS se zde netvoří jeden velký článek na dané téma, ale informační hodnotu tvoři zobrazení všech názorů a informací od všech uživatelů. Je zde na první pohled vidět, kdo jakou informaci poskytl.
23
6. Aplikace pro tvorbu a správu Wiki software (wiki engine10 nebo wiki aplikace) je nástroj, který podporuje fungování webu na principu wiki. Umožňuje uživatelům vytvářet a upravovat jednotlivé stránky a spolupracovat prostřednictvím webového rozhraní (prohlížeč). Běží na jednom nebo na více webových serverech a obsah je zpravidla uložen v souborovém nebo databázovém systému (en.wikipedia.org, [online]) První wiki software představil programátor Ward Cunningham v roce 1995. V současné době (duben 2012) existuje několik desítek aktivně vyvíjených wiki aplikací v různých programovacích jazycích. Existují licencované programy, ale většina je open-source11.
6.1 Dělení wiki softwaru podle užití 1) Veřejné wiki- typicky jsou přístupny všem uživatelům bez omezení (není to podmínka). Předpokládá se široká komunita čtenářů i editorů. Nejčastěji se používá aplikace MediaWiki. 2) Podnikový wiki- enterprise wiki je software pro použití v podnikové nebo organizační sféře. Slouží hlavně pro zvýšení efektivnosti při sdílení interních informací. Klade se zde zvýšený důraz na správu řízení přístupu, integraci s ostatním softwarem a správu dokumentů. Mezi nejpoužívanější proprietární aplikace patří SocialText, Jive Engage nebo SamPage. Existují však i open source aplikace, které nabízí kompletní podnikové řešení. Jsou to především Foswiki a TWiki. 3) Osobní wiki- například aplikace NotePub, Pimki nebo Tomboy. Slouží k tvorbě wiki systému pro osobní účely (z hlediska wiki filosofie je tvorba personálních WS spíše ojedinělá).
10
Engine znamená programové jádro počítačové hry, databázového stroje nebo programu. Open-source je označení pro počítačový software s otevřeným zdrojovým kódem. Otevřenost zde znamená jak technickou dostupnost kódu, tak legální dostupnost - licenci software, která umožňuje, při dodržení jistých podmínek, uživatelům zdrojový kód využívat, například prohlížet a upravovat. 11
24
7. Druhy uživatelů wiki systému Uživatelé Wikipedie a obecně wiki systému se dělí do několika kategorií, podle míry jejich participace na tvorbě obsahu. Od takzvaných černých pasažérů až po správce, kteří se věnují kompletní údržbě celého systému a zároveň jeho průběžnému vylepšování. 1) Čtenář (černý pasažér)- Uživatel pouze přijímá obsah, který mu wiki nabízí, ale nepodílí se žádným způsobem na tvorbě jejího obsahu 2) Příležitostný editor- Na rozdíl od čtenáře tento uživatel čas od času provede drobné vylepšení jednoho či více článků. Může se jednat o doplnění zdrojů, opravy gramatických chyb nebo korekce nepřesných informací. 3) Tvůrce nových článků- na rozdíl od příležitostného editora iniciativně zakládá nové články (pahýly), které případně dále vylepšuje. 4) Korektor- soustřeďuje se výhradně na opravu textů, které vytvořili ostatní aktivní uživatelé. Především se soustředí na to, zda jsou informace podávány smysluplně a neobsahují gramatické chyby. Korektor se také může soustředit na komplexní kontrolu informací v jednotlivých článcích, kterou provádí například po uskutečnění většího množství editací, které článek podstoupil. V takových případech korektor například pozmění vhodné schéma a šablonu článku nebo provede úpravu názvů odstavců a jejich rozložení v textu. 5) Autor s širokou základnou vědomostí o tématech- nejužitečnější uživatel z hlediska tvorby informační hodnoty wiki systému. Tvoří rozsáhlé kvalitní články s ověřenými zdroji a dále se o takové články stará. 6) Správce- Tento uživatel stará o bezproblémový běh celého systému. Může udělovat privilegovaným uživatelům dodatečná práva pro správu. Stará se o tvorbu a dodržování pravidel. 7) Boti-
ačkoliv
vystupují
v systému
jako
samostatní
uživatelé,
jedná
se
o naprogramované automatické roboty, kteří provádějí mnohdy velké množství minoritních editací, které jsou však výrazným způsobem prospěšné pro chod a kvalitu celého systému (wiki botům je věnován samostatný odstavec v sekci wiki vandalismu)
25
8. Shrnutí výhod a nevýhod wiki systémů V následujících seznamech jsou uvedeny tři nejdůležitější výhody a stejný počet nevýhod dle mého hodnocení: Výhody: 1) Aktuálnost 2) Jednoduchost 3) Otevřenost Nevýhody: 1) Nutnost participace 2) Autorská práva 3) Konflikty
26
9. Wikipedia- Informační fenomén dneška 9.1 Základní informace Wikipedia je vícejazyčná internetová encyklopedie založená na spolupráci velkého množství uživatelů (tzv. wikipedistů). Je podporována neziskovou organizací Wikimedia foundation. V dubnu 2012 obsahovala přibližně 21 milionů článků z toho 3,9 milionu v anglickém jazyce. Existuje 285 jazykových verzí, do kterých pravidelně přispívá zhruba 130 000 aktivních editorů. V současnosti se jedná o nejoblíbenější zdroj obecných informací. O chod anglické verze se stará přibližně 1500 administrátorů (en.wikipedia.org, [online]). Podrobné a přesné údaje jsou zobrazeny v tabulce č. 2.
9.2 Provozní údaje Jako zdroj pro následující informace sloužil server alexa.com12 Wikipedia je šestá nejnavštěvovanější stránka sítě internet (na pátém místě je čínský vyhledávací server baidu.com a na sedmém je web Windows Live). Server pravidelně navštěvuje přibližně 365 milionů uživatelů a ze samotné Spojené Státy zaznamenají průměrně 2,7 miliardy zobrazených článků každý měsíc. Z území spojených států také přichází 20,5 % všech uživatelů. Na druhém místě je japonsko s 7,6 % a na třetím je Indie s 6,9 %. V podílu návštěvnosti jasně dominuje základní anglická verze. Procentuální rozložení přístupů na jazykové mutace je zobrazeno v následujícím grafu na obrázku č. 1.
12
http://www.alexa.com/siteinfo/wikipedia.org#
27
Ostatní 13% ru.wikipedia.org 5% en.wikipedia.org ja.wikipedia.org 7%
es.wikipedia.org de.wikipedia.org ja.wikipedia.org
de.wikipedia.org 7%
ru.wikipedia.org Ostatní en.wikipedia.org 60%
es.wikipedia.org 8%
Obr. č. 1. Grafické znázornění podílu na návštěvnosti jednotlivých verzí | zdroj dat: alexa.com
9.3 Česká verze Wikipedie Česká verze Wikipedie je podle počtu článků 18. v pořadí z více než 250 existujících jazykových verzí. Byla spuštěna 3. května 2002. Za tři roky existence dosáhl počet článků čísla 10 000. Přibližně o další tři roky později to bylo již 100 000 článků. K prvnímu únoru roku 2012 byl počet článku na Wikipedii 224 tisíc. O chod české verze se stará v současnosti 29 administrátorů (cs.wikipedia.org, [online]).
9.4 Porovnání dvaceti nejrozsáhlejších verzí Wikipedie V následující tabulce č. 2 jsou uvedeny jednotlivé verze spolu s jejich doménovými zkratkami a počtem článků. Dále jsou zde uvedeny počty administrátorů a aktivních editorů, kteří se podílejí na tvorbě obsahu. V tabulce jsou také doplňkové výpočty, které uvádějí kolik je administrátorů a editorů vzhledem k počtu článků. Poslední doplňující hodnota udává tzv. stub ratio. Jedná se o poměr kvalitních článků k pahýlům (způsob výpočtu tohoto indikátoru je předmětem diskuse wikipedistů).
28
Tabulka dvaceti nejrozsáhlejších verzí Wikipedie (údaje k 23. 4. 2012, 12:00) Celkový počet článků
Počet Počet aktivních administrátorů editorů
Jazyková verze
Doménová Zkratka
1
Angličtina
en
3 930 056
1 486
137 503
2 645
29
0,14
2
Němčina
de
1 396 677
290
22 280
4 816
63
0,35
3
Francouzština
fr
1 241 369
195
16 705
6 366
74
0,24
4
Holandština
nl
1 038 913
64
4 804
16 233
216
0,46
5
Italština
it
912 605
103
8 312
8 860
110
0,31
6
Polština
pl
892 525
154
4 979
5 796
179
0,53
7
Španělština
es
885 092
137
15 214
6 461
58
0,23
8
Ruština
ru
846 478
94
12 567
9 005
67
0,28
9
Japonština
ja
803 030
64
11 863
12 547
68
0,37
10
Portugalština
pt
720 313
34
5 642
21 186
128
0,24
11
Švédština
sv
459 011
101
3 138
4 545
146
0,34
12
Čínština
zh
447 499
72
6 853
6 215
65
0,19
13
Vietnamština
vi
405 456
24
1 224
16 894
331
0,36
14
Ukrajinština
uk
380 295
24
2 094
15 846
182
0,32
15
Katalánština
ca
37 2008
27
1 452
13 778
256
0,41
16
Norština
no
337 388
69
2 030
4 890
166
0,40
17
Finština
fi
295 278
48
1 972
6 152
150
0,37
18
Čeština
cs
228 515
29
2 192
7 880
104
0,38
19
Maďarština
hu
215 289
39
2 002
5 520
108
0,29
20
Korejština
ko
196 500
29
2 014
6 776
98
0,31
Pořadí
Tabulka č. 2. Statistika dvaceti nejrozsáhlejších verzí Wikipedie zdroj dat: http://s23.org/wikistats/wikipedias_html.php
29
Články / Články / administrátoři editoři
Stub ratio
Na obrázku č. 2 je graficky znázorněno množství článků na jednotlivých jazykových verzích.
Počet článků nejrozsáhlejších verzí Wikipedie Počet článků 4500000 4000000 3500000 3000000 2500000 2000000 1500000 1000000 500000 0 en de fr nl
it
pl es ru ja pt sv zh vi uk ca no fi
cs hu ko
Obr. č. 2. Počet článků nejrozsáhlejších verzí Wikipedie zdroj dat: http://s23.org/wikistats/wikipedias_html.php
V následujícím grafu (obr. č. 3) jsou vzestupně seřazeny jazykové verze dle poměru článků na jednoho editora.
Počet článků na editora
Počet článků na editora
350 300 250 200 150 100 50 0 en es de zh ru ja fr ko cs hu it pt sv fi no pl uk nl ca vi Obr. č. 3. Graf poměru počtu článků na jednoho editora dle jazykových verzí zdroj dat: http://s23.org/wikistats/wikipedias_html.php
Z dat prezentovaných v tabulce č. 2 a grafu č. 2 je zřetelná očekávaná převaha anglicky psané Wikipedie v počtu článků. Ze dvou doplňujících sloupců (v tabulce zcela vpravo) je také patrné, že v anglické verzi se vyskytuje poměrově více administrátorů i editorů. V obou 30
údajích výrazně předčila všechny ostatní verze. To vyvolává předpoklad o vyšší kvalitě jednotlivých článků. Tuto hypotézu jsem zkoumal v praktické části mé bakalářské práce, kde jsem srovnával ekvivalentní články české a anglické verze na základě textové rozsahu. Graf na obrázku č. 3 zachycuje vzestupně seřazené jednotlivé verze dle poměru článků vůči editorům. Zde je zajímavé srovnání pořadí u nizozemské a korejské verze. Holandská verze je v počtu článků na čtvrtém místě, ale při porovnání „kvality“ článků je až na osmnáctém s hodnotou 216 článků na jednoho editora. Naproti tomu korejská verze se v množství článků vyskytuje na dvacáté příčce, ale v poměrovém množství editorů je na místě osmém. Tyto hodnoty podpírá hodnota stub ratio. Holandská verze má aktuální ukazatel na hodnotě 0,46, zatímco korejská udává hodnotu 0,31.
9.5 Základní myšlenka neutrálnosti Wikipedie Na anglické verzi wikipedie je neutrálnímu pohledu věnován rozsáhlý podrobný článek. Proto sem se rozhodl čerpat informace hlavně z tohoto zdroje. Snažil jsem se o co nejpřesnější interpretaci důležitých pravidel. Nezaujatý úhel pohledu je jeden z nejdůležitějších principů, kterými se portál Wikipedie řídí a očekává ho od všech uživatelů, kteří přispívají k rozvoji obsahu. Je to esenciální pravidlo, na kterém je Wikipedie založena, a proto je tvrdě prosazováno bez sebemenších ústupků. Editování Wikipedie z neutrálního hlediska (NPOV- neutral point of view) znamená reprezentovat spravedlivě, úměrně, a pokud možno bez předsudků, všechny významné pohledy na „věc“, které byly publikovány spolehlivými zdroji (en.wikipedia.org, [online]). Dosažení toho, co komunita Wikipedie chápe jako neutrální, znamená pečlivě a kriticky analyzovat celou řadu spolehlivých zdrojů a pak se pokusit zprostředkovat čtenáři informace obsažené v nich jasně a přesně. Wikipedie se snaží o neutrální vysvětlování sporů, ne o účast v nich. Editoři, navzdory tomu, že mají vlastní názor, by měli usilovat v dobré víře o poskytnutí úplné informace a nepodporovat jeden konkrétní úhel pohledu na úkor jiného. To však neznamená, že by různé úhly pohledu neměli na Wikipedii své místo. Musí se však dodržovat následující zásady pro dosažení požadované úrovně neutrality, které odpovídá encyklopedickému pojetí: Vyhýbat se interpretaci názoru jako faktu. Ve většině případů články obsahují zmínky o významných názorech, které se týkají dané problematiky. Tyto informace by však neměli být podávány jako „názor Wikipedie (autora)“. Spíše by měli být připsány 31
v textu jako rozšiřující hledisko, pro lepší pochopení problematiky. Samozřejmostí je důkladné uvedení zdrojů takových názorů (například článek v tisku). Jako příklad může sloužit „aféra“ Václava Klause s protokolárním perem v Chile. Prezident byl zachycen na videozáznamu při vkládání pera do kapsy a toto video vzbudilo pozornost u nás i v zahraničí. Často se projevovali názory, že náš prezident pero ukradl. V každém článku na Wikipedii se musí striktně dodržovat princip neutrality. To znamená, že pokud se tato událost objeví v textu, musí být interpretována bez jakéhokoliv prosazování názoru, zda prezident pero chtěl ukrást nebo si ho jen nechat na památku. Může se objevit například odkaz na článek z tisku, ve kterém se píše o tom, že v zahraničí se baví tím, že český prezident krade. Ten opět musí zůstat bez snahy o hodnocení, zda je tento názor správný či nikoliv. Stejně tak by nebylo správné, kdyby se editor snažil prezidenta za každou cenu ospravedlnit. Česká verze Wikipedie nabízí dle popisovaných pravidel nezaujatý samostatný článek na toto téma s názvem Chilský incident Václava Klause. Nevydávat něčí tvrzení za fakt. Zacházet s těmito názory jako s konfliktními tvrzeními o věci. V žádném případě neuvádět tato tvrzení jako směrodatné prohlášení. Preferovat nekritický jazyk. Neutrální pohled nesympatizuje ani nekritizuje danou věc (nebo s tím co o ní říkají jiné zdroje). Proto se autor musí vyhýbat citově zabarveným slovům, které by čtenáři nabízeli inklinaci k jedné názorové straně. Je možné vysvětlovat protichůdné názory, ale opět pomocí nezaujatého jazyka. Co nejpřesněji poukázat na důležitost protichůdných názorů pro pochopení věci. Autor se musí ujistit, že prezentování existujících názorů reflektuje skutečnou úroveň výskytu těchto názorů. Tím by se měl vyhnout vzbuzování falešného dojmu, že jsou například dva názory v rovnováze nebo, že jeden z nich výrazně převažuje. Článek by měl co nejpřesněji popisovat dle skutečnosti výskyt a důležitost zmíněných pohledů. Jako názorný příklad může posloužit polemika okolo existence holocaustu. Ačkoliv existuje minoritní názor, který jeho existenci zpochybňuje, nemůže být tento názor prezentován jako rovnocenný většinovému z hlediska výskytu.
9.5.1 Dosahování neutrality Pokud se některý článek jeví jako neobjektivní, i když má věrohodné zdroje, snaha Wikipedie není v tom, tento článek smazat, ale v tom, upravit ho postupně do přijatelné objektivní podoby. Zkreslené informace mohou být doplněny názory z opačného spektra a z jiných 32
zdrojů pro dosažení rovnováhy nebo mohou být jen upravena určitá slova, která jsou citově zabarvená. V některých případech se tento problém dá vyřešit smazáním jen určitých pasáží. K úplnému smazání článku může editor přistoupit, jen pokud je napsán tak, že není možné jeho objektivním přepracováním odstranit jeho zavádějící význam.
9.5.2 Pojmenovávání Důležitým faktorem pro zachování neutrality hraje i samotné pojmenování článku a pojmenovávání dílčích elementů v něm. Navzdory tomu, že jsou preferovány neutrální výrazy, nesmí tato snaha narušovat jasnost pojmenování. Pokud je výraz hojně využíván spolehlivými zdroji (a je proto pravděpodobné, že bude znám i mezi čtenáři), může být použit v i v případě, že vykazuje znaky zaujatosti. Například výraz „Bostonský masakr“ je znám jako událost v amerických dějinách, a proto slovo masakr může být použito jako vhodné pojmenování. Použití nejlepšího jména může záviset na kontextu. Vhodné je uvést alternativní názvy nebo rozvést diskuzi o nejvhodnějším z nich. Podobný postup je také vhodné aplikovat při tvorbě nadpisů. Nadpisy často mají spíše popisnou funkci (namísto pojmenování něčeho). Tyto nadpisy by se také měli vyhnout narušení neutrality, tak aby nepodněcovali úhel pohledu „pro“ či „proti“ nebo aby neomezovali obsah odstavce jen na jednu názorovou stranu. Například nadpis „kritika věci X“ by spíše měl znít „Společenský pohled na věc X“. Neutrální nadpisy podporují rozvoj více hledisek a odpovědnější prezentace skutečností.
9.5.3 Struktura článku Vnitřní struktura článků je také důležitý faktor při zachovávání neutrality celku a při předcházení zbytečným názorovým rozporům. I když konkrétní způsoby strukturování článků nejsou zakázány v pravidlech, musí být kladen důraz, aby celková prezentace byla v zásadě neutrální. Oddělování textu nebo ostatního obsahu do různých sekcí článku, založené pouze na specifickém úhlu pohledu, může vést k tvorbě neencyklopedických struktur, kde se jen polemizuje mezi zastánci a odpůrci. Může se také vytvořit zdánlivou hierarchii faktů, ve kterých
se
detailní
informace
v hlavním
textu
mohou
jevit
jako
pravdivé
a nediskutovatelné a na druhé straně strukturně oddělené informace jako falešné a domnělé. Pravidla Wikipedie nabádají k snaze o tvorbu jednotného textu skládáním odstavců přirozeně, namísto očividné izolace do sekcí, které záměrné „bojují“ proti sobě. 33
9.5.4 Správné rozložení uváděných pohledů Neutralita vyžaduje, aby každý článek, ve kterém jsou zmiňovány lišící se pohledu na problematiky, věnoval určitým názorům pozornost podle toho, jaké zastoupení má tento názor v běžné populaci. Jak již bylo napsáno výše, je vyžadováno, aby se autoři vyhýbali výraznému protěžování menšinového názory navzdory ostatním, které jsou zastoupené ve společnosti více. Obecně platí, že extrémně menšinové názory nejsou ve wikipedických textech zahrnuty vůbec. Tyto „speciální“ názory mohou dostat více pozornosti v samostatných článcích, které se věnují jen přímo tomuto úhlu pohledu a nenarušují tak celkovou integritu obecného článku. Nicméně, i tyto neobvyklé texty by měli být prezentovány s jasným odkazem na obecně platné teorie tak, aby bylo pochopitelné, že se jedná například o nepotvrzenou domněnku nebo teorii. Článek nesmí být prezentován striktně jen z perspektivy tohoto názoru. Mělo by také být jasně dáno, která část textu uvádí významně menšinový názor. U těchto článků také musí být uveden obecný náhled, aby mohl čtenář pochopit, jakým způsobem se liší pohled menšiny od běžného a v čem je jeho kontroverznost. V těchto případech záleží na konkrétním tématu. Pro představu může sloužit článek o teorii země jako placky. Navzdory tomu, že dokonce i dnes má tato teorie zastánce, je pro většinu čtenářů lehce pochopitelné, že v současnosti se jedná o vyvrácenou teorii. Proto stačí v článku pár větami zmínit jaká je v současnosti uznávaná teorie a pak již detailně rozebrat historii teorie o placaté zemi se všemi již diskreditovanými názory. Některé minoritní názorové proudy však vyžadují důkladnější vysvětlení. To platí například pro prezentování konspiračních teorií o moderní historii, kdy je třeba tyto pravidla velice striktně následovat. I když je důležité zmínit všechny významné úhly pohledu na každé téma, politika Wikipedie nezaručuje a ani si nedává za cíl prezentovat v článcích veškeré existující minoritní názory a mimořádná tvrzení. Mezi lidmi existuje nekonečné množství pověr, mýtů, pseudovědeckých názorů, konspiračních teorií, spekulací a hoaxů13. Wikipedie se nechce zabývat všemi těmito do značné míry nelegitimními názory, protože by tím mohla být narušena samotná podstata Wikipedie, která si dává za cíl prezentovat pravdivé, konzistentní a ověřené informace. Cílem Wikipedie není rozhodovat, zda jsou tyto názory dobré či špatné, ale již jen samotné uveřejnění by mohlo znamenat částečnou legitimaci. Pokud čtenář vyhledává podobný
13
Hoax je anglické označení pro nepravdivou poplašnou zprávu.
34
„sporný“ obsah, existují na webu desítky wiki stránek, které se právě těmto sporným a často i kompletně vymyšlenými tezím věnují14.
9.5.5 Estetické názory Články na Wikipedii, které se věnují umění nebo jiným kreativním tématům, mohou mít tendenci k hodnocení. To je však na encyklopedickém webu nepřípustné. Estetické cítění je různorodá vlastnost, a proto by se autoři měli vyhnout osobnímu hodnocení dané umělecké věci. Lepším prostředkem k vyjádření umělecké hodnoty může být prezentování například výsledků anket mezi širokou veřejností nebo mezi předními odborníky. Nelze do článku napsat, že Karel Gott je nejlepší zpěvák na světě, ale lze uvést výsledky mnoha anket o nejlepšího zpěváka České republiky i Československa. Článek může v určitém případě obsahovat hodnocení daného umělce významnou osobností z oboru. Ověřitelné veřejné a vědecké posudky poskytují užitečný kontext pro danou oblast.
9.5.6 Nedoporučované výrazy Na Wikipedii nejsou žádná slova nebo spojení zakázána, ale některé z nich by měli být používány s obezřetností, protože mohou vést k zaujatosti. Například slovo „tvrzení“ v sobě ukrývá výraz pochybnosti a může také znamenat, že prohlášení je nepravdivé. Například věta „Honza tvrdí, že ten koláč nesnědl“ v sobě skrývá určité pochybnosti o pravdomluvnosti. Takovou větu je vhodné přeformulovat například do tvaru „Honza řekl: Já jsem koláč nesnědl“. Je žádoucí vyhýbat se výrazům, které jsou lichotivé, urážlivé, vágní nebo klišé (za předpokladu, že nejde o citaci).
14
Například web uncyclopedia.wikia.com je na první pohled téměř k nerozeznání od Wikipedie, ale její obsah je tvořen hlavně pro pobavení čtenářů a nevyžaduje od editorů striktní dodržování pravidel.
35
10. Wiki vandalismus Tomuto tématu se věnuje nespočet článků na samotné wikipedii. Mnoho uživatelů usiluje o nastolení co nejúčinnějších metodik určování a odstraňování vandalismu. Při psaní této kapitole čerpal hlavně z těchto článků. Všechny tyto „provozní“ články jsou zamčeny pro běžné uživatele (nemohou je editovat), a tudíž jsou tvořeny výhradně uživateli, kteří se s vandalismem často setkávají. Pod pojmem wiki vandalismus se rozumí přidávání, odstraňování nebo změna obsahu výhradně za účelem narušení a působení škody. Typickým a nejčastějším příkladem vandalismu je přidávání očividných, obscénních a často i humorných součástí do těla textu nebo jen prosté přidávání nelogických a nesmyslných dat. Editoři případné vandaly většinou varují, a pokud narušování z jedné IP adresy nebo ze stejné registrace přetrvává, tak zpravidla následuje dočasný zákaz editovat. V případě naprosto zřejmého narušení může zablokování přijít i bez předchozího varování. Toto je příklad s jednoduchým rozhodováním a jednoduchým řešením. Mnohem závažnější je však rozhodování z hlediska žádanosti obsahu. Zde nastává často spor o tom, zda autor přidával informace s dostatečnou neutrálností a zda jsou pravdivé nebo si část pozměnil dle svého osobní uvážení a přesvědčení (tento problém se velice často vyskytuje v politických tématech). Tyto spory často předcházejí tzv. wiki válkám.
10.1 Nejčastěji se vyskytující druhy vandalismu Seznam nejčastějších způsobů vandalismu: 1) Přidávání závadného textu 2) Mazání správného a ověřeného textu 3) Tvorba nových článků, které neodpovídají encyklopedickým požadavkům 4) Spam- editace zahrnující prvky reklamy 5) Nesmyslný vandalismus- většinou jde o testování nových uživatelů, kteří zkouší měnit obsah wiki 6) Promyšlený vandalismus- uživatel dělá předem promyšlené kroky, tak aby jeho počínání zůstalo co nejdéle skryto a jeho vandalské editace zůstali bez opravy co nejdéle 36
7) Neoprávněné reverty- vandal vrací správné editace 8) Hoax- šíření poplašné informace 9) Skrytý vandalismus- tento vandalismus se dá odhalit jen pomocí zobrazení zdrojového kódu každého článku. Nejčastěji se jedná o vkládání sprostých a urážlivých poznámek do zdrojového textu 10) Narušování odkazů- také se jedná o skrytý druh vandalismu, kdy narušitel změní adresu odkazu a uživatel je tedy přesměrován na nežádoucí obsah. 11) Obrázkový vandalismus- vkládání nevhodných obrázku. Typicky s erotickým podtextem. 12) Opakované přidávání obsahu podléhajícího autorským právům 13) Rozsáhlý vandalismus s pomocí tzv. vandalbotů- jedná se o snahu vandalů poškodit co největší množství článků. K tomu se hodí vandalboti, což jsou podobné automatické programy jako ty, které slouží k hromadnému odstraňování vandalismu.
10.2 Motivace vandalismu Jeden z nejčastějších důvodů vandalismu je jen samotné vědomí uživatele, že vůbec může jednoduše měnit obsah webu, což zejména nově příchozí ze zvědavosti zkusí. Tyto změny většinou nebývá nijak zásadně škodlivé a zpravidla jsou rychle odstraněny. Tito uživatelé dostanou jedno či dvě varování a své škodlivé chování ukončí poté, co pochopí, že jejich změny jsou rychle eliminovány a nemají téměř žádný dopad.
10.3 Hledání pozornosti Někteří mohou však vytrvat a stát se tak součástí jednoho z fenoménu dnešního internetu- tzv. trollingu15. Tito uživatelé s často nejasných důvodů neustále škodí ať už ve volně dostupných wiki systémech nebo se jen snaží vyburcovat ostatní uživatele k reakci na diskuzních fórech. Z pravidla považují za svůj úspěch, když uživatelé považují jejich editace či názory za jejich vlastní a ihned nepochopí, že tzv. troll právě čeká na to, až na něj ostatní zareagují. Jediná motivace takového chování je prosté vyžadování pozornosti. Nejčastěji se zaměřují na frekventované nebo kontroverzní články, kde je pravděpodobnost vzbuzení pozornosti větší. Prováděné změny jsou ve většině případů nepromyšlené 15
Troll je v internetovém slangu účastník online diskusních fór, chatů či blogů, který zasílá provokativní, hanlivé nebo irelevantní příspěvky k citlivým tématům, jejichž hlavním smyslem je vyprovokovat ostatní uživatele k vytoužené emotivní odezvě nebo jinak narušit normální věcnou diskusi
37
a jednoduché. Každé další varování často vzbuzuje v notorických vandalech pocit, že jejich jednání vzbudilo pozornost a to je motivuje k další činnosti. Ani zablokování jejich IP adresy není v dnešní době dynamických adres velký problém. Často stačí prostě restartování modemu nebo mobilního připojení k internetu a troll může pokračovat s novou IP adresou. Po takovém návratu si zpravidla dávají větší pozor na to, aby nebyli okamžitě odhaleni. Proto se často snaží změnit obsah článků tak, aby narušili jeho integritu, ale nedalo se to považovat za očividné vandalství. Pravděpodobně dostanou varování, že provedli nesprávnou editaci, ale nebudou okamžitě označení za vandaly a zablokování.
10.4 Neprospěšná editace s dobrým úmyslem Některé změny označovány jako vandalismus přichází s dobrým úmyslem autora. Vznikají většinou při odlišného názoru na konkrétní téma, kdy čtenář zaujímá někdy až extrémně odlišný názor a to v něm vyvolá pocit nutnosti změny v textu. Toto opět může vést k dlouhotrvajícím sporům a neustálým revertům. Může nastat případ, kdy není chyba na straně posledního editora, nýbrž na straně původního tvůrce článku, který sveřepě trvá na své původní verzi a nehodlá se vzdát nově příchozímu. Tento problém se vyskytuje zpravidla u článků s jedním autorem, protože při kolektivním autorství se předpokládá, že k názorové syntéze již došlo.
10.5 Emoční stránka dlouhodobého vandalismu Existuje malé množství opravdu neodbytných narušitelů, kteří pojmou svoje jednání jako dlouhodobou válku s cílem vyhrát za každou cenu. Investují ohromné množství času a úsilí do svých vandalských aktivit, aniž by jim z těchto aktivit plynuly jakékoliv benefity. V boji proti těmto uživatelům se používá takový způsob reakce, aby byl uživateli věnován co nejmenší osobní přístup a zároveň mu byl poskytnut podnět k reakci namísto neustále prodlužování souboje. V případech, kdy uživatel nadále neustává ve své záškodnické činnosti, začne často svůj boj brát jako svůj osobní výtvor, který je třeba bránit všemi možnými způsoby. Lehce mohou sklouznout k názoru, že se z nich stává důležitá osoba v daném prostředí a snaží se udržovat si tuto pozici co nejdéle. V této fázi už jsou schopni vymýšlet dobře sestavené metody a vzory k tomu jak co nejefektivněji škodit, aniž by se hlouběji zabývali otázkou smyslu jejich činnosti. Jsou schopni trávit obrovské množství hodin zalogováni do velkého množství svých wiki účtů (pro lepší diverzifikaci svých útoků) a provádět nespočet útoků za účelem výhry ve své válce. 38
V této fázi už vandal studuje interní předpisy a zvyky, aby mohl lépe cílit své útoky. Někteří „škodiči“ se upínají na určité administrátory a udělají si z nich své úhlavní nepřátele ve svém boji, který často vykazuje prvky posedlosti. Tito lidé často vidí svou činnost jako boj za svobodu a sebe pasují do role mučedníků, kteří musí tomuto útočnému tažená obětovat maximum dostupných prostředků. Tyto vleklé spory mohou trvat měsíce i roky. Na štěstí pro všechny wiki weby jsou tito uživatelé velice vzácní.
10.6 Autoritářství V tomto případě se jedná o neprospěšné chování nikoliv ze strany běžných uživatelů, ale ze strany vysoce postavených editorů, kteří již získali v komunitě určitá privilegia. Jedná se o převrácené jednání, kdy ve jménu boje proti vandalství přehnaně brání ostatním uživatelům s menšími právy v jejich práci. Mohou tak opět činit z dobrého úmyslu, aniž by si uvědomili, že tím rozvoji WS spíše škodí a vyvracejí tak samotnou wiki ideologii. Toto jednání mnohdy vychází z kladení přehnaných nároků na nové příchozí a vyžadování přesného dodržování všech pravidel pro psaní příspěvků. Ukazatel takového jednání může být vysoký počet revertů a mazání takto „aktivního“ editora.
10.7 Ostatní motivy Relativně velké procento vandalství vzniká pro pobavení uživatelů. Přidávají do článků vtipné fráze nebo mění kontext tak aby některé věty vyzněli vtipně. Tento typ vandalství je většinou neškodný, protože je na první pohled zřetelný a pokud na něj narazí uživatel vyžadující seriózní informace, tak si jednoduše zobrazí přechozí verzi. Pravděpodobnější však je, že bude chyba opravena ještě rychleji než by mohla sloužit k závažné dezinformaci. Někteří vandalové jsou striktně zaměřeni proti jednomu tématu (např. osoba, stát atd.). V takovém případě se jeví jako ideální řešení dočasné zablokování témat, která jsou chybně editována. Dalším zajímavým motivem pro narušování informační hodnoty je prosazování názoru, že princip wiki není správný pro tvorbu informačních kanálů. V těchto případech většinou vandal edituje tak, aby změna nevyvolala žádnou pozornost, ale aby přesto narušovala správnost informací. Tím se snaží dokázat že open-source zdroje informací jsou mnohem méně spolehlivé než například encyklopedie Britannica atp. Pokud jimi způsobené chyby setrvají v textu dlouhou dobu, předkládají to jako důkaz o správnosti svého tvrzení. 39
10.8 Prevence Pravidla pro prevenci vandalismu lze tedy shrnout do těchto bodů: 1) Vybudovat silnou komunitu- čím silnější komunita, tím menší sklony k vandalismu a zároveň snazší cesta k jeho opravě 2) Nedávat vandalům najevo, že jejich útoky někoho obtěžují nebo zaměstnávají na dlouhou dobu (do not feed the troll16). 3) Při opakovaném porušování a nedbání na varování přistoupit k dočasnému bloku 4) Nedávat vandalům nechtěné návody, kam udeřit. Pokročilý administrátoři používají speciální aplikace pro správu wiki systémů. Ty pomáhají v jednoduchém sledování důležitých editací nebo problémových uživatelů či IP adres. To dělá jejich práci mnohem méně náročnou. Mezi nejpoužívanější programy patří Vandal fighter nebo WikiMonitor.
10.9 Wiki boti Bot17 je automatický nebo poloautomatický nástroj (program nebo skript), který provádí opakované a všední úpravy a opravy, aby udržoval co největší kvalitu článků. Roboti jsou schopni provádět úpravy velice rychle a pomáhat tak výrazně „živým“ správcům. Na druhou stranu při špatném nastavení dokáží napáchat rozsáhlé škody, a proto se důkladně testují, než je administrátoři vypustí do provozu. V současné době existuje přibližně 1500 schválených botů (ne všichni jsou v editačním provozu). V následujícím odstavci je popsán nejvyužívanější bot na serveru wikipedia.org pro automatické odstranění vandalismů (en.wikipedia.org [online]).
10.9.1 ClueBot NG Tvůrci tohoto bota přišli se zcela novou metodou klasifikace vandalismu než všechny předchozí anti-vandalské nástroje. Ty používali jednoduché heuristické postupy a seznamy podezřelých slov k určení, zda se v případě zkoumané editace jedná o vandalismus. Tyto metody vedli k odstraňování 5-10% nejjednodušších případů vandalismu. ClueBot NG využívá kombinaci metod, které jsou zaměřeny hlavně na neustálý rozvoj detekčních schopností. To znamená, že daný program se učí z již provedených editů. Například vytváří 16 17
V češtině nekrmte trolla, smyslem je nedělejte to, co troll chce (tj. reakce které troll očekával). Výraz bot vznikl zkrácením slova robot.
40
seznam slov, který obsahuje u každého výrazu i s jeho pravděpodobností výskytu ve vandalské editaci. Na rozdíl od blacklistů18, které se používali dříve, může tedy tento automatický nástroj vytvořit celkovou pravděpodobnost skládáním pravděpodobnostních indexů výrazů z celé editace (vysoký index znamená vysoká pravděpodobnost výskytu slova ve vandalské editaci a naopak). Pokud například úprava obsahuje slova, u kterých je vysoká pravděpodobnost vandalství, může rozhodnutí převážit vysoký výskyt slov s malým indexem. Nejdůležitější nastavení spočívá v určení prahu pravděpodobnosti, při kterém bot provede změnu. Při každé analýze je určeno číslo mezi 0 a 1 (jednoduché vyjádření procentní pravděpodobnosti). Jestliže bot vygeneruje úpravu s pravděpodobností vandalství na hodnotě 1, jedná se se stoprocentní jistotou o vandalismus. Tuto hranici si opět bot nastavuje sám pomocí vlastního učení, kdy sleduje odezvu na své editace a podle toho, jaké procento jeho oprav je hodnoceno negativně19, si sám určí práh pravděpodobnosti, při které změnu provede. Správce bota nastavuje jakou hodnotu false positive si má bot „hlídat“. Hodnota na úrovni 0,25% znamená, že toto procento automatických editací je hodnoceno jako nesprávné. Pokud tedy bot překročí tuto hranici, upraví si automaticky práh pravděpodobnosti na vyšší hodnotu, aby se méně mýlil. Wikipedia uvádí, že při optimálním nastavení dokáže ClueBot NG správně klasifikovat 90% editací (en.wikipedia.org, [online]).
18 19
Blacklist (černá listina) je v informatice označení pro seznamy obsahujících něco zakázaného. V prostředí wiki se používá označení „false positive“.
41
11. Praktický test 11.1 Volba metodiky testování Můj původní plán koncepce testování rychlosti oprav vandalských editací spočíval ve vkládání velkého množství nesprávných editací a sledování za jak dlouho a zda vůbec budou provedeny opravy. Po počátečních zkouškách jsem však dospěl k názoru, že tento způsob pozorování není vhodný. Velice záhy jsem pochopil, že vytváření vandalských editací z jediné pevné IP adresy je téměř nemožné, protože po pár provedených editacích, přijde uživateli upozornění od správce a při dalším pokračování je uživatel nemilosrdně zablokován (při prvním porušení na dobu 24 hodin). Po čas blokace IP adresy může uživatel číst články, ale nemá možnost je upravovat. To se jeví jako velice elegantní řešení v duchu Wikipedie, která se za každou cenu snaží vyhnout represivním opatřením ve svobodném duchu, který celý princip fungování Wikipedie charakterizuje. Zákoutí takové blokace může způsobit obtíže v případě, že vandal svoje edity provádí z veřejně dostupné sítě (kde všichni uživatelé sdílí jednu IP adresu, pod kterou jsou v síti internet identifikování). Například vysoké školy, kdy pokud je možnost editace zablokována, nemůže upravovat články nikdo z připojených ke školní síti. Pokud uživatel provádí nesprávné editace tak se mu do několika minut zobrazí při načtení úvodní stránky toto hlášení zobrazené v obrázku č. 4.
Obr. č. 4. Varování na úvodní straně Wikipedie při opakovaném vandalismu | zdroj: cs.wikipedia.org
Pokud uživatel nedbá těchto pokynů a dále pokračuje v záškodné činnosti, správce rozhodne o dočasném omezení možnosti editace a zobrazí se toto hlášení z obrázku č. 5.
42
Obr. č. 5. Oznámení o dočasném zablokování možnosti editace wikipedie | zdroj: cs.wikipedia.org
Pokud uživatel obdrží předchozí upozornění a stále touží po pokračování v jeho záškodné činnosti, jeví se jako jediná možnost proměnná IP adresa (vycházím při tom z předpokladu, že většina uživatelů internetu přistupuje prostřednictvím připojení s pevnou IP adresounapříklad ADSL). To umožňuje například použití internetového proxy serveru20. Ten dovoluje uživateli vystupovat v prostředí internetu pod IP adresou tohoto serveru, aniž by bylo možné jednoduše vystopovat jeho skutečnou adresu. Po vyzkoušení této možnosti jsem došel k závěru, že tento způsob výrazně zpomaluje práci vandala, protože datový tok přes dostupné proxy servery je velice nízký (zdlouhavé načítání) a navíc Wikipedie aktivně sleduje IP adresy těchto serverů a blokuje z nich přístup. Další zpomalení spočívá v nutnosti neustálého hledání dalších proxy serverů, kterých je na internetu omezený počet (každý použije vandal jen pro jednu nesprávnou editaci). To znamená, že po použití pár desítek z nich je již velice obtížně najít další. Výrazný faktor, kvůli kterému není vhodné používat tuto metodu, je také riziko napadení počítače škodlivým softwarem, který se prostřednictvím těchto serverů šíří. Jako další poměrně nenáročné řešení, jak vystupovat s proměnou IP adresou, jsem si vybral připojování se k serveru Wikipedie prostřednictvím připojení mobilního operátora. Tato služba z pravidla funguje tak, že se zařízení po ukončení práce s internetem odpojí a při dalším připojení má již odlišnou IP adresu. To znamená, že uživatel provede vždy jednu nesprávnou editaci, poté se od služby odpojí a další editaci provede již s novou IP adresou. Jednotlivá připojení a autentifikace internetového přístroje trvá přibližně 10 vteřin. To znamená, že tato metoda se pro záškodnickou činnost hodí lépe, a přitom správce Wikipedie proti němu nemá šanci zakročit a nemůže vandala žádným způsobem blokovat. Tuto metodu jsem použil při vkládání zavádějících informací do textů Wikipedie, ve snaze o co nejdelší setrvání editací, které obsahovali záměrně nepravdivé informace.
20
Proxy server funguje jako prostředník mezi klientem a cílovým počítačem (serverem), překládá klientské požadavky a vůči cílovému počítači vystupuje sám jako klient. Přijatou odpověď následně odesílá zpět na klienta
43
11.2 Pozorování reálné situace Jako vhodný způsob, který lustruje skutečné dění na Wikipedii, jsem zvolil sběr již existujících dat. U jednotlivých článků jsem načetl historii editací za rok 2011 a zapisoval jednotlivé časy nesprávných editací a jejich revertů. Do tabulek jsem zanesl tyto editace: 1) Označené jako vandalismu 2) Revertované bez komentáře21 3) Narušují informační hodnotu Test jsem rozdělil na dvě části: 1) Hlavní- zde jsem se zaměřil na nejčtenější články obou jazykových verzí. 2) Doplňující- zde jsem pro srovnání provedl analýzu na průměrných článcích zvolených náhodným výběrem. Tato část také obsahuje porovnání rozsahu dvojic ekvivalentních článků v obou jazykových verzích. Statistická data jsem čerpal z: Wikipedia article traffic statistics (URL: http://stats.grok.se/) (Tento server funguje jako oficiální statistická databáze Wikipedie) V hlavní části jsem čerpal z první stovky českých a z prvních tří set anglických nejčtenějších článků. Důvod této odlišnosti je velký počet uzamknutých anglických článků v první stovce. Konkrétní články jsem vybíral dle tématu jejich obsahu, pro co největší rozmanitost testu (top články jsou z velké části wiki příspěvky o státech a osobnostech showbyznysu). Průměrné články jsem zvolil zcela náhodně na základě vlastního úsudku. Analyzované články obou verzí mají záměrně shodné či podobné téma (vodní pólo-water polo, opencardOystercard) pro následné porovnání. Následující obrázek č. 6. ilustruje vzhled stránky se všemi historickými editacemi jednotlivým článků. Červeně zakroužkovány jsou dvojice časů, které jsem zanášel spolu s datem do statistických tabulek.
21
Většina vandalských editací se revertuje bez komentáře, aby vandal dostal co nejméně pozornosti.
44
Obr. č. 6. Ilustrační obrázek historických editací s vyznačeným vandalismem | zdroj: cs.wikipedia.org
11.3 Analýza nejčtenějších článků Seznam českých top témat: 1) Václav Klaus 2) Německo 3) USA 4) První světová válka 5) Adolf Hitler 6) Mark Zuckerberg 7) Egypt 8) Slunovrat 9) Jan Amos Komenský 10) Procesor Abych co nejlépe ilustroval vývoj článku během jednoho roku, uvádím následující tabulku č. 3, kde jsou zachyceny všechny případy vandalismu v článku Václav Klaus v roce 2011. Záměrně jsem ho vybral, protože se jedná o velice exponovanou osobu a existuje mnoho jeho zastánců i odpůrců. V současné době (duben 2012) je článek kvůli velkému množství vandalských editací uzamčen a úpravy jsou povoleny pouze ověřeným uživatelům, kteří již v minulosti provedli kladně hodnocené editace, a je proto menší pravděpodobnost, že se článek stane terčem útoků. Po většinu roku 2011 byl však článek otevřen pro všechny uživatele.
45
Do seznamu editací jsem zaznamenával veškeré změny, které byli revertovány nebo byly zdrojem sporů. Tučně jsou zvýrazněny zajímavé případy editací a jejich revertů, které okomentuji níže. 1) Václav Klaus Datum 20.1. 22.1. 24.1. 5.2. 21.2. 25.2. 27.2. 1.3. 11.3. 24.3. 18.- 24.3. 6.4. 11.4. 12.4. 13.4. 15.4. 16.4. 19.- 20.4. 21.4.
10.5. 13.5.
22.5. 23.5. 26.5.
17.6. 18.6. 20.6. 26.6. 18.7.
Čas editace 17:05 11:00 21:31 3:46 9:34 16:43 20:42 18:49 11:39 11:41 9:20 7:39 18:59 21:23 15:15 18:46 15:03 6:54 7:49 19:50 11:30 11:03 12:37 17:06
12:28 8:45 9:41 11:18 17:55 10:44 9:35 12:57 13:27 16:41 6:22 20:16 7:09 13:02 8:51
Čas opravy 17:25 11:24 21:36 18:31 9:36 16:45 20:42 18:51 11:40 11:42 9:37 7:42 7:42 21:24 16:51 18:47 15:45 10:42 7:51 20:06 11:35 5:38 14:01 17:40 17:52 18:09 18:14 12:29 8:46 9:46 11:18 18:01 10:49 10:21 13:19 13:31 17:00 6:25 20:22 7:12 13:09 9:23 9:37 9:43 9:46 12:18 12:21 12:27 12:30 12:31 12:37 12:38 12:41 12:43
25.7. 28.7.
13:11 12:16
Popis Vandalismus Vandalismus Nevěrohodný zdroj- blog (1) Nesmyslná věta Vandalismus Nesmyslná informace Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Přidána kritická pasáţ Vandalismus Přidáno známe video s perem Vandalismus Rozsáhlý sloţitý vandalismus Neověřené informace (2) Vandalismus Vandalismus Vandalismus Sloţitý vandalismus-přidání neověřené minulosti Naráţky na propisku Re-revert o kradení propisky Další revert Opět revert Konec malé wiki-války-zmínka o propisce mizí Vandalismus Vandalismus Vandalismus vandalismus Vandalismus Vandalismus Názorový vandalismus Vandalismus-přidány osobní názory Revert registrovaného uživatele-výzkum (3) Rozpoutaní male wiki-války zakončené revertem všech editaci vandalismus Vandalismus Vandalismus Vandalismus Rozpoutání wiki-války-anonym přidává nepodloţené kritické informace Revert Re-revert Re-Re-revert Další revert a přidání velkého mnoţství dalších drobných editací Vrácení všech editací Registrovaný uţivatel obhajuje názory anonyma a prosazuje jeho editaci Návrat k původní verzi Počínající vulgarismy Vzájemné obviňování z vandalismu Další názorové rozepře Další změny Návrat k několikrát smazaným názorovým odstavcům Správce tento článek na týden uzamkl (4) Anonym opět přidal názorové odstavce do článku Opět revert a počínající válka
46
2.8. 8.8. 12.8.
14:22 10:39 11:11 6:13 14:42
12:25 13:07 13:27 14:24 10:43 11:12 6:21
16.8.
13:29
18.8. Konec srpna 31.8. Září 8.9.
11:03
11:04
18:45
18:46
15:39 15:42 13:26 13:33
15:40 15:43 13:27 13:39
13:57 13:54 23:11 23:42 17:16 16:00 15:51 0:01 12:28 14:16 18:06 16:19 16:38 16:47 17:07 17:12 19:06 10:23 10:43 9:29 20:01 20:02
14:00 13:58 23:23 23:59 17:17 16:05 15:57 0:02 12:29 14:19 18:25 17:55 16:45 16:50 17:12 17:13 19:10 10:29 10:46 9:30 20:02
15.9. 16.9. 1.10. 9.10. 11.10. 12.10. 14.10. 15.10. 25.10. 29.10. 4.11. 5.11. 20.11. 22.11. 29.11. 30.11.
2.12. 5.12.
20.12.
Nový uţivatel obhajuje nové úpravy Opětovné smazání sporných informaci Přidání informaci-tímto válka končí Vandalismus Neencyklopedický text (5) Neencyklopedický text Vandalismus Začátek wiki-války Následuje 13x revert Zamčení článku a ukončení wiki-války Spor o homosexualitě atp. Vandalismus-vulgarity místo celého článku (6) Prakticky celý zbytek srpna probíhala další revertační válka s několika zámky Vandalismus Další rozsáhlá revertační válka a spory Vandalismus Vandalismus Vandalismus Vandalismus Další mini-válka s následným zámkem Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Vandalismus Zámek pro opakovaný vandalismus Opět rozsáhlá válka
Tabulka č. 3. Soupis škodlivých editací za rok 2011 v článku Václav Klaus | zdroj: cs.wikipedia.org
Z této tabulky je zřejmé, že na pozadí statických článků, které sleduje většina uživatelů, může být mnohdy velice rušno. Je vidět vysoký výskyt drobných vandalismů, které jsou dle mého pozorování v drtivé většině jen „testy“. Ve wiki komunitě se tak říká vandalismu nových uživatelů, kteří objevili princip fungování Wikipedie a ověřují si, zda opravdu mohou články měnit. Tyto testy jsou na první pohled rozpoznatelné. Jedná se často o vložení vtipné věty nebo smazání určitého odstavce. Tyto chyby jsou zpravidla opraveny během pár minut. Pro zajímavost jsem podrobil miniaturnímu průzkumu deset mých blízkých přátel (věková skupina 19-28 let), kteří se příliš nezajímají o informační technologie, a pět z nich nemělo tušení, jakým způsobem probíhá tvorba obsahu na Wikipedii. Tři přátelé se celkem podobně domnívali, že obsah vytváří velice rozsáhlá skupina registrovaných tvůrců, kteří musí 47
splňovat určité podmínky. Pouze dva popsali fungování této znalostní databáze s dostatečnou přesností.
11.3.1 Statistické hodnocení historie editací článku Václav Klaus Pokud započítáme jen standardní vandalismy a další menší chybné úpravy dostaneme tyto hodnoty pro rok 2011: Počet oprav: 57 Celková doba: 448 minut (7 hodin 28 minut) Průměrná doba opravy: 8 minut Medián trvání opravy: 3 minuty Pravděpodobnost, že uživatel načte článek napadený vandalem: 0,00085 % Dle statistik byl článek zobrazen 118603× a tak vandalizovaný obsah načetlo přibližně: 106 uživatelů (poslední výpočet je pouze orientační- předpokládá, že uživatelé vstupovali v pevně daných lineárních intervalech, což neodpovídá skutečnosti) Vysvětlení nestandardních editací z výše uvedené tabulky (1) Jediný revert za rok 2011 v důsledku nedůvěryhodného zdroje- všechny ostatní revertované editace neměli zdroj žádný nebo se jednalo o názory jednotlivců. (2) Editace, která „visela“ v těle textu téměř čtyři hodiny ačkoliv neměla žádný zdroj. K okamžitému smazání nedošlo v důsledku nekonfliktnosti informace a složitému ověřování její pravdivosti (z mého pohledu nejzáludnější typ nesprávné editace, kdy je pro editora složité se rozhodnout o korekci) (3) Revert editace registrovaného uživatele, který provedl vlastní výzkum a závěry. Tyto informace nemají na Wikipedii své místo, ačkoliv měl uživatel dobrý úmysl. Další neobvyklost spočívá v samotném mazání příspěvku „ověřeného“ uživatele, ke kterým nedochází příliš často. Ve většině případů dochází k vracení editace uživatelů identifikovatelných pouze pomocí IP adresy.
48
(4) 18. 7. Došlo k prvnímu uzamčení článku v roce 2011. Anonym, který prosazoval názorové odstavce, se však hned 25. července vrátil a opět začal prosazovat svoji verzi. (5) Revert proběhl v důsledku ne-encyklopedicky podaných informací, které mohli být sice pravdivé s dobrými zdroji, ale nesplňovali podmínky encyklopedického textu. (6) Došlo k nahrazení celého článku vulgárním textem. Revert proběhl během jediné minuty. Tyto reverty plné sprostých slov většinou spolehlivě odstraní okamžitě k tomu určení softwaroví roboti s tím, že upozorní „živé“ wikipedisty, aby jeho revert zkontrolovali.
11.3.2 Výsledky pozorování historie editací českých článků V následujících tabulkách jsou uvedeny editace a časy jejich oprav na devíti zbývajících českých testovaných článcích z prvních stovky nejčtenějších. V dolní části tabulky je vždy celkový souhrn, který obsahuje počet minut za celý rok, průměr času opravy a medián času opravy. Medián je v případě sudého množství hodnot tvořen průměrem dvou prostředních sousedících hodnot. Vedle názvu článku je uvedeno, zda byl po dobu roku 2011 článek zavřený či otevřený. Pokud byl článek zavřen za celý rok po kratší dobu než tři týdny, je článek označen jako otevřený. Výsledné hodnoty jsou uvedeny v tabulkách č. 4-12.
49
2) Německo
Datum 4.1. 14.1. 17.1. 27.1. 10.2. 23.2. 18.3. 21.3. 12.10.
19.10. 25.10. 23.11. 29.11. 1.12. 6.12.
14.12. Celkem: Průměr: Medián:
Německo-otevřený od do 11:05 11:07 19:35 19:41 15:21 15:22 18:26 18:29 18:08 18:14 15:21 15:22 12:08 12:09 22:35 22:46 8:51 8:53 8:54 9:00 9:02 9:05 8:10 8:12 15:52 15:54 12:09 12:11 7:00 7:18 6:03 6:11 6:36 6:40 6:41 6:42 16:19 16:25 14:57 14:58
Minut 2,0 6,0 1,0 3,0 6,0 1,0 1,0 11,0 2,0 6,0 3,0 2,0 2,0 2,0 18,0 8,0 4,0 1,0 6,0 1,0 86,0 4,3 2,5
Tabulka č. 4. Vandalismus v roce 2011 v článku Německo| Zdroj: cs.wikipedia.org
Komentář (Německo):V případě tohoto článku se jedná o vandaly velice zřídka vyhledávaný článek, ačkoliv je v první stovce nejčtenějších. Většina vandalských editací je odstraněna během několika minut.
50
3) USA
Datum 17.1. 25.1. 2.3. 21.3. 22.3. 30.3. 1.4. 4.4. 7.4. 8.4. 19.4. 25.4. 28.4. 9.5. 10.5. 13.5. 17.5. 12.6. 17.6. 24.6. 27.7. 10.8. 18.9. 19.12. Celkem: Průměr: Medián:
USA-otevřený od do 12:59 12:59 12:54 12:55 9:40 9:43 17:53 19:24 13:57 14:12 11:08 11:09 12:40 12:41 17:01 17:01 7:55 7:57 6:47 6:55 13:13 13:15 5:58 5:58 5:59 6:00 12:13 12:15 13:31 13:31 17:49 17:50 19:40 19:42 17:44 17:47 15:11 15:12 9:42 9:45 18:15 18:17 17:11 17:12 1:24 1:32 14:17 14:52 17:22 19:09
Minut 0,0 1,0 3,0 91,0 15,0 1,0 1,0 0,0 2,0 8,0 2,0 0,0 1,0 2,0 0,0 1,0 2,0 3,0 1,0 3,0 2,0 1,0 8,0 35,0 107,0 290,0 11,6 2,0
Tabulka č. 5. Vandalismus v roce 2011 v článku USA | zdroj: cs.wikipedia.org
Komentář (USA): Minutový průměr na opravu chyb zde narušují dvě dlouhé opravy, které trvaly přes jednu hodinu. Medián je naopak nižší než u článku o Německu.
51
4) První světová válka
Datum 12.1. 14.2. 1.3. 11.5. 16.5.
17.5. 21.5. 1.6. 13.7. 18.10. 20.11. 1.12. Celkem: Průměr: Medián:
První světová válka-otevřený od do 8:10 8:12 16:45 16:46 21:29 21:42 6:15 6:29 9:18 9:19 9:21 9:22 9:24 9:24 15:37 15:40 19:04 19:07 9:24 9:29 13:02 13:04 16:29 16:33 8:24 8:25 8:25 8:26 0:01 8:28 16:20 16:22
Minuty 2,0 1,0 13,0 14,0 1,0 1,0 0,0 3,0 3,0 5,0 2,0 4,0 1,0 1,0 507,0 2,0 560,0 35,0 2,0
Tabulka č. 6. Vandalismus v roce 2011 v článku První světová válka | Zdroj: cs.wikipedia.org
Komentář (První světová válka): Zde narušuje průměr extrémně dlouhá úprava 20. listopadu. Jednalo se o naprosto banální změnu popisku jednoho z mnoha obrázků, která nebyla na první pohled identifikovatelná jako špatná. 5) Adolf Hitler
Datum 9.1. 29.5. Celkem: Průměr: Medián:
Adolf Hitler- zavřený od do 22:08 22:08 16:01 17:37
Minuty 0,0 96,0 96,0 48,0 48,0
Tabulka č. 7. Vandalismus v roce 2011 v článku Adolf Hitler | zdroj: cs.wikipedia.org
Komentář (Adolf Hitler): První trvale zavřený článek v testu. Je vidět, že pokud je umožněna editace pouze ověřeným uživatelům, tak se vandalismus prakticky eliminuje. Jediná delší editace zmiňovala, že na Adolfa Hitlera bylo spácháno 42 atentátů (bez zdroje). Což je spíše editace s dobrým úmyslem. Bleskově revertovaná editace z 9. ledna spočívala v nahrazení jednoho odstavce humornou nevulgární větou.
52
6) Mark Zuckerberg
Datum 22.3. 23.3. 3.7. 16.10. 5.12. Celkem: Průměr: Medián:
Mark Zuckerberg-otevřený od do 13:26 13:26 11:55 11:58 11:58 11:59 16:23 16:25 16:28 16:29 0:05 22:56 17:29 17:46
Minuty 0,0 3,0 1,0 2,0 1,0 1371,0 17,0 1395,0 199,3 2,0
Tabulka č. 8. Vandalismus v roce 2011 v článku Mark Zuckerberg | zdroj: cs.wikipedia.org
Komentář (Mark Zuckerberg): V případě článku o zakladateli Facebooku je výskyt vandalství téměř zanedbatelný. Revert z 16. října spočíval v odstranění těchto vět (vloženo bez úprav):“ V současné době byl označen jako nejmladší miliardář ! Také byl natočen o facebooku film The social Network kde se dozvíte , jak založil facebook .“ Tento text je hodnocen jako neencyklopedický a bez zdrojů. 7) Egypt
Datum 10.1. 24.2. 22.3. 30.3. 27.4.
11.5. 22.6. 15.7. 19.7. 8.10. 6.11. 7.12. 15.12. 25.12. Celkem: Průměr: Medián:
Egypt-otevřený od do 15:19 15:19 15:21 15:21 18:26 18:40 7:14 7:39 5:35 11:13 6:14 6:14 6:24 8:06 8:29 8:30 10:51 12:45 8:10 8:12 15:14 17:06 22:31 22:43 15:29 15:35 17:14 19:15 15:24 15:31 13:33 13:35 18:30 18:45 0:01 9:51
Minuty 0,0 0,0 14,0 25,0 338,0 0,0 102,0 1,0 114,0 2,0 112,0 12,0 6,0 121,0 7,0 2,0 15,0 590,0 2061,0 114,5 13,0
Tabulka č. 9. Vandalismus v roce 2011 v článku Egypt | zdroj: cs.wikipedia.org
53
Komentář (Egypt): Článek popisující tuto africkou zemi je nestandardní v relativně vysokém výskytu dlouhých oprav. Dlouhý revert z 30. března Spočíval v odstranění neškodných vět: „Egypt je chudá země. Spousta lidí umírá v pouštích hladem. V hotelech je to pěkné, ale jak vyjdete ven, vidíte jen špínu a chudobu.“. Druhý dlouho odolávající edit z 25. prosince spočíval v umístění komerčního odkazů do zdrojů. 8) Slunovrat
Datum 7.4. Celkem: Průměr: Medián:
Slunovrat-otevřený od do 17:10 17:11
čas 1,0 1,0 1,0 1,0
Tabulka č. 10. Vandalismus v roce 2011 v článku Slunovrat | zdroj: cs.wikipedia.org
Komentář (Slunovrat): Článek absolutně bez povšimnutí vandalů z první stovky nejčtenějších je zajímavý úkaz. Jediná vrácená editace spočívala v nesrozumitelně podané informaci.
54
9) Jan Amos Komenský
Datum 16.1. 28.1. 14.2. 9.3. 13.3. 22.3. 28.3. 30.3. 11.4. 29.5. 22.6. 28.9. 20.10. 26.10. 9.11. 29.11.
8.12. 15.12. 16.12.
Jan Amos Komenský- otevřený od do 19:14 19:14 10:15 10:17 10:36 10:41 17:32 17:32 18:32 18:35 20:33 20:37 9:52 9:54 10:00 10:01 10:03 10:04 5:48 6:05 21:42 21:44 6:15 6:18 17:22 17:23 17:30 17:32 12:18 12:30 12:31 12:42 9:49 9:51 7:26 7:40 7:17 7:22 7:24 7:25 7:26 7:28 11:03 11:03 11:04 11:04 7:01 7:08 7:09 7:12 13:25 13:38 14:40 14:41 7:17 7:18 7:18 7:20 7:55 7:57
Celkem: Průměr: Medián:
Minuty 0,0 2,0 5,0 0,0 3,0 4,0 2,0 1,0 1,0 17,0 2,0 3,0 1,0 2,0 12,0 11,0 2,0 14,0 5,0 1,0 2,0 0,0 0,0 7,0 3,0 13,0 1,0 1,0 2,0 2,0 119,0 4,0 2,0
Tabulka č. 11. Vandalismus v roce 2011 v článku J. A. Komenský | zdroj: cs.wikipedia.org
Komentář (Jan Amos Komenský): Typický článek o historické postavě, kde existuje mnoho editorů, kteří každou změnu pečlivě hlídají a opravují. Větší množství vandalizujících editů je vyváženo nízkým průměrem doby opravy bez výskytu extrémních případů.
55
10) Procesor
Datum 11.1. 17.1. 23.1. 1.6. 13.6. 6.9. 9.9. 24.9. 12.10. 12.11. 14.11: Celkem: Průměr: Medián:
Procesor-otevřený od do 8:18 8:18 12:08 14:40 14:48 14:48 12:26 15:33 12:32 12:33 12:47 12:48 12:48 12:49 9:33 9:50 9:43 9:44 9:22 9:23 18:53 19:29 9:50 23:03
Minuty 0,0 152,0 0,0 187,0 1,0 1,0 1,0 17,0 1,0 1,0 36,0 793,0 1190,0 99,2 1,0
Tabulka č. 12. Vandalismus v roce 2011 v článku Procesor | zdroj: cs.wikipedia.org
Komentář (Procesor): Většina editů byla bleskově opravena. Dlouho trvající opravy spočívali v odstraňování naprosto zanedbatelných spojení nesouvisejících s textem. V průběhu pozorování mě upoutala skutečnost, že články s vědečtěji zaměřeným tématem podléhají vandalismu méně.
11.3.3 Shrnutí a závěry české části průzkumu Z hodnot v tabulkách se dá usoudit, že na české verzi Wikipedie je vandalisace příspěvků spíše zřídkakdy viděný jev. A když už se vyskytne, tak je často opravena během pár minut. Z testovaných článků měl největší celkový součet minut článek o Egyptu. I tak hodnota 2061 minut představuje pravděpodobnost načtení vandalismu uživatelem 0,004%. Důležitý faktor také hraje podoba vandalismu, protože v mnoha případech nesprávná editace narušuje obsah stránky jen velice nepatrně. Během sledování samo-opravné funkce Wikipedie jsem téměř nenarážel na editace, které by zásadní způsobem narušovali informační hodnotu článku. Nejčastěji se opakují tyto dva typy vandalských úprav: Smazání podstatné částí článku nebo nahrazení celého článku jiným textem. Vkládání zkušebních krátkých textů nebo jen slov. Zpravidla se autor snaží o vtipnou formulaci nebo vkládá sprostá slova. V následujícím obrázku č. 7 je editační tabulka s jednou takovou typickou úpravou. Červeně označené části textu jsou ty, které byly předmětem úpravy. 56
Obr. č. 7. Porovnání dvou verzí článků | zdroj: cs.wikipedia.org
57
11.3.4 Sledování opravování vandalismu na anglické verzi Wikipedie Seznam anglických témat: 1) Google 2) Qatar 3) Wikileaks 4) World War I 5) Johnny Depp 6) Cloud computing 7) Albert Einstein 8) Halloween 9) F-35 lightning II 10) Salvia divinorum Výběr sledovaných témat pro anglickou verzi Wikipedie byl o něco složitější, protože velká část článků v první stovce nejsledovanějších, je uzamčena a mohou ji tedy editovat jen ověření uživatelé, kteří nepředstavují tak velké nebezpečí (z hlediska vandalismu) jako ostatní uživatelé, jež jsou identifikování jen podle vlastní IP adresy. Vybíral jsem tedy z první třístovky článků. Opět jsem se snažil o jistou tematickou vyváženost a rozmanitost, protože v nejčtenějších článcích se ve velkém množství vyskytují články o státech a články o významných osobách, ať už z oblasti politiky nebo kulturního života. Do výběru jsem nakonec umístil jak zavřené tak otevřené články. Tvar tabulek je stejný jako v případě české verze. Je v ní uvedeno datum a čas editace i jejího revertu a v dolní části je souhrn celkovým hodnot. Některé tabulky jsem z důvodu přehlednosti celku zkrátil, přičemž jsem doplnil celkový počet úprav. Hodnoty jsou uvedeny v tabulkách č. 13-22.
58
1) Google
Datum 5.6. 7.8. 24.8. 31.8. 15.12. Celkem: Průměr: Medián:
Google-zavřený od do 16:43 16:46 22:00 22:02 11:09 11:11 0:53 0:53 1:25 1:32
Minuty 3,0 2,0 2,0 0,0 7,0 14,0 2,8 2,0
Tabulka č. 13. Vandalismus v roce 2011 v článku Google | zdroj: en.wikipedia.org
Komentář (Google): Článek o tomto IT gigantovi, který se dlouhodobě pohybuje mezi padesáti nejčtenějšími články na anglické Wikipedii, je trvale uzamčen a registrovaní uživatelé provádějí naprosté minimum škodlivých editací. Po celý rok 2011 byl článek zvandalizován naprosto zanedbatelných 14 minut.
59
2) Qatar Qatar-otevřený od do 15:31 15:39 1:22 1:30 2:04 2:05 17:16 17:16 15.1. 0:52 0:53 7:58 18:18 17.1. 7:47 7:47 19.1. 3:27 3:31 27.1. 2:18 2:18 2:18 2:24 29.1. 21:06 21:07 30.1. 20:54 20:54 3.2. 6:09 6:09 8.2. 1:57 1:57 10.2. 17:44 17:44 12.2. 3:23 3:24 15.2. 17:36 23:58 19.2. 0:56 1:25 21.2. 22:34 22:36 22:44 22:45 22:49 22:50 22:51 22:53 1.3. 17:03 20:04 4.3. 23:44 23:45 6.3. 15:41 16:08 10.3. 23:18 23:20 19.3. 15:36 15:41 21:11 23:40 21.3. 5:29 5:44 5:57 5:57 16:51 16:52 4.4. 0:22 19:30 10.4. 0:01 22:06 13.4. 0:46 12:43 Zkrácení tabulky (celkem 106 revertů) Celkem: Průměr: Medián: Datum 7.1. 8.1. 12.1.
Minuty 8,0 8,0 1,0 0,0 1,0 620,0 0,0 4,0 0,0 6,0 1,0 0,0 0,0 0,0 0,0 1,0 382,0 29,0 2,0 1,0 1,0 2,0 181,0 1,0 27,0 2,0 5,0 149,0 15,0 0,0 1,0 1148,0 1325,0 717,0 9641,0 91,0 5,0
Tabulka č. 14. Vandalismus v roce 2011 v článku Qatar | zdroj: en.wikipedia.org
Komentář (Qatar): Tabulku vandalismů na článku o tomto státě jsem pro její délku zkrátil na přijatelnou míru. Z hodnot je vidět, že se v tomto příspěvku vyskytuje větší množství editací, které se udrželi déle než jednu hodinu, což zvedá průměr na jednu chybu na relativně vysokých 91 minut. Vzhledem k tomu, že tyto dlouhé reverty byli v menšině, tak se medián udržel na standardní úrovni. Dalším znatelný jev, který vyplívá ze záznamu je častý výskyt oprav s délkou pod jednu minutu. Ty má na starosti ve většině případů automatický opravný
60
software. Ten dokáže odhalit nápadné způsoby vandalismu, jako jsou například sprostá slova nebo smazání výrazné části článku. 3) WikiLeaks WikiLeaks-otevřený od do 6:10 6:15 15:57 16:02 16:06 16:08 2.2. 0:57 14:12 7.2. 20:49 20:55 8.2. 0:02 1:41 5:27 5:28 9.2. 1:03 1:06 8:30 13:33 22:09 22:09 Zkrácení tabulky (celkem 123 revertů) 25.11. 17:13 17:28 29.11. 13:41 14:42 2.12. 9:40 9:46 7.12. 12:42 12:44 10.12. 22:56 22:56 18.12. 21:35 21:35 23:26 23:27 20.12. 6:24 6:26 17:20 17:21 23.12. 8:42 8:43 Celkem: Průměr: Medián: Datum 6.1. 17.1.
Minuty 5,0 5,0 2,0 795,0 6,0 99,0 1,0 3,0 303,0 0,0 15,0 61,0 6,0 2,0 0,0 0,0 1,0 2,0 1,0 1,0 3093,0 25,1 3,0
Tabulka č. 15. Vandalismus v roce 2011 v článku WikiLeaks | zdroj: en.wikipedia.org
Komentář (WikiLeaks): V článku o kontroverzním serveru se vyskytlo velké množství vandalských útoků, proto jsem musel opět tabulku výrazně zkrátit. I když bylo vandalských útoků velké množství, tak většina z nich byla opravena do 2 minut. Nejdéle odolávající chyba z 2. února se držela jen díky nízkému dopadu na informační hodnotu článku (jednalo se o nesmyslnou změnu formátu data).
61
4) World War I
Datum 15.1. 16.1. 25.1. 30.1. 6.2. 15.4. 19.4. 1.6. 12.6. 13.6. 14.6.
26.6. 18.7. 6.9. 18.11. 13.12. Celkem: Průměr: Medián:
World War 1- zavřený od do 18:50 18:59 20:24 20:46 1:38 2:01 10:21 10:26 13:48 13:50 5:57 6:44 10:53 10:55 21:27 21:51 0:17 0:40 14:16 14:52 18:58 20:43 21:27 21:35 22:02 22:17 23:00 23:58 15:20 16:05 9:25 22:36 12:31 12:39 9:57 11:03 16:16 16:23
Minuty 9,0 22,0 23,0 5,0 2,0 47,0 2,0 24,0 23,0 36,0 105,0 8,0 15,0 58,0 45,0 791,0 8,0 66,0 7,0 1296,0 68,2 23,0
Tabulka č. 16. Vandalismus v roce 2011 v článku WW1 | zdroj: en.wikipedia.org
Komentář (World War I): Zde se jednalo o množství editací, které neměli stoprocentně spolehlivé zdroje, ale vypadali prospěšně a byly tak vraceny v relativně dlouhých časech. Skutečných vandalských útoků bylo vzhledem k uzavřenosti článku naprosté minimum. Ty byly opět odstraňovány během několika minut.
62
5) Johnny Depp
Datum 11.1. 13.1. 7.2. 3.4. 19.4. 2.6. 24.9. 10. -12. 10 14. -15. 10 Celkem: Průměr: Medián:
Johnny Depp-zavřený od do 15:14 21:17 3:06 7:30 2:38 23:43 8:30 8:31 1:49 1:58 8:13 8:33 1:29 1:36 21:13 21:18 2:58 18:13 10:38 13:25
Minuty 363,0 264,0 1265,0 1,0 9,0 20,0 7,0 5,0 2355,0 1607,0 5896,0 589,6 142,0
Tabulka č. 17. Vandalismus v roce 2011 v článku Johnny Depp | zdroj: en.wikipedia.org
Komentář (Johnny Depp): V tomto článku se významně projevují dva neobvykle dlouhé reverty z poloviny října. Jednalo se o neopodstatněné mazání jednoho odstavce, které provedl pokaždé ten samý uživatel. Další dlouhá editace ze 7. února spočívala v neencyklopedickém a názorově zabarveném popisu obrázku, což nenarušilo výrazně konzistenci článku. Ostatních vrácených editací bylo minimum.
63
6) Cloud computing Cloud Computing-otevřený od do 7:37 7:37 1:09 3:16 10:25 10:25 10:27 10:27 5.1. 11:56 11:56 6.1. 3:36 3:36 7.1. 11:46 11:47 11.1. 16:32 16:37 19:11 19:11 13.1. 18:43 18:48 20:58 21:07 21:51 21:58 14.1. 10:54 10:55 10:56 10:56 19.1. 10:41 13:41 20:03 20:37 Zkrácení tabulky (celkem 230 revertů) 20.1. 8:55 9:09 21.1. 20:53 21:21 23.1. 3:27 3:36 24.1. 17:30 17:39 9.11. 1:14 3:16 9:28 9:49 16.11. 6:53 6:54 18.11. 14:40 15:56 22.11. 9:43 16:41 24.11. 18:30 18:33 25.11. 12:28 13:00 Celkem: Průměr: Medián: Datum 1.1. 2.1. 3.1.
Minuty 0,0 127,0 0,0 0,0 0,0 0,0 1,0 5,0 0,0 5,0 9,0 7,0 1,0 0,0 180,0 34,0 14,0 28,0 9,0 9,0 122,0 21,0 1,0 76,0 418,0 3,0 32,0 1110,0 39,6 7,5
Tabulka č. 18. Vandalismus v roce 2011 v článku Cloud computing | zdroj: en.wikipedia.org
Komentář (Cloud computing): V textu bylo největší množství vrácených editací z mnou sledovaných článků. To je dle mého pozorování zapříčiněno v první řadě tématem, které vybízí k umisťování reklamních editací. Protože se v posledních letech tato technologie široce rozšiřuje, přitahuje řadu firem, které zde většinou vkládají do textu odkazy na své internetové stránky. Někdy také přidávají nové pasáže, kde například popisují řešení, které jejich firma nabízí. Protože je taková reklama na Wikipedii zakázána, jsou editace považovány za vandalismus a jsou bez milosti smazány. Na tomto článku jsem také sledoval skupinu uživatelů, kteří se o text pečlivě starají po celý rok. Mimo to, že dokáží v krátkých intervalech odhalit každou nesprávnou editaci, tak také provádějí pravidelné „kompletní údržby“ článku například po sérii větších úprav. V takových případech korektně opraví nadpisy, strukturu článku, pravopisné chyby, slovosled další nesrovnalosti, které by ubírali článku 64
na srozumitelnosti. V tomto konkrétním případě provedl uživatel vystupující pod přezdívkou „SamJohnston“ celkově 126 prospěšných editací. 7) Albert Einstein
Datum 2.1. 23.2. 28.4. 21.9. 23.9. Celkem: Průměr: Medián:
A. Einstein- zavřený od do 19:03 19:06 18:00 18:03 19:20 19:43 12:15 12:31 7:28 7:29
Minuty 3,0 3,0 23,0 16,0 1,0 46,0 9,2 3,0
Tabulka č. 19. Vandalismus v roce 2011 v článku A. Einstein | zdroj: en.wikipedia.org
Komentář (Albert Einstein): V tomto po celý rok zavřeném článku se vandalismus prakticky
nevyskytoval.
Téměř
všechny
vrácené
editace
nesplňovali
požadavky
na věrohodnost zdroje. Celkové množství pouze pěti nesprávných editací za celý rok ukazuje, že pokud už článek může editovat jen ověřený uživatel, pravděpodobnost konzistence článku se limitně blíží ke stoprocentní hranici. Tento princip se mi jeví jako velice užitečný pro zvětšení důvěryhodnosti sdělovaných informací. Pokud už je článek dostatečně propracovaný a obsahuje velké množství ověřených informací, není, dle mého názoru, akutní potřeba, aby editaci mohl provádět každý běžný uživatel. Počet zhlédnutí za rok 2011: 6 259 109 Pravděpodobný počet uživatelů, kterým se načetla zvandalizovaná stránka: 547 (0,00009%)
65
8) Halloween Halloween-otevřený od do 17:14 17:35 10:22 10:23 22:03 22:07 6.1. 21:05 21:07 21:09 21:09 21:10 21:11 7.1. 22:18 22:18 9.1. 4:50 4:50 12:09 13:17 Zkrácení tabulky (celkem 131 revertů) 28.9. 17:17 17:17 21:03 21:15 29.9. 0:30 0:30 0:52 0:52 17:36 17:36 19:47 19:47 19:48 19:48 2.10. 2:55 2:56 7:48 8:15 9:07 10:33 14:55 15:14 18:26 18:29 18:32 18:32 18:39 18:42 19:08 19:16 Celkem: Průměr: Medián: Datum 2.1. 3.1.
Minuty 21,0 1,0 4,0 2,0 0,0 1,0 0,0 0,0 68,0 0,0 12,0 0,0 0,0 0,0 0,0 0,0 1,0 27,0 86,0 19,0 3,0 0,0 3,0 8,0 5335,0 40,7 1,0
Tabulka č. 20. Vandalismus v roce 2011 v článku Halloween | zdroj: en.wikipedia.org
Komentář (Halloween):Tento článek je typický velkým množstvím oprav vracených automatickým softwarem. Z celkového počtu 131 revertů jich bylo 45 provedených okamžitě nebo během jediné minuty. To také zajistilo medián délky opravy na hodnotě 1. Nejdelší doba opravy se vyskytla 9. července a měla hodnotu 1 190 minut. Autor této editace přidal do textu neověřenou informaci o odlišném vzniku tohoto svátku, která neměla žádný zdroj.
66
9) F-53 Lightning II F-35 Lightning II- otevřený od do 4:16 4:18 4:25 4:34 6.1. 22:21 22:22 23:13 23:13 7.1. 4:12 4:12 9:47 9:57 9.1. 10:10 10:15 20.1. 16:29 16:29 16:30 16:30 16:31 16:32 21:38 22:05 21.1. 5:23 5:33 22.1. 6:16 9:00 Zkrácení tabulky (celkem 65 revertů) 7.9. 18:08 18:08 20.9. 17:21 17:37 19.10. 21:42 21:44 20.10. 17:51 17:52 21.10. 1:52 1:55 25.10. 0:07 0:14 4.11. 20:01 20:03 6.11. 1:36 16:03 9.11. 18:39 18:43 23.11. 22:55 22:59 23:01 23:06 19.12. 21:30 21:42 20.12. 4:39 4:42 30.12. 16:22 18:38 Celkem: Průměr: Medián: Datum 2.1.
Minuty 2 9 1 0 0 10 5 0 0 1 27 10 164 0 16 2 1 3 7 2 867 4 4 5 12 3 136 2006 30,9 4
Tabulka č. 21. Vandalismus v roce 2011 v článku F-35 II | zdroj: en.wikipedia.org
Komentář (F-35 Lightning II):V tomto článku o stíhacím letadle je typické editování článku osobami, které se o dané téma zajímají, a proto provádějí velice pečlivé úpravy a dlouze diskutují s ostatními uživateli o tom, které verze podávaných informací je nejvhodnější, a která informace pochází z nejdůvěryhodnějšího zdroje. Tento atribut opět výrazně vylepšuje celkovou kvalitu článku. Dva nejpilnější uživatelé provedli celkem 246 prospěšných editací během roku 2011.
67
10) Salvia divinorum Salvia divinorum-zavřená Datum od do Minuty Ani jeden případ vandalství za celý rok 2011
Tabulka č. 22. Vandalismus v roce 2011 v článku Salvia divinorum | zdroj: en.wikipedia.org
Komentář (Salvia divinorum): Tento článek je také ukázka bezproblémového fungování Wikipedie jako zdroje velkého množství užitečných a správně ověřovaných informací. Ukazuje se, že pokud je článek dostatečně rozsáhlý a uzamčený pro editace širokou veřejností, zlepší se tím úroveň jeho konzistence. Tento článek obsahuje 158 citací a 83 tištěných i elektronických zdrojů. To představuje obrovské penzum ověřených informací, kterému bude jiný zdroj těžko konkurovat. Například server britannica.org nenabízí o této rostlině žádné informace.
11.3.5 Shrnutí a závěry anglické části průzkumu Rozdíl mezi anglickou a českou verzí Wikipedie je v množství uzavřených článků v první tisícovce nejčtenějších obou verzí. Z toho vyplívá menší míra vandalismu v těchto „top“ článcích. Naopak v mnou vybraných článcích v prvních třech stovkách, které byly otevřené, jsem odhalil výrazně větší množství vandalismů. Hodnoty průměru a mediánu časů oprav se při celkovém srovnání výrazně nelišili. Graficky je to znázorněno v následujícím obrázku č. 8. Tyto výpočty jsou provedeny se součty všech chyb obou testovaných verzí.
68
60 50.3
48.6
50 39.7
Minuty
40 30
Průměr
20
Medián
10
4
4
2
0 EN
CS
Celkem
Jazyková verze Obr. č. 8. Graf znázorňující průměr a medián časů oprav v praktickém testu | zdroj: vlastní
Na dalších dvou grafech na obrázku č. 9. a 10. je znázorněno rozdělení jednotlivých časů oprav dle početního a procentuálního zastoupení. Grafy zastoupení časových intervalů při jednotlivých opravách
Počet časů v intervalu 180 160 140 120 100 80 60 40 20 0
161 135
127 120 93 74 40
39
Počet časů v intervalu 25 1
Obr. č. 9. Graf počtu časů v jednotlivých intervalech | zdroj: vlastní výpočet
69
Procentuální zastoupení časů 2-6 hod 5% 1-2 hod 5%
6-24 hod 3%
>24 hod 0%
<60 sek 20% 16-60 min 15% 1 min 16% 6-15 min 16% 3-5 min 11%
2 min 9%
Obr. č. 10. Graf procentuálního zastoupení všech časů oprav v jednotlivých intervalech | zdroj: vlastní výpočet
Komentář k předcházejícím grafům: Přes 50% všech revertovaných editací v mém pozorování bylo opraveno za méně než 5 minut a méně než 15% nesprávných příspěvků přežilo déle než jednu hodinu. První těžiště hodnot je v intervalu do dvou minut a druhé v oblasti patnácti minut.
11.3.6 Doplňující druhá část testu Tuto část sem do práce zařadil, abych lépe nastínil rozdíl mezi českou a anglickou verzí Wikipedie, co se týče objemu nabízených informací k jednotlivým tématům a míry vandalismu. Odlišnosti budu nejprve ilustrovat na analýze dvojic článků (cs, en), které mají stejné či související téma. Tentokrát jsem se rozhodl pouze pro výpis celkových hodnot. Základní údaje tvoří součet všech opravných časů a jejich počet. Z těchto hodnot je spočítaný průměr a na poslední řádce je uveden medián, který do jisté míry eliminuje narušení objektivnosti výskytem nepatrného množství extrémních hodnot.
70
Seznam českých článků pro doplňující test: 1) Plzeň 2) Vodní pólo 3) Daniel Hůlka 4) Bankovní institut 5) Vysoká škola ekonomická 6) Dálnice D1 7) MotoGP 8) Opencard 9) Jižní město- Praha 10) UML- unified modeling language 11) Elektrostatická indukce 12) Safír 13) Laos
Seznam anglických článků pro doplňující test: 1) Manchester 2) Water Polo 3) Pendulum (hudební skupina) 4) University of South Florida 5) Yale 6) Route 66 7) MotoGP 8) Oystercard 9) Charlton- London 10) UML- unified modeling language 11) Electrostatic induction 12) Sapphire 13) Laos
71
Vyhodnocení po dvojicích Data jsou umístěna do přehledných jednoduchých tabulek, kde jsou ve dvou sloupcích uvedeny základní výstupy analýzy. Prostřední sloupec je statistika k českému článku a vlevo k anglickému. Levý sloupec udává tyto hodnoty: Celkem: Celkový součet času v minutách, po který byl daný článek nekonzistentní kvůli špatným editacím. Počet: Celkové množství provedených revertů. Průměr: Průměrná hodnota časů, po kterou setrvala chyba neopravena. Medián: Střední hodnota všech časů oprav. Jednotlivé tabulky s hodnotami (Jako zdroj dat ke všem následujícím tabulkám č. 23 až č. 35 byl server wikipedia.org a slouží k porovnání dvou jazykových verzí z hlediska výskytu vandalismu.)
1) Plzeň / Manchester Celkem:
195
592
Počet:
7
19
Průměr:
27,9
31,2
Medián:
3
2
Tabulka č. 23
2) Daniel Hůlka /Pendulum Celkem:
0
3165
Počet:
0
35
Průměr:
-
90,4
Medián:
-
12
Tabulka č. 24
3) Bankovní institut / University of South Florida Celkem:
0
1308
Počet:
0
15
Průměr:
-
87,2
Medián:
-
6
Tabulka č. 25
72
4) VŠE / Yale Celkem:
67
6421
Počet:
9
112
Průměr:
7,4
57,3
Medián:
3
5
Tabulka č. 26
5) Dálnice D1 / Route 66 Celkem:
0
13
Počet:
0
4
Průměr:
-
3,2
Medián:
-
0,5
Tabulka č. 27
6) Opencard / Oystercard Celkem:
0
1097
Počet:
0
6
Průměr:
-
182,8
Medián:
-
184
Tabulka č. 28
7) Jižní město- Praha / Charlton-London Celkem:
14
0
Počet:
6
0
Průměr:
2,3
-
Medián:
2
-
Tabulka č. 29
8) Vodní pólo / Water Polo Celkem:
0
1138
Počet:
1
49
Průměr:
0
23,7
Medián:
0
0
Tabulka č. 30
73
9) MotoGP / MotoGP Celkem:
4
99
Počet:
1
7
Průměr:
4
14,1
Medián:
4
14
Tabulka č. 31
10) UML / UML Celkem:
0
2242
Počet:
0
27
Průměr:
-
83
Medián:
-
40
Tabulka č. 32
11) Elektrostatická indukce / Electrostatic induction Celkem:
0
95
Počet:
0
1
Průměr:
-
95
Medián:
-
95
Tabulka č. 33
12) Safír / Sapphire Celkem:
0
851
Počet:
0
36
Průměr:
-
23,6
Medián:
-
4,5
Tabulka č. 34
13) Laos / Laos Celkem:
0
3898
Počet:
0
66
Průměr:
-
59,1
Medián:
-
15,5
Tabulka č. 35
74
Tyto statistiky odhalují zásadní rozdíl mezi články na obou jazykových verzích. Zatímco většina mnou vybraných českých článků nevykazuje téměř žádnou hladinu vandalismu, tak v anglické verzi je výskyt v ekvivalentních článcích výrazně vyšší (jen o něco nižší než v top článcích). Je to logicky dáno mnohem větším „provozem“ daných stránek a několikanásobně větším množstvím uživatelů (tabulka č. 2 z obecné části), kteří se podílejí na funkci anglické Wikipedie. Články jsou mnohem lépe zpracovány a nabízejí násobně větší množství informací. Daň za kvalitnější články je větší výskyt vandalských editací, které však spíše paradoxně prozrazují vyšší kvalitu článku, protože platí určitá úměrnost mezi kvalitou článku a množstvím jeho vandalských editací. Toto tvrzení jsem ověřil v následující sekci.
11.3.7 Rozsah ekvivalentních článků na jednotlivých verzích Vybral jsem 29 tematicky shodných dvojic článků, abych porovnal jejich textový rozsah. Jako měřítko jsem použil počet oddělených řetězců ve zdrojovém textu (tím se do celkového výsledku lépe promítne i množství odkazů, zdrojů či obrázků). Ve sloupci vpravo je poté poměr rozsahů obou článků v procentuálním vyjádření. Součástí analýzy jsou i dvojice článků z přechozí sekce (jsou tučně zvýrazněny). Výsledky jsou zobrazeny v tabulce č. 36.
75
Porovnání rozsahu stejných článků v anglické a české verze Článek CS EN Poměr (cs/en) 585 10292 6% Vodní pólo 404 4319 9% MotoGP 998 3869 26% UML 872 3766 23% Safír 1794 7052 25% Laos Ţralok 2438 9648 25% Mahátma Gándhí 5074 16098 32% Olympijské hry 2090 14606 14% 338 2002 17% Indukce 2000 12258 16% Rýže Velký třesk 4229 11429 37% Tichý oceán 1052 3887 27% Křesťanství 4613 16807 27% Chřipka 2309 16503 14% Boeing 747 914 14004 7% Oko 803 7137 11% Sníh 1742 6612 26% Eiffelova věţ 4089 8310 49% Xbox 360 2201 14119 16% Brokovnice 362 12363 3% Jízdní kolo 3364 8291 41% Real Madrid 2172 10913 20% Sluchátka 716 4484 16% Ekonomie 991 16094 6% Mikrovlnná trouba 614 6738 9% Čas 2484 11918 21% Bungee jumping 933 2454 38% Propiska 320 2097 15% Průměr: 1804 9217 20,6 % Tabulka č. 36. Porovnání stejných článků v anglické a české verzi | zdroj: vlastní z dat wikipedia.org
Ani jeden článek české verze nedosáhl na hodnotu 50% rozsahu jeho anglického ekvivalentu. Několik článků se dokonce dostalo pod hranici 10%. Nejhorší zástupce „brokovnice“ se dostal dokonce jen na 3%. Z průměru vyplívá, že česká verze mnou vybraných článků obsahuje přibližně pětkrát méně informací než verze tvořená anglicky. Tento výsledek podporuje hypotézu z obecné části této bakalářské práce, která srovnávala počty administrátorů a aktivních editorů s počtem článků. Z té vyplívalo, že v české verzi obhospodařuje jeden administrátor přibližně třikrát více článků a stejný poměr panuje i v případě editorů. Pro přehlednější vyjádření jsem zařadil grafické znázornění výše uvedených hodnot v obrázku č. 11, kde vodorovná osa vyjadřuje počet slovních řetězců ve zdrojovém kódu článku. 76
Propisovací tužka Bungee jumping Čas Mikrovlná trouba Ekonomie Sluchátka Real Madrid Jízdní kolo Brokovnice Xbox 360 Eiffelova věž Sníh Oko Boeing 747 Chřipka Křesťanství Tichý oceán Velký třesk Rýže Indukce Olympijské hry Mahátma Gándhí Žralok Laos Safír UML MotoGP Vodní pólo
en cs
0
2000
4000
6000
8000 10000 12000 14000 16000 18000
Obr. č. 11. Graf znázorňující porovnání rozsahu ekvivalentních článků na dvou jazykových verzí Wikipedie | zdroj: vlastní
Pro vyvážení analýzy jsem také sledoval články, které pojednávají o ryze českém tématu, ale zároveň jsou známy hojně i v zahraničí. Stejným způsobem jsem sledoval jejich textový rozsah. Výsledky uvádí tabulka č. 37. Data jsou graficky znázorněna na obrázku č. 12.
77
Tabulka porovnání rozsahu článků s výrazně českou tématikou Článek Václav Havel Brno Jawa Jaromír Jágr Vltava Pilsner Urquell Sametová revoluce Emil Zátopek Průměr:
CS 7590 15106 754 4646 2375 736 9108 2015 5291
EN 6606 9794 1202 6709 791 613 4842 1735 4036
Poměr 115% (cs/en) 154% 63% 69% 300% 120% 188% 116% 140%
Tabulka č. 37. Porovnání rozsahu článků s výrazně českou tématikou | zdroj: vlastní z dat wikipedia.org Vltava Sametová revoluce Brno Pilsner Urquell
en
Emil zátopek
cs
Václav Havel Jaromír Jágr Jawa 0
2000 4000 6000 8000 10000 12000 14000 16000
Obr. č. 12. Graf porovnání článků o ryze českých tématech v obou jazykových verzích. | zdroj: vlastní
Zde je vidět, že kvalita (hodnocená dle rozsahu) textů o českých „specialitách“ se drží anglické verze a ve většině případů ji předčí. Anglická verze nabídla více informací pouze v případě Jaromíra Jágra a výrobce motocyklů Jawa. Za určitých okolností by se dala tímto způsobem pozorovat míra informovanosti vnějšího světa o naší republice.
11.4 Test s pomocí záměrného vkládání chyb Pro další ověření samo-opravné funkce Wikipedie, jsem vandalské editace sám vytvářel a sledoval, za jak dlouho dojde k jejich opravám. Změny jsem prováděl ve stejných článcích, které jsem předtím podrobil analýze v druhé části předchozího testu. Pro co nejlepší možnost porovnání jsem do anglické a české verze zanášel co možná nejpodobnější chyby bez ohledu na použitý jazyk. 78
Rozdíl mezi oběma verzemi byl opět v rozsahu použitých článků, kdy anglické verze obsahovali mnohem více informací, ve kterých často bylo obtížné určit, do jaké sekce je třeba chybu zavést. Také se u anglických článků vyskytuje podvojnost informací. To znamená, že určitá informace se v jiných kontextech nachází na několika místech v článku, a proto je třeba je pro úspěšný vandalismus provést změny několikrát. V mém testu jsem, s ohledem na co největší shodnost s testováním českých článků, tyto násobné editace neprováděl a vždy jsem chybu zanesl jen jednou do každého článku. Popis provedených změn V každé verzi jsem provedl 14 změn na 14 článcích (celkem tedy 28 vandalismů). V popisu je název článku, popis chyby, datum a čas provedení, datum a čas revertu a zhodnocení. Pokud chyba zůstala neopravena po dobu jednoho týdne, tak jsem ji revertoval sám. Změny v článcích jsou zobrazeny na obrázcích č. 13-40 (pocházejí z porovnávajícího zobrazení dvou po sobě jdoucích verzí článků). Červeně zvýrazněny jsou části textu, které prošly změnou.
11.4.1 Škodlivé editace v české verzi 1) Plzeň 11. dubna 2012, 23:49 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Úprava v historické sekci.
Obr. č. 13. Úprava provedená na článku Plzeň | zdroj: cs.wikipedia.org
Hodnocení: Tato chyba není zásadním narušením hodnoty článku, ale větší množství takovýchto nesrovnalostí by celkovou hodnotu článku značně degradovalo.
79
2) Vodní pólo 11. dubna 2012, 23:54 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Úprava pravidel o držení míče jednou rukou.
Obr. č. 14. Úprava provedená na článku Vodní pólo | zdroj: cs.wikipedia.org
Hodnocení: Tato chyba podstatně narušovala informační hodnotu článku, protože významně upravovala uváděná základní pravidla této hry. 3) Daniel Hůlka 11. dubna 2012, 23:57 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Záměna místa studia.
Obr. č. 15. Úprava provedená na článku Daniel Hůlka | zdroj: cs.wikipedia.org
Hodnocení: Vzhledem k malému rozsahu článku je i tato malá změna poměrně výrazné zasažení do jeho hodnoty. 4) Bankovní institut vysoká škola 12. dubna 2012, 0:00 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Změna historické části článku.
Obr. č. 16. Úprava provedená na článku BIVŠ | zdroj: cs.wikipedia.org
80
Hodnocení: Zásadní změna historických údajů školy, která hrubě narušila hodnotu článku. 5) Vysoká škola ekonomická 12. dubna 2012, 0:12 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Pozměněný princip příjímacího řízení.
Obr. č. 17. Úprava provedená na článku VŠE | zdroj: cs.wikipedia.org
Hodnocení: Opět významné narušení informací. Zvlášť změna požadavků na NSZ může být pro mnoho studentů zásadní informace. 6) MotoGP 12. dubna 2012, 0:07 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vymyšlené údaje o kategorii Moto3.
Obr. č. 18. Úprava provedená na článku MotoGP | zdroj: cs.wikipedia.org
Hodnocení: Zcela zavádějící smyšlená informace, která vede k významnému znehodnocení článku.
81
7) Opencard 12. dubna 2012, 0:10 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Úprava způsobu načítání karty.
Obr. č. 19. Úprava provedená v článku Opencard | zdroj: cs.wkipedia.org
Hodnocení: Také silné narušení článku, které může v krajním případě vést i ke ztrátě důvěry uživatele nebo k přehnaným obavám ze zneužití. 8) Jižní město 12. dubna 2012, 0:13 -> 12. dubna 2012, 3:44 Celková doba opravy: 3 hodiny 31 minut Popis: Změna orientace sídliště dle světových stran.
Obr. č. 20. Úprava provedená na článku Jižní město | zdroj: cs.wikipedia.org
Hodnocení: Zavádějící chyba, která však byla opravena během relativně krátké doby. Přesto čas opravy převyšuje průměrné hodnoty oprav standardních vandalismů. 9) UML 12. dubna 2012, 10:21 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Změna názvu a zkratky organizace a drobná změna letopočtu.
Obr. č. 21. Úprava provedena na článku UML | cs.wikipedia.org
82
Hodnocení: Úprava data a zásah do názvu firmy, která se podílela na vzniku tohoto jazyka, jsou důležité změny, a degradují článek. 10) Elektrostatická indukce 12. dubna 2012, 10:25 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vložení nesmyslné věty to těla článku.
Obr. č. 22. Úpravy provedené na článku Elektrostatická indukce | zdroj: cs.wikipedia.org
Hodnocení: Naprosto nesmyslná informace, kterou jsem vložil do hlavní části textu. Oproti předpokladu přežila bez revertu celý týden. Zde se může jednat o problém ověřitelnosti informace z webových zdrojů. Pokud totiž vandal provede změny také na anglické verzi, může se editor milně domnívat, že informace je správná.
11) Safír 12. dubna 2012, 10:27 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Změna chemické koncovky oxidu a přidání několika možných příměsí.
Obr. č. 23. Úprava provedená na článku Safír | zdroj: cs.wikipedia.org
Hodnocení: Změna chemického názvu doprovodného nerostu se jeví jako méně významná. Stěžejní bod této editace je v doplnění nepravdivé informace, že zabarvení safír způsobuje i měď, popřípadě hořčík.
83
12) Laos 12. dubna 2012, 10:31 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Reformulace historických událostí.
Obr. č. 24. Úprava provedená na článku Laos | zdroj: cs.wikipedia.org
Hodnocení: Vložení vymyšlené informace o neexistujícím státním zřízení je podstatná změna, která by si zasloužila rychlý revert. 13) Rýže 12. dubna 2012, 10:38 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vložení smyšleného textu.
Obr. č. 25. Úprava provedená na článku Rýže | zdroj: cs.wikipedia.org
Hodnocení: Kompletně smyšlená informace, včetně údajné nizozemské organizace. Další ukázka toho, že na Wikipedii mají šanci na udržení i nepravdivé informace. Naprostá absence zdroje by měla vést k okamžitému smazání příspěvku. Další důvod by mělo být neencyklopedické a nekonkrétní podání textu, které vlastně vůbec nic nesděluje.
84
14) Planckova konstanta 12. dubna 2012, 10:44 -> 12. Dubna 2012, 13:44 Byla provedena pouze oprava pravopisných chyb se zachováním nepravdivých informací. Chyba zůstala neopravena po dobu jednoho týdne. Popis: Informace o neexistujícím výzkumu.
Obr. č. 26. Úprava provedená na článku Planckova konstanta | zdroj: cs.wikipedia.org
Hodnocení: Nesmyslná věta o smyšleném výzkumu bez jakýchkoliv zdrojů by dle očekávání neměla vydržet příliš dlouho. Opět se ukazuje, že pokud vandalská editace obsahuje náznaky odbornosti, tak je případný editor opatrný a nepřistupuje k okamžitému revertu.
11.4.2 Škodlivé editace v anglické verzi 1) Manchester 14. dubna 2012, 17:30 -> 14. dubna 2012, 20:18 Celková doba opravy: 2 hodiny 48 minut Popis: Změna názvu stavby.
Obr. č. 27. Úprava provedená na článku Manchester | zdroj: en.wikipedia.org
Hodnocení: Relativně nepodstatná byla opravena v čase pod tři hodiny. I tento čas je v porovnání s rychlostmi revertů v předchozích testech nadprůměrně dlouhý (srovnání se sledovanými vandalismy v historických záznamech).
85
2) Water polo 14. dubna 2012, 17:40 -> 15. dubna 2012, 19:47 Celková doba opravy: 26 hodin 7 minut Popis: Úprava popisu pravidel.
Obr. č. 28. Úprava provedená na článku Water polo | zdroj: en.wikipedia.org
Hodnocení: Stejná chyba jako v české verzi byla opravena následující den, což představuje přes 26 hodin nekonzistentnosti článku. Zde je však poměrný dopad nižší než u české verze, vzhledem k celkovému rozsahu článku (viz. srovnávací test). 3) Pendulum (hudební skupina) 14. dubna 2012, 17:52 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Změna místa vzniku kapely.
Obr. č. 29. Úprava provedená na článku Pendulum (band) | zdroj: en.wikipedia.org
Hodnocení: Tato nepravdivá editace mění důležitý fakt o celé skupině. Očekával jsem, že tato editace bude některým z fanoušků skupiny velice rychle odstraněna, což se však nestalo. Jistý matoucí prvek může být fakt, že městečko Bunbury se nachází velice blízko Perthu a tak se může zdát, že v tom editu jde jen o upřesnění místa.
86
4) University of South Florida 14. dubna 2012, 17:55 -> 14. dubna 2012, 23:56 Celková doba opravy: 6 hodin 1 minuta Popis: Drobné úpravy v datu a historickém názvu školy.
Obr. č. 30. Úprava provedená na článku University of South Florida | zdroj: en.wikipedia.org
Hodnocení: Revert se dostavil po šesti hodinách od nesprávné editace, což představuje zhruba trojnásobek průměru u tohoto článku dle předchozích měření. 5) Yale 14. dubna 2012, 19:08 -> 14. dubna 2012, 21:59 Celková doba opravy: 2 hodiny 51 minut Popis: Nenápadná změna historického názvu školy.
Obr. č. 31. Úprava provedená na článku Yale | zdroj: en.wikipedia.org
Hodnocení: V tomto rozsáhlém článku je provedená změna spíše nedůležitého charakteru. I tak byla opravena v době kratší než tři hodiny.
87
6) MotoGP 14. dubna 2012, 18:22 ->14. Dubna 2012, 19:39 byla provedena korekce nejzásadnější chyby (obsah). Ke kompletní opravě však nedošlo ani po týdnu (údaj o váhovém limitu). Popis: Nesprávný popis kategorie Moto3.
Obr. č. 32. Úprava provedená na článku MotGP | zdroj: en.wikipedia.org
Hodnocení: Nestandardní průběh korekce, kde došlo k opravě části vandalismu, ale nedošlo k jeho úplnému revertu. Údaj o váhovém (nesmyslném) limitu zůstal v těle textu a tím dále snižuje jeho kredibilitu. U tohoto článku proběhla úprava uživatelem bez registrace, což napovídá, že si pravděpodobně všiml chyby při čtení článku (většina rychlých revertů pochází od správců, kteří mají speciální software na sledování chyb). 7) Oystercard 14. dubna 2012, 18:26 -> 14. dubna 2012, 22:58 Celková doba opravy: 4 hodiny 32 minut Popis: Vložení informace o možnosti čtení karty na vzdálenost 2 metrů.
Obr. č. 33. Úprava provedená na článku Oyster card | zdroj: en.wikipedia.org
Hodnocení: Změna podobného typu jako u článku o Opencard se na anglické verzi „ohřála“ méně než pět hodin. Snadnějšímu odhalení mohl dopomoct špatný přepočet mezi centimetry a palci, který neodpovídá skutečnosti a tak mohl upoutat případného korektora.
88
8) Charlton- London 14. dubna 2012, 18:30 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Změna orientace předměstí dle světových stran.
Obr. č. 34. Úprava provedená na článku Charlton, London | zdroj: en.wikipedia.org
Hodnocení: Podobná chyba jako byla provedena v českém článku o Jižním městě, zde vydržela podstatně déle. Změna údaje o umístění předměstí znamená výrazné narušení hodnoty. 9) UML 14. dubna 2012, 18:34 -> 14. dubna 2012, 20:24 Celková doba opravy: 1 hodina 50 minut Popis: Změna názvu a zkratky organizace a změna jednoho letopočtu.
Obr. č. 35. Úprava provedená na článku UML | zdroj: en.wikipedia.org
Hodnocení: Zde došlo k relativně rychlé opravě, která vrátila kvalitu článku na původní úroveň.
89
10) Electrostatic induction 14. dubna 2012, 18:41 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vložení vymyšlené informace.
Obr. č. 36. Úprava provedená na článku Electrostatic induction| zdroj: en.wikipedia.org
Hodnocení: Stejně nesmyslná informace jako v českém článku se i zde udržela velmi dlouho, ačkoliv nemá žádný zdroj. 11) Sapphire 14. dubna 2012, 18:44 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Přidány smyšlené informace.
Obr. č. 37. Úprava provedená na článku Sapphire | zdroj: en.wikipedia.org
Hodnocení: Tato editace se stejně jako u české verze odolala opravě déle než jeden týden. Změna provedena v článku je z mého pohledu také zásadní, a pokud by někdo nabízené informace použil jako zdroj, tak by tím svojí práci poškodil.
90
12) Laos 14. dubna 2012, 18:48 -> 14. dubna, 23:59 Celková doba opravy: 5 hodin 11 minut. Popis: Přidání smyšlených informací.
Obr. č. 38. Úprava provedená na článku Laos | zdroj: en.wikipedia.org
Hodnocení: Minoritní úprava se v dlouhém článku o této zemi zdá jako nepodstatná. I tak částečně narušovala hodnotu článku déle než pět hodin. 13) Rýže 14. dubna 2012, 18:54 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vložení vymyšlené informace o neexistujícím výzkumu.
Obr. č. 39. Úprava provedená na článku Rice | zdroj: en.wikipedia.org
Hodnocení: Vložení stejné informace jako v české verzi odolává také po dobu delší než 1 týden. Naprostá nepřítomnost jakéhokoliv zdroje je atribut, který by měl vést k okamžitému zkoumání takové editace.
91
14) Planckova konstanta 14. dubna 2012, 19:01 -> Chyba zůstala neopravena po dobu jednoho týdne. Popis: Vložení vymyšlené informace o neexistujícím výzkumu.
Obr. č. 40. Úprava provedená na článku Planck constant | zdroj: en.wikipedia.org
Hodnocení: Podobný edit jako v případě článků o rýži. Ani zde nedošlo k rychlému napravení vzniklého vandalismu. Dokonce jiný uživatel vytvořil pro můj výmysl nový odstavec s názvem výzkum. Takto zařazená informace by měla velkou naději na setrvání v článku po velice dlouhou dobu. V rámci způsobení co nejmenších škod na informacích jsem však všechny svoje vandalské činy po týdnu revertoval.
11.4.3 Vyhodnocení testu pomocí vkládání vlastních chyb Oproti očekávání vydržela většina chyb v české verzi a polovina chyb ve verzi anglické déle než jeden týden. Všechny časy oprav jsou graficky zpracovány v tabulce č. 38 (červené označení buňky znamená, že chyba nebyla opravena v intervalu jednoho týdne od jejího vytvoření).
92
Tabulka průběhu testu vkládáním vlastních chyb
Názvy článků
Doba opravy [hod:min] CS
EN
Plzeň/Manchester
2:48
Hůlka/Pendulum BIVŠ/USF
6:01
VŠE/Yale Jiţní město/Charlton
2:51 3:31
Open/Oystercard
4:32
Vodní pólo
26:07
MotoGP UML
1:50
Elektrostatická indukce Safír Laos
5:11
Rýţe Planckova konstanta Podíl opravených článků:
7%
50%
3:31 7:02 Průměrný čas na opravu: Tabulka č. 38. Provedených revertů po vkládání vlastních chyb | zdroj: vlastní
V tomto testu často selhaly opravné mechanismy a tyto výsledky mohou být hodnoceny jako nelichotivé. Pouze jediný článek ze čtrnácti testovaných v české verzi Wikipedie byl opraven. Zbytek zůstal bez povšimnutí stejně jako sedm článků v anglické verzi. Jako velice překvapivé považuji setrvání naprosto nesmyslných informací o vymyšlených výzkumech, které neměli nic společného s encyklopedickým podáním informacích a s uváděním relevantních zdrojů. Je však nutné zmínit fakt, že provedené opravy se týkali vždy jen malých částí článků, protože při poškozování většího úseky textu dochází zpravidla k okamžité korekci. Tento způsob drobného vandalismu schovaného v závoji správné editace se mi jeví jako jeden z možných způsobů poškozování informací vandaly na Wikipedii. Na rozdíl od klasického vandalismu (sprostá slova, vtipy) nemusí běžný uživatel tyto chyby okamžitě rozeznat. V přiložené tabulce lze sledovat, že pokud byly chyby opraveny, stalo se tak přibližně během prvních šesti hodin. Pokud chyby přečkali tuto hranici, tak už ve většině případů zůstaly neopraveny. Pouze anglické článek o vodním pólu byl oproti tomuto trendu opraven po 26 hodinách.
93
11.5 Celkové shrnutí praktického testu dvou verzí Wikipedie Z mého pohledu, po vyhodnocení všech získaných údajů a načerpaných zkušeností, se „pravý“ vandalismus na serveru wikipedia.org projevuje jako minoritní jev, který zásadně neovlivňuje nabízené informace. Větší riziko pro konzistenci informací představují nesprávné úpravy, často provedeny s dobrým úmyslem. Na rozdíl od rychlých revertů, reagujících na očividné vandalství, se opravy nechtěných chyb prodlužují do mnohdy několikahodinové délky. To částečně dokazuje mnou provedený test, kde informace, které se tváří na první pohled seriózně setrvávají v textu několik dní bez povšimnutí. Pokud by někdo chtěl cíleně škodit Wikipedii jako vandal, jeví se mi taková metoda jako nejúčinnější z mnou pozorovaných. Otázka zůstává, z čeho by vyvstávala motivace pro takové chování. Nenápadnou editaci je třeba provést důkladně a to zabírá nezanedbatelné množství času. A i v případě, že by se takový vandal našel, tak není v možnostech jednotlivce výrazně ovlivnit signifikantní množství článků. Navíc neustále revertování způsobených škod působí jako značně demotivační prvek. Z provedených analýz již proběhlého vandalství vyplývá, že pravděpodobnost „trefení“ článku, který je pod vlivem vandala, je hluboko pod hranicí desetiny procenta. Pokud už by k takové události došlo, tak je často narušena jen zanedbatelná část článku, kterou čtenář lehce dokáže identifikovat. Před začátkem testu jsem se domníval, že většina špatných editů bude vrácena na základě upozornění běžných uživatelů, kteří na ni při čtení narazí. Realita ukázala, že velkou většinu revertů provádějí registrovaní uživatelé s pokročilými právy pro správu systému (často za pomoci speciálního softwaru). V průběhu těchto testů jsem často pracoval s myšlenkou vytvoření určité nástavby informační databáze Wikipedie. Tu jsem popsal v následující sekci.
11.5.1 Možnost tvorby oficiální informační databáze Rozsáhlá databáze, která se nachází na serverech wikipedia.org je ceněný zdroj vědomostí pro uživatele, kteří nepožadují oficiální cestou ověřené informace. Dle mých zkušeností, většina uživatelů používá nabízené informace k zorientování v daném tématu, popřípadě k hledání zdrojů dalšího studia. Často díky článkům na Wikipedii získávají základní kostru vědomostí a mají tím lepší výchozí pozici pro čerpání podrobných informací z oficiálních zdrojů. Nabízí se pak otázka: proč neposkytnout s pomocí Wikipedie oficiální prameny vědomostí?
94
Realita takového „dvoj-systému“ by mohla vypadat takto: Existuje sesterský portál, na kterém se soustřeďují kvalitně zpracované informace z Wikipedie. Funguje spolehlivý systém definitivního schvalování informací (stejně jako v případě tištěných publikací), které se posléze stávají oficiálními prameny a dají se uvádět na stejné úrovni jako například tištěné publikace nebo oficiální online dokumenty. Tento přidružený server prostřednictvím poskytování reklamy získává tolik důležité finanční prostředky, které by poté zpětně plynuli na provoz a zlepšování samotné Wikipedie. Díky dostatečnému financování má wiki část systému otevřené dveře k vylepšování jejího fungování a generování hodnotného obsahu pro vytváření oficiální databáze. Oba portály jsou propojeny. To znamená, že wiki stránka o tématu nabízí přechod na oficiální ověřenou část a naopak. Uživatel má také možnost zobrazit obě verze vedle sebe pro porovnání. Pokud se chce o téma dále zajímat, může toto porovnání použít k odhalení částí, které potřebují kvalitnější zdroje, aby mohli být zařazeny do oficiální verze. Tím může svým dílem přispět do konceptu komunitní tvorby informační hodnoty. Překážka tohoto systému by mohla spočívat v neochotě některých organizací, podporovat tvorbu takových veřejně dostupných zdrojů, protože určité zájmové skupiny se brání odlivu kapitálu, který k nim proudí díky komerčnímu systému nabízení takového obsahu prostřednictvím autorských práv. Tuto skutečnost potvrzují spory okolo omezování svobody informací, které se odehrávali na počátku roku 2012, kvůli připravované dohodě A. C. T. A., která měla zásadním způsobem ovlivnit práva uživatelů internetu při práci s předměty duševního vlastnictví. Do jisté míry se tím ukazuje, že pokud společnost aplikuje principy kapitalismu při správě duševního vlastnictví, může tím nevědomky brzdit vlastní rozvoj. Ve stejné analogie, však myšlenka volně nabízeného obsahu naráží na srovnatelné problémy, se kterými se potýká teorie ryzího společenského socialismu. Totiž, že může nastat situace, kdy bude nedostatek motivace jednotlivců přispívat do takového systému vlastní prací a vědomostmi.
95
Na závěr citát anglického dramatika a prozaika G. B. Shaw: Když máte jedno jablko a já mám jedno jablko a ta jablka si vyměníme, tak stále budeme mít každý jedno jablko. Ale pokud máte myšlenku a já mám myšlenku a ty myšlenky si vyměníme, tak každý z nás bude mít dvě myšlenky.22 Autor byl zastáncem takzvanému fabiánského socialismu (přechod k socialismu pomocí reforem parlamentní cestou).
22
Zdroj: http://citaty.kukulich.cz/temata/mysleni/8
96
Závěr Závěrem bych rád zhodnotil celkový náhled na způsob tvorby wiki. Rozhodně je třeba si uvědomit, že takto vzniklý obsah často nabízí kvalitní informace, které se dají mnohdy srovnat s těmi, které jsou nabízené tradiční cestou. Ze samotného principu tvorby obsahu wiki systému je však zřejmé, že takové informace mohou sloužit pouze k vytvoření základního pohledu na problém, protože i přes všechny opatření, nemohou garantovat oficiální správnost. To platí zejména v případě serveru wikipedia.org, který je v současnosti jednou z nejvíce využívaných služeb na celé internetové síti. Nabízí obrovskému množství uživatelů základní informace téměř ze všech oblastí lidské vzdělanosti. Tím také plní své poslání, kdy se vlastně ani nesnaží o povýšení této své funkce. Celé fungování wiki systému by se dalo přirovnat k společnosti lidí, která se řídí určitými pravidly a snaží se o svůj pozitivní vývoj. Většina lidí se poté pravidly řídí a přispívá tak k cestě správným směrem, ale zároveň se vyskytují jedinci, kteří svým jednáním celou společnost poškozují, ať vědomě či nevědomě. Většinová společnost se s oběma případy snaží vyrovnat zaváděním opatření pro maximální eliminaci takového jednání. Na jedné straně je to snaha o správnou interpretaci pravidel, tak aby nedocházelo k omylům, a na druhé straně je to účinná práce s negativními vlivy. Pokud se nedaří eliminovat narušovaní společnosti „domluvou“, je třeba přistoupit k určitým represivním opatřením například prostřednictvím částečného omezení svobody (v případě wiki systémů je to zákaz editace). Stejně jako v lidské společnosti, je v případě wiki systému stěžejní otázka míra participace jednotlivých členů na jejím rozvoji. V případě, že jednotlivci nejsou ochotni poskytnout své vědomosti a zdroje pro dobro společnosti, brzdí se zásadním způsobem i rozvoj celého systému. To se dle mých závěrů částečně děje na webové encyklopedii Wikipedia, kde je stále velké množství tzv. černých pasažérů, kteří pouze čerpají informace, ale nepodílí se na jejich tvorbě. Tento jev se výrazněji projevu také na české verzi, kde připadá na jednoho editora mnohem více článků než v případě verze anglické. Tento nedostatek účasti většiny uživatelů však vyvažuje ohromné nasazení aktivních editorů, kteří i v relativně malém počtu dokáží udržovat kvalitu nabízeného obsahu na vysoké úrovni. V praktické části bakalářské práce došlo ke korekci původních předpokladů. Nepotvrdila se domněnka, že na správnosti nabízeného obsahu se podílejí hlavně běžní uživatelé. Hlavní funkčnost celého systému zajišťují registrovaní editoři a správci, kteří se v počtu několika stovek lidí snaží udržet konzistenci obsahu na co nejvyšší úrovni. To se dle výsledků 97
provedených testů ve většině případů daří. Velká část sledovaných vandalismů byla opravena v přijatelném čase a zásadně tak neovlivňovala hodnotu celé informační databáze. V případě vkládání promyšlených vandalismů (těžko odhalitelné pro editora), je samo-opravná funkce značně nespolehlivá a ve většině případů selhala. V anglické verzi ještě opravné mechanizmy dokázali eliminovat přibližně polovinu závadných editací, avšak v případě česky psané verze zůstala většina článků v neopraveném stavu po dobu delší než jeden týden. V dílčím srovnání rozsahu ekvivalentních článků se potvrdil předpoklad, že články s podobnou tématikou jsou na anglické verzi výrazně kvalitnější, když dle mých zjištění obsahují přibližně pětkrát více slov. Tím se potvrdila statistická data uvedená v obecné části. V případě dalšího rozšiřujícího testování těchto „samo-opravných“ funkcí bych se zaměřil vyhodnocování většího množství článků pro zvýšení hodnoty takového průzkumu. Pro porovnání mnou vypozorovaných výsledků bych použil čistě statistické vyhodnocení vandalismu na základě algoritmického hodnocení (za použití softwaru). Další alternativou pro zkoumání fungování wiki systémů by mohl být dlouhodobý test v podobě opakovaného rozsáhlého narušování obsahu. Pro hodnocení by sloužilo sledování, do jaké míry se dokáže systém s takto destruktivním narušováním vypořádat.
98
Seznam použité literatury Knižní publikace EBERSBACH, A.; Markus Glaser a Foreword by Gunter DUECK. Wiki: web collaboration. 2nd ed., rev. and enl. ed. Berlin: Springer, 2007. ISBN 35-403-5150-7. LEUF, B.; CUNNINGHAM, W. The Wiki way: quick collaboration on the Web. 2nd ed., rev. and enl. ed. Boston: Addison-Wesley, c2001, 435 s. ISBN 02-017-1499-X. Dokumenty dostupné online AUGAR, N.; RAITMAN, R.; ZHOU, W.: Teaching and learning online with wikis. In R. Atkinson, C. McBeath, D. Jonas-Dwyer & R. Phillips (Eds), Beyond the comfort zone: Proceedings of the 21st ASCILITE Conference, 2004 (pp. 95-104). Perth, 5-8 December. [online] Dostupné z WWW:
BLACK, P.; DELANEY, H.; FITZGERALD, B. (2007), Legal Issues for Wikis: The Challenge of User-generated and Peer-produced Knowledge, Content and Culture, 14, eLaw J., p. 245 [online]. 2007, [cit. 2012-04-06]. Dostupné z WWW: BOULOS, M.; MARAMBA, I.; WHEELER, S.: Wikis, blogs and podcasts: a new generation of Web-based tools for virtual collaborative clinical practice and education, 2006, BMC medical education, [online] Dostupné z WWW:< http://www.biomedcentral.com/14726920/6/41> Interenetové zdroje 50 ways to use Wikis for a more collaborative and interaktiv classroom. Www.smartteaching.org [online]. 2012 [cit. 2012-04-06] Dostupné z WWW: Benefits of using Wikis in the Classroom. Www.bc.edu [online]. 2012 [cit. 2012-04-06]. Dostupné z WWW: Bot policy. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-02-05]. Dostupné online z WWW: Bots. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-02-05]. Dostupné online z WWW: 99
ClueBot_NG. In: Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-04-25]. Dostupné online z WWW: CUNNINGHAM, W.: WHat is a Wiki, WikiWikiWeb [online]. 2002, [cit. 2012-04-02]. Dostupné z WWW: < http://www.wiki.org/wiki.cgi?WhatIsWiki> Česká Wikipedie. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-04-08]. Dostupné z WWW: List of wiki software. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-04-08]. Dostupné z WWW: Neutral point of view. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-04-08]. Dostupné z WWW: < http://en.wikipedia.org/wiki/Wikipedia:NPOV> Spam blacklist/ About. Meta.wikimedia.org [online]. 2012 [cit. 2012-04-04]. Dostupné z WWW: The motivation of a vandal. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-02-03]. Dostupné online z WWW: Vandalism on Wikipedia. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-02-03]. Dostupné online z WWW: < http://en.wikipedia.org/wiki/Vandalism_on_Wikipedia> Vandalism types. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-02-03]. Dostupné online z WWW: Wiki. Www.britannica.com [online]. 2012, [cit. 2012-04-02]. Dostupné z WWW: . Wikipedia. Wikipedia: the free encyclopedia [online]. San Francisco (CA): Wikimedia Foundation, 2012 [cit. 2012-04-08]. Dostupné z WWW:
100
Seznam použitých tabulek Tabulka č. 1. Základní přehled syntaxe wiki-textu | Zdroj: en.wikipedia.org Tabulka č. 2. Statistika dvaceti nejrozsáhlejších verzí Wikipedie Zdroj dat: http://s23.org/wikistats/wikipedias_html.php Tabulka č. 3. Soupis škodlivých editací za rok 2011 v článku Václav Klaus | zdroj: cs.wikipedia.org Tabulka č. 4. Vandalismus v roce 2011 v článku Německo| Zdroj: cs.wikipedia.org Tabulka č. 5. Vandalismus v roce 2011 v článku USA | zdroj: cs.wikipedia.org Tabulka č. 6. Vandalismus v roce 2011 v článku První světová válka | Zdroj: cs.wikipedia.org Tabulka č. 7. Vandalismus v roce 2011 v článku Adolf Hitler | zdroj: cs.wikipedia.org Tabulka č. 8. Vandalismus v roce 2011 v článku Mark Zuckerberg | zdroj: cs.wikipedia.org Tabulka č. 9. Vandalismus v roce 2011 v článku Egypt | zdroj: cs.wikipedia.org Tabulka č. 10. Vandalismus v roce 2011 v článku Slunovrat | zdroj: cs.wikipedia.org Tabulka č. 11. Vandalismus v roce 2011 v článku J. A. Komenský | zdroj: cs.wikipedia.org Tabulka č. 12. Vandalismus v roce 2011 v článku Procesor | zdroj: cs.wikipedia.org Tabulka č. 13. Vandalismus v roce 2011 v článku Google | zdroj: en.wikipedia.org Tabulka č. 14. Vandalismus v roce 2011 v článku Qatar | zdroj: en.wikipedia.org Tabulka č. 15. Vandalismus v roce 2011 v článku WikiLeaks | zdroj: en.wikipedia.org Tabulka č. 16. Vandalismus v roce 2011 v článku WW1 | zdroj: en.wikipedia.org Tabulka č. 17. Vandalismus v roce 2011 v článku Johnny Depp | zdroj: en.wikipedia.org Tabulka č. 18. Vandalismus v roce 2011 v článku Cloud computing | zdroj: en.wikipedia.org Tabulka č. 19. Vandalismus v roce 2011 v článku A. Einstein | zdroj: en.wikipedia.org Tabulka č. 20. Vandalismus v roce 2011 v článku Halloween | zdroj: en.wikipedia.org Tabulka č. 21. Vandalismus v roce 2011 v článku F-35 II | zdroj: en.wikipedia.org Tabulka č. 22. Vandalismus v roce 2011 v článku Salvia divinorum | zdroj: en.wikipedia.org Tabulky č. 23 až č. 35. Porovnání dvou ekvivalentních článků na anglické a české verzi | zdroj: en.wikipedia.org Tabulka č. 36. Porovnání stejných článků v anglické a české verzi | zdroj: vlastní z dat wikipedia.org Tabulka č. 37. Porovnání rozsahu článků s výrazně českou tématikou | zdroj: vlastní z dat wikipedia.org Tabulka č. 38. Provedených revertů po vkládání vlastních chyb | zdroj: vlastní
101
Seznam použitých grafů Obr. č. 1. Grafické znázornění podílu na návštěvnosti jednotlivých verzí | Zdroj dat: alexa.com Obr. č. 2. Počet článků nejrozsáhlejších verzí Wikipedie Zdroj dat: http://s23.org/wikistats/wikipedias_html.php Obr. č. 3. Graf poměru počtu článků na jednoho editora dle jazykových verzí Zdroj dat: http://s23.org/wikistats/wikipedias_html.php Obr. č. 8. Graf znázorňující průměr a medián časů oprav v praktickém testu | zdroj: vlastní Obr. č. 9. Graf počtu časů v jednotlivých intervalech | zdroj: vlastní výpočet Obr. č. 10. Graf procentuálního zastoupení všech časů oprav v jednotlivých intervalech | zdroj: vlastní výpočet Obr. č. 11. Graf znázorňující porovnání rozsahu ekvivalentních článků na dvou jazykových verzí Wikipedie | zdroj: vlastní Obr. č. 12. Graf porovnání článků o ryze českých tématech v obou jazykových verzích. | zdroj: vlastní
Seznam použitých obrázků Obr. č. 4. Varování na úvodní straně Wikipedie při opakovaném vandalismu | zdroj: cs.wikipedia.org Obr. č. 5. Oznámení o dočasném zablokování možnosti editace wikipedie | zdroj: cs.wikipedia.org Obr. č. 6. Ilustrační obrázek historických editací s vyznačeným vandalismem | zdroj: cs.wikipedia.org Obr. č. 7. Porovnání dvou verzí článků | zdroj: cs.wikipedia.org Obr. č. 13. Úprava provedená na článku Plzeň | zdroj: cs.wikipedia.org Obr. č. 14. Úprava provedená na článku Vodní pólo | zdroj: cs.wikipedia.org Obr. č. 15. Úprava provedená na článku Daniel Hůlka | zdroj: cs.wikipedia.org Obr. č. 16. Úprava provedená na článku BIVŠ | zdroj: cs.wikipedia.org Obr. č. 17. Úprava provedená na článku VŠE | zdroj: cs.wikipedia.org Obr. č. 18. Úprava provedená na článku MotoGP | zdroj: cs.wikipedia.org Obr. č. 19. Úprava provedená v článku Opencard | zdroj: cs.wkipedia.org Obr. č. 20. Úprava provedená na článku Jižní město | zdroj: cs.wikipedia.org Obr. č. 21. Úprava provedena na článku UML | cs.wikipedia.org Obr. č. 22. Úpravy provedené na článku Elektrostatická indukce | zdroj: cs.wikipedia.org Obr. č. 23. Úprava provedená na článku Safír | zdroj: cs.wikipedia.org Obr. č. 24. Úprava provedená na článku Laos | zdroj: cs.wikipedia.org Obr. č. 25. Úprava provedená na článku Rýže | zdroj: cs.wikipedia.org
102
Obr. č. 26. Úprava provedená na článku Planckova konstanta | zdroj: cs.wikipedia.org Obr. č. 27. Úprava provedená na článku Manchester | zdroj: en.wikipedia.org Obr. č. 28. Úprava provedená na článku Water polo | zdroj: en.wikipedia.org Obr. č. 29. Úprava provedená na článku Pendulum (band) | zdroj: en.wikipedia.org Obr. č. 30. Úprava provedená na článku University of South Florida | zdroj: en.wikipedia.org Obr. č. 31. Úprava provedená na článku Yale | zdroj: en.wikipedia.org Obr. č. 32. Úprava provedená na článku MotGP | zdroj: en.wikipedia.org Obr. č. 33. Úprava provedená na článku Oyster card | zdroj: en.wikipedia.org Obr. č. 34. Úprava provedená na článku Charlton, London | zdroj: en.wikipedia.org Obr. č. 35. Úprava provedená na článku UML | zdroj: en.wikipedia.org Obr. č. 36. Úprava provedená na článku Electrostatic induction| zdroj: en.wikipedia.org Obr. č. 37. Úprava provedená na článku Sapphire | zdroj: en.wikipedia.org Obr. č. 38. Úprava provedená na článku Laos | zdroj: en.wikipedia.org Obr. č. 39. Úprava provedená na článku Rice | zdroj: en.wikipedia.org Obr. č. 40. Úprava provedená na článku Planck constant | zdroj: en.wikipedia.org
103