FAKULTA INFORMATIKY A MANAGEMENTU UHK
SPAM nevyžádaná reklamní pošta
semestrální projekt předmětu OBDAI
Vypracoval: Obor: Forma: Ročník: Datum:
Martin Adámek IM 5 Denní 4. listopad-prosinec 2005
E-pošta:
martin
adamek cz
PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Obsah Obsah ....................................................................................................................................1 Úvod......................................................................................................................................2 Co je spam?........................................................................................................................2 Rozšíření spamu .................................................................................................................2 Encyklopedické definice.....................................................................................................3 Antispamový zákon............................................................................................................3 I mimo elektronické kanály ................................................................................................5 Získávání e-mailových adres................................................................................................6 Sdělením - marketing .........................................................................................................6 Zveřejněním - spamboti......................................................................................................7 Používáním ........................................................................................................................9 Existencí - freemail ..........................................................................................................10 Důkazy – dvouletý subdoménový výzkum........................................................................10 Ochrana e-mailových adres před spamboty......................................................................13 Bez odkazu „mailto:“ .......................................................................................................13 Zavináč ............................................................................................................................13 Textový přepis..................................................................................................................15 Zápis obrázkem ................................................................................................................16 Další způsoby ochrany......................................................................................................17 Ověřování e-mailových adres.............................................................................................20 Obrázky............................................................................................................................20 Odhlášení odběru..............................................................................................................22 Závěr...................................................................................................................................23 Prameny..............................................................................................................................24 Zdroje textů a informací ...................................................................................................24 Zdroje obrázků .................................................................................................................25
Spam Strana 1 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Úvod Co je spam? Spam je nevyžádaná reklamní pošta, nebo jiné nevyžádané sdělení, zpravidla komerčního charakteru, rozesílané hromadně mnoha příjemcům. Ale názory na to, co přesně je spam, se liší: • Za spam můžeme jednoznačně považovat zprávy zasílané automaticky mnoha adresátům, kteří si tyto zprávy neobjednali, a zejména nemají možnost odběr těchto zpráv zrušit. Tyto zprávy zpravidla přicházejí ze zahraničí, jsou psány nejrůznějšími jazyky (převládá angličtina) a nabízejí nejrůznější zboží - nejčastěji nelegální software nebo Viagru a podobné prostředky. Tyto zprávy často chodí opakovaně stejným příjemcům, přičemž mnohdy obsahují velmi podobnou nebo stejnou nabídku – upraveny jsou pouze vnitřně, aby je nezachytil spam-filtr, ale čtenáři se jeví jako stále stejná zpráva. • Slabší forma spamu je víceméně jednorázové a často ruční zasílání nabídek českými firmami, se spolehlivou možností zrušit odběr dalších zpráv – resp. většinou stačí nedat souhlas se zasíláním dalších zpráv a seriózní česká firma to respektuje. Takové e-maily mne většinou nechávají poměrně klidným, a občas odesílateli na oplátku zašlu nabídku svoji. Např. provozovatel nějaké horské chaty našel můj web o cykloturistice, a poslal mi nabídku cyklistického víkendu, který pořádal. Tak jsem mu jako doplňkový program nabídl cestopisnou prezentaci o mé cestě na kole do Monaka. Sice se nakonec ta víkendová akce pro nedostatek zájemců vůbec nekonala, ale jednou třeba může taková relevantní protinabídka přinést ovoce. • Někdy se také jako spamování hovorově označuje i hromadné přeposílání zajímavých e-mailových zpráv na distribuční seznam. Ale jelikož tito příjemci o přeposílání mají zájem, sami se ho aktivně zúčastňují, a mají možnost se kdykoliv z příjmu zpráv odhlásit, nelze v tomto případě o spamu mluvit. • Za spam samozřejmě nelze označit ani vyžádaný odběr informací z nějakého serveru nebo i příjem komerčních sdělení (akčních nabídek) nějaké firmy – pokud se příjemce sám zaregistroval, a odesílatel si autentičnost této registrace ověřil, například vhodně napsaným skriptem, který po registraci odesílá kontrolní mail a vyžaduje potvrzení registrace. Samozřejmostí je pak možnost kdykoliv odběr zpráv ukončit.
Rozšíření spamu Spam lze považovat za velmi rozšířený fenomén, postihující mnoho lidí používajících počítač. Zadáme-li heslo „spam“ do Googlu [pramen 1], nalezne cca. 230 miliónů odkazů. Před měsícem a půl to bylo 217 miliónů, čili o 13 mil. méně. A další 3 milióny odkazů v azbuce nalezneme Obrázek 1 pro výraz „спам“. Význam tohoto slova by měl dnes být znám i lidem, jejichž oborem nejsou informační a komunikační technologie. Proto mne docela překvapilo, že slovo „spam“ se mi ve Wordu 2000 podtrhává červenou vlnovkou, čili že v r.2000 nebylo obsaženo v českém kontrolním slovníku Microsoftu.
Spam Strana 2 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Encyklopedické definice Existuje mnoho definic spamu, podíváme se jen na některé z nich: Server asnwers.com [2] k heslu „spam“ uvádí: • „Unsolicited e-mail, often of a commercial nature, sent indiscriminately to multiple mailing lists, individuals, or newsgroups; junk e-mail.“ A zmiňuje i předpokládaný původ tohoto slova: • „From SPAM (probably inspired by a comedy routine on the British television series Monty Python's Flying Circus, in which the word is repeated incessantly).“ V české mutaci otevřené encyklopedie Wikipedie[4] nalézám nejen další definici, ale i podrobnější informaci o původu tohoto slova: • „Spam je nevyžádaný masově rozesílaný e-mail, případně jiné druhy internetové komunikace, nejčastěji reklamní. Používá se též zkratka UBE/UCE (Unsolicited Bulk/Commercial Email). Pro opak spamu, tj. poštu, která je zaslána konkrétní osobou se specifickým jednorázovým účelem a adresát ji považuje za žádoucí, se řidčeji používá termín ham (anglicky šunka).“ • „Název pochází ze značky amerických konzerv lančmítu (…), která se vyrábí od 30. let dodnes (v současnosti ale výrobce trvá na psaní velkým písmem SPAM) a za 2. světové války a po ní byla hojně rozšířená a stále méně oblíbená ve Velké Británii. Proto se objevuje v závěrečném skeči 25. dílu seriálu Monty Pythonův létající cirkus, kde všechny položky jídelního lístku v restauraci obsahují spam, i mnohokrát opakovaně, a spory zákazníků s číšnicí o objednávky přerušuje skupina Vikingů zpívajících "Spam, spam, spam..."“ Obrázek 2 • „Označení tak bylo přijato nejprve pro praktiku - konzerva SPAM mnohonásobného rozesílání téže zprávy na Usenetu, ale pak se význam posunul pro zneužívání skupin k šíření různých nepřípadných textů a přímo reklamy a zachoval se i poté, co se těžiště takových aktivit přesunulo do e-mailu.“ Server Coto.je[3] nenachází k výrazu „spam“ ani jednu položku. Tím získáváme důkaz, že „spam“ je poměrně nový jev, který přišel až s novými elektronickými prostředky komunikace - tento server vyhledává z Ottovy encyklopedie, Malé československé encyklopedie a Encyklopedie Universum.
Antispamový zákon Zákon č. 480/2004 Sb. „O některých službách informační společnosti a o změně některých zákonů“ [pramen 7] nabyl účinnosti dnem jeho vyhlášení, tj. 29. července 2004. Spamu se nejvíce týká §7 – „Šíření obchodních sdělení“: Odstavec 1: • Pokud fyzická nebo právnická osoba získá od svého zákazníka podrobnosti jeho elektronického kontaktu pro elektronickou poštu (…) může tato fyzická či právnická osoba využít tyto podrobnosti elektronického kontaktu pro potřeby šíření obchodních sdělení pouze za předpokladu, že zákazník dal předem prokazatelný souhlas k takovémuto
Spam Strana 3 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
využití svého elektronického kontaktu a má jasnou a zřetelnou možnost jednoduchým způsobem, zdarma nebo na účet této fyzické nebo právnické osoby, odmítnout souhlas s takovýmto využitím svého elektronického kontaktu i při zasílání každé jednotlivé zprávy. Odstavec 2: • Nejde-li o případ podle odstavce 1, je elektronické prostředky zakázáno použít pro šíření nevyžádaných obchodních sdělení; nevyžádané šíření obchodních sdělení není povoleno bez prokazatelného souhlasu adresáta. Odstavec 3: • Zaslání elektronické pošty za účelem šíření obchodního sdělení je zakázáno, pokud tato není zřetelně a jasně označena jako obchodní sdělení, skrývá nebo utajuje totožnost odesílatele, jehož jménem se komunikace uskutečňuje, nebo je zaslána bez platné adresy, na kterou by mohl adresát přímo a účinně zaslat informaci o tom, že si nepřeje, aby mu byly obchodní informace odesílatelem nadále zasílány. Maximální výši pokuty nalezneme v §11 „Správní delikty“, a činí 10 000 000 Kč. Antispamový zákon samozřejmě postihuje pouze české vypátratelné subjekty, které, jak už jsem uvedl výše, nejsou hlavními producenty nevyžádané pošty. Největší problém jsou zahraniční rozesilatelé nabízející pochybné produkty, a ti se tohoto zákona bát nemusí. Takže to vypadá, že antispamový zákon je vlastně zbytečný.
Obrázek 3 -„spam ničí komunikaci“
Podobný názor sdílí i článek „Převážně neškodný“[8] z 26.8.2004, jak ostatně naznačuje už samotný název článku. Uvádí případ, kdy kompetentní úřednici nestačily k prošetření českého spammera kompletní hlavičky e-mailů, a žádala „o zaslání potřebných dokladů z jejichž obsahu bude jednoznačně zřejmá vazba odesilatele na obsah přepravované zprávy“. Takže vlk-uživatel se teoreticky nažral, a koza-spammer rozhodně zůstala celá. Ale nalezl jsem i příklad opravdové účinnosti zmíněného zákona. Na webu sekty „Vesmírní lidé“ visí od června 2000 podrobný manuál [9] k šíření idejí tohoto spolku. Tento návod mimo jiné nabádá ke spamování pomocí elektronické pošty, dokonce uvádí využitelné zdroje adres. Tito Vesmírní lidé jsou přesvědčeni, že každý jedinec musí být jejich prostřednictvím nevyhnutelně informován o temných silách a pozitivní energii. V září 2004 se na tomto webu objevil antispamový zákon i s komentářem[10] I.Bendy, hlavy vesmírných lidí. V komentáři si stěžuje na to, že temné síly způsobují cenzuru pošty v parlamentu, médiích, i jiných organizacích – což usuzuje podle toho že nedostal odpověď na letáky, které zmíněným organizacím zaslal. V přímé souvislosti se zákonem je v komentáři uvedeno: • „Lidé mohou žádat úpravu zákona tak, aby bylo možno zasílat nekomerční zprávy, tedy nemající charakter obchodu za účelem zisku, ale duchovních – vztahových oblastí lidské společnosti! To, že něco nežádám, neznamená, že je to vždy negativní !!!“
Spam Strana 4 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Celý komentář působí dojmem, že pan Benda se zákonem sice nesouhlasí, ale hodlá ho neporušovat, a nabádá k tomu i své ovečky. Což znamená, že antispamový zákon alespoň částečně plní svůj účel.
I mimo elektronické kanály Tažení proti nevyžádané reklamě do pop3 a imap schránek v Čechách zasáhlo i obyčejné fyzické schránky na domech. V poslední době se na některých z nich objevily nápisy „Nevhazujte neadresnou reklamu“ nebo „Nevhazujte reklamní letáky“. Toto „neadresné rozesílání reklamních tiskovin“ je sice výrazně dražší, ale také účinnější než elektronický spam. Tato možnost je poměrně oblíbená. Kromě toho, že si firmy mohou roznos letáků po okolí zajistit svépomocí, nabízí tuto službu mnoho společností v čele s Českou poštou. Přestože se také jedná o nevyžádanou reklamu, většina lidí letáky bez problémů přijímá. Díky limitujícím finančním nákladům je objem papírové reklamy nižší než v případě e-mailu, navíc tyto letáky zpravidla obsahují relevantní a srozumitelný obsah nabízející služby v nejbližším okolí. A někdo letáky vítá, protože má doma kotel na tuhá paliva. Pokud jde o mne, tyto tiskoviny mi nevadí, zejména proto, že narozdíl od elektronického spamu se mi nepřeposílají textovými zprávami na mobil. Pouze mi přijde, že zbytečný tisk mnoha nečtených papírů je po ekologické stránce poněkud nešťastný. Česká pošta nabízí neadresný roznos letáků v zákazníkem zvolené oblasti, za příplatek je možné určit zda letáky půjdou do firem nebo do domácností. Navíc na webu Pošty[5] nalezneme i nabídku databáze adresních míst na CD. Takže pošta nabízí kompletní seznam adres pro zasílání „adresného“ spamu, kterému se příjemce nemůže vyhnout. Budiž nám uklidněním náklady na tisk, balení a doručení, které takovýto „papírový spam“ do značné míry limitují. Velmi rozšířeným doručovatelem plošné papírové reklamy je také „Česká reklamní pošta Ferda“. Na webu [6] této společnosti jsem ceník služeb nenalezl.
Obrázek 4 - „Nedělej si iluze, 90% z toho je spam...“
Spam Strana 5 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Získávání e-mailových adres Spammeři mají k dispozici více cest, kterými se mohou dostat k našim e-mailovým adresám. Tyto způsoby prozrazení adresy jsem rozdělil do čtyř skupin, od těch s jednoznačným zaviněním adresáta až po postupy proti kterým není obrany.
Sdělením - marketing Mnoho firem je natolik lačných po kontaktech na potenciální zákazníky, že se jim vyplatí pořádat pro sběr kontaktů nejrůznější akce. A nemusí se zdaleka jednat jen o marketingové firmy - týká se to i obchodních firem, které mohou velmi snadno oslovovat možné zákazníky právě elektronickou poštou. Svépomocí je to vyjde mnohem levněji než kdyby živily marketingové firmy. A distribuční seznam naplní snadno – stačí když na Invexu položí na pult akvárium, a každému kdo do něj vhodí vizitku dají nějakou drobnost, např. CD. Nebo z vhozených vizitek vylosují vítěze jedné zajímavější ceny. Další způsoby jsou typické spíše pro firmy, které se specializují na marketing. Např. telemarketingová společnost obvolává nejrůznější firmy (telefonní čísla už někde získala) podle kritéria, zadaného zákazníkem, a snaží se zjistit e-mailovou adresu na kterou může zaslat podrobnější informace o nabízených produktech. Podobně může specializovaná marketingová firma získat e-mailové adresy například při anketách a dotazníkových promo-akcích na ulicích. Pro dotyčnou firmu pak samozřejmě není problém informace (vč. elektronického kontaktu) získané v tomto projektu použít pro jiný projekt nebo je případně prodat jiné firmě. S tím souvisí např. i databáze adresních míst nabízená Českou poštou, jak jsem již zmínil v úvodu. Obrázek 7 Databáze s kontakty se pak stávají předmětem obchodu marketingových firem. Stačí jednou někomu sdělit svoji e-mailovou adresu, a ta může putovat do různých databází a jako jejich součást pak k dalším zákazníkům a odesilatelům spamu. Tyto databáze mohou podle způsobu jejich získání obsahovat nejrůznější doplňující informace – nejde tedy jen o pouhé seznamy elektronických adres pro spamování prostřednictvím e-mailu. Záznam o firmě obsahuje zejména telefonní čísla, jména kontaktních osob, zmíněné e-maily, ale třeba i přibližný počet zaměstnanců, právní formu (FO, spol s.r.o., a.s., ...), obor činnosti, typ činnosti (výroba, obchod, služby, ...), region, příp. přesnou adresu. Těchto upřesňujících údajů se používá k filtrování při telemarketingových akcích a jejich následnému zefektivňování. Když jsem kdysi velmi krátce brigádničil jako operátor v call-centru, při jedné telemarketingové akci jsme nabízeli nápojové automaty. Volali jsme firmám nad 50 zaměstnanců, u kterých byla větší pravděpodobnost úspěchu. Informace ale nejsou cenné jen v případě firem. Velmi zajímavá jsou i data o „obyčejných“ lidech. V uvedeném call-centru se mj. nabízely knihy jednoho vydavatelství specializujícího se na zásilkový obchod s mnoha pochybnými akcemi na podporu prodeje. Celková marketingová strategie této firmy se pohybovala a pohybuje na hranici morálních zásad. Ceny vysoké, kvalita průměrná, a obchodní praktiky zákeřné. Protože jsem se nechtěl podílet
Spam Strana 6 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
na okrádání důvěřivých babiček, odmítl jsem uskutečnit pro tohoto zákazníka byť jediný hovor. A jelikož v jiných projektech nebylo místo, práci v call-centru jsem raději ukončil. Jedna z praktik této firmy spočívala v obvolávání lidí, kteří mají svátek nebo narozeniny - právě na základě zjištěných osobních údajů. Starší paní neznalou dnešních poměrů samozřejmě potěší, že si na ni někdo vzpomněl, blahopřeje jí k narozeninám, a i když se osobně neznají, tak jí ten neznámý dobrodinec sám od sebe dokonce nabízí dárek. Zpravidla slevu na nějakou knihu nebo třeba knihu zdarma při objednání jiné. Takový zákazník netuší, že správně nadefinovaný pohled do databáze vyfiltruje vedle něj spousty dalších lidí, kteří také mají v nejbližších dnech narozeniny, a že taková akce trvá stále, po celý rok, a nikomu vůbec nejde o něj. Zákazník netuší, že je pro nabízející firmu jen obyčejná položka v databázi, nic víc. Nejde tady vůbec o osobní přístup, a už vůbec ne o to blahopřání. Je to pouze jedna Obrázek 8 z metod automatizovaného soukolí lidí a strojů pro generování zisku. Z uvedeného vyplývá jediný způsob obrany proti nežádoucím nabídkám všeho druhu – nic zbytečně nevyplňovat, a pokud je to možné, tak nabízejícím firmám nesdělovat e-mail, jiné kontakty, ale ani další doplňující údaje. Je nutné si uvědomit, že osobní/firemní data jsou cennější než přívěsek nebo jiný bonus nabízený za vyplněný dotazník. To platí pro firmy i pro soukromé osoby. Pokud už mne nějaká nabídka opravdu zaujme, tak se zeptám jestli bližší informace naleznu na nějakém webu. Raději si dám práci s poznamenáním nebo zapamatováním něčí webové adresy, než abych podezřelé (marketingové) firmě sdělil svůj e-mail. Svoji elektronickou adresu jsem neprozradil ani mému mobilnímu operátorovi, kterému jinak musím důvěřovat. Poté co jsem několikrát odpověděl, že do databází e-mail neuvádím, objevil se v mých kontaktních informacích záznam „e-mail nemá“. A na závěr této podkapitoly musím zmínit registraci na nejrůznějších internetových serverech s nedůvěryhodným obsahem. Pokud se někdo zaregistruje na zahraničním serveru s obsahem na hranicích slušnosti nebo dokonce zákona, je to jako kdyby si spam objednal. Ale ani využívání služeb důvěryhodných a slušných serverů není stoprocentně bezpečné. Pravděpodobnost zneužití adresy českým provozovatelem webových služeb je sice výrazně nižší, ale stále není úplně nulová. Doporučuje se založit si pro účely registrací na serverech speciální e-mailovou adresu. Tu je pak možné používat i pro výše zmíněné marketingové firmy.
Zveřejněním - spamboti Spambot je robot, který prochází internet a zjišťuje e-mailové adresy zveřejněné na webových stránkách. Tento způsob získávání e-mailových adres je velmi rozšířený. Vyhledává především adresy uvedené v hypertextových odkazech „mailto:“. Uvedení e-mailu v tomto formátu na nějaké navštěvované stránce se v podstatě rovná objednávce spamu. Spambot ale nalezne i e-mailovou adresu uvedenou jako obyčejný text – vyhledává textový řetězec obsahující zavináč a tečku.
Spam Strana 7 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Proto se zavináč a tečka často přepisují slovně, většinou uzavřeni v závorkách. Anglicky „(at)“ a „(dot )“, česky „(zavináč)“ a „(tečka)“. Česká varianta se samozřejmě používá i bez diakritiky. Protože se tento způsob zápisu adres začíná rozšiřovat, nechá se předpokládat, že někteří spamboti už si poradí i s ním. Řešením je zápis adresy nebo její části obrázkem. Alespoň prozatím. Rozeznání textu skrytého v obrázku již dávno není problém, jen se ho zatím pro tyto účely nevyplatí používat. Dokud je dostatek adres uváděných textově, bylo by rozeznávání obrázků plýtvání strojovým časem. Spamboti trochu připomínají nějakého démona – mluví se o nich, někdo věří, že existují, někdo ne, ale narozdíl třeba od počítačového viru spambota nikdo v akci na vlastní oči neviděl. Protože však jeho realizace nepředstavuje velký Obrázek 9 technický problém, a existence spamu je nepopiratelná, – zpodobnění spambota je více než pravděpodobné, že k získávání adres jsou spamboti opravdu využíváni. A všechny dosažitelné důkazy naznačují, že některé adresy byly získány právě pomocí spambotů – viz subdoménový výzkum níže. Navíc jsem na internetu nalezl sejmutou obrazovku „e-mailového kombajnu“. Je zachycen právě uprostřed žně – viz obrázek 10.
Spamboti sice nejsou jedinou cestou pro plnění databáze elektronickými adresami, protože se používají i jiné zde popsané způsoby, ale jsou dominantními přispěvateli do těchto databází – protože ke svému provozu nepotřebují mnoho drahé lidské práce. Proto je nutné svou adresu před spamboty chránit – bezpečným zveřejňováním e-mailových adres se podrobněji zabývá následující kapitola „Ochrana e-mailových adres před spamboty“. Obrázek 10 – e-mailový kombajn
Analýza textu se v internetové reklamě používá i jinde. Na zahraničních diskusních fórech je možné si všimnout, že některá slova v příspěvcích jsou automaticky změněna v odkazy, které vedou na nabídku zmíněného zboží. Podobně e-mailová služba Gmail analyzuje obsah e-mailové zprávy a pak vybírá co nejrelevantnější reklamu. Tedy alespoň teoreticky – v českých e-mailech se zatím reklama Gmailu neobjevuje.
Spam Strana 8 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Používáním I když někdo svoji adresu nesděluje marketingovým firmám, a ani ji nevystavuje na žádném webu, může se stát, že mu časem začne chodit nevyžádaná pošta. Stačí když svůj e-mailový účet používá. Teoreticky by stačilo monitorovat provoz e-mailového serveru, z procházející pošty opisovat obsah polí „To“, „Cc“, „BCc“, příp. „From“ a „Reply-to“, a adresy by se do databáze jen hrnuly. A občas se nějaké adresy dají najít i přímo v textu zprávy. Člověk používající svůj e-mail píše na různé adresy, různým lidem, různým firmám. A pak se jeho e-mailová adresa může objevit v kolonce „to“ nějakého hromadného mailu. Při psaní takových hromadných mailů neuzavřené skupině lidí, je vhodné a slušné použít kolonku Bcc (blind carbon copy - skrytá/slepá kopie). Týká se to například vyžádaných nabídek, hromadných oznámení, výsledků soutěží, i jiných „hromadných“ informací, pokud se ne všichni adresáti znají. V případě, že mi někdo takový mail s třiceti cizími adresami v poli „To“ pošle, mohu se maximálně podívat na ostatní příjemce, a v případě potřeby z mailu odhadnout jejich možné webové adresy, pokud mne mohou zajímat. Ale je to malá satisfakce za to, že moje mailová adresa putuje neznámo kam. Když odesílatel nevyplní pole „To“ ani „Cc“, a všechny adresáty umístí do pole „BCc“, objeví se pak příjemcům v poli „To“ text „undisclosed-recipients“ – „utajení příjemci“. Sítí chodí nepočítaně přeposílaných mailů, většinou humorných. V případě přeposílání takového mailu je obzvlášť vhodné používat kolonku BCc, a případně smazat všechny předchozí příjemce, pokud jsou v textu zprávy obsaženi. Takový mail putuje dál a dál, a pokud obsahuje desítky e-mailových adres, může už tento počet stát někomu za tu práci, aby je zkopíroval do marketingové databáze. Velmi nežádoucí jsou akce typu „Ericson rozdává wapové mobily“ nabádající k tomu, abyste mail poslali viditelně dvaceti lidem, a kopii poslali na určitou adresu. Jednak se jedná o zbytečně obtěžující hoax (poplašný nepravdivý mail), což je po letmém přečtení naprosto evidentní (nejen proto, že se nikomu nevyplatí zaplatit za 20 mailových adres cca. 4000 Kč, ale i proto že tento mail chodil i v době, kdy už se v textu nabízené mobily dávno nevyráběly). A hlavně majitel zmíněné adresy velmi snadno získá tisíce e-mailových adres, se kterými může naložit podle své libosti. Proto je vhodné na maily tohoto typu nereagovat, a neobjednávat tak zbytečně svým známým spam. Další cesta jak své kamarády nechtěně a nevratně uvrhnout Obrázek 5 – „Neuveď nás v pokušení do spárů spamu je nejen zveřejňování seznamů kontaktů na a zbav nás od spamu“ stránkách nechráněných heslem, ale také využívání webových formulářů typu „Poslat článek kamarádovi“, „Upozorni známého“, „Doporučit mailem“, „Informuj někoho“, .... . Nikdy není jisté, jak může být s takovou adresou naloženo. Výjimku dělám snad pouze u služeb nabízených velkými firmami, které kromě jiného provozují také mailový portál. Pokud přes něčí server posílám nebo přijímám maily, je pro něj velmi snadné se zmocnit mých kontaktů, a tudíž mu musím důvěřovat. Pak už na tomto serveru klidně mohu vyplnit
Spam Strana 9 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
kolonku „doporučit známému“, protože riziko je stejné jako když tomu známému pošlu přes dotyčný server e-mail. Teoreticky by se e-mail mohl dostat do databáze i z papírové vizitky, letáku, nebo katalogu. Ale vzhledem k dostupnosti automatizovaných cest ke snadnému získání mnoha adres najednou by takový postup byl pro spammery značně neefektivní, a tudíž lze papír považovat za poměrně bezpečné místo pro zveřejnění elektronického kontaktu.
Existencí - freemail K tomu, aby se e-mailový účet začal plnit nevyžádanou reklamou dokonce není nutné e-mail vůbec používat. Stačí ho založit a nechat ležet. Některé méně seriózní freemailové servery totiž mohou zvýšit své příjmy doručováním spamu do schránek svých uživatelů – podobně jako Pošta letáky. Případně mohou prodávat adresy, ale přímé doručování zaručuje trvalejší příjem.
Obrázek 11 – „Ali i jeho velbloud si ve spamové bouři naštěstí dokázali poradit“
Vypadá to jako spekulace, ale jde o fakty podloženou skutečnost. Když před časem můj bývalý spolužák vyvíjel e-mailového klienta, založil si za tím účelem mnoho e-mailových účtů na pokusy. A na jednu z těchto adres dnes chodí okolo 100 spamových mailů týdně. Nikomu tu adresu neřekl, nikam ji neregistroval, nikde ji neuváděl. A používal ji pouze minimálně, na pokusy – a pouze svým vlastním programem. Jde o účet na jednom dnes už nepříliš používaném, českém poštovním serveru. Spam tam ve velké míře začal chodit už třetí den po založení. Z toho plyne úmyslný podíl tohoto českého serveru na doručování spamu.
Důkazy – dvouletý subdoménový výzkum Konec spekulací. Když jsem před dvěma lety získal vlastní doménu, chodilo mi na stávající adresu značné množství spamu. Starou adresu jsem přestal používat, a snažil jsem se zařídit, abych mohl do budoucna příchozí spam na své doméně částečně filtrovat nebo alespoň zjistit, jak se moje adresa do databází dostala. Založil jsem si proto několik subdomén a na všech jsem aktivoval doménové koše. Kdekoliv se musím zaregistrovat, tam uvádím unikátní e-mailovou adresu, přidělenou právě dotyčnému portálu nebo službě. Pak mohu u některých spamových zpráv zjistit, odkud přibližně má odesílatel moji adresu. Protože jde o závěry mého vlastního výzkumu, ne o externí informace, které by bylo zapotřebí ověřovat, dovoluji si níže uvádět konkrétní servery.
Spam Strana 10 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Zdroje adres pro reálný spam, který mi chodí: • V poslední době mi dlouhodobě a opakovaně přichází velmi podobné spamové zprávy na adresu, kterou intenzivně používám pro odchozí poštu, ale vůbec nikde ji neuvádím. Ani elektronicky, ani na papíře, ani ústně. Jde o účet na mailovém serveru Seznam.cz. V úvahu připadají téměř všechny důvody, které jsem uvedl výše v podkapitole „Používáním“ – může jít např. o monitoring provozu kteréhokoliv mailového serveru nebo třeba někdo přeposlal mail ode mne dál, aniž by odstranil moji adresu. Nebo si někdo uložil adresu ze které jsem mu napsal, a tu pak použil do veřejně viditelného pole „To“ při odesílání hromadného mailu. • Zajímavé je, že mi chodí poměrně dost spamových mailů na 2 adresy, které jsem nikomu nepřidělil, ani nikde nepoužil. Jsou zkomoleninou jiných adres. Nevím jak přesně tyto adresy vznikly. • Dále mi nějaký spam chodí na adresy, které sice nepoužívám, ale zněly by logicky. Např. na „sales@...“, „info@...“ a „domena@domena“ – obvyklé pokusy spammerů s velkou šancí na úspěch i u domén bez koše. Což dokazuje činnost spambotů – nejen že maily vyhledávají, ale dokonce je i tipují podle domén, jejichž existenci zjistí. Občas přijde mail i na „nahodne.vygenerovany.retezec@domena“. • Dost spamu mi bohužel chodí i na moji oficiální adresu, kterou uvádím na vizitce, v signatuře mailu nebo chráněnou na webu. Záznam v databázích může nejpravděpodobněji pocházet z monitoringu mailů, které mi chodí. Příp. z něčího on-line adresáře webmailu nebo ze signatury mailu ode mě. Opět připadá v úvahu většina důvodů uvedených v podkapitole „Používáním“. • Občas mi přijde mail i na adresu, kterou jsem „zakódovanou do českého jazyka“ uvedl do automatické odpovědi na mé staré e-mailové adrese. Adresu jsem do autoodpovědi neuvedl přímo - pouze jsem ji dost složitě popsal. Takže ji z textu pochopí pouze člověk, který dobře rozumí česky. Člověk nerozumící česky nebo počítač nemají nejmenší šanci adresu pochopit. Dokonce se jednou stalo, že odesílatel zprávy (Čech) tu adresu pro složitost zápisu vůbec nepochopil. Přesto mi na tuto adresu za dva roky přišlo téměř 250 spamových zpráv. Mohou pro to být dva důvody: o Adresa mohla být stažena monitoringem mailu – což by dokazovalo velmi intenzivní monitoring e-mailů, protože tato adresa slouží pouze pro první kontakt, je tedy „na jedno použití“, celkem mi na ni přišlo 7 nespamových zpráv. o Adresa mohla být zařazena do databáze někým kdo vědomě a záměrně plní spamové databáze a současně umí česky. Přitom ale všechny spamové zprávy na tuto adresu přišly v angličtině. Podotýkám, že tato adresa nemohla být prozrazena jiným způsobem než dvěma právě uvedenými způsoby. Více o tomto způsobu ochrany adresy níže, v kapitole „Ochrana e-mailových adres před spamboty“. • Mnoho spamu mi chodí na adresu, kterou jsem uvedl v katalogu Centrum.cz jako kontakt na webmastera u jednoho webu, který jsem vytvořil pro někoho jiného. Na tuto adresu mi chodí nabídky související se zaměřením dotyčného webu. Což navozuje předpoklad, že adresa nebyla z Centra získána spambotem (ačkoliv katalog Centrum pro to poskytuje nejlepší podmínky), ale buď byla Centrem prodána jako součást velmi dobře roztříděné (a tudíž dražší) databáze, nebo ji někdo z Centra zjistil ručně. Příp. mohlo jít o spolupráci člověka a skriptu. Ale velmi kvalitní filtrování pro zaměřování a zvyšování relevance reklamy, dohromady s tím, že značná část spamu je česky, naznačuje, že by skutečně mohlo jít o obchodní aktivitu Centra. A pokud ne, jde přinejmenším o nevhodné nakládání se získanými údaji, které lze u firmy zaměřené na ICT a marketing označit za vědomé.
Spam Strana 11 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
•
Na adresu přiřazenou Centru mi přišlo také oznámení o „zrušení registrace“ ze serveru Publicity.cz, pod který spadá mj. Rejstrikfirem.cz. V mailu bylo uvedeno, že důvodem je snaha o zamezení zneužití adres. Pokud tomu lze věřit, vypadá to, že tento server někde získal mailové adresy z Centra, ale nehodlá je zneužívat bez souhlasu adresátů. Ale může jít samozřejmě i o pokus ověřit si aktuálnost kontaktů v databázi, a tím zvýšit její cenu. • Spam mi chodí i na adresu pod kterou jsem se zaregistroval na serveru Cykloserver.cz, a kde je tato adresa v odkazu „mailto“ uváděna u článků, které jsem napsal. V tomto případě jde s největší pravděpodobností o práci spambotů. • Jeden čas jsem měl na webových stránkách uvedenu specielní adresu určenou pro vystavení na webu – podobně jako u autoodpovědi ve starém mailu šlo o adresu na jedno použití, pro první kontakt. Byla chráněna textovým přepisem tečky a zavináče, navíc s náhodně vloženými mezerami. o Napsalo mi na ni cca. 5-10 lidí (tj. cca. 5-10 nespamových zpráv). o Nepřišel mi na ni ani jeden typický spamový e-mail. Pouze několik zpráv z Polska, ale šlo o spam „slabšího typu“ – poměrně relevantní nabídka s ručním zjištěním adresy z polské verze mých stránek. Z toho vyplývá, že důkladný textový přepis uchránil adresu před spamboty, a že z cca. deseti zpráv nebyla adresa odchycena. Což by ovšem naznačovalo, že v dříve zmíněném případě (adresa uvedená ve starém mailu) nebyla adresa odchycena monitoringem mailserveru, ale že ji do zahraniční databáze doplnil nějaký Čech.
Spam Strana 12 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Ochrana e-mailových adres před spamboty Obecné zásady bezpečného nakládání s e-mailovými adresami jsem uvedl v předchozí kapitole. Zde se zaměřím na způsoby jak zveřejnit svoji e-mailovou adresu na webových stránkách tak, aby ji pokud možno neodhalil spambot, ale aby ji přitom mohl přečíst lidský návštěvník. Některé způsoby jsou převzaté z různých webových stránek (zajímavé způsoby ochrany adresy před spamboty dlouhodobě sbírám), jiné jsem vymyslel nebo upravil z převzatých způsobů. Záměrně zde neuvádím prameny jednotlivých způsobů, ani reálné e-mailové adresy, protože bych tím narušil ochranu cizích adres. Ochrannou funkci bezpečných zápisů snižuji už tím, že je zde vůbec uvádím. Obrázek 17 Proto konkrétní zápisy adresy níže demonstruji na obecné adrese „
[email protected]“ nebo „
[email protected]“.
Bez odkazu „mailto:“ Jak už jsem zmínil výše, základem je neuvádět e-mailovou adresu v hypertextovém linku „mailto:
[email protected]“. Tento odkaz byl vymyšlen kdysi v počátcích internetu, jako součást standardu html, pro zvýšení uživatelského komfortu. Kliknutím na něj se návštěvníkovi webových stránek otevře výchozí e-mailový klient s vyplněnou adresou, příp. předmětem a textem. Návštěvník webu tak vyvine minimální úsilí k tomu, aby autorovi napsal – což je důležitá funkce zejména pro firemní prezentace, ale je příjemná i pro osobní stránky. Bohužel odkazy mailto: jsou velmi snadno zneužitelné pro spamboty, kterým pak stačí rychle proběhnout obsah html stránky, najít příkaz mailto: a bez dalších zdlouhavých analýz textu si obsah příkazu uložit do výstupní databáze. Příkazy mailto: jsou pro spamboty ta nejsnadnější cesta k získání adresy, proto je vhodné tento odkaz vůbec nepoužívat. Bohužel to přináší nevýhodu pro nevidomé návštěvníky webu. Zvukový výstup předává uživateli informace výrazně nižší rychlostí než výstup obrazový. Jeden ze způsobů, jakými si může nevidomý uživatel udělat rychle přehled o obsahu stránky, je proskákat ji pouze po odkazech. Pokud potřebuje najít e-mailový kontakt, tak ho tímto způsobem nenalezne. Musí si nechat pomalu přečíst celou stránku, a doufat, že na ní ten e-mail někde bude. Vidícím návštěvníkům přináší nepoužití „mailto:“ pouze malé snížení komfortu.
Zavináč Spambot ale může nalézt i adresu uvedenou prostým textem, bez odkazu „mailto:“. Hledá řetězec vyhovující masce „*@*.*“ – tedy „
[email protected]“, přičemž obsahem hvězdiček mohou být i další tečky. Základem hledání je tedy zavináč, doplněný tečkou. A podstatou ochrany adresy je pak nevyhnutelně odstranění nebo zamaskování těchto znaků, zejména zavináče. Obrázek 18
Spam Strana 13 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Protože je význam zavináče v Čechách značně zkreslený a mnoho lidí jej mylně považuje za jakýsi symbol internetu, považuji za vhodné zde odbočit a věnovat tomuto znaku několik odstavců. Znak „@“ se v angličtině čte zpravidla „at“, což znamená „v“, „na“, příp. „u“ nebo „při“. Je to zkrátka odpověď na otázku kde. To odpovídá i grafické podobě tohoto znaku. Zavinutí znaku „a“ do obalu znamená, že jakýsi obsah je uchovávaný v něčem uvnitř. Při programování v jazyce symbolických adres (tzv. Assembleru) se znak „@“ používá pro nepřímou adresaci: • „mov r0,A“ znamená „zkopíruj obsah Akumulátoru do registru r0“ • „mov @r0,A“ znamená „zkopíruj obsah Akumulátoru na adresu uvedenou v registru r0“ Původ zavináče nejen že nesouvisí s internetem, ale dokonce ani s počítači. Podle Wikipedie[11] a serveru Worldwidewords.org[12] byl tento znak už dávno používán pro označení ceny za jednu měrnou jednotku, zejména na účetních dokladech – např. „7 widgets @ £2 ea. = £14“. V tomto významu „po“, „za“ lze tedy znak „@“ přirovnat k u nás užívanému znaku „à“. Oba zmíněné zdroje [11] a [12] rovněž uvádí, že do e-mailové Obrázek 12 adresy zahrnul zavináč Ray Tomlinson v r. 1972. V e-mailové adrese má zavináč zmíněný význam „v“ nebo „na“. Např. logovací ID „jmeno“ na serveru „domena.cz“. Podobně může výraz „uzivatel@pocitac“ označovat konkrétního uživatele pracujícího na konkrétním počítači. Bohužel v češtině se tento znak občas používá dost nešetrným způsobem. Vyjadřuje se jím cokoliv moderního, elektronického nebo internetového, případně je zaměňován s výrazem „www“ (world wide web – světově rozšířená pavučina). Často u nás bývá používán místo znaku „a“. Někdo to považuje za graficky zajímavé nebo snad originální, ale ve skutečnosti jde o zcela nesmyslné použití. Znak „a“ nelze zaměňovat se znakem majícím význam „objekt A uvnitř jiného objektu“. Např. pokud se „Jakub“ podepisuje „J@kub“, tak jeho podpis znamená „J v kub“. Ale není to pouze specifikum češtiny. V ruské verzi Wikipedie[13] jsem nalezl podobně nestandardní použití zavináče: • „В испанском, итальянском и других романских языках используется в неформальной переписке по электронной почте вместо буквы «o», чтобы сделать существительное нейтральным к полу (…).“ - Tedy, že v neformální internetové španělštině, italštině, a jiných románských jazycích, se znak „@“ používá univerzálně místo znaku „o“, resp. „a“, pro neutrální vyjádření platné pro obě pohlaví – např. „amig@s“ místo „amigos y amigas“ – „kamarádi a kamarádky“.
Spam Strana 14 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Zatímco v angličtině se „@“ čte podle jeho významu, v mnoha jiných jazycích vychází slovní název znaku z jeho grafické podoby. V českém jazyce je to „zavináč“ podle zavinutého řezu z rybího masa a zeleniny. V polštině se nazývá „małpa“ [maupa], což znamená opice. V ruštině „собака“ [sabaka], čili pes. V obou jazycích byla zřejmě inspirací grafická podobnost s ocasem. Na Wikipedii[11] nalézám další evropské názvy, které v dotyčných jazycích znamenají šnek, kočičí ocásek, štrůdl, opičí ocásek, koláček, červ, alfa vír nebo chobot. Z toho je vidět, že zavináč je pojmenováván poměrně barvitě.
Obrázek 19 - małpa
ASCII kód zavináče je 64dec, tzn. že i s českou klávesnicí je možné ho napsat kombinací „alt+64“.
Textový přepis Základní způsob přepisu zavináče a tečky je „jmeno (at) domena (dot) cz“. Protože už ale spamboti mohou být připraveni i na vyhledávání tohoto přepisu, je lepší používat českou variantu „jmeno (zavináč) domena (tečka) cz“. Varianta s diakritikou může být lepší než bez diakritiky, ale rozdíl není velký. Ideální je tento zápis ještě nějak narušit. Je možné vložit mezi některé znaky mezery – např. „jmeno (z avi náč) domena (t eč ka) cz“ nebo vynechat závorky, příp. promíchat variantu s diakritikou a bez – např. „jmeno zavinac domena tečka cz“. Čím originálnější a nestandardnější zápis, tím lépe. Ale je třeba mít na paměti, že by uváděnou adresu stále měl být schopen pochopit lidský návštěvník webu. Samozřejmostí je pak překlad zápisu pro každou jazykovou verzi webu – je sice možné použít anglický zápis, ale lokální překlad je lepší. Jako konkrétní příklad originálního poškození zápisu, mohu uvést tvar který jsem nalezl na jednom webu: „jmeno (zalvinaaccc) domena (ttlecka) cz“ Pokud by výše uvedený způsob byl pro dané použití příliš záhadný, je možné uvést adresu ve formátu "jmeno @ domena.cz". U tohoto zápisu však musíme počítat s velkou nevýhodou – příliš malá úroveň ochrany. Je vhodné ho používat např. na dokumenty, u kterých je předpoklad používání ve vytištěné formě, ale nelze vyloučit ani ojedinělý výskyt ve formě elektronické. I tento zápis jsem už viděl prakticky použitý na webové stránce. V tomto případě byl ale kombinovaný s odkazem mailto:, který měl jako svoji hodnotu vyplněnou správnou, nepoškozenou adresu. Takže poškození viditelné adresy zde bylo úplně zbytečné, protože nepoškozená adresa byla pohodlně přístupná přímo v příkazu mailto:. Pro ideální zabezpečení textovým přepisem je vhodné poblíž chráněné adresy neuvádět slovo „e-mail“ ani „mail“. V české verzi je možné použít např. výraz „elektronická pošta“ nebo jako na titulní stránce této práce „e-pošta“. V angličtině se nabízí např. výraz „e-post“, který sice zní poněkud nestandardně, ale o to právě u ochrany proti spambotům jde. Nevýhodou tohoto i následujícího způsobu přepisu je nemožnost nalézt adresu pomocí stisku ctrl+F a vyhledáním znaku „@“ nebo řetězce „mail“. I u tohoto opatření platí, že přinese snížený komfort pro vidící návštěvníky a velmi snížený komfort pro návštěvníky nevidomé.
Spam Strana 15 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Návštěvník webu se pak musí po adrese pídit ručně. A to je právě hlavní prostředek ochrany - vyjádřit citlivé údaje natolik originálně, aby rozluštění automatizovanými prostředky bylo co nejnáročnější. Spammerům se totiž nevyplatí nechat počítač ztrácet čas s rozluštěním všeho za každou cenu, výhodnější je nashromáždit co nejvíce nechráněných nebo špatně chráněných adres.
Zápis obrázkem Pokud chceme lidskému vidícímu návštěvníku zajistit pohodlnější čitelnost chráněné adresy, můžeme ji zapsat obrázkem. Obrázek jako takový chrání adresu před spambotem o mnoho účinněji než textový přepis. Ale aby mohl adresu přečíst také nevidomý návštěvník, je nutné zadat u obrázku alternativní text, a do něj umístit textově přepsanou adresu, čímž se vrátíme na úroveň zabezpečení jako u textového přepisu. Tomu je možné se vyhnout použitím audio nahrávky adresy, s tím, že odkaz na ni je zapotřebí nějak srozumitelně popsat. Nabízí se samozřejmě také možnost zapsat adresu obrázkem, a nevidomé návštěvníky ignorovat, ale toto řešení bych označil, mírně řečeno, za velmi nevhodné. Podrobné informace o tvorbě webu přístupného nevidomým jsou Obrázek 13 v českém jazyce na webových stránkách projektu Blindfriendly (www.blindfriendly.cz). Zápis obrázkem může být nepraktický také pro některé mobilní návštěvníky používající PDA, komunikátor nebo smartphone. Mohou mít vypnuté zobrazování obrázků z důvodu rychlosti a ceny připojení, příp. velikosti displeje. I tyto případy může řešit alternativní textový popis obrázku. Html kód adresy chráněné obrázkem s textovým přepisem pro nevidomé a mobilní návštěvníky může vypadat např. takto: •
Přičemž soubor obrazek.jpg obsahuje zapsanou kompletní e-mailovou adresu. A pokud chceme počítat i se spamboty nejbližších budoucích generací, bylo by krajně nevhodné pojmenovávat dotyčný obrázek např. „e-mail.jpg“. Ale zatím není nutné se obávat, že by si spamboti dávali práci s analýzou obrázku. Ještě vhodnější varianta použití obrázku je přepis pouze zavináče a tečky. Návštěvník si tak může e-mailovou adresu textově zkopírovat, a pak do ní v e-mailovém klientu pouze doplnit zavináč a tečku. Samozřejmostí je doplnění obrázků alternativním textem – např. „zavináč“ a „tečka“. Výhodou je, že mezi jednotlivými texty vyjadřujícími adresu „překáží“ další html kód, který by měl spambotovi zabránit v nalezení adresy. Navíc je toto řešení vhodné i pro weby na kterých musí být umístěno mnoho kontaktů – stačí vytvořit jeden obrázek pro zavináč, jeden pro tečku, a pak tyto dva obrázky vložit do každé uveřejněné adresy. Html kód bude při částečném přepisu adresy obrázky vypadat takto: •
jmeno
prijmeni
domena
cz
Spam Strana 16 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Pokud v budoucnosti budou spamboti analyzovat i obsah „podezřelých“ obrázků, tj. obrázků, které vyhodnotí jako pravděpodobný úkryt e-mailové adresy, bude nutné zvolit ještě větší originalitu. Podle polského a ruského názvu pro zavináč jsem se snažil najít vyhovující obrázky psa a opice. Nakonec jsem nějaké použitelné obrázky nalezl, a nejlépe se jevil obrázek slona. Ten jsem poté v „obyčejném“ Paintbrushi (tzv. Malování) ve Windows upravil tak, aby připomínal zavináč. Kromě toho, že zde přikládám ukázku, jsem již tohoto slona natvarovaného do zavináče použil i pro zápis mého elektronického kontaktu Obrázek 15 – slon[14] po úpravě na titulní stránce projektu. do podoby zavináče Slon nebo jiné zvíře použité v adrese místo zavináče sice může na první pohled vypadat poněkud neformálně, ale zato Obrázek 14 slibuje ochranu i proti spambotům vzdálenějších budoucích generací. Navíc v dnešní době volí některé velké firmy (např. mobilní operátoři) natolik odvážné image, že veselé zvíře v e-mailové adrese by nemělo být pohoršující.
Další způsoby ochrany Výše uvedené způsoby přepisu adresy textem nebo obrázkem jsou asi v současné době nejrozšířenější. Ale kromě nich se nabízejí i další, méně používané možnosti. Jak jsem již uvedl v podkapitole „Subdoménový výzkum“, umístil jsem na moji starou e-mailovou adresu automatickou odpověď koncipovanou tak, aby z ní novou kontaktní adresu zjistil pouze člověk rozumící česky. Podstata této formy ochrany spočívá v nepřímém popsání, českým jazykem. Uvádím část automatické odpovědi, která obsahuje novou adresu: „Napište mi na novou adresu, začíná předložkou ze, pak následuje tečka a po ní slovo seznamu. Pak obvyklý zavináč, slovo novy, tečka, po tečce moje příjmení a obvyklý konec, tj. ".cz".“ Záměrně jsem s výjimkou národní topdomény neuvedl žádný výraz v uvozovkách, protože pak by adresa mohla být odhadnutelná i bez znalosti češtiny. V tomto případě využívám toho, že na starou adresu mi nepsal nikdo z ciziny, ani jsem ji nikde v zahraničí neuváděl. Dnes už bych tento způsob použít nemohl. Nicméně, jak už jsem zmínil výše, i na takto chráněnou adresu mi chodí poměrně velké množství spamu. Jako nejpravděpodobnější se nakonec ukázala varianta, že adrese do databází někdo ručně pomohl. Narazil jsem i na způsob zápisu, který umožňuje udělat výjimku a použít odkaz „mailto:“. Stačí jako hodnotu odkazu zadat řetězec „jmeno#domena.cz“, a poblíž odkazu umístit viditelné upozornění, že je nutné nahradit křížek zavináčem. Výhodou je zachování poměrně vysokého komfortu pro návštěvníka – zákazníka (tento zápis jsem nalezl na komerční prezentaci jedné firmy). Zákazník pak není demotivován přílišnou pracností, a firmu kontaktuje. Pokud si pisatel nevšimne, že musí křížek nahradit zavináčem, většina e-mailových klientů by ho měla upozornit, že zadaná e-mailová adresa není platná. Nevýhodou tohoto řešení je příliš malá úroveň zabezpečení. Pokud si autor spambota všimne, že je tento způsob používán, velmi snadno ho naučí takový zápis odhalit.
Spam Strana 17 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Často používaný, poměrně spolehlivý způsob, je neuvádění e-mailové adresy, a implementace kontaktního formuláře na webovou stránku. Formulář samozřejmě musí být realizován tak, aby v html kódu stránky nebyla uvedena e-mailová adresa, protože jinak by toto řešení jako ochrana nemělo smysl. Výhodou řešení je možnost rychlého kontaktu, návštěvník ani nemusí spouštět e-mailový program, ani opisovat adresu. Nevýhodou pro některé pisatele může být absence kopie zprávy v jeho odeslané poště a nemožnost využití některých funkcí běžné elektronické pošty - např. html formátování, příloha nebo potvrzení o přečtení. Navíc zkušení uživatelé internetu mohou mít už z principu nedůvěru k uvádění své e-mailové adresy do jakéhokoliv webového formuláře. První nevýhoda je odstranitelná zahrnutím zaškrtávacího políčka „poslat Obrázek 20 kopii na moji adresu“, html formátování lze také doplnit, i když už není tak - také spambot pohodlné jako v mailovém klientu, a poslední nedostatek už je věc důvěry pisatele k majiteli webu. Viděl jsem i zajímavou obměnu tohoto způsobu, kde byla e-mailová adresa uvedena běžným nechráněným způsobem „
[email protected]“, v kombinaci s hypertextovým odkazem vedoucím na kontaktní formulář. Takové řešení ovšem není příliš vhodné – jednak e-mailová adresa není vůbec chráněná před spamboty, a navíc uživatel netuší, že po kliknutí na adresu se dostane na kontaktní formulář – protože očekává odkaz „mailto:
[email protected]“. Nalezl jsem i poměrně unikátní řešení využívající javascript. Jeho podstatou je použití vzorce „adresa= jmeno + @ + domena.cz“. Protože autor tohoto způsobu ho nabízí na svém webu[14] veřejně k dispozici, mohu uvést i jeho adresu[14]. Html kód vypadá následovně: • <SCRIPT type="text/javascript" language="javascript">
Obrázek 16
Tento způsob je svým způsobem geniální – v html kódu není nikde celá adresa uvedena, protože její části jsou od sebe odděleny html kódem. A při zobrazení v běžném prohlížeči se zapnutým javascriptem se uživateli zobrazí plnohodnotný komfortní „mailto:“ odkaz se správnou, nepoškozenou adresou. Nevýhodou je, že uživatelé méně schopných prohlížečů - např. některých mobilních zařízení, e-mailovou adresu vůbec nezjistí. Navíc zůstává otázkou, zda spambot určitě prohlíží pouze čistý obsah html souboru. Pokud by totiž zkoumal vygenerovanou html stránku po provedení javascriptu, byl by tento způsob naprosto neúčinný.
Spam Strana 18 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Na závěr zmíním způsob, který jsem nalezl na jednom českém webu. Jeho podstatou není ochrana adresy, ale její pravidelná změna. Podobně jako moje subdoménová analýza, i toto řešení využívá možnosti plynoucí z používání vlastní domény. Princip je velice jednoduchý - adresa je ve formátu
[email protected]. Tzn., že vždy po novém roce adresát zruší starou e-mailovou adresu a založí novou. Tím ovšem riskuje, že mu někdo napíše na starou adresu a nenapadne ho, že má část před zavináčem aktualizovat podle nového letopočtu. A pokud snad u staré adresy aktivuje automatickou odpověď, riskuje, že se nová adresa rychle dostane do spamových databází, jako se to stalo mně.
Spam Strana 19 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Ověřování e-mailových adres Málokteré osobní údaje se mění tak rychle jako elektronické adresy. Důvodem pro změnu může být nespokojenost se stávajícím mailserverem, zajímavá nabídka serveru jiného nebo získání vlastní domény. Někdo změní adresu s novým zaměstnavatelem, někdo po svatbě s novým příjmením, a v poslední době už se jako důvod začíná objevovat i zaspamování stávajícího e-mailového účtu. Čím větší procento odeslaných spamových zpráv je doručeno a přečteno, tím je rozesílání efektivnější. Proto se spammeři snaží mít adresy ověřené. Aktuální databáze má vyšší cenu než databáze stará dva roky.
Obrázek 6
Obrázky Mnoho spamových zpráv je v html formátu s vloženými obrázky, které ovšem nejsou součástí zprávy. Ve zdroji zprávy je pouze uveden odkaz na nějaké URL. Mnoho těchto obrázků má opravdu za účel zobrazit skutečný obrázek a upoutat čtenářovu pozornost. Ale některé obrázky pracují na principu webových počitadel – prohlížeč/e-mailový klient se je pokusí zobrazit, navštíví uvedenou adresu, a počitadlo zjistí, že webová stránka/e-mailová zpráva byla navštívena/zobrazena. Když spammer přidělí každému příjemci jeho unikátní kód, pozná pak podle počitadla., kdo přesně zprávu zobrazil - čímž si ověří platnost a aktuálnost dotyčné adresy. Zdrojový html kód tohoto obrázku vypadá poměrně důvěryhodně: •
o Kód neobsahuje složitý náhodný řetězec, který by mohl skrývat označení konkrétní e-mailové adresy, navíc název vypadá poměrně logicky - „3D, 500 x 500 pixelů, č.1“. Přesto se na uvedené adrese žádný obrázek nezobrazil. Zkouška proběhla v den doručení zprávy, takže důvodem by nemělo být odstranění obrázku z uvedené adresy.
Oproti tomu tento zdrojový kód už na první pohled naznačuje, že slouží k ověření adresy nebo k jiným statistickým účelům: (z kódu jsem vypustil doménu) • o Prvním důvodem k podezření je název obrázku „fggvdgx_lhwwozotg.gif“, který nedává smysl – byl tedy podle všeho vygenerován náhodně, a pravděpodobně přiřazen k nějakému konkrétnímu záznamu v databázi. o Potvrzením domněnky je pak údaj o nulové šířce a výšce obrázku – kdyby odesílatel chtěl obrázek opravdu zobrazit, určitě by nenastavoval nulovou šířku a výšku.
Spam Strana 20 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Výše uvedené html kódy samozřejmě adresát při čtení zprávy nevidí. Řešením je nezobrazovat (ani v náhledu) podezřelé e-maily po dobu připojení k internetu. Spam zásadně promazávám až poté co se odpojím. Pak mi sice e-mailový klient nabízí připojení k internetu, aby mohl obrázky zobrazit, ale stačí několikrát jeho návrh zamítnout a je to v pořádku. Kdo je k internetu připojen trvale (např. přes Wifi nebo kabel), může v e-mailovém programu zkusit aktivovat režim „pracovat off-line“. Na tomto místě je ještě nutné podotknout, že ne všechny zprávy které pro správné zobrazení vyžadují připojení k internetu jsou spam. Mnoho zpráv obsahuje odkazy na skutečné, neškodné obrázky – zejména se to týká nejrůznějších rozesílaných vyžádaných informačních služeb, tzv. „e-mailových novin“.
Obrázek 21 – při off-line zobrazení zprávy obsahující vnější obrázky automaticky vyskočí dialog nabízející připojení k internetu
Spam Strana 21 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Odhlášení odběru V mnoha nevyžádaných zprávách se objevuje možnost odhlásit se z odběru podobných zpráv. Většinou anglicky, čili „unsubscribe“. Zda na takový odkaz pro zrušení odběru kliknout nebo ne, je otázkou. Sice ten odkaz opravdu může zasílání zpráv zastavit, ale také může jít o léčku k ověření platnosti adresy. Ve druhém případě pak kliknutí naopak způsobí nežádoucí nárust objemu příchozího spamu. Obecně lze říci, že českým identifikovatelným odesílatelům lze důvěřovat, zahraničním neidentifikovatelným nikoliv. Ale vždy záleží na individuelním případu, jediná možnost je tedy odhad. Případně by bylo řešením odpovědět na adresu ze které byla zpráva odeslána – neseriózní spammer ji totiž falšuje, aby ho neobtěžovaly chyby doručení na neplatné adresy a aby ho nikdo nemohl kontaktovat. Bohužel ale občas chodí spam i z adres obyčejných nevinných lidí, jejichž adresa se také dostala do databáze. Takže ten komu nějaký spam chodí, si nemůže být jistý, zda v nějakém jiném spamu není uveden jako odesílatel. Obrana proti tomu je naprosto nemožná – je pouze možné ochranou vlastní adresy snížit pravděpodobnost. Nicméně zejména pro účely této práce udělám výjimku – a zkusím na jeden „unsubscribe“ odkaz kliknout: Zdrojový kód mailu nabízí odhlášení v tomto kódu: (opět vypouštím doménu) • If you would like to terminate your agreement and discontinue receiving emails from our network, you may unsub HERE at any time. Your removal will be automatic. o Kód obsahuje číselnou identifikaci mé e-mailové adresy „3D79439“, která je stejná ve více spamových mailech které mi přišly. To naznačuje, že odkaz opravdu funguje – otázkou však stále zůstává, zda následkem bude menší nebo větší objem spamu. o Odkaz vede na skript „unsub.pl“, což naznačuje, že by výsledkem akce mohlo být opravdu skutečné „unsubscribe“. Ačkoliv stále může jít o dobře zpracované ověření adresy – odkazované URL je totiž v e-mailovém klientu vidět už při najetí myší, před samotným kliknutím.
Po kliknutí se mi otevírá stránka kde mám pro potvrzení odhlášení ještě jednou kliknout. Současně jsou zobrazeny detaily mé registrace:
Obrázek 22 – odhlášení a podrobnosti registrace
Spam Strana 22 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Z podrobností se dozvídám, že moje adresa byla vložena přes web v červnu nebo říjnu 2004, 4 minuty před polednem, z IP adresy 62.209.200.xxx . Stejná IP adresa je uvedena i v mnoha spamových mailech, které mi přišly „Your IP we have on file when you confirmed is 62.209.200.xxx.“ Otázkou však zůstává, zda mohu věřit údajům, které mi předkládá spammer. Ačkoliv pokud mne opravdu někdo z uvedené adresy zaregistroval, a pokud mi po odhlášení přestanou maily od tohoto odesilatele chodit, tak to bude znamenat, že se ve skutečnosti nejedná o spammera. Po využití „whois“ služby na serveru CNW[15] zjišťuji, že inkriminovaná IP adresa spadá pod jistého internetového poskytovatele v Jizerských horách. Kdybych měl jistotu, že moje e-mailová adresa byla skutečně zadána z této IP, mohl bych dotyčného providera kontaktovat, aby zjistil konkrétního viníka a zjednal opatření. Ale jednak se nechci opírat o údaj jednoho zahraničního spammera, a navíc je IP adresa zfalšovatelná. Nic konkrétního nenacházím ani na webovém serveru „http://www.showmyip.com“, který např. u mé IP adresy mylně tvrdí, že sedím v Praze – na základě hlavního sídla mého operátora. Ještě zkouším Google a prohledávám své e-mailové složky, kde zjišťuji, že ze zmíněné adresy mi nikdy nepřišel žádný e-mail.
Klikám tedy na druhý odkaz „unsubscribe my e-mail adress“ a zobrazuje se mi potvrzení.
Obrázek 23 – potvrzení o odhlášení
Časem se ukáže, zda v tomto případě „unsubscribe“ znamenalo opravdu odhlášení.
Závěr Jak již vyplynulo z výše uvedeného, základem všeho je prevence. S e-mailovou adresou svou i s e-mailovými adresami známých je nutné nakládat šetrně. Do podezřelých formulářů je lepší nezadávat adresu žádnou, a do těch ostatních používat adresu speciální, podobné je to v případě marketingových firem. Pro zveřejňování elektronické adresy na webových stránkách je pak vhodné používat některý z uvedených způsobů nebo jejich kombinaci, a spamové zprávy je nejjistější promazávat offline.
Spam Strana 23 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Prameny Zdroje textů a informací • Standardy požadují, aby u webové adresy bylo uvedeno datum. Jelikož web je velmi dynamické médium, uvádím pro jistotu i přibližný čas. • Uvádím datum a čas mého čerpání informací z uvedené stránky, nikoliv datum a čas kdy byla tato stránka vytvořena nebo změněna. [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15]
www.google.com, 25.11.2005 14:00 www.answers.com, 25.11.2005 14:00 www.coje.to, 25.11.2005 14:15 cs.wikipedia.org/wiki/Spam, 25.11.2005 14:30 www.cpost.cz, 25.11.2005 15:00 www.ferda.cz, 25.11.2005 15:30 www.uoou.cz/spam_zakon.php3, 25.11.2005 21:30 www.maly.cz/index.php?item=1054, 25.11.2005 22:45 www.vesmirnilide.cz/jaksirit.htm, 25.11.2005 23:00 www.vesmirnilide.cz/zak_spam.htm, 25.11.2005 23:00 cs.wikipedia.org/wiki/%40, 29.11.2005 13:00 www.worldwidewords.org/articles/whereat.htm, 29.11.2005 13:00 ru.wikipedia.org/wiki/%40, 29.11.2005 13:45 www.danjo.ca, 27.11.2005 0:00 counter.cnw.cz/whois.cgi?whois=62.209.200.xxx, 3.12.2005 16:30
Spam Strana 24 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005
Zdroje obrázků 1. www.freenews.fr, 27.11.2005 2. www.lifehacker.com, 27.11.2005 3. www.ozzie.net, 27.11.2005 4. www.elistas.net, 27.11.2005 5. www.taejinmon.com, 27.11.2005 6. www.douglas.bc.ca, 27.11.2005 7. www.unicallinc.com, 27.11.2005 8. www.btbusinessembrace.com, 27.11.2005 9. www.hackles.org, 26.11.2005 10. www.logicsolv.com, 26.11.2005 11. www.metva.com, 27.11.2005 12. www.tepla.cz, 25.11.2005 + moje úprava 13. www.blindfriendly.cz, 23.1.2004 14. www.ccshbrno.cz, 25.11.2005 15. obrázek [14] + moje úprava 16. www.danjo.ca, 26.11.2005 17. www.mailduster.com, 26.11.2005 18. www.howstuffworks.com, 1.12.2005 19. www.ccshbrno.cz, 25.11.2005 20. www.matterform.com, 26.11.2005 21. vlastní screenshot, 3.12.2005 22. vlastní screenshot, 3.12.2005 23. vlastní screenshot, 3.12.2005
Spam Strana 25 PDF byl vytvořen zkušební verzí FinePrint pdfFactory www.fineprint.cz
Martin Adámek, 2005