Rok / Year: 2011
Svazek / Volume: 13
Číslo / Number: 3
Geolokace síťových zařízení v internetových sítích Network devices geolocation in internet Lukáš Verner, Dan Komosný
[email protected],
[email protected] Fakulta elektrotechniky a komunikačních technologií VUT v Brně.
Abstrakt: Článek popisuje principy a využití geolokačních metod pro určování geografické polohy síťových zařízení. Pro ukládání informací o vlastnících internetových domén byly vytvořeny databáze, které často obsahují záznamy o geografické poloze registrovaných síťových zařízení vázané k jejich IP adrese. Za účelem porovnání přesnosti záznamů byla vytvořená aplikace, pomocí které lze porovnávat přesnost záznamů z databáze Whois a GeoIP.
Abstract: This article describes the the principles and use geolocation methods for determining the geographic location of network devices. To store information about the owners of Internet domains were created databases that often contain a record of the geographical location of registered network devices tied to their IP address. In order to compare the accuracy of registration was created an application that allows you to compare the accuracy of Whois records from the database and GeoIP.
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
Geolokace síťových zařízení v internetových sítích Lukáš Verner, Dan Komosný, Fakulta elektrotechniky a komunikačních technologií VUT v Brně Email:
[email protected],
[email protected]
Abstrakt – Článek popisuje principy a využití geolokačních metod pro určování geografické polohy síťových zařízení. Pro ukládání informací o vlastnících internetových domén byly vytvořeny databáze, které často obsahují záznamy o geografické poloze registrovaných síťových zařízení vázané k jejich IP adrese. Za účelem porovnání přesnosti záznamů byla vytvořená aplikace, pomocí které lze porovnávat přesnost záznamů z databáze Whois a GeoIP.
1 Úvod Světová internetová síť nemá pevně stanovené hranice a je velmi těžké zjistit, kde se jednotlivé její součásti nacházejí. Znalost fyzické polohy síťových stanic je ale velmi důležitá. Využívá se v mnoha aplikacích. Například při zasílaní cílené reklamy uživateli, boji proti spamu, pro zábavu nebo při zasílaní předpovědi počasí pro lokalitu, ve které se stanice uživatel právě nachází. Za tímto účelem se vyvíjejí geolokační metody na určení geografické polohy síťových zařízení v síti těchto metod je celá řada a dají se rozčlenit do dvou základních skupin. Pasivní geolokační metody využívají k určení polohy informace ze záznamů internetových databází vázaných nejčastěji k IP adrese nebo k názvu domény. Aktivní geolokační metody určují polohu hledaných stanic na základě měření datového provozu směrem k hledané cílové stanici. Nejčastěji zpoždění. Tento článek je zaměřen na objasnění metod IP geolokace patřících k pasivním metodám geolokace. Byla vytvořena aplikace, pomocí které lze porovnávat přesnost záznamů IP geolokace v databázích Whois a GeoIP. Pomocí této aplikace je v tomto článku na různých příkladech demonstrována přesnost daných databází.
2 Geolokace stanic v internetu IP Geolokace je metoda používaná v internetových sítích pro zjišťování geografických údajů o pozici síťového zařízení připojeného k internetu. Nejčastěji počítače, mobilního telefonu, serveru apod. Přesto že internet ve své podstatě nemá hranice, nalezení fyzické polohy stanic pomocí geografické lokalizace je cenným nástrojem využívaným v mnoha službách a aplikacích jakými jsou například: • Online reklama: S rostoucím rozvojem internetu se neustále zvyšuje počet obyvatel využívajících Internet. Internetová síť se stává ideálním prostředkem pro šíření reklamy. Nicméně je velmi důležité zaměřit reklamu na správnou cílovou skupinu. Pomocí Geolokace je možné zasílat reklamu určenou pro uživatele v dané geografické oblasti a tím je upozornit na-
příklad na nabídku služeb a produktů v jejich okolí [2]. • Aktuálnost z hlediska polohy: Taktéž i samotní uživatelé internetu, kteří například často cestují, si přejí mít informace vztahující se zejména k jejich okolí (např. počasí, kulturní akce, zprávy) a je žádané, aby tyto informace byly cílené automaticky. • Vyhledávání dopravního spojení: Ve své podstatě je toto použití podobné jako v předchozím příkladě. V tomto případě jsou geolokační techniky využity k tomu aby určili aktuální polohu pohybujícího se uživatele a nabídli mu pak možnosti dopravního spojení v jeho okolí. • VoIP telefonie: Spolu s rozvojem internetové sítě se rozvíjí i odvětví VoIP telefonie. Zde bývá přáním uživatelů zjistit místo, kde se nachází volající, či volaný. Můžou nastat případy tísňových hovorů, kdy vznikne krizová situace a volající není schopen odpovídat (volající je zmatený, ve stresu nebo upadne do bezvědomí) – v tu chvíli může přesné určení lokace volajícího zachránit život. • Ochrana proti podvodům: Další užitek znalosti geografické polohy praktik lze spatřit v pomoci odhalování podvodů s kreditními kartami. Například, pokud si zákazník zvolí oblast pro obvyklé používání jeho karty, může se lehce přijít na případné zneužití provedené z místa, které této oblasti neodpovídá. • Boj proti spamu: V boji proti spamu je využití kolokačních metod spíš kontroverzní. Je založeno na myšlence, že spameři se uchylují do zemí, které nemají vyvinutou legislativu boje proti spamu. Pomocí geolokace lze detekovat datové přenosy z takových zemí a přenesená data pak označit jako podezřelá nebo je vymazávat. To však s sebou nese riziko, že jako spam budou identifikovány i běžné datové přenosy. • Zábava: Pomocí geolokace vznikají nové typy socialních sití. Například Foursquare a Gowalla. Tyto sítě jsou vázány k poloze uživatele. V případě sociální sítě Foursquare uživatel přijde do nějaké budovy, například do školy a za pomocí sociální sítě může sledovat, kteří jeho přátelé jsou ve škole a tak se s nimi scházet. Sociální síť Gowalla funguje na principu hraní hry kdy je uživatel pomocí geolokace naváděn na určitá místa aby našel nějaký hledaný předmět a přemístil jej poté na jiné místo. Na internetových stránkách pak lze sledovat, jak se jednotlivé předměty pohybují po světě. Existuje řada geolokačních metod využívaný pro stanovení fyzické polohy stanice. Tyto metody lze rozdělit do dvou základních skupin. Pasivní metody a aktivní metody.
33 – 1
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
Z pohledu protokolového modelu TCP/IP lze geolokační metody využit také k nalezení virtuální polohy stanic v internetu. Nalezením virtuální polohy stanice je velmi důležitým parametrem využívaným pro zefektivnění využívání síťových prostředku a snížení redundance vysílání dat v internetových sítích. Znalost virtuální polohy je využívána například při hledání nejbližšího zdroje dat. Objem dat přenášených v globální síti dramaticky roste každým dnem. Přispívá k tomu například i rozvoj vícesměrového vysílání IPTV, používání P2P (peer-topeer) sítí či masivní nárůst uživatelů hledajících zábavu v hraní on-line her, které jsou čím dál více náročné na objem dat potřebných k přenosu a závislé na rychlosti jejich přenosu. Pro správnou funkci těchto aplikací je nutné, aby byly data pro ně určená příjmány co nejrychleji a zatížili síť co nejméně. Zdroj dat je potřeba zvolit tak, aby byl co nejblíže jak z pohledu relativní pozice v síti, tak i z pohledu fyzické vzdálenosti, od které se odvíjí, kudy data pocestují a jak dlouho jim cesta potrvá. Z toho plyne, že znalost virtuální polohy stanic v síti je důležitým vodítkem ke správné volbě zdroje dat. Zdrojem může být buď uživatel (v P2P síti) nebo server (případně jeho mirroru). K nalezení virtuální polohy se nejčastěji využívají metody hledající polohu pomocí umělých souřadnicových systémů. Těmito metodami jsou například metoda Vivaldi, nebo GNP (Global Network Positioning). 2.1 Pasivní geolokační metody Pasivní metody geolokace jsou založeny na principu získávání lokalizačních informací na základě dostupných informací o síťovém zařízení. Informace o pozicích síťových zařízení se získávají na základě záznamů veřejných nebo soukromých databází. Podle zdrojových informací lze pasivní metody geolokace rozdělit na: • geolokace na základě IP adresy, • geolokace na základě DNS(Domain Name System) záznamů, • geolokace s využitím Wifi.
obsahují, nebo množství domén a IP adres v nich registrovaných. Mezi dvě nejznámější veřejné databáze patří databáze Whois a GeoIp [3].
D ATABÁZE W HOIS Veřejná databáze Whois je nejznámější v současnosti používanou databází. O registraci IP adres a domén v jednotlivých státech se starají národní registrátoři, kteří společně podléhají mezinárodní organizaci pro přidělování čísel v internetu IANA. Databáze Whois obsahuje záznamy zaměřené na evidenci údajů o majitelích internetových domén a IP adres. Mezi tyto informace patří například jméno správce domény, kontaktní adresa, email, případně telefonní číslo. Do databáze lze zasílat dotazy pomocí programového nástroje Whois s parametrem názvu hledané domény. Odpověď databáze je ve formátu textového souboru. Velkou nevýhodou odpovědí je, že neobsahují pokaždé informace ve stejném textovém formátu a je velmi těžké z nich programově selektovat hledané informace. Obrázek 1 a Obrázek 2 demonstrují příklady rozdílu struktury záznamů v databázi Whois. Pro doménu s IP adresou 147.229.2.90 je adresa uložená v řetězci znaků kde na začátku každého řádku je položka address. Adresa domény s IP adresou 74.125.232.247 je rozdělená na řádky s položkami Address, City, StateProv, PostalCode a Country. Databáze obsahuje další záznamy, kterých formát je odlišný vůči daným příkladu. Pro programátora je proto velmi těžké vytvořit funkci, která by dokázal zpracovat všechny formáty záznamů v databázi Whois a selektovat z nich tu správnou adresu hledané domény [4].
Obrázek 1: Výpis adresy z databáze Whois pro IP adresu domény vutbr.cz
2.1.1 Geolokace na základě IP adresy Patří mezi nejjednodušší metody, neboť IP adresa síťového zařízení, případně brány přes, kterou se dané síťové zařízení připojuje do internetu je dostupná skoro vždy. Geolokační informace se získávají prostřednictvím porovnávání záznamů IP adres s databází organizace pro přidělování adres IANA (Internet Assigned Numbers Authority). Organizace IANA je rozdělena na několik koordinačních středisek podle lokality, které databáze spravují: • Americký registr pro Internet Numbers (ARIN). • RIPE síťové koordinační centrum (RIPE NCC). • Asijsko-Pacifické síťové informační centrum (APNIC). • Latinsko Americké a Karibické Internetové adresy registrů (LACNIC). • Africké síťové informační centrum (AfriNIC). Existuje několik druhů databází, přičemž některé jsou soukromé, jiné veřejné. Mezi jednotlivými databázemi můžou být velké rozdíly v oblasti struktury, přesnosti informací, které
Obrázek 2: Výpis adresy z databáze Whois pro IP adresu domény gmail.com
D ATABÁZE G EOIP Další velmi často používanou databází je databáze GeoIP. Obsahuje knihovnu jazyka C, která umožňuje najít zemi, ze které pochází daná IP adresa nebo název počítače. Používá k tomu souborovou databázi obsahující bloky IP jako klíče. Země, města, PSČ a zeměpisné souřadnice jsou pak hodnotami těchto klíčů. Pro některé IP adresy stanic obsahuje databáze GeoIP přesný záznam polohy včetně města a geografických souřad-
33 – 2
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
nic. Pro jiná však většinou dokáže určit pouze zemi původu. V takovém případě jsou zeměpisné souřadnice hledané stanice nastaveny na střed země jejich původu [5]. Obrázek 3 demonstruje příklad výpisu databáze GeoIP pro IP adresy domén vutbr.cz a seznam.cz. Ze zobrazených výsledku je patrné, že pro doménu vutbr.cz databáze GeoIP obsahuje přesné údaje o poloze, včetně města a zeměpisných souřadnic. Pro hledanou doménu seznam.cz obsahuje databáze informace pouze o zemi původu a zeměpisné souřadnice jsou nastaveny na její střed.
Obrázek 3: Výpis databáze GeoIP pro IP adresy domén vutbr.cz a seznam.cz 2.1.2 Geolokace na základě DNS záznamů
Databáze přístupových bodů GoogleMaps je plně automatizovaná a dokáže si sama opravovat záznamy. Například pokud by se v seznamu okolních přístupových bodů hledané stanice nacházely čtyři přístupové body z Brna a jeden z Prahy. Je jasné, že správce přístupového bodu z Prahy jej přestěhoval do Brna a jeho poloha uložená v databázi není správná. Proto si databáze GoogleMaps aktualizuje informace o jeho poloze na základě vzájemné polohy okolních přístupových bodů. Na Obrázek 5 je zobrazen příklad využití databáze GoogleMaps k lokalizaci notebooku připojeného do internetu pomocí bezdrátového spojení Wifi. Kliknutím na modré tlačítko na stránkách GoogleMaps se odešle databázi žádost k geolokaci obsahující informace o okolních dvou přístupových bodech. Oba tyto body jsou v databázi GoogleMaps nalezeny a po jejich vyhodnocení databáze vrátí do prohlížeče informace o předpokládané poloze dotazujícího notebooku spočítané na základě dostupnosti okolních přístupových bodů. Hledaný notebook je na obrázku vyznačen červeným bodem [11].
Další způsobem jak můžeme určit polohu hledané stanice je dedukce pozice stanice na základě reverzních záznamů DNS. Reverzní záznam DNS je překlad IP adresy do pro člověka srozumitelnější a zapamatovatelnější podoby, doménového jména. Struktura sytému DNS je hierarchická. Proto lze z DNS záznamu často určit například zemi ve které se stanice nachází [10]. Na Obrázek 4 je příklad reverzního překladu IP adresy na doménové jméno s využitím linuxového nástroje nslookup. Z výpisu lze dedukovat, že stanice s IP adresou 77.75.76.3 se nachází někde v České republice. Obrázek 5: Geolokace pomocí Wifi a databáze GoogleMaps 2.2 Aktivní geolokační techniky Obrázek 4: Výpis informací o doméně s IP adresou 77.75.76.3 využitím nástroje nslookup 2.1.3 Geolokace s využitím Wifi Pokud je stanice připojena pomocí bezdrátového připojení Wifi, lze její pozici zjistit na základě polohy okolních přístupových bodů a síly jejich signálu. K lokalizaci se používá internetový prohlížeč, který během procesu lokalizace stanice načte informace o všech přístupových bodech ve svém okolí (SSID, MAC, síla signálu) a odešle je k porovnání databázi GoogleMaps. GoogleMaps obsahuje databázi přístupových bodů Wifi, kde je zaznamenána jejich MAC adresa, SSID a předpokládaná poloha. Poloha přístupových bodů se počítá na základě polohy jiných, již předem známých přístupových bodů v jejím okolí. Pokud databáze GoogleMaps obdrží žádost na lokalizaci stanice spolu se seznamem přístupových bodů v okolí hledané stanice, vyhledá dané přístupové body ve své databázi. Na základě jejich vzájemné polohy a úrovní signálů změřených hledanou stanicí pak spočítá místo, kde se hledaná stanice pravděpodobně nachází.
Aktivní geolokační metody jsou založené na odhadu polohy stanice na základě informací získaných měřením datového přenosu stanice v internetové síti. Nejčastěji se měří zpoždění a zjišťuje se cesta dat přes síťové uzly od zdroje dat k cíli. Zpoždění je doba potřebná na přenos jednoho datového segmentu od zdroje k příjemci. Obecně může být zpoždění ovlivněno mnoha faktory. Například přenosovou rychlostí vedení, momentální zatížení, geografickou vzdáleností zdrojové a cílové stanice, případně výkonností a aktuálním zatížením mezilehlých uzlů, kterými jsou nejčastěji směrovače a přepínače připojené v síti na cestě od zdrojové stanice k cílové stanici. Podle místa, kde zpoždění vzniká jej lze dělit na: • zpoždění na koncových zařízeních, • zpoždění na mezilehlých uzlech, • zpoždění na přenosových linkách. Existuje mnoho nástrojů na měření přenosového zpoždění a hledání cesty od zdroje k cíly. Těmi nejzákladnějšími jsou nástroje Ping a Traceroute. Nástroje pro měření zpoždění měří hodnotu zpoždění vznikající součtem zpoždění vzniknutých při přenosu signálu od zdroje k cíly a zpět. Tato hodnota se nazývá RTT (Round-Trip Time). Zpoždění se měří v obou směrech, protože cesta vysílaného signálu od zdroje k cíly
33 – 3
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
může být odlišná vůči cestě signálu z cíle zpět ke zdroji a může tak mít různou dobu zpoždění.
od jednotlivých referenčních bodů a taky odhadované pozice mezilehlých uzlů (viz Obrázek 7) [15].
2.2.1 Metoda GeoPing GeoPing určuje polohu stanice tím, že využívá zpoždění v sítí a geografické vzdálenosti. V sítí existuje množina směrovacích uzlů, u kterých je známa jejich geografická poloha. Tyto uzly se nazývají referenční body nebo také landmarkry. Během procesu geolokace se měří zpoždění od všech referenčních bodů k cílové stanici a vytváří tzv. vektor zpoždění, který určuje, jak daleko je cílová stanice od jednotlivých referenčních bodů. Poloha stanice je pak odhadnuta na základě Euclidovské vzdálenosti jednotlivých polohy referenčních bodů v okolí hledané stanice a jejich vektorů zpoždění [12],[13]. 2.2.2 Metoda ShortestPing ShortestPing je jednoduchou metodou založenou na měření zpoždění. Každý cíl je mapován k referenčnímu bodu, který je k němu nejblíže z hlediska hodnoty zpoždění RTT. Jeho poloha se určí jako poloha referenčního bodu s nejmenší hodnotou zpoždění RTT. Velkou nevýhodou této metody je její nepřesnost, neboť výsledná poloha stanice je definovaná jako poloha nejbližšího z referenčních bodů. Skutečná pozice může ale být mnohem vzdáleněji než pozice vybraného referenčního budu [13]. 2.2.3 Metoda Constraint-Based Geolocation Metoda Constraint-Based Geolocation (CBG) měří zpoždění mezi všemi referenčními body a cílovou stanicí. Toto zpoždění se následně přepočítá na vzdálenosti a kolem každého referenčního bodu vznikne oblast, kde se hledaná stanice pravděpodobně nachází. Místo, kde vznikne průnik oblastí, je považováno za výslednou pozici cílové stanice (viz Obrázek 6) [14].
Obrázek 7: Příklad geolokační metody TBG
3 Aplikace pro lokalizaci stanice v internetu Tato kapitola popisuje webovou aplikaci pro určování geografické polohy internetových stanic reprezentovaných IP adresami nebo doménami s využitím pasivních geolokačních metod. Tato aplikace je umístěná na stránkách grid1.utko.feec.vutbr.cz/geoip/gmap.php a umožňuje porovnávat informace získané z databáze Whois a databáze GeoIP. Na základě informací získaných z těchto databází lze zjistit nejen polohu hledané stanice ale také pozorovat odlišnost záznamů jednotlivých databází a jejich přesnost. Aplikace pracuje na serveru s operačním systémem Linux a dotazy k jednotlivým databázím jsou odesílané pomocí linuxového terminálu bash. Výsledky v podobě textových řetězců jsou zpracovávány pomocí programovacího jazyka PHP a zobrazovány na webových stránkách. Informace o hledaných internetových stanicích lze pozorovat v přehledné tabulce a jejich poloha je vyznačena na mapách Google. Aplikace pro geolokaci internetových stanic umožňuje také vyhledávání trasy od serveru, na kterém aplikace pracuje k hledané internetové stanici. K nalezení mezilehlých uzlů je využíván nástroj Tracepath. Tento nástroj pracuje stejně jako nástroj Traceroute, má však jednodušší formát. Poloha nalezených mezilehlých uzlů je pak určována pomocí databáze Whois. 3.1 Popis činnosti aplikace pro geolokaci
Obrázek 6: Příklad geolokační metody CBG 2.2.4 Metoda lokace založená na topologii sítě (TBG) Jedná se o rozšíření lokalizační techniky CBG. Při této technice se pří měření zpoždění využívá informace o topologii a směrování v síti, přes kterou data prochází. Metoda se snaží odhadnout pozici cílové stanice na základě měření zpoždění
Vývojový diagram na Obrázek 8 znázorňuje průběh procesu zjišťování pozice hledané stanice v internetu. Po odeslání formuláře s parametrem hledané stanice se nejdřív ověří formát názvu hledané stanice. Pokud se jedná o doménu, tak se pomocí nástroje nslookup nejdřív nalezne IP adresa dané domény a až poté se odešle dotaz k vyhledání záznamu v databázích Whois a GeoIP. Protože databáze Whois vrací údaje ve formátu proměnného textového řetězce, informace o poloze IP adresy je z těchto údajů třeba selektovat pomocí funkcí PHP. Databáze Whois neobsahuje informace o zeměpisné poloze hledané stanice. Tyto informace jsou získávány z nalezené adresy pomocí map Google. Databáze GeoIP ob-
33 – 4
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
sahuje záznamy s pevně stanovenou strukturou ve formě pole proměnných. Proto se tyto informace nemusí složitě selektovat jak v případě využití databáze Whois. Na rozdíl od databáze Whois obsahuje databáze GeoIP také informace o geografické poloze hledané IP adresy. Neobsahuje však detailní adresu hledané stanice. Tato adresa je zjišťována na základě geografických souřadnic, s využitím map Google. Informace získané z jednotlivých databází jsou pak na webových stránkách přehledně zobrazeny v tabulce a poloha hledané stanice je označena na mapě Google. Pokud je zaškrtnuto pole pro vyhledávání trasy k hledané internetové stanici, je použit nástroj Tracepath, pomocí kterého je získán seznam mezilehlých uzlů směrem k hledané stanici. IP adresy nelezených mezilehlých uzlů jsou pak z výstupního řetězce nástroje TracePath selektovány pomocí PHP funkcí a jejich poloha je určována pomocí databáze Whois. Nalezená trasa je pak také zobrazená v tabulce výsledků vyhledávání. Na mapách Google jsou mezilehlé uzly označeny zelenými značkami pospojovány červenou čarou.
zace domény vutbr.cz (Tabulka 1 a Obrázek 9). Podle výsledků získaných pomocí aplikace pro lokalizaci internetových stanic si můžeme všimnout, že databáze Whois obsahuje pro tento záznam informace o poloze na adrese Brno Antonínská 1, zeměpisné souřadnice však nebyly určeny správně. Problém nesprávného určení zeměpisných souřadnic byl způsoben složitostí formátu adresy získané z databáze Whois. Během procesu získávání zeměpisných souřadnic mapy Google nesprávně vyhodnotili dotaz s kompletní adresou získanou z databáze Whois. Pokud by daná adresa obsahovala jen údaje o ulici, městě a státu, mapy Google by dotaz vyhodnotili správně a vrátili by zeměpisné souřadnice ulice Antonínská 1 v Brně. Na tomto příkladě si lze tady povšimnout nevýhodu nejednotného a jednoduchého formátování záznamů v databázi Whois. Databáze GeoIP v tomto příkladě pravděpodobně neobsahuje správné zeměpisné souřadnice hledané domény. Na místě určeném zeměpisnými souřadnicemi z této databáze se totiž nenachází budova školy ani internetový uzel, kde by se server školy mohl nacházet. Databáze však dokázala správně určit město, stát a PSČ(Poštovní směrovací číslo) kde se hledaná doména nachází. Tabulka 1: Tabulka výsledků vyhledávání domény vutbr.cz Data získaná pomocí WHOIS IP: 147.229.2.90 Doména: www.vutbr.cz Adresa: Brno University of Technology, Center of Computing and Information Services, Antoninska 1, Brno, 601 90, The Czech Republic Město: Brno Provincie: South Moravia PSČ: Země: Czech Republic Zeměpisná šířka: 49.1909804 Zeměpisná délka: 16.6115347
Data získaná pomocí GEOIP IP: 147.229.2.90 Doména: www.vutbr.cz Adresa: Kuldova 757/9, 615 00 Brno-Zábrdovice, Czech Republic Město: Brno Provincie: 78 PSČ: 615 00 Země: CZ Zeměpisná šířka: 49.200001 Zeměpisná délka: 16.633301
Obrázek 9: Zobrazení polohy domény vutbr.cz
Obrázek 8: Proces lokalizace stanice ve vytvořené aplikaci 3.2 Příklady lokalizace pomocí vytvořené aplikace Následující příklady demonstrují přesnost záznamů získaných z jednotlivých databází. Jako první si uvedeme příklad lokali-
Další příklad popsaný v Tabulka 2 a na Obrázek 10 je výsledkem vyhledávání polohy domény facebook.com. Červeně je na Obrázek 10 je vyznačena poloha domény určená pomocí programu GeoIP a modře poloha domény určená pomocí programu Whois. Díky nevhodnému formátu adresy byly opět špatně určeny zeměpisné souřadnice polohy stanice určené databází Whois. Databáze GeoIP určilo polohu domény facebook.com přesně.
33 – 5
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
Tabulka 2: Tabulka výsledků vyhledávání domény facebook.com Data získaná pomocí WHOIS IP: 66.220.156.18 Doména: www.facebook.com Adresa: 1601 S. California Ave, Palo Alto, CA, 94304, US Město: Palo Alto Provincie: California PSČ: 94304 Země: United States Zeměpisná šířka: 37.4160330 Zeměpisná délka: -122.1520042
Data získaná pomocí GEOIP IP: 66.220.156.18 Doména: www.facebook.com Adresa: Acorn Trail, Palo Alto, CA 94304, USA Město: Palo Alto Provincie: CA PSČ: 94304 Země: US Zeměpisná šířka: 37.376202 Zeměpisná délka: -122.182602
Obrázek 11: Zobrazení polohy a trasy k doméně wikipedia.org Tabulka 4: Trasovací uzly na cestě k doméně wikipedia.org IP: 147.229.253.234 Doména: gw-ant.net.vutbr.cz Adresa: Brno University of Technology, Center of Computing and Information Services, Antoninska 1, Brno, 601 90, The Czech Republic IP: 195.69.145.176 Doména: te-1-4.br1-knams.wikimedia.org Adresa: Amsterdam Internet Exchange BV, Westeinde 12, NL - 1017 ZN Amsterdam, The Netherlands IP: 91.198.174.250 Doména: ve7.te-8-1.csw1-esams.wikimedia.org Adresa: P.O. Box 78350, San Francisco, CA 94107-8350, USA IP: 91.198.174.232 Doména: text.esams.wikimedia.org Adresa: P.O. Box 78350, San Francisco, CA 94107-8350, USA
Obrázek 10: Zobrazení polohy domény facebook.com Poslední příklad je ukázkou určování polohy hledané stanice včetně vyhledávání trasy od serveru, na kterém aplikace pracuje k hledané stanici. Vyhledávání polohy mezilehlých uzlů může pomoci při určení správnosti lokalizace hledané stanice. V Tabulka 3 a na Obrázek 11 je znázorněn výsledek lokalizace domény wikipedia.org. Zelenými body jsou zde vyznačeny jednotlivé směrovací uzly. Z nalezených výsledků je patrné, že v databázi Whois je registrován server wikipedia.org, který se nachází v USA a v databázi Geoip server umístěný v Holandsku. Když se podíváme do tTabulka 4 výsledku trasování k doméně wikipedia.org, můžeme si všimnout, že daná doména má více serverů. Tímto způsobem dochází u domény wikipedia.org k rozdělení zátěže mezi servery a také tímto přispívají k snížení objemu dat přenášených v globální síti. Tabulka 3: Tabulka výsledků vyhledávání domény wikipedia.org Data získaná pomocí WHOIS IP: 91.198.174.232 Doména: www.wikipedia.org Adresa: P.O. Box 78350, San Francisco, CA 94107-8350, USA Město: San Francisco Provincie: California PSČ: 94107 Země: United States Zeměpisná šířka: 37.7618242 Zeměpisná délka: -122.3985871
Data získaná pomocí GEOIP IP: 91.198.174.232 Doména: www.wikipedia.org Adresa: Haringweg 25, 8251 Dronten, Netherlands Město: Dronten Provincie: Flevoland PSČ: Země: NL Zeměpisná šířka: 52.500000 Zeměpisná délka: 5.750000
4 Závěr Cílem tohoto článku je objasnění funkce pasivních geolokačních metod využívaných v sítích pro určování geografické polohy síťových zařízení. Pasivní metody geolokace využívají k nalezení pozice stanice veřejné nebo privátní databáze. Tyto databáze jsou spravovány různými organizacemi a jejich formát není jednotný. Proto jsou jejich záznamy často zkreslené. Většina databázi s jistotou dokáže určit zemi, ve které se hledaná stanice nachází. Některé dokážou určit město a dokonce i ulici cílové stanice. Nemusí to ale být přesné informace, jak bylo demonstrováno na příkladech vytvořené aplikace. V aplikaci byla porovnávána přesnost databází Whois a GeoIP. Během hledání polohy jednotlivých domén pomocí těchto databází bylo zjištěno, že databáze Whois je mnohem přesnější než databáze GeoIP. Obsahuje totiž detailnější informace o hledané doméně, případně jejich správcích i s kontakty na ně. Její velkou nevýhodou však je, že nemá přesnou strukturu. Databáze GeoIP dokáže spolehlivě určit zemi původu hledané domény. Obsahuje však zeměpisné souřadnice hledané domény a má pevně stanovenou strukturu.
33 – 6
2011/33 – 17. 6. 2011
VOL.13, NO.3, JUNE 2011
Literatura [1] BALEJ, Jiří; KOMOSNÝ, Dan. Zdroje zpoždění při komunikaci v Internetu. Elektrorevue [online]. 2010, 2010, 42, [cit. 2011-06-15]. Dostupný z WWW: <www.elektrorevue.cz>. ISSN 1213-1539. [2] Http://www.symbio.cz/ [online]. 2009-02-19 [cit. 201106-15]. Geolokace aneb ideální internet zase o krok blíž. Dostupné z WWW:
. [3] IPinfoDB [online]. 2010 [cit. 2010-12-13]. IP address geolocation database. Dostupné z WWW:. [4] Http://www.cni.org/ [online]. 1992 [cit. 2011-06-15]. Whois Tutorial. Dostupné z WWW: . [5] Http://www.maxmind.com/ [online]. 2010 [cit. 201106-15]. GeoIP Database Installation Instructions. Dostupné z WWW: . [6] Domaintools [online]. 2010 [cit. 2010-11-20]. WHOIS Lookup at DomainTools.com. Dostupné z WWW: . [7] Google Maps [online].[cit. 2011-06-15]. Dostupný z WWW: < http://maps.google.com/ >. [8] HOLZHAUER, Florian. IP Geolocation. Berlin, 2007. 11 s. Seminární práce. Technische Universitat Berlin. Dostupné z WWW: < http://fholzhauer.de/wpcontent/uploads/2006/10/ip_geolocation_handout.pdf >. [9] RFC 792. Internet Control Message Protocol : DARPA INTERNET PROGRAM PROTOCOL SPECIFICATION. [s.l.] : USC/Informationciences Institute, 1981. 20 s. Dostupné z WWW: . [10] Http://www.windowsnetworking.com/ [online]. 200509-27 [cit. 2011-06-15]. Using NSLOOKUP for DNS Server diagnosis. Dostupné z WWW: . [11] HASSMAN, Martin. Http://html456.blogspot.com/ [online]. 2011 [cit. 2011-06-15]. Jak funguje geolokace ve Firefoxu. Dostupné z WWW: . [12] DOLEŽEL, Pavel. Současné možnosti nalezení fyzické pozice stanice v Internetu. Brno, 2010. 50 s. Semestrální práce. Vysoké učení technické v Brně, Fakulta elektrotechniky a komunikačních technologií. [13] Katz-Bassett, E.; et al. Towards IP Geolocation Using Delay and Topology Measurements [online]. 2006 [cit. 2011-06-15]. University of Washington, Seattle. Dostupné z WWW: <www.cs.washington.edu/homes/arvind/papers/geoloc.p df>. [14] GUEYE, Bamba; et al. Constraint-Based Geolocation of Internet Hosts. In Internet Measurement Konference. 2004. [s.l.]: ACM/SIGCOMM, 2004. s. 14. Dostupné z 33 – 7
WWW:. E00-108534666 [15] Baden, R. IP Geolocation in Metropolitan Area Network [online]. 2007 [cit. 2010-06-15]. University of Maryland, College Park. Dostupné z WWW: <www.cs.umd.edu/Grad/scholarlypapers/papers/Randol phBaden.pdf>.