Prostředky pro testování Service Level Agreement (SLA) a optimalizace provozu na WAN spojích na Cisco Jan Staroba, STA458
Abstrakt: Service Level Agreement (SLA), je dohoda o úrovni poskytované služby uzavřená mezi poskytovatelem IT služeb a zákazníkem. Cílem této práce je popsat jednu z dílčích částí metody optimalizace provozu na WAN spojích založených na techlogoiích společnosti CISCO a to se zaměřením na právě na SLA. Součástí tohoto shrnutí je i otestovaná ukázková konfigurace. Klíčová slova: SLA, CISCO, IOS, router, VoIP, IP, TCP, UDP, ICMP, 1 Úvod.............................................................................................................................2 1.1 Proč chtít SLA?.....................................................................................................2 1.2 Optimalizace provozu na WAN............................................................................2 2 SLA v prostředí CISCO IOS........................................................................................3 2.1 Technologické pozadí IP SLA..............................................................................4 2.2 Používané metriky Cisco IOS IP SLA..................................................................4 2.3. Postup konfigurace...............................................................................................4 3. Testovací topologie.......................................................................................................5 3.1 Seznámení s topologií............................................................................................5 4. Konfigurace..................................................................................................................6 4.1 Analýza kvality služby pomocí VoIP UDP Jitter operace.....................................6 4.1.1 Nastavení Responderu....................................................................................6 4.1.2 Nastavení IP SLA Senderu.............................................................................7 4.1.3 Výpis konfigurace operace UDP VoIP Jitter.................................................7 4.1.4 Rozšířené možnosti konfigurace...................................................................7 4.2 Analýza kvality služby pomocí UDP Echo operace..............................................8 4.2.1 Nastavení Responderu....................................................................................8 4.2.2 Nastavení IP SLA Senderu.............................................................................8 4.2.3 Výpis konfigurace operace UDP Echo..........................................................9 5. Výsledky provedených testů.........................................................................................9 5.1 Výpis statistiky operace UDP VoIP Jitter.............................................................9 5.2 Výpis statistiky operace UDP Echo..........................................................................10 6. Závěr...........................................................................................................................11 7. Použitá literatura.........................................................................................................11
leden 2009
1/11
1 Úvod V úvodní části této práce se nejprve dozvíme k čemu a proč samotné SLA slouží. Dále si taé povíme něco o optimalizaci provozu na WAN spojích. Společenost Cisco se touto problematikou podrobně zabývá a je třeba připomenout, že využití SLA při tomto procesu je pouze zlomek velkého balíku metod uřčených k tomuto účelu.
1.1 Proč chtít SLA? Nejprve se pokusme porozumět tomu, proč se vůbec SLA ve společnostech poskytující IT služby uplatňuje. SLA je běžným právním dokumentem, který obsahuje předpokládaný rozsah a úroveň služby a také případné postihy za její nedodržení. Prvotním cílem tohoto dokumentu ovšem není penalizovat dodavatele služby, ale naopak preventivně předcházet tomu, aby nedocházelo k chybám při jejich poskytování v důsledku rozdílnosti vzájemných očekávání. Na tyto preventivní mechanismy by se při tom měli soustředit jak zákazník, tak i dodavatel služby, protože nedostatečným plněním úrovně poskytovaných služeb může dojít k mnohem větším finančním škodám, než jsou penále zakotvené v SLA.
Obr. 1. Vztah smlouvy o poskytování služby a metrik SLA.
1.2 Optimalizace provozu na WAN Jak již bylo zmíněno, balík pro testování kvality poskytované služby je dílčí součástí rozsáhlého balíku postupů určených pro optimalizaci WAN spojů. Řešení pro optimalizaci WAN se v současné době stávají jedním z důležitých požadavků na síťovou infrastrukturu.
Obr. 2. Cisco WAN Optimalizace, zdroj www.cisco.com leden 2009
2/11
Analytici z oblasti IT očekávají, že trh se službami určenými pro optimalizaci WAN spojů se do roku 2009 zdvojnásobí a dosáhne objemu více než 1,2 miliardy dolarů. Dle odhadu bude také 55% všech zaměstnanců po celém světě přistupovat ke svým aplikacím z poboček. Na obrázku uvedeném výše je znázorněn návrh organizace procesu optimalizace. Nejdůležitější částí je tzv. Infrastructure Service Layer. My se zde zaměříme zejména na část s názvem Monitoring, jejíž součástí jsou právě služby SLA. Část nazvaná Control se orientuje na využití služeb QoS – Quality of services. V poslední době dochází k rozvoji služeb, jejichž úspěšnost z pohledu uživatele významně závisí na kvalitativních charakteristikách komunikace přes počítačovou síť. Jedná se zejména o služby VoIP – Internetové telefonie a videokonference, jejichž síťový provoz je potřeba preferovat před například distribuovanými výpočty nebo přenosy velkých objemů dat. QoS se tedy postará o to, aby daná služba, kterou chceme využívat, běžela bez problému a nebyl upřednostňován jiný, méně významný provoz.
Obr. 3. Struktura procesu optimalizace WAN, zdroj www.cisco.com
2 SLA v prostředí CISCO IOS Společnost Cisco implemetuje mechanismus určený pro zajištění danné kvality poskytované služby ve svých zařízeních pod názvem Cisco IOS IP Service Level Agreement, zkráceně IP SLA. Tento modul je základním jádrem softwarového řešení, jež nabízí svým zákazníkum možnost analyzovat kvalitu služeb a aplikací běžících nad protokolem IP. K Cisco IP SLA lze přistupovat hned několika způsoby a to přes rozhraní textové konzole (CLI) nebo pomocí protokolu Simple Network Management Protocol (SNMP) nad kterým je možné provozovat příslušnou grafickou nádstavbu. leden 2009
3/11
2.1 Technologické pozadí IP SLA Princip funkce Cisco IOS IP SLA je založen na aktivním monitorování generovaného provozu. Proces posílá testovací data skrze celou síťovou topologii a to i mezi více cílovými objekty. Simuluje tak běžné síťové služby postavené nad IP protokolem a v reálném čase sbírá informace o síti, jejichž výčet si rozebreme dále v textu. Testovací provoz dokáže IP SLA generovat jak mezi dvěmi Cisco zařízeními tak například mezi jedním Cisco zařízením a vzdáleným síťovým aplikačním serverem. Packety, které jsou generovány k samotným testům lze z pohledu síťových vrstev konfigurovat na více úrovních. Máme tak možnost nastavit zdrojovou i cílovou ip adresu packetu, čísla portů u UDP/TCP, Type Of Services nebo například URL webovou adresu.
2.2 Používané metriky Cisco IOS IP SLA Vyhodnocování dílčích testů probíhá na základě několika výkonových metrik. ●
Delay – zpoždění
●
Jitter – kolísání
●
Packet loss – ztráta packetu
●
Packet sequencing – správné řazení packu
●
Path – cesta dle počtu přeskoků
●
Connectivity – dostupnost
●
Server or website download time – čas potřebný ke stažení cíle
●
Voice quality scores – kvalita přenosu hlasu
2.3. Obecný postup konfigurace Než přikročíme ke konkrétní konfiguraci některého z modelových případů, ukážeme si, jakými kroky taková konfigurace projde a na co je třeba nezapomenout. Opět připomínám, že testování provozu zde probíhá na základě posílání generovaných packetů. Nejprve tedy zařízení (sender) vygeneruje a odešle testovací packet k cíli (responder). Ten v závislosti na konkrétní předdefinované IP SLA operaci vyhodnotí packet, označí jej časovým razítkem a odešle zpět. Z hodnoty obsažené v časovém razítku se následně vypočítají výsledky testu. Základní body konfigurace: ●
Zaktivovat cílové zařízení (responder).
●
Nastavit požadovaný typ Cisco IP SLA operace.
●
Nastavit vlastnosti již vybrané Cisco IP SLA operace.
●
Vymezit hraniční stavy pro danou operaci (treshold).
●
Přidat test do plánovače úloh a nastavit čas startu a periodu opakování.
●
Zobrazit výsledky testu pomocí CLI nebo jiného nástroje.
Cisco IP SLA nabízí tyto operace: leden 2009
4/11
Cisco IOS IP SLAs Operation
Použití operace
UDP Jitter
Hlasové a datové sítě, dle Cisca nejpoužívanější test
ICMP Path Jitter
Hlasové a datové sítě.
UDP Jitter for VoIP
Sítě s užíváním VoIP.
UDP Echo
Test konektivity, výkon aplikací nad IP protokolem.
ICMP Echo
Test konektivity, výkon aplikací nad IP protokolem.
ICMP Path Echo
Test konektivity, identifikuje cestu sítí.
HTTP
Výkonnost web serveru.
TCP Connect
Doba připojení k zařízení, výkon serveru.
FTP
Výkonost FTP serveru.
Dynamic Host Configuration Protocol
Doba odezvy DHCP serveru.
Domain Name System (DNS)
Výkonnost služeb DNS serveru.
Data Link Switching Plus (DLSw+)
Doba odpovědi mezi DLSw+ uzly.
Frame Relay
Měření kvality pro WAN sítě.
Tabulka 1: Dostupné Cisco IOS IP SLA Operace
3. Testovací topologie K praktick0mu ozkoušení chování SLA testů jsem zvolil jednoduchou testovací topologii, na které demonstrativně předvedeme základní konfiguraci Cisco IP SLA. Jak již bylo v předchozí kapitole zmíněno, možností k testování sítě je velké množství, avšak princip a základní myšlenka konfigurace je stále stejná. Jelikož testy v tomto projektu by měly být voleny vzhledem k současnému využití služeb QoS, vybral jsem dva typy simulující provoz VoIP. Výsledky zkoumání a podrobné výpisy konfigurace jsou uvedeny níže v textu.
3.1 Seznámení s topologií K základní konfiguraci Cisco IP SLA si vystačíme se dvěma routery Cisco řady 2800 a jedním koncovým zařízením, kterým je v našem případě běžné PC. Je třeba podotknout, že uvedená konfigurace se drobně liší v syntaxi oproti zápisu uvedenému v manuálu Cisco IOS IP SLA Configuration Guide. Je to tak nejspíše z důvodu odlišné verze IOSu. Je třeba také podotknout, že k jakékoliv funkčnosti je třeba mít nainstalován IOS s integrovanými funcemi pro správu IP SLA. Rozdíly v syntaxi jsou skutečně velmi malé a na podstatu konfigurace, kterou se tento dokument snaží vystihnout, nemají vliv.
Obr.4. Testovací topologie
leden 2009
5/11
Jak je patrné z obrázku, jeden z routerů slouží pouze jako Responder a druhý jako zdroj testovacích packetů. Routery jsou propojeny seriovou linkou s defaultní rychlostí a koncové zařízení 100Mb/s ethernetem. Routování zajištoval směrovací protokol OSPF.
4. Konfigurace Podívejme se na lehký úvod do konfigurace. Testovací operace, které jsem vybral pro tento účel jsou následující: ●
UDP Jitter VoIP Operation
●
UDP Echo Operation
Jelikož je VoIP provoz šířen sítí v UDP packetech, vybral jsem k otestování právě tyto dvě SLA operace. K provedení těchto testů je potřeba nejprve nakonfigurovat Responder stranu, dále samotný test a na závěr test spustit pomocí plánovače. To vše si podrobněji ukážeme v následující kapitole.
4.1 Analýza kvality služby pomocí VoIP UDP Jitter operace Operace IP SLA UDP Jitter byla primárně vytvořena pro diagnostiku sítě, kde jsou provozovány aplikace kritické na čas, jako například Voice Over IP, Video Over IP a další podobně. Cisco uvádí, že tento test je hlavním pilířem IP SLA a v praxi je nejpoužívanější. Slovo Jitter znamená v překladu kolísání, z čehož lze snadno vyvodit, že test měří nerovnoměrnou změnu zpoždění packetů na síti. Služby VoIP jsou na prodlevu (delay) packetů velmi citlivé a je tedy velmi užitečné situaci na síti sledovat. Přistupme tedy k samotné konfiguraci.
4.1.1 Nastavení Responderu Konfigurace tzv. odpovídající strany je velmi snadná. Popíšeme ji krok po kroku, přičemž vycházíme z neprivilegovaného režimu Cisco routeru. 1. enable 2. configure terminal 3. ip sla monitor responder 4. exit Zde si dovoluji upozornit na drobné odlišnosti v syntaxi. Klíčové slovo monitor není potřeba na některých verzích IOSu uvádět.
4.1.2 Nastavení IP SLA Senderu Pro přehlednost konfigurace odesílající strany uvedeme jen základní konfiguraci a zmíníme jen některé rozšiřující konfigurační možnosti. Podrobný výčet všech dostupných parametrů lze najít v dokumentaci na stránkách společnosti Cisco pod názvem Cisco IOS IP Service Level Agreements User Guide. Nejprve nastavíme samotnou testovací operaci. 1. enable 2. configure terminal 3. ip sla monitor číslo instance 4. udp-jitter dest-ipaddr cílová adresa dest-port cílový port codec typ kodeku pro přenos hlasu advantage-factor upravuje hodnoty ICPIF.
leden 2009
6/11
5. frequency čas v sekundách, po kterém bude následovat opětovné odeslání testovacích dat 6. exit Dále zbývá jen přidat zkonfigurovanou operaci do plánovače. 1. ip sla monitor schedule číslo instance life čas v sekundách start-time now 2. exit Parametr start-time lze nastavit v těchto hodnotách: hh:mm[:ss] [month day | day month] | pending | now | after hh:mm:ss]
4.1.3 Výpis konfigurace operace UDP VoIP Jitter Ukázka jedoduché vzorové konfigurace: Číslo 1 značí číslo instance IP SLA. ip sla 1 udp-jitter 10.0.0.2 16384 codec g711alaw advantage-factor 10 frequency 30 history enhanced interval 900 buckets 100 ip sla schedule 1 start-time now
4.1.4 Rozšířené možnosti konfigurace Operace UDP VoIP Jitter umožňuje generovat obsah za použití tří typů použivaných kodeků pro přenos hlasu. Liší se pouze v hodnotě Packet Payload, což je cena packetu.
Tabulka 2: Možnost volby kodeku
leden 2009
7/11
4.2 Analýza kvality služby pomocí UDP Echo operace Operace IP SLA UDP Echo si klade za cíl monitorovat dobu odezvy mezi dvěma Cisco routery nebo jinými síťovými zařízeními, jež mají přiřazenu IP adresu. Princip funkce UDP Echo je změřit čas odpovědi (round-trip-time) testovacího UDP datagramu od jeho vysláného ze zdrojového routeru napříč sítí k cílovému zařízení, až po jeho návrat zpět.
Obr. 5. Pruncip funkce oprerace UPD Echo
4.2.1 Nastavení Responderu Konfigurace tzv. odpovídající strany je shodná s konfigurací v předchozím případě. Opět vycházíme z neprivilegovaného režimu Cisco routeru. 1. enable 2. configure terminal 3. ip sla monitor responder 4. exit Opět je třeba připomenout změny v syntaxi. Klíčové slovo monitor není potřeba na některých verzích IOSu uvádět.
4.2.2 Nastavení IP SLA Senderu Nastavení odesílací strany je opět velmi podobné. Kostra konfigurace je shodná pro všechny typy testů, které jsou v IP SLA dostupné. 1. enable 2. configure terminal 3. ip sla monitor číslo instance 4. udp-echo dest-ipaddr cílová adresa dest-port cílový port 5. frequency čas v sekundách, po kterém bude následovat opětovné odeslání testovacích dat leden 2009
8/11
6. exit Dále zbývá jen přidat zkonfigurovanou operaci do plánovače. 1. ip sla monitor schedule číslo instance life čas v sekundách start-time now 2. exit I zde lze parametr start-time lze nastavit v těchto hodnotách: hh:mm[:ss] [month day | day month] | pending | now | after hh:mm:ss]
4.2.3 Výpis konfigurace operace UDP Echo Ukázka jedoduché vzorové konfigurace: Číslo 1 značí číslo instance IP SLA. ip sla 2 udp-echo dest-ipaddr 10.0.0.2 dest-port 16384 frequency 30 history enhanced interval 900 buckets 100 ip sla schedule 1 start-time now
5. Výsledky provedených testů Nejsnadnější cestou k výsledkům testů je výpis textového souhrnu přímo na konzoli. IP SLA dovoluje statistiky pravidelně ukládat, archivovat a dále administrovat. Lze je ukládat přímo v paměti routeru nebo odesílat na jiné externí zařízení. Pro naše krátkodobé testy však bohatě postačil detailní výpis právě proběhlé operace. Slouží k tomu následující příkaz: show ip sla statistics aggregated V tomto výpisu jsou zahrnuty veškeré nakonfigurované testy IP SLA. Pro výběr výpisu statistiky konkrétního tesu IP SLA, je třeba uvést na konec příkazu odpovídající číslo instance dané IP SLA operace. V následujících podkapitolách jsou tedy uvedené detailní statistiky každého ze dvou prováděných testů.
leden 2009
9/11
5.1 Výpis statistiky operace UDP VoIP Jitter IPSLAs Latest Operation Statistics IPSLA operation id: 1 Latest RTT: 1 milliseconds Latest operation start time: *10:26:17.439 UTC Fri Dec 12 2008 Latest operation return code: OK RTT Values: Number Of RTT: 1000 RTT Min/Avg/Max: 1/1/2 milliseconds Latency one-way time: Number of Latency one-way Samples: 0 Source to Destination Latency one way Min/Avg/Max: 0/0/0 milliseconds Destination to Source Latency one way Min/Avg/Max: 0/0/0 milliseconds Source to Destination Latency one way Sum/Sum2: 0/0 Destination to Source Latency one way Sum/Sum2: 0/0 Jitter Time: Number of SD Jitter Samples: 999 Number of DS Jitter Samples: 999 Source to Destination Jitter Min/Avg/Max: 0/1/1 milliseconds Destination to Source Jitter Min/Avg/Max: 0/1/1 milliseconds Source to destination positive jitter Min/Avg/Max: 1/1/1 milliseconds Source to destination positive jitter Number/Sum/Sum2: 1/1/1 Source to destination negative jitter Min/Avg/Max: 1/1/1 milliseconds Source to destination negative jitter Number/Sum/Sum2: 1/1/1 Destination to Source positive jitter Min/Avg/Max: 1/1/1 milliseconds Destination to Source positive jitter Number/Sum/Sum2: 1/1/1 Destination to Source negative jitter Min/Avg/Max: 1/1/1 milliseconds Destination to Source negative jitter Number/Sum/Sum2: 1/1/1 Interarrival jitterout: 0 Interarrival jitterin: 0 Over thresholds occurred: FALSE Packet Loss Values: Loss Source to Destination: 0 Loss Destination to Source: 0 Out Of Sequence: 0 Tail Drop: 0 Packet Late Arrival: 0 Packet Skipped: 0 Voice Score Values: Calculated Planning Impairment Factor (ICPIF): 1 MOS score: 4.34 Number of successes: 76 Number of failures: 15 Operation time to live: 858 sec Operational state of entry: Active Last time this entry was reset: Never
Z výsledku tohoto pozitivního testu vydíme, že mezní hodnota Treshold nebyla překročena. Dále stojí za povšimnutí nastavení hodnoty ICPIF, což je tvz. faktor zatížení sítě a počet úspěšných a neúspěšných přenosů datagramu. Hodnota ICPIF vychází ze dvou hodnot a to ze zpoždění packetu a jeho případné ztráty. Pohybuje se v hodnotách 1-43, kdy nejnižsí hodnota znamená nejlepší hodnocení.
5.2 Výpis statistiky operace UDP Echo IPSLAs Latest Operation Statistics IPSLA operation id: 2 Latest RTT: 1 milliseconds Latest operation start time: *10:25:44.379 UTC Fri Dec 12 2008 Latest operation return code: OK Over thresholds occurred: FALSE Number of successes: 7 Number of failures: 0 leden 2009
10/11
Operation time to live: 3395 sec Operational state of entry: Active Last time this entry was reset: Never
IPSLAs Latest Operation Statistics IPSLA operation id: 2 Latest RTT: NoConnection/Busy/Timeout Latest operation start time: *10:31:14.379 UTC Fri Dec 12 2008 Latest operation return code: No connection Over thresholds occurred: FALSE Number of successes: 16 Number of failures: 2 Operation time to live: 3072 sec Operational state of entry: Active Last time this entry was reset: Never
Zde jasně vidíme kolik packetů dorazilo k cíli, kolik ne. Naměřené chyby ve druhé ukázce jsou uměle vytvořením fyzickým přerušením konektivity v průběhu testu.
6. Závěr Cisco IP SLA je poměrně rozsáhlý a mocný nástroj, který byl primárně vytvořen jako dílčí nástroj k optimalizaci a sledování spojů komplexní sítě. Jeho nasazení jako součásti velkého balíku pro optimalizaci WAN spojů a síťové infrastruktury je společností Cisco výrazně doporučováno. Je však zapotřebí počítat s tím, že pro efektivní využití tohoto nástroje bude potřeba sáhnout hlouběji do firemních rezerv a zakoupit také nástroje pro grafické vyhodnocování, například Cisco NetQoS Performance Center. Všechny uvedené konfigurace jsou ozkoušeny a plně funkční.
7. Použitá literatura [1] Cisco IOS IP SLAs Configuration Guide [online]. 2008 [cit. 2008-05-27]. Dostupný z WWW:
. [2] HORA, Michal. IT Outsorcing [online]. 2005 [cit. 2008-05-27]. Dostupný z WWW: . [3] Cisco WAN optimization [online]. 2008 [cit. 2008-05-27]. Dostupný z WWW: .
leden 2009
11/11