Monitoring kritických systémů Case study Tomáš Hrubý, AutoCont CZ
[email protected] 17.2.2011
Krátké seznámení se společností AutoCont CZ a.s.
— — — — — — — —
2
česká soukromá společnost holdingového uspořádání mateřská firma založená roku 1990 v Ostravě od roku 1994 též na Slovensku 50 poboček po celém území ČR a SR Celkové tržby v roce 2009 cca 2.500 mil. Kč přes 800 zaměstnanců v ČR a SR certifikát jakosti ISO 9001:2001 a ISO/IEC 20000:05 Platinum partner společnosti CA
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Agenda
— Úvodní situace — Zvolené řešení – použité produkty CA — Architektura — Praktické zkušenosti z implementace − Pozitivní zkušenosti − Problematické body
— Dotazy?
3
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Úvodní situace
— Požadavek na dohled zcela nového datacentra — Dohledované prvky: − Servery Windows, Linux (celkem cca 50) − Databáze Oracle, MS SQL − Síťové prvky (převážně Cisco) − Nutno dohledovat infrastrukturu datacentra – jističe, čidla teploty atd. − Nutný dohled specifických aplikací psaných na zakázku – možnost logování stavu pomocí syslogu
— Požadovaná integrace s CA ServiceDesk Manager a CMDB
4
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Zvolené řešení – použité produkty CA
— CA Spectrum 9.1.2 − − − − −
Centrální konzola Vizualizace struktury sítě Zpracování SNMP událostí všeho druhu – přímo nebo s pomocí SBGW Notifikace Reporting – CA BOXI
— CA Event Integration for Spectrum 1.2 − Zpracování logů aplikací zasílaných přes Syslog
— CA SystemEdge − Dohled operačních systémů Windows Server, Linux
— CA DB Insight − Dohled databází Oracle, MS SQL 5
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Architektura řešení
6
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Implementace – CA Spectrum
— Instalace serverové části verze 9.1.2 bez komplikací — Discovery síťových prvků vesměs úspěšné „out-of-the box“ — Vizualizace prostředí v konzoli OneClick velmi komfortní a přehledná (možno customizovat podle potřeby) — Pro dohled DC (typicky jističe) nutno zajistit MIB − Velmi dobré zkušenosti s modulem SouthBound GW – například jističe či čidla teploty lze výborně vizualizovat na jednotlivé objekty
— Zpracování událostí (Event management) pomocí Event console – zpravidla bez problémů
7
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Implementace – CA SystemEdge
— Agenti CA SystemEdge slouží pro detailnější dohled operačních systémů (různých platforem) — Instalace vesměs bez komplikací — Problém – ve spojení se Spectrum 9.1.2 nelze agenty nastavovat z konzole OneClick, tato funkce je k dispozici až v 9.2 — Obecně chybí ve spojení se Spectrum centrální správa agentů (je k dispozici v produktu eHealth)
8
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Implementace – CA Event Integration — Produkt použit především pro zpracování dat zasílaných formou syslogu — Příjem syslogu pomocí aplikace Kiwi syslog server — Instalace a úvodní konfigurace CA EI o něco složitější, nicméně výsledek dobrý − Jde o mimořádně mocný nástroj, který umí zpracovat události velice dobře… − …bohužel ale není práce příliš intuitivní – optimální je upravovat politiky ručně přímo v XML souborech, vyžaduje čas na pochopení.
— Je nutno komunikovat s dodavateli aplikací, pokud posílají logy v jednotném formátu, vše se velmi zjednoduší. 9
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Implementace – CA DB Insight
— Zpočátku komplikace s kompatibilitou s Oracle clusterem − Původně zvažován produkt eHealth DPO, jeho podpora ale byla ukončena − Výsledkem byl přechod na DB Insight, kde byla (byť s jistým zpožděním) podpora doplněna
— Vlastní instalace a funkce je po získání aktuální verze OK − Určitou komplikací je pouze name resolution – produkt je značně „háklivý“ na stav DNS, virtuálních jmen clusteru atd…
10
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Přechod na verzi 9.2 a komplikace s ní spojené
— V průběhu projektu jsme se rozhodli Spectrum upgradovat na novou verzi 9.2 − Velmi zásadním důvodem možnost ovládání SystemEdge z OneClick − Kromě toho ale řada zlepšení v event managementu a dalších oblastech
— Upgrade proběhl na první pohled bez problémů, ale: − Bohužel se začala projevovat řada bugů nové verze (např. nefunkční REGEX v Event Console) − Postupné řešení – aplikace cumulative patche H01, později H02 – s ním již systém poměrně stabilní a klady 9.2 převládají (k dispozici je již H03, který situaci dále zlepšuje)
11
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Shrnutí - klady a problematické body
— Klady − Naprostá spokojenost s OneClick konzolí − Velmi se osvědčilo SBGW pro dohled prvků datacentra − Po překonání úvodních komplikací představuje Event Integration velmi „mocný“ nástroj − Dobrá podpora ze strany CA
— Problematické body − Integrace SystemEdge a DB Insight se Spectrem není zatím dokonalá − Ne zcela podařený upgrade na 9.2 (výsledek dobrý, ale komplikací bylo víc, než by bylo žádoucí)
12
February 17, 2011
Monitoring kritických systémů Case study.pptx
Copyright ©2011 AC CZ.
Vaše dotazy?
Tomáš Hrubý, AutoCont CZ
[email protected] 17.2.2011
Děkuji vám za pozornost