1 Egy DBA napja: Teljeskörű üzemeltetés Oracle Enterprise Manager-rel Sárecz Lajos Vezető értékesítési tanácsadó2 Program Agenda Teljeskörű menedzsme...
Egy DBA napja: Teljeskörű üzemeltetés Oracle Enterprise Manager-rel Sárecz Lajos Vezető értékesítési tanácsadó
Program Agenda
• Teljeskörű menedzsment Oracle Enterprise Manager használatával • Egy DBA napja demo • Kérdések és válaszok
3
Teljeskörű menedzsment
4
Eltérő szerepek; Eltérő perspektívák; Egyetlen környezet Egyetlen, teljeskörű megoldást igényel Végfelhasználók
• Miért csökkent a megrendelések Üzletágvezető száma? • Mitől fut lassan az alkalmazás?
Alk. üzemeltető / Alk. support
DBA
• Miért okoz az alkalmazás erőforrás problémákat az adatbázisban?
• Miért túlterheltek a szerverek? Szerver admin
Applications and Application Services
Middleware
Database
Host, OS, Storage and Network Host, Host, OSOS
5
Az Enterprise Manager teljes megoldást kínál Teljeskörű üzemeltetés az alkalmazástól a diszk rétegig
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
6
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
7
Egy DBA napja A demo forgatókönyv • Végfelhasználók nem tudják befejezni a tranzakcióikat – A RUEI műszerfal detektálja a problémát és annak hatását – A szolgáltatások műszerfalon az alkalmazás szolgáltatása leállt
• Alkalmazás szolgáltatás oldalán failed „Checkout” hiba – A topológia nézettel a szolgáltatás komponenseit vizsgáljuk
• Köztes rétegben egyre több szál jelez hibát – A JVM diagnosztika zárolt szálakat mutat és DB SQL Wait-et jelez
• Adatbázis diagnosztika, javaslatok megtekintése – “Checkout” SQL okozza a sor zárolást – SQL hard parszolást okoz
• Virtuális host-ra az Ops Center Console riasztást jelez – Az Ops Center egy SR-t készít a rossz ventilátor javítására
8
Végfelhasználók és üzleti tranzakciók monitorozása
9
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
10
Felhasználó monitorozás áttekintés Passzív és aktív monitorozás egymást kiegészítik
• Valós felhasználó monitorozás – Az „Online Tool Shop” alkalmazás összes valós felhasználói munkamenetének és tranzakciójának monitorozása
• Szintetikus felhasználó monitorozás – Aktívan monitorozza a kritikus tranzakciókat beleértve a “Checkout Transaction”-t is, függetlenül a valós aktivitástól Felhasználók Web Servers
Application Servers
Databases
Internet Cloud
Hosts
Szintetikus felhasználó monitorozás
Valós felhasználó monitorozás
11
Valós végfelhasználó monitorozás Műszerfal Lépések vizsgálata a tranzakciós tölcsérben
A felhasználók frusztráltak a “Checkout” tranzakció miatt Kritikus tranzakció KPI riasztás az “Online Tool Shop” esetén
“Checkout” tranzakció tüske megjelent
Tipp: A műszerfal alkalmazásonként, felhasználónként testreszabható 12
Valós végfelhasználó monitorozás Checkout tranzakció tölcsér Nézzük meg ugyanezt a tranzakciót a szolgáltatások műszerfalon
“Online Tool Shop” fizetési tranzakciójában sok munkamenet szakad meg
Tipp: Azonosítsuk be azt a lépést, ahol a felhasználók megszakítják a tranzakciót, majd fúrjunk le, hogy megtaláljuk a probléma kiváltó okát. 13
Vizsgáljuk tovább azt a szolgáltatás tesztet, amelyik leállt
Az “Online Tool Shop” alkalmazás szolgáltatás leállt! Megrendeléseket veszítünk.
Tipp: Egy szolgáltatás akkor áll le, ha bármely helyszínről végrehajtott rendelkezésre állást mérő tranzakció bármilyen okból kifolyólag meghiúsul.
14
Szintetikus felhasználó monitorozás Különböző helyszínekről kapott válaszidők Menjünk a szolgáltatás oldalra, hogy megvizsgáljuk miért sikertelen a tranzakció
A szolgáltatást különböző végpontokról monitorozzuk
A teszt sikertelen minden helyszínről; Tipikusan szerver oldali problémát jelent
Tipp: Minden kritikus tranzakciót monitoroz függetlenül a felhasználók aktivitásától; Azonosítja a problémákat, mielőtt a felhasználók tapasztalnák 15
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
16
Diagnosztika az alkalmazás és köztes rétegben
17
Alkalmazás teljesítmény menedzsment áttekintés • “Online Tool Shop” alkalmazást egy szolgáltatásként modellezzük – Szolgáltatás szint mérése (rendelkezésre állás és teljesítmény) – Gyorsan azonosítja az alkalmazás problémás komponenseit – Grafikus módon megmutatja a szolgáltatás topológiát (rendszer komponensek kapcsolatai)
• Integrált middleware menedzsment megoldás – Komponensek teljesítményére teljeskörű nézet – Lefúrási lehetőség a JVM rétegbe, így azonosítható a “Checkout” tranzakció probléma forrása (method, thread) – Korrelálja a middleware problémákat az adatbázis réteggel
18
Alkalmazás szolgáltatás modell Szolgáltatás tesztek és riasztások
Rendszer topológia
A “Checkout” tranzakció sikertelen
A szolgáltatás riasztás request timeout-ot jelez
Tipp: A valós tranzakciók beimportálhatók a RUEI*-ből és használhatók szolgáltatás tesztként; Több helyszínről futtatva a szolgáltatási teszteket további információt ad: A győri iroda nem éri el az alkalmazást, a budapesti igen – alkalmazás jól működik, hálózati probléma a győri irodában. * Real User Experience Insight
19
Alkalmazás szolgáltatás modell Lefúrás a szolgáltatás topológia használatával
Problémákat találtunk mind a köztes rétegben, mind az adatbázis rétegben
Lefúrás a köztes rétegbe
Opcionális: Bármelyik problémás komponens választható a lefúráshoz
20
Alkalmazás diagnosztika a köztes rétegben WebLogic Server Homepage
Riasztások
Kritikus riasztás
Tüske a feldolgozási időben
Tipp: A főoldal (riasztások & válaszidők) jó kiindulópont a probléma diagnosztizáláshoz
21
Alkalmazás diagnosztika a köztes rétegben Szerver riasztások megtekintése Vissza a főoldalra szál diagnosztizálásért
Nagy számú aktív szál és aktív munkamenet
Tipp: Nagy számú aktív szál és aktív munkamenet lelassult alkalmazásra utal.
22
Alkalmazás diagnosztika a köztes rétegben Lefúrás a JVM-be
Összegzés
JVM diagnosztika a zárolt szálak azonosítására
Tipp: Az integrált JVM diagnosztikával közvetlenül le lehet fúrni a JVM szintre, és az éles környezetben végrehajtható a Java elemzés. 23
Alkalmazás diagnosztika a JVM szintjén JVM diagnosztikai műszerfal Valós idejű elemzés Zárolások száma riasztóan növekszik
“Checkout” tranzakció az érintett
Tipp: Valós idejű & historikus JVM metrika értékek; leszűkítés a problémára. 24
Alkalmazás diagnosztika a JVM szintjén Java szálak megtekintése valós időben
Valós idejű elemzés
Tipp: Az épp futó szálak viselkedésének és állapotának vizsgálata. 25
Alkalmazás diagnosztika a JVM szintjén A problémás szál megtalálása A szál a Cart.java-n akadt meg (Checkout.jsp része)
Egyből beazonosítható az SQL is, ami blokkol
A zárolást okozó szál
Tipp: Azonosítsuk be a problémát és annak hatását és fúrjunk le további elemzésre. 26
Alkalmazás diagnosztika a JVM szintjén Problémás SQL beazonosítása
SQL hash értéke a DB debug-hoz
Javítsuk meg ezt a konkrét SQL problémát
Tipp: Middleware problémák korrelálása az adatbázis réteghez
27
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
28
Probléma diagnosztika az adatbázisban
29
Adatbázis teljesítmény menedzsment áttekintés • Diagnosztika közvetlenül beépítve az adatbázis kernelbe – Pontos és hatékony – Felfedi a problémák forrását – különbséget tesz a tünetek és a kiváltó okok között – A problémamentes területeket is felsorolja pl.: I/O nem problémás
• Adatbázis teljesítményt korrelálja más komponensekkel – hardver, operációs rendszer, tároló, alkalmazás, stb
• Automatizálja az SQL hangolást • A konfiguráció és változáskezeléssel integrált – Teljeskörű diagnosztika – Gyorsabb probléma megoldás
Az ADDM javaslat megtekintése A problémantes területekkel nem érdemes időt tölteni
DBA Tipp: RAC* környezetben az ADDM az adatbázis klaszter erőforrásait is elemzi és felfedi a klasztert érintő problémákat is. * Real Application Cluster
35
Javaslatok alapján vizsgáljuk meg a problémákat Tábla zárolások
A sor szintű zárolás alkalmazás logikai hibára utal
DBA Tipp: Nem az adatbázissal van a gond; Használjunk JVM diagnosztikát hogy megtaláljuk a problémás Java osztályt / metódust 36
Javaslatok alapján vizsgáljuk meg a problémákat Hard parszolás
A problémát egy nem engedélyezett konfigurációs változtatás okozza
DBA Tipp: Az Enterprise Manager Configuration Management használatával a nem engedélyezett változtatásokat valós időben lehet monitorozni
40
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
41
Lefúrás a szerver és diszk rétegbe
42
Szerver menedzsment áttekintés • Teljeskörű menedzsment a fizikai és virtuális rendszerekre – Hardver & OS monitorozás – valós időben és historikusan – Automatikus felderítés – Automatizált telepítés és patch-elés
• Fejlett virtuálizáció menedzsment – VM életciklus menedzsment – Létrehozás, törlés és konfigurálás – Erőforrás monitorozás – Terhelés migráció
• Támogatja a korrelációt más infrastruktúra komponensekkel
43
Host menedzsment Host riasztások megtekintése
Hibás ventilátor riasztás
Tipp: Az Ops Center integráció szerver szintű információkat ad a Grid Control-nak
44
Host menedzsment Probléma felderítése
A hibás ventilátor hatásai
Tipp: ASR (Automatic Service Request)* automatikusan nyit egy Sun service request-et, anélkül hogy bárkinek fel kellene hívni a Sun szakértőket. * Available at no cost on servers covered by a Sun warranty or a Sun Spectrum service plan.
45
Egy DBA napja demo menete
Üzletágvezető
Alk. üzemeltető / Alk. support
DBA
RUEI Dashboard
Services Model
DB Performance page
Business Transaction Management
Services Dashboard
J2EE Application Home Page
JVM Diagnostics
ADDM Recommendations
Database Testing
Szerver admin Ops Center Virtualization Mgmt
Host Management
47
Az élet visszatér a normális kerékvágásba
48
Adatbázis teljesítmény
Jelentős teljesítmény javulás
DBA Tipp: Alkalmazás adminisztrátorok értesíthetők, hogy az adatbázis jól működik. 49
Szolgáltatás oldal
A “Checkout” tranzakció teszt sikeres
Tipp: Az “Online Tool Shop” rendelkezésre állását különböző helyszínekről futó szintetikus tranzakciók igazolják. 50
Szolgáltatások műszerfal
Az Online Tool Shop szolgáltatás ismét jól működik