Monitoring as a Service
A P E R T O S O N V – G u i d o G e z e l l a a n 1 6 – 9 8 0 0 D e i n z e – T e l . : + 3 2 9 3 8 1 6 4 5 0
Probleemstelling IT diensten kampen vaak met het probleem van een gebrek aan een duidelijke, allesomvattende monitoringoplossing. Door het ontbreken hiervan is het erg moeilijk om een duidelijk beeld te krijgen van het resource gebruik op de verschillende servers en netwerkapparatuur. Men kan moeilijk nagaan wat de evolutie is van zaken als CPU, geheugenverbruik en schijfruimte over een bepaalde periode. Problemen worden pas ontdekt als het reeds te laat is: disks die stuk zijn in een raid set, schijven die volledig volgelopen zijn, te hoog geheugenverbruik, te hoge I/O op de datastores van de VMware omgeving, enz. Tenslotte heeft men ook geen zicht op de beschikbaarheid van de verschillende bedrijfs-‐ kritische applicaties.
Oplossing
Monitoring software kan ervoor zorgen dat u zo snel mogelijk op de hoogte wordt gebracht bij problemen. Mits juist geconfigureerd bent u vaak reeds op de hoogte van mogelijk problemen, vooraleer ze effectief een negatieve impact veroorzaken. Voorbeelden: • U krijgt bericht op het moment dat de vrije schuifruimte minder dan 20% bedraagt • Automatische waarschuwing wanneer problemen ontdekt worden met een raid controller of één van de onderliggende disks • Waarschuwing bij onbereikbaarheid van bepaalde applicaties • Bij problemen met de VPN verbinding tussen 2 sites wordt u direct op de hoogte gesteld • Bericht bij falen van backups Deze software kan u ook helpen bij het identificeren van terugkerende problemen, ontdekken van trends en helpen bij besluitvorming rond upgrades. Voorbeelden: • Evolutie van schijfruimteverbruik over een bepaalde periode, zodat u pro-‐actief extra ruimte kan voorzien • Identificatie van hoge CPU load op vaste momenten van de dag. U kan dan nakijken of dit al dan niet als normaal kan worden bestempelt en indien nodig actie ondernemen • Bepalen of u al dan niet baat heeft bij het upgraden van uw internet-‐connectie: verbruikt u nooit de volledige bandbreedte van uw verbinding dan heeft upgraden wellicht geen zin.
Ons aanbod Apertoso biedt een oplossing aan op basis van ZABBIX. Deze monitoringsoftware is in staat om onder andere volgende zaken te monitoren (niet exhaustieve lijst): • VMware omgevingen o Monitoring van een volledige vSphere omgeving: hypervisors, storage o Monitoring van de individuele virtuele machines • Hardware monitoring via IPMI, DRAC, ILO • RAID monitoring • Monitoring van Linux en Windows gebaseerde servers • Applicatie-‐ en databasemonitoring • Netwerkmonitoring • UPS monitoring Onze oplossing is gebaseerd op een architectuur waarbij bij de klant enkel een capture device wordt geplaatst. Alle monitoring-‐data wordt opgeslagen op servers van Apertoso NV, waarbij de klant inloggegevens krijgt om zijn eigen data te raadplegen. Dankzij deze manier van werken is er voor de klant geen investering nodig in infrastructuur voor het opslaan van de monitoringgegevens. Apertoso NV voorziet tevens in de volledige setup en configuratie van de oplossing. Samen met de klant wordt nagegaan welke toestellen en applicaties hij of zij wil opnemen in de monitoringoplossing. Deze configuratie is inbegrepen in het contract.
Prijs
Hoeveel u betaalt per jaar is enkel afhankelijk van het aantal hosts dat u wil monitoren. Een host kan volgende zaken zijn: • Server • Netwerktoestel: firewall, switch, router… • UPS • vSphere omgevingen: vCenter en hypervisors tellen als hosts. De verschillende virtuele machines tellen niet als aparte host als men enkel gebruik maakt van de statistieken die via de vCenter API beschikbaar worden gemaakt. Wil men extra monitoring van individuele virtuele machines (applicatie monitoring, backup status etc), dan tellen deze virtuele machines wel als host. Afhankelijk van het type host kunnen, in samenspraak met de klant, verschillende monitoringparameters worden geconfigureerd.
SMALL
MEDIUM
LARGE
Maximum hosts SMS alerts Email alerts Gebruikers Setup (*) Monitoring-‐appliance (*)
10 500/jaar onbeperkt onbeperkt €500 / gratis €100 / gratis
25 1000/jaar onbeperkt onbeperkt €1000 / gratis €100 / gratis
50 2000/jaar onbeperkt onbeperkt €2000 / gratis €100 / gratis
€450/jaar
€950/jaar €1800/jaar
(*) setup & appliance zijn gratis bij een 2-‐jarig contract ; Meer hosts? Neem contact met ons op.
Extra In het geval de monitoring-‐applicatie een probleem geconstateerd heeft kan u ervoor kiezen het probleem door Apertoso NV te laten afhandelen. Als extra dienst bij de monitoring-‐ oplossing bieden wij u 3 verschillende tarieven voor het afhandelen van het probleem, waarbij de prijs afhankelijk is van het niveau van dringendheid die door u wordt bepaald. NIET DRINGEND STANDAARD DRINGEND We gaan binnen de 5 werkdagen aan de slag en proberen uw probleem zo snel mogelijk op te lossen.
€75/uur
We gaan op werkdagen binnen de 48 uur aan de slag en proberen uw probleem zo snel mogelijk op te lossen.
€95/uur
We gaan op werkdagen binnen de 4 uur aan de slag en proberen uw probleem zo snel mogelijk op te lossen.
€115/uur
Voorbeelden Screens Deze “screens” worden volledig op maat configureert en geven een grafische voorstelling van de actuele toestand van uw systemen.
In bovenstaand voorbeeld ziet u een aantal verschillende servers, netwerklinks (groene lijnen), switches en firewalls. Bij elk device en/of link kan ingesteld worden welke triggers gekoppeld zijn met de status. Zo kan een netwerklink bijvoorbeeld rood kleuren als de poort op de switch down gaat of als de gebruikte bandbreedte boven een bepaald percentage gaat. De status van een server kan o.a. afhangen van parameters als cpu-‐load, applicatie-‐beschikbaarheid enz.
Onderstaande screen geeft een snel overzicht van de status van een VMware cluster. Zo ziet u dat de 2 storage servers een probleem hebben geconstateerd. Concreet was er in onderstaande een probleem van media errors op de disks. ZABBIX las deze waarden uit van de RAID controllers, zodat vroegtijdig problemen met de disks werden bloot gelegd. Voor de RAID controller was op zich nog alles in orde (RAID set status was nog steeds optimal), maar de disks konden worden vervangen door de fabrikant voor ze effectief in failed status terecht kwamen, wat kan gebeuren als ze teveel media errors beginnen vertonen. Zonder de monitoring oplossing had men nooit geweten dat bepaalde disks reeds media errors vertoonden.
Statusoverzicht Op het home-‐scherm van de monitoring-‐oplossing ziet u snel welke machines er al dan niet problemen hebben. Onderstaand voorbeeld is afkomstig van dezelfde setup als vorig screenshot. U kan zien welke disks media errors vertoonden en in welke server. Verder blijkt ook een bepaalde host in een remote netwerk niet bereikbaar:
Overzichtsschermen
U kan geheel naar wens een aantal overzichtsschermen configureren waar u meerdere grafieken van één of meerdere hosts naast elkaar kan plaatsen en vergelijken op hetzelfde punt in de tijd. Een scrollbar is beschikbaar om terug te keren in de tijd en/of de gevisualiseerde periode aan te passen. Een eerste screenshot toont het geheugenverbruik op 4 verschillende hypervisors. Zo kan u nagaan of uw servers gelijkmatig belast zijn. Bovenaan ziet u de scrollbar waarvan eerder sprake.
In dit tweede voorbeeld ziet u verschillende grafieken van 1 server: CPU load, Memory usage, Free disk space op één van de volumes en netwerkverkeer. Interactie met de scrollbar zorgt ervoor dat alle grafieken tegelijkertijd worden aangepast.
Ruwe data en individuele grafieken
Bij elke host kan u steeds alle “latest data” opvragen. U krijgt dan een overzicht van alle zaken die worden bijgehouden met hun laatste waarde. Ten allen tijde kan u doorklikken en individuele grafieken opvragen. Hierop zit u dan de evolutie van deze specifieke waarde over de tijd heen.
Samengestelde grafieken Naast de individuele grafieken die u kan opvragen per gemonitorde waarde, zijn er ook steeds samengestelde grafieken beschikbaar die meerdere waardes op 1 grafiek combineren. In onderstaand voorbeeld ziet u een gecombineerde grafiek van binnenkomend en uitgaand netwerkverkeer op een server:
Bovenstaande grafiek geeft de CPU load weer op een machine, waarbij gemiddeldes van de laatste 1min, 5min en 15min worden gecombineerd op dezelfde grafiek. Zo kan worden nagegaan wat de piekbelasting en gemiddelde belasting is op een bepaalde machine.
Bijkomende informatie? Hebt u nog vragen of wil u graag een demonstratie, neem dan contact met ons op. Wij helpen u graag verder. Jos De Graeve Maarten De Wispelaere General manager Senior ICT Engineer Apertoso NV Guido Gezellelaan 16 9800 Deinze Tel. : +32 9 381 64 50 Email:
[email protected] Een beknopt overzicht van deze dienst kan u ook terugvinden op volgende pagina: http://www.apertoso.be/monitoring-‐as-‐a-‐service/ Alle vermelde prijzen excl. BTW Prijzen geldig tot 31/12/2014 De algemene voorwaarden van Apertoso NV kan u terugvinden op: http://www.apertoso.be/wp-‐content/uploads/2014/03/verkoopsvoorwaarden.pdf