Leírás
www.npsh.hu
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás
Védjegyek és Jogi nyilatkozat Copyright © Novell, Inc. Minden jog fenntartva. A Novell, és termékei a Novell, Inc. bejegyzett védjegyei az Egyesült Államokban és más országokban. A bejegyzett védjegyek teljes listája a Novell weboldalán található: http://www.novell.com/company/legal/trademarks/tmlist.html. A Linux Linus Torvalds bejegyzett védjegye. Az egyéb védjegyek a birtokos cégek tulajdonát képezik. A jelen dokumentáció kizárólag az ügyfél, ügyfél címe részére készült, ezért egyéb területen, más szervezetnél történő alkalmazásokhoz a Novell Consulting és a Novell Professional Services Hungary nem járul hozzá. A jelen anyag nem másolható, fénymásolható, továbbítható vagy tárolható, csak a Novell Professional Services Hungary előzetes írásos engedélyével. A jelen dokumentum OpenOffice.org 3 Novell Edition programmal készült. Novell Professional Services Hungary 1124 Budapest, Csörsz u. 45. Tel.: +36 1 4894600 Fax.: +36 1 4894601
2/8
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás
Tartalomjegyzék I. Konfiguráció.............................................................................................................................. 4 II. Operációs rendszer verzió........................................................................................................ 4 II.1. Kernel Taint státusz.............................................................................................................................5
III. Teljesítmény mutatók.............................................................................................................. 6 III.1. Memória kihasználtság.......................................................................................................................6 III.2. Load average......................................................................................................................................6 III.3. Interruptok és Context Switchek másodpercenként..........................................................................7 III.4. Lemezterület.......................................................................................................................................7 III.5. Rendszer processzek állapota............................................................................................................7
IV. Üzemeltetési folyamatok........................................................................................................ 8 IV.1. Szabványosítás...................................................................................................................................8 IV.2. Konfiguráció felügyelet.......................................................................................................................8 IV.3. Mentés................................................................................................................................................8 IV.4. Hibatűrés............................................................................................................................................8
3/8
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás
I. Konfiguráció Ezek az információk a Supportconfig nevű alkalmazással gyűjthetőek össze legegyszerűbben. Az eszköz elérhető a http://www.novell.com/communities/ node/2332/supportconfig-linux URL-en. Az alkalmazás begyűjti a szükséges információkat elvégzi a rendszer ellenőrzését és arról jelentést is készít. A SupportConfig használata esetén feltétlen meg kell győződni arról, hogy a felhasznált állományok a mostani futásból származnak. A futás dátuma és a használt SupportConfig verziója megtalálható a basicenvironment.txt állományban.
II. Operációs rendszer verzió Amennyiben a telepített verzió nem a legfrissebb elérhető Service Packkel fut, érdemes frissíteni az utolsó SPre. Az új SP kiadása után, az előző verzió még 6 hónapig támogatott. Ezt az információt az SPident -vv parancs futtatásával nyerhetjük ki legkönnyebben a rendszerből:
# SPident -vv Summary (using 1105 packages) Product/ServicePack conflict match update (shipped) SLE-10-x86_64 0 0% 344 31.1% 177 (2754 12.5%) SLE-10-x86_64-SP1 0 0% 485 43.9% 183 (2938 16.5%) SLE-10-x86_64-SP2 2 0.1% 809 73.2% 179 (2337 34.6%) - grep 2.5.1a-20.17.i586 < 2.5.1a-20.17.x86_64 - yudit 2.9.0-0.4.i586 < 2.9.0-0.4.x86_64 Unknown 290 26.2% Legend for Package Details: - conflicting package (found < expected) CONCLUSION: System is NOT up-to-date! found SLE-10-x86_64-SP1 + "online updates" expected SLE-10-x86_64-SP2 Ebben a példában a végkövetkeztetés kissé félrevezető. Mivel két csomag van telepítve ami eltér az SP2-ben szállítottól, az alkalmazás nem ismeri fel, hogy a rendszer már SP2-re frissített. Ez azonban mindennapos, ezért a jelentést úgy kell értékelni, hogy a kérdéses rendszer a két lemaradt csomag kivételével megfelel az SP 2nek. Általánosságban, ez nem jelent problémát, hacsak nem olyan komponensről van szó ami éppen hibásan működik, vagy ha nagyon fontos csomagról van szó – mint például a Linux kernel. Amennyiben nagy számú ütközést jelez az SPident, ez utalhat egy részlegesen végrehajtott frissítésre. Ha SupportConfigot használjuk az ellenőrzés elvégzésére, az SPident kimenete a basic-environment.txt fájlban tárolódik. SUSE Linux Enterpise Server 11-en már nem elérhető az SPident alkalmazás. Helyette a sam nevű, a sam-suse csomag részeként elérhető program alkalmas ugyanezen feladat ellátására. Az alábbi kivonat a sam parancs kimenetéből az összegzés szekciót mutatja be.
*** Summary (see above or log for details):
4/8
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás Product: SUSE_SLES 11 0 x86_64 Statistics: Total packages installed: Packages signed by Novell: Packages matching installed products: Packages not created by Novell: Unsupported Novell packages: File modifications: Unsatisfied dependencies: Novell packages depending on 3rd party packages: Updates needed: Files not belonging to a package:
1180 1171 1171 2 0 0 0 0 0 ?
Status and recommendations: With a small number of changes, your system can receive support from Novell. In order to ensure supportability, please resolve the following item(s): - One or more repositories need to be updated. SAM was not able to check if your installed Novell software has the versions required to be supported. Please update your repositories for example by running 'zypper refresh'. Then re-run SAM. - repository 'SUSE-Linux-Enterprise-Server-11_11-0' - Package(s) not created by Novell have been found: - novell-npum-2.2.1-0.x86_64 - snort-2.8.4.1-1.1.x86_64 These packages are not part of your Novell product. Novell support engineers might ask you to direct support requests to the manufacturer of these packages.
II.1. Kernel Taint státusz Ezzel az ellenőrzéssel kideríthető tartalmaz-e a kernel olyan modulokat amelyek befolyásolhatják a rendszer viselkedését, és az esetleges hibák felderítésekor harmadik fél bevonását igénylik. Ha a kiszolgáló EMC PowerPath-t használ, vagy VMware virtuális gép, a kernel mindenképpen „tainted” lesz. Ellenőrzés módja: /sbin/sysctl kernel.tainted
> /sbin/sysctl kernel.tainted kernel.tainted = 192 A modulokat az lsmod parancs futtatásával lehet kilistázni. Ebben a listában alaphelyzetben nem lehet olyan modul amit nem a Novell szállított. SupportConfig futtatását követően ez az információ is a basicenvironment.txt fájlban található.
5/8
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás
III. Teljesítmény mutatók III.1. Memória kihasználtság A memória-használati mutatóka többek között a „free -k” parancs futtatásával kaphatjuk meg.
> free -k total Mem: 3622164 -/+ buffers/cache: Swap: 2097136
used 1961984 718664 0
free 1660180 2903500 2097136
Ebben a példában hozzávetőleg 3.6GB fizikai memória és 2GB swap terület van a szerverben. Ha nagyobb mennyiségű swapet használ a rendszer, ez jelezheti azt, hogy a kiszolgáló a futó feladatok elvégzéséhez nem rendelkezik elég memóriával. Ezekben az esetekben memória bővítéssel drasztikus teljesítmény javulás érhető el. Ez az információ is a basic-healthcheclk.txt állományban lelhető fel, a SupportConfig futtatását követően.
III.2. Load average A „load average” a processzorra váró folyamatok számát jelzi az utolsó 1, 5, 15 percben. Ez egy viszonylag jó mérőszáma a kernel terheltségének. A magas load average nem feltétlenül probléma, de indoklás igényel, és nem szabad, hogy a kiszolgáló válaszidői megnövekedjenek miatta. 20 feletti load average mindenképpen problémára utal. CPU terhelés A CPU terhelést két mutatóval tudjuk megfelelően leírni. Az egyik a terhelés mértéke, a másik, a terhelés megoszlása. A terhelés megoszlása általában fontosabb, mint a terhelés mértéke. Ezeket az információkat az mpstat és a vmstat parancs futtatásával kaphatjuk meg. A vmstat kimenetének első sora a rendszer teljes futásidejének átlagát mutatja. A további sorok a minták átlagait mutatják. Az mpstat kimenetében minden sor a mintavételekre vonatkozik. Ha a CPU idő nagy része a user folyamatok futtatására megy el, meg kell nézni mely feladatok használják fel a rendelkezésre álló CPU időt. Ha a system idő az amit magasnak látunk, érdemes egy pillantást vetni a vmstat kimenetének system oszlopára. A magas interrrupt (in) aktivitás hibás hardver működésre vagy meghibásodásra utalhat. A procinfo szekció a hardware.txt fájlban segíthet beazonosítani melyik interrupt okozza a problémát.
6/8
shared 0
buffers 87384
cached 1155936
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás
Ebben a példában látható, hogy a vmstat első sora szerint a CPU-k tétlenek voltak a futásidő nagy részében. A további sorok viszont azt jelzik, hogy pillanatnyilag a rendszer összes processzora 100%-on üzemel. Látható, hogy a user CPU idő használta el a teljes rendelkezésre álló számítási kapacitást. Mivel felhasználói programok okozzák a jelenséget, meg kell nézni mely feladatok használnak kiugróan sok CPU időt. A jobb oldalon látható egy soros parancs a legtöbb CPU időt felhasználó 10 folyamatot listázza ki. Látható, hogy a loop nevű root nevében futó alkalmazás használta el az összes CPU-t.
III.3. Interruptok és Context Switchek másodpercenként > vmstat 1 4 procs -----------memory---------- ---swap-- -----io---- -system-- -----cpu-----r b swpd free buff cache si so bi bo in cs us sy id wa st 0 0 64 8708 75712 110188 0 0 1 21 12 0 4 1 94 0 0 0 0 64 8708 75712 110188 0 0 0 0 314 1365 9 1 90 0 0 0 0 64 8724 75712 110188 0 0 0 0 286 1333 0 0 100 0 0 0 0 64 8724 75712 110188 0 0 0 0 294 1360 0 0 100 0 0 Ha az in vagy cs oszlopok 10000 feletti értékeket mutatnak, az teljesítmény problémára utalhat.
III.4. Lemezterület A lemezterület kihasználtságát a df -h parancs futtatásával nézhetjük meg.
> df -h Filesystem /dev/sda2 udev /dev/sda3 novfs 192.168.2.10:/tivo
Size 20G 1.8G 88G 63122Y 216G
Used Avail Use% Mounted on 12G 7.1G 63% / 180K 1.8G 1% /dev 81G 6.4G 93% /home 63122Y 0 100% /var/opt/novell/nclmnt 180G 37G 84% /mnt
Ebben a példában a /home alá felcsatolt fájlrendszer 93%-ig telített. Hamarosan elfogyhat a hely. Különösen figyelni kell a /var és a /tmp fájlrendszerekre. Amennyiben ezek nem jelennek meg külön a listában, a / fájlrendszer részét képezi. Ha ezekben a könyvtárakban nincs elegendő hely az komoly működési zavarokat okozhat. Ezek a statisztikák a basic-health-check.txt fájlban találhatóak a SupportConfig futtatása után.
III.5. Rendszer processzek állapota Ha processzeket látunk „D” állapotban (uninterruptible sleep - megszakíthatatlan felfüggesztett állapot), ez arra utal, hogy az adott processz lemez felé irányuló I/O-ra vár. Az adott eszközre váró összes folyamat ilyen állapotba kerülhet, ebben az időszakban ezek a folyamatok nem reagálnak, a rendszer látszatra megfagyhat. „Z” állapotú, zombi folyamatok keletkeznek ha processzek leállnak, segfaultolnak, anélkül, hogy a szülőjük erről értesülne. Ez gyakorta hibásan működő alkalmazásokra utal. A „D” állapotú processzek a kiszolgáló teljesítményére nézve kedvezőtlenek, a „Z” állapotú alkalmazások a futó alkalmazások hibájára utalnak. A példában az egyik loop processz van „D” állapotban. Ez az egyik olyan folyamat ami sok CPU-t használ, ez
7/8
Általános ellenőrzési feladatok SUSE Linux operációs rendszereken – Leírás problémát jelenthet, de mivel a többi működik, ez a jelenség valószínűleg átmeneti és üzemszerű. Érdemes később újra ellenőrizni, és az eredmény összevetni az előző elleneőrzésével. Amennyiben ugyanaz a folyamat (megegyező PID) vár I/O-ra további vizsgálatot igényelhet a probléma.
IV. Üzemeltetési folyamatok IV.1. Szabványosítás Azonos szerepet betöltő kiszolgálóknak amennyire lehet, hasonlónak kell lenniük. Ez megkönnyíti a kiszolgálók karbantartását és az esetleges tudás átadást is. Amennyiben a megszokottól eltérő megoldásokat alkalmazunk, azokat alaposan dokumentálni és egyértelműen kommunikálni kell.
IV.2. Konfiguráció felügyelet Tanácsos valamilyen módon a konfigurációs változásokat követhetővé tenni. Ugyan a manuális változás kezelési folyamatokban definiált dokumentációs lépések hasznosak, ezek mellett fontos egy automatikus archiválási, verziókövetési mechanizmus kiépítése. Erre alkalmas lehet a SupportConfig heti, havi futtatása is. Az eltárolt adatok, információk automatizáltan képződnek és lehetőséget nyújtanak a változások követésére.
IV.3. Mentés Minden termelésben részt vevő rendszerről készülnie kell mentésnek. A mentési stratégia kidolgozása túlmutat ezen a dokumentumon, de fontosságát nem lehet eltúlozni.
IV.4. Hibatűrés Amennyiben a szerverek által futtatott szolgáltatások leállása komoly zavart okoz az üzletmenetben, tanácsos elgondolkodni hibatűrő környezet kialakításán és katasztrófa elhárítási terv kidolgozásán. Ezen a ponton ismét nagyon fontos a mentési stratégia kidolgozása.
8/8