Linux adatkezelési képességei avagy RAID, LVM és állományrendszerek
Szalai Ferenc
[email protected] Creator:inkscape 0.44.1
http://www.avaxio.hu
Nézz magadba és rendszereidre!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Mi a tipikus konfiguráció?
Creator:inkscape 0.44.1
http://www.avaxio.hu
1 szerverben, 1 vagy maximum néhány merevemez. Nincs redundancia!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Azán, ha megtörténik a baj
Creator:inkscape 0.44.1
http://www.avaxio.hu
Sírás van
Creator:inkscape 0.44.1
http://www.avaxio.hu
vagy mentés
legyen mentés! Creator:inkscape 0.44.1
http://www.avaxio.hu
Előzzük meg a bajt! Használjunk hibatűrő megoldásokat!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Olcsó merevlemezekből építkezzünk (SATA, ATA)
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID: Redundant Array of Inexpensive Disks (David A. Patterson, Garth A. Gibson and Randy Katz, 1988 junius)
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID szintek
Creator:inkscape 0.44.1
http://www.avaxio.hu
Elemi egység: BLOKK
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID 0 - stripe
Nincs redundancia! Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID 0 Sebességre hajtunk!
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID 1 - mirror
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID 5 Parittás (pl. Hamming ECC) a te barátod!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Jó nekem a 1TB-os lemez?
Creator:inkscape 0.44.1
http://www.avaxio.hu
Problémák nagy lemezekkel Nagy sebesség eltérések a lemez elején vs végén (20-30%) ● Hosszú RAID szinkronizációs idő ● Egybe vesztünk sokat ● Élettartam problémák (<< 300.000 óra két hiba között) ●
Creator:inkscape 0.44.1
http://www.avaxio.hu
A dupla merevlemez meghibásodások száma arányos a merevlemez számának 3-adik hatványával!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Sok lemeznél a RAID5 nem megoldás! Legalább RAID6 legyen!
Creator:inkscape 0.44.1
http://www.avaxio.hu
RAID6 Parittásbol sosem elég! Legyen rögtön kettő!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Kevert RAID szintek Alap szintek kombinálhatók. ● Pl: RAID 0+1, RAID1+0 ●
Creator:inkscape 0.44.1
http://www.avaxio.hu
Az örök dilemma: Hardver vagy softver RAID?
Creator:inkscape 0.44.1
http://www.avaxio.hu
3ware 9560 PCI-E RAID vezérlő Vs. Linux szoftver RAID
Creator:inkscape 0.44.1
http://www.avaxio.hu
Creator:inkscape 0.44.1
http://www.avaxio.hu
Creator:inkscape 0.44.1
http://www.avaxio.hu
Linux szoftver RAID HOGYAN
Creator:inkscape 0.44.1
http://www.avaxio.hu
Kell egy eszköz!
Creator:inkscape 0.44.1
http://www.avaxio.hu
MDADM a te barátod
Creator:inkscape 0.44.1
http://www.avaxio.hu
mdadm --create --auto=yes \ --level=5 --raid-devices=3 \ –-spare-devices=1 \ /dev/md0 /dev/sdn /dev/sdk \ /dev/sdl /dev/sdm mdadm –-stop /dev/md0
Creator:inkscape 0.44.1
http://www.avaxio.hu
cat /proc/mdstat Personalities : [raid0] [raid6] [raid5] [raid4] md3 : active raid5 sdl[4] sdm[3](S) sdk[1] sdn[0] 976772992 blocks level 5, 64k chunk, algorithm 2 [3/2] [UU_] [>....................] recovery = 0.0% (241152/488386496) finish=134.9min speed=60288K/sec unused devices: <none>
Creator:inkscape 0.44.1
http://www.avaxio.hu
mdadm --detail /dev/md3 /dev/md3: Version : 00.90.03 Creation Time : Sat Oct 13 07:03:46 2007 Raid Level : raid5 Array Size : 976772992 (931.52 GiB 1000.22 GB) Device Size : 488386496 (465.76 GiB 500.11 GB) Raid Devices : 3 Total Devices : 4 Preferred Minor : 3 Persistence : Superblock is persistent Update Time : Sat Oct 13 07:03:46 2007
State : clean, degraded,
recovering
Active Devices : 2 Working Devices : 4 Failed Devices : 0 Spare Devices : 2 Layout : left-symmetric Chunk Size : 64K Rebuild Status : 0% complete UUID : f1b7a549:ceee3fb8:8cf68a7e:6edfe29a Events : 0.1 Number Major Minor RaidDevice State 0 8 208 0 active sync /dev/sdn 1 8 160 1 active sync /dev/sdk 4 8 176 2 spare rebuilding /dev/sdl 3
8
192
Creator:inkscape 0.44.1
-
spare /dev/sdm
http://www.avaxio.hu
mdadm –-fail mdadm –-remove mdadm –-add mdadm –-assemble –-scan /dev/md0 mdadm –-monitor –-demonise – scan (/etc/default/mdadm) (/etc/cron.d/mdadm -> checkarray) Creator:inkscape 0.44.1
http://www.avaxio.hu
mdadm --detail –-scan >> /etc/mdadm/mdadm.conf ARRAY /dev/md3 level=raid5 numdevices=3 spares=2 UUID=f1b7a549:ceee3fb8:8cf68a7 e:6edfe29a
Creator:inkscape 0.44.1
http://www.avaxio.hu
Figyeljünk a nevekre! /dev/disk/by-id
Creator:inkscape 0.44.1
http://www.avaxio.hu
Daraboljunk intelligensen! (Linux Volume Management (LVM) azaz PV, VG, LV és egyéb állatfajták)
Creator:inkscape 0.44.1
http://www.avaxio.hu
Emlékeztető: Még mindig blokk az elemi egység
Creator:inkscape 0.44.1
http://www.avaxio.hu
Creator:inkscape 0.44.1
http://www.avaxio.hu
Fizikai kötetek - PV pvcreate /dev/md3 pvcreate /dev/hda1 pvscan PV /dev/md3 lvm2 [931.52 GB] Total: 1 [931.52 GB] / in use: 0 [0 [931.52 GB]
] / in no VG: 1
pvresize pvdisplay pvremove
Creator:inkscape 0.44.1
http://www.avaxio.hu
Az LVM egyik legfontosabb előnye a méretgazdálkodás
Creator:inkscape 0.44.1
http://www.avaxio.hu
Kötet csoportok – VG vgcreate barmi /dev/md3 /dev/hda1 vgs VG #PV #LV #SN Attr VSize VFree barmi 1 0 0 wz--n- 931.52G 931.52G
vgdisplay vgrename vgremove
Creator:inkscape 0.44.1
http://www.avaxio.hu
Logikai kötetek - LV lvcreate -i 2 -n var -L 300M barmi /dev/barmi/var lvs LV VG Attr LSize Origin Snap% Move Log Copy% var barmi -wi-a- 300.00M lvdisplay lvremove lvresize lvreduce Creator:inkscape 0.44.1
http://www.avaxio.hu
Figyelemre méltó apróság: snapshot
Creator:inkscape 0.44.1
http://www.avaxio.hu
lvcreate –-snapshot -L 512M \ -n backup /dev/sda1 a snapshot készítése előtte állítsunk le minden I/O műveletet ● a méret az eredeti kötet 10-20% kell csak legyen ●
Creator:inkscape 0.44.1
http://www.avaxio.hu
Creator:inkscape 0.44.1
http://www.avaxio.hu
Paraméter /sys/block/sda/queue/max_sectors_kb /sys/block/sda/queue/nr_request s blockdev –setra /sys/block/sda/queue/scheduler
Default Opt 128 64 128 512 256 16384 deadline cfq
ionice -c2 -n0
Creator:inkscape 0.44.1
http://www.avaxio.hu
Melyik állományrendszert használjunk?
Creator:inkscape 0.44.1
http://www.avaxio.hu
Az esetek 90%-ban az ext3 tökéletesen megfelelő a maradék 10%-ban használjunk XFS-t
Creator:inkscape 0.44.1
http://www.avaxio.hu
Minden ellenállás hasztalan
Creator:inkscape 0.44.1
http://www.avaxio.hu
Nem lehet végtelen mennyiségű merevlemezt egy szerverbe pakolni!
Creator:inkscape 0.44.1
http://www.avaxio.hu
Adatorientált tervezésre van szükség! Vigyük a merevlemezelet a szerveren kívülre
Creator:inkscape 0.44.1
http://www.avaxio.hu
(legalább) Két megközelítés van:
Creator:inkscape 0.44.1
http://www.avaxio.hu
BLOKK szintű (SAN=Storage Area Network)
Creator:inkscape 0.44.1
http://www.avaxio.hu
Állományrendszer szintű (NAS=Network Attached Storage)
Creator:inkscape 0.44.1
http://www.avaxio.hu
NAS állomány rendszer a adattároló szerver oldalon ● Protokollok: NFS, SMB ● Problémák ●
– – – –
Bonyolult protokoll alacsony szintű biztonság hibatűrés és terhelés kiegyenlítés nehezen megvalósítható gyenge klaszerizációs képességek
Creator:inkscape 0.44.1
http://www.avaxio.hu
SAN állomány rendszer a kliens oldalon ● Protokollok: FC, iSCSI, AoE, SRB over Inifinband ● Problémák: ●
– – –
gyenge biztonság FC: dedikált hálózat kell hozzá gyenge klaszterizációs képességek
Creator:inkscape 0.44.1
http://www.avaxio.hu
Hova tovább, tovatovább?
Creator:inkscape 0.44.1
http://www.avaxio.hu
Klaszterizált megoldások:
Creator:inkscape 0.44.1
http://www.avaxio.hu
Lustre, GlusterFS, StarFish, stb. szokjuk a szavakat
Creator:inkscape 0.44.1
http://www.avaxio.hu
Kalandra fel!
Creator:inkscape 0.44.1
http://www.avaxio.hu