Adattároló rendszerek fogalmai. Merevlemez. Adattároló egységek. Diszk = szalag = Merevlemezek paraméterei ADAT MEMÓRIA DISZK RANDOM IO

2012.02.28.

1

2

Adattároló rendszerek fogalmai • On-line: bármikor elérhető • Off-line: humán beavatkozás igényel (pl. szalag) • Szekvenciális: bájtfolytonosan írható/olvasható • Random elérésű: bárhonnan írhatunk/olvashatunk • DAS: directly attached storage ▫ Közvetlenül a rendszerbuszra kapcsolva ▫ Gyors, kis távolságra vihető el, drága

• NAS: network attached storage ▫ Hálózaton érhető el (lassú) ▫ Nagy távolságra vihető el, drága

3

Adattároló egységek ▫ Tömeggyártás, olcsó ▫ Gyors szekvenciális adatelérés ▫ Random adatelérés, de az lassú ▫ Érzékeny mechanika ▫ Nagy fogyasztás

• Félvezető tárolók (SSD) ▫ ▫ ▫ ▫

Ma még drága Nagyon gyors random Írási problémák Alacsonyabb fogyasztás

Merevlemez

• Memória:

• Adatrögzítés módja:

▫ Drága, de már TB elérhető ▫ Nagyon gyors, random

▫ Az információt ferromágneses réteg tárolja ▫ Kiolvasás a GMR elv szerint

• Szalagos egységek • Felépítése:

▫ Jó ár/kapacitás arány ▫ A meghajtók ma már nagyon drágák ▫ Soros adatelérés ▫ Archiválásra, biztonsági mentésre, adattovábbításra

Forrás: Wikipedia

• Merevlemez

4

▫ Egy vagy több lemez közös tengelyen ▫ Motor ▫ Olvasófejek közös tengelyen ▫ Elektronika

• Optikai tárolók ▫ Kis kapacitás, reménytelen

5

Merevlemezek paraméterei • Fizikai méret: ▫ Szerverekben 2.5”, 3.5” ▫ Lemezek száma tipikusan 12-3

• Kapacitás: 500 GB – 2000 GB ▫ Limitáló tényező: bitsűrűség ▫ A mai technológia 30 TB-ig kiterjeszthető

• Sebesség ▫ 60-150 MB/s szekvenciális olvasás (a lemez szélén) ▫ 4.5-15 ms random elérési idő ▫ Limitáló tényező: fordulatszám: max. 5400 – 15000 rpm

6

Diszk = szalag =

• Interfész ▫ SATA II – 3 Gb/s rövid kábel, gépen belül ▫ SAS – 6 Gb/s – közepes távolság, szekrényen belül ▫ FibreChannel – gigabit, optikai, drága, nagy távolság

• Memória: gyors, drága

ADAT ≫ MEMÓRIA DISZK RANDOM IO

• Diszk: olcsó, de lassú 100-150 MB/s

SZEKVENCIÁLIS IO

• Cache méret: 16-32 MB

• 1 TB-os diszk beolvasása: • Raid Edition: speciálisan szervergépekbe szánt változat

▫ szekvenciális olvasáskor: 4,5 óra ▫ random olvasáskor: 15-150 nap

SSD ?

▫ Jobb mechanikai kialakítás ▫ Nagyobb cache ▫ Speciális firmware

1

2012.02.28.

7

Merevlemezek meghibásodása • Vezérlő áramkör ▫ Teljes lemezt elérhetetlen ▫ Áramkör cserével a meghajtó még talán olvashatóvá tehető (egyszerűbb)

• Lemez fizikai meghibásodása ▫ Általában ponthibák ▫ A vezérlő logika legtöbbször automatikusan képes javítani, ha a hiba lokális ▫ A javítás időbe telik (másodpercek – át kell másolni mindent egy hibátlan helyre) ▫ Bit rotting ▫ Ellenőrzőösszeg (checksum)

8

SSD-k paraméterei • Flash memória • Félvezetőből kialakított háttértároló, nincsen mozgó alkatrész • Alacsony fogyasztás • Nagy sebesség

• Mechanikai meghibás ▫ Motor, csapágy, fejmozgató mechanika ▫ Az adatok mechanikai javítás után még olvashatóvá tehetők (bonyolult)

• S.M.A.R.T.

▫ Tipikusan 150-200 MB/s, de nem konzisztens ▫ 0 ms random elérési idő

▫ Self-Monitoring, Analysis, and Reporting Technology ▫ Információt nyújt a meghajtó fizikai állapotáról ▫ Működési statisztika, hőmérséklet, hibás szektor arány stb. ▫ Az előre várható hibákból eredő adatvesztések elkerülését segíti

• Egyelőre nem túl nagy méret: 250 GB / egység • Problémák az írással: ▫ A flash memória íráskor öregszik ▫ Egyszerre csak komplett blokkok írhatók

• Nagyon drága • Strapabírásuk nem igazán ismert

9

10

11

12

Interfészek, protokollok • SATA: serial advanced technology attachement ▫ Asztali és laptop gépekhez fejlesztve ▫ 1.5-6 Gb/s soros adatátvitel ▫ 1 m hosszú kábel ▫ diszkenként egy kábel • SCSI: Small Computer System Interface ▫ Munkaállomásokhoz és szerverekhez ▫ 1.2-5 Gb/s párhuzamos adatátvitel ▫ 12 m hosszú kábel ▫ több eszköz sorban felfűzve ▫ drága

• Fiber Channel ▫ Optikai link, főleg NAS (network attached storage) megoldásokhoz, drága • iSCSI ▫ SCSI protokoll hálózaton keresztül ▫ NAS

• SAS: Serial Attached SCSI ▫ SATA hardver + SCSI protokoll ▫ 3-6 Gb/s soros adatátvitel ▫ 10 m hosszú kábelek ▫ Multiplexer, backplane támogatás ▫ SATA lemezekkel kompatibilis (olcsó)

Alapprobléma • Különálló diszkek esetében ▫ olvasás/írás szekvenciálisan sem túl gyors ▫ p(hiba) nagy ▫ 2TB egyben nem feltétlenül elég

• Redundáns rendszert akarunk • Gyors rendszert akarunk • Nagy kapacitást akarunk több diszket összekapcsolni

Alapfogalmak • • • • • • • • • •

Fizikai lemez RAID JBOD Virtuális lemez Kötet (volume) Kötet menedzser Partíció Fájlrendszer Blokk méret Paritás bit

• • • • •

Hot-swap Hot-spare SATA SAS SCSI

• Hardveres megoldás: RAID • Szoftveres megoldás: redundáns fájlrendszerek

2

2012.02.28.

13

RAID

RAID • Szoftveres: ▫ a szükséges számolást a CPU végzi ▫ olcsó megoldás munkaállomásokba, kis szerverekbe ▫ Az operációs rendszer különálló lemezeket lát • Hardveres ▫ RAID vezérlő kártya (alaplapi vagy bővítő, PCI-e x8, x16) ▫ A számolást a RAID kártya processzora végzi ▫ Általában nagy cache ▫ Back-up akkumulátort igényel ▫ Az operációs rendszer felé egybefüggő, nagy kapacitású lemez látszik

• Redundant Array of Identical Drives • Több (azonos) lemezegység összekapcsolása • Az OS számára virtuális lemezként látszik • Célok: ▫ Gyorsabb adatelérés ▫ Redundancia: egy lemez meghibásodása ne okozzon adatvesztést ▫ Nagyobb kapacitás

15

RAID – gyorsabb adatelérés • Sebességet korlátozza ▫ Lemez fordulatszáma ▫ Bitsűrűség

• Több lemez párhuzamos olvasása/írása:

16

RAID - redundancia • Egy (vagy több) lemez kiesése ne okozzon adatvesztést

• Korlátozó tényezők: ▫ diszkvezérlő sávszélessége tipikus SAS vezérlő: 2GB/s ▫ csatlakoztatható diszkek száma

• Az adatokat többször kell tárolni ▫ Teljes tükrözés (mirror), vagy ▫ Paritás bitek tárolása

▫ Szekvenciálisan olvasandó adat nem egy lemezen folytonosan, hanem csíkokra (stripe) vágva, lemezek között elosztva

• Minél nagyobb redundanciát akarunk, annál kisebb lesz a hasznos tároló kapacitás • A maximális méretet a legkisebb lemez mérete határozza meg

• A sebesség a lemezek számával (arányosan) nő

17

RAID konfigurációk: RAID 0

18

RAID konfigurációk: RAID 1 • mirror = tükrözés

• Az adatokat úgy osztja el két vagy több lemez között, hogy a lemezekről párhuzamosan olvasva nagyobb sebességet lehessen elérni

• Az adatokat tükrözi két lemezen úgy, hogy ha az egyik elromlik, akkor a másikról az adatok még elérhetőek

• Teljes kapacitás: Ctotal = ndisk × Cdisk • Nem redundáns, sőt: pfailure = ndisk × pfailure,disk

Forrás: Wikipedia

• stripe = csíkozás

• Teljes kapacitás: Ctotal = ndisk × Cdisk / 2

Forrás: Wikipedia

• RAID: redundant array of identical drives • Több lemezegység logikai összekapcsolása kötetekbe (volume) • Cél: ▫ Gyorsabb adatelérés ▫ Redundancia: egy vagy két lemez meghibásodása nem okoz adatvesztést (de teljesítmény csökkenést általában igen) ▫ Nagyobb kapacitás

14

• Redundáns: pfailure = (házi feladat)

3

2012.02.28.

19

Paritásbitek • 1. diszk: • 2. diszk: • XOR:

10011101 11001001 01010100

RAID konfigurációk: RAID 5/6 • RAID-5:

• Általánosítás n diszkre: n bitből páros vagy páratlan számú 1-es bit van?

▫ Minimum három lemez ▫ Paritás bitek a lemezeken elosztva ▫ Egy lemez kiesését viseli el

▫ A 3. diszken tárolva

• 1. diszk: • 3. diszk: • XOR:

10011101 01010100 11001001

▫ Pont ez volt a 2. diszken!

• Egy diszk kiesésekor még visszaállítható az adat

• RAID-6: ▫ Minimum négy lemez ▫ Paritás bitek két lemezen ▫ Két lemez egyidejű kiesését viseli el Forrás: Wikipedia

• Hiba esetén helyreállítás:

20

• Azt, hogy melyik diszk hibás, máshonnan tudjuk, ez a paritásbitekből nem található ki • Általánosítható úgy, hogy több diszk kiesését elviselje.

21

RAID konfigurációk: RAID n+0

22

RAID írása, késleltetés (latency) • Egyszerre több diszket kell írni • Meg kell várni, míg a lemez a megfelelő blokkhoz fordul ehhez átlagosan ennyi fordulat kell:

• A csíkozás és tükrözés összekapcsolása • Csíkozás két RAID kötet fölött • Minimum négy lemez (1+0) • Csak olvasáskor gyorsabb, íráskor mindkét kötetet párhuzamosan írni kell

Diszkek száma

Átlagos késleltetés (fordulat)

1

0.500

= 1 – 2–n • Γ = fordulatszám • = átlagos késleltetés: = / Γ • Tipikus értékek:

• Teljes kapacitás: Ctotal = CRAIDn / 2

▫ Γ = 7200 RPM, = 4.2 ms

• Több lemez esetén, mire az összes lemez a megfelelő blokkhoz fordul:

• Redundáns: pfailure = (házi feladat)

SSD:

= 1 – 2–n

2

0.750

3

0.875

4

0.938

5

0.969

6

0.984

7

0.992

8

0.996

0 latency nagy lehetőségek a jövőben!

23

A paritásbitek felírása drága • A1 egy része megválzott (a memóriában van az új adat) • A1-et írni akarjuk • Ap-t újra kell számolni • Szükség van: ▫ A1 régi értékére és Ap-re

• Műveletsor: ▫ ▫ ▫ ▫ ▫

Olvasd be A1-et (régi érték) Olvasd be Ap-t Számold ki az új Ap-t Írd ki A1-et (új érték) Írd ki Ap-t

24

RAID írásának gyorsítása • Cache használata ▫ A két olvasási művelet megspórolható, ha az adat a cache-ben van

• Write back cache használata ▫ Az adat csak a cache-be íródik ▫ Csak később kerül ki a diszkre ▫ Csökkenthető a késleltetés

4

2012.02.28.

25

RAID írási lyuk

26

RAID rendszerek adatbázisoknál

• Write hole • Több lemezt írása nem atomi művelet!

• Tudományos adattárak ▫ ▫ ▫ ▫

• Mi van, ha írás közben hiba történik? ▫ Megsérül a lemez ▫ Áramkimaradás történik ▫ Sérült lemez át kell írni a blokkot máshova ▫ Áramkimaradás

Olvasás jóval gyakoribb, mint az írás Hosszú szekvenciális műveletek RAID 5 a nagy tárterületért Adatbetöltéskor write through cache használata

• Tranzakció-kezelő rendszerek ▫ Sok apró írás ▫ RAID 1+0 a nagy sebességért ▫ Write back cache használata

Szünetmentes tápegység Battery Back-up Unit (BBU) használata Frissíti a RAID cache-t, míg az áram visszajön

27

RAID mőveletek

28

RAID megvalósítása

Kötet újraépítése

Időzített járőrözés

Szoftver RAID

Hardver RAID

• volume rebuild

• patrol read, scrubbing

• Ha megsérül egy lemez a köteten belül, akkor a hardver egység cseréje után a logikai kötetet újra kell építeni • Az újraépítés jelentős időbe kerül, o(10 óra), a lemez méretétől függően • A RAID vezérlők támogatják az ún. meleg tartalék (hot-spare) lemez kijelölését, amik rögtön a kiesett lemez helyébe lépnek, és elindul az újraépítés

• Az, hogy egy lemez meghibásodott, sokszor csak akkor derül ki, amikor az adatokat olvasni akarjuk • Bit rotting • Hogy ez időben kiderüljön, rendszeresen végig kell olvasni a lemezeket

• Szükséges számolást a CPU-n • Olcsó megoldás: munkaállomásokba, kis szerverekbe

• Dedikált RAID vezérlő kártya • Számolás IOP végzi • Gyakran drága

• RAID 5,6 stb. nagyon lassú • Nincsen dedikált cache • Nincsen BBU • Az OS különálló lemezeket lát • Volume manager fűzi össze

• Gyors RAID 5,6 • Hardver szintű optimalizálási lehetőség ▫ pl. latency csökkentése • Nagy cache (256-512 MB) ▫ Gyors írás, adaptív előreolvasás • BBU lehetőség • Az OS egybefüggő nagy lemezt lát

29

Tipikus RAID problémák Kompatibilis diszk hiánya ▫

▫

Korrelált meghibásodások

4×SAS

Sok diszk

SATA/SAS

Diszk

Backplane + Multiplexer SATA/SAS

Nem elég nagy a számítógépház Nem elég nagy a tápegység teljesítménye Külső RAID házak használata Túl sok a kábel Multiplexeres backplane használata Gyakori diszk csere, a gépet nem lehet leállítani Hot-swap

Diszk

▫ ▫ ▫ ▫ ▫ ▫ ▫

4×SAS

SATA/SAS

Teljes adatvesztést okozhat A kártya nem mindig cserélhető (régi típus) A lemezen használt formátum gyártó specifikus, az elveszett adatokat csak speciális szoftver tudja visszaolvasni

RAID vezérlő

SATA/SAS

▫ ▫ ▫

PCIe

SAS vezérlő (akár RAID-del) 4×SAS linkek Multiplexeres backplane RAID dobozok

Diszk

▫

RAID vezérlő kártya hibája (ritka)

▫

▫ ▫ ▫ ▫

SATA/SAS

▫

A diszkek általában azonos gyártási sorozatokból valók A meghibásodások egyszerre több diszken jelentkeznek • A második diszk újraépítés közben hibásodik meg

Write-back algoritmussal dolgozó cache esetén a RAID vezérlő az írási műveletet készre jelenti, ahogy az adat beíródott a cache-be. Ekkor még nem íródott ki a változás a diszkre, de az operációs rendszer mégis úgy tudja. Áramkimaradás esetén a cache tartalma elvész, az adatok inkonzisztens állapotba kerülnek.

Diszk

▫

•

Cache szünetmentes tápjának (BBU) hiánya

SATA/SAS

•

•

Szerver

Diszk

▫ ▫

Ha az újraépítési idő alatt még egy lemez tönkre megy, akkor az teljes adatvesztést okoz Sok lemez esetén okoz nagy gondot RAID 6 jó megoldás

• SAS alapon • SBB: storage bridge bay nyílt szabvány:

Diszk

▫

Régi RAID kötetekhez nem lehet új diszket kapni, ilyenkor célszerű a teljes rendszert lecserélni

SATA/SAS

•

Diszk

Lassú kötet újraépítés

SATA/SAS

Hamis biztonságérzetet ad

•

RAID hardver elemei

Diszk

•

30

5

2012.02.28.

31

RAID rendszer belsı diszkekkel

RAID rendszer külsı diszkekkel

4× SAS

PCIe

Meghajtó

Alaplap

Diszk

Diszk

Diszk

Diszk

Diszk

Diszk

Alaplap Szerver ház

Diszk

Szerver ház

Diszk

Meghajtó

Meghajtó

Meghajtó

Meghajtó

Meghajtó

Meghajtó

SATA / SAS

Meghajtó

Külső RAID vezérlő

PCIe

Belső RAID vezérlő

32

Enclosure Manageme nt Module (EMM)

SATA/SAS Backplane

RAID ház

33

34

Szoftver rétegek Adatbázis szerver

Fájlszerver

Webszerver

Fájl API

FS

FS

Fájlrendszer (file system = FS)

Partíció

Partíció

Kötet

Fizikai vagy virtuális (HW RAID) diszk



35

Fogalmak • Partíció: ▫ egy fizikai vagy virtuális diszk több partícióra osztható ▫ pl.: rendszer, adat

• Logikai kötet: ▫ Szoftveres megoldás több lemez összekapcsolására ▫ Szoftver RAID vagy redundáns kötet

• Fájlrendszer ▫ ▫ ▫ ▫

Könyvtárak és fájlok logikai megvalósítása a partíciók vagy kötetek fölött Blokkméret: minimum írás/olvasás mérete Fájlok blokkokból épülnek fel FAT32, ext2, ext3, NTFS stb.

• Fájl API ▫ A különböző fájlrendszereket logikai szempontból egyesítő könyvtárak

36

Redundáns kötetek • Hardver RAID ▫ Drága, nem elég flexibilis • Szoftver RAID ▫ Hardver RAID olcsó imitációja, lassú

• Slab: alapvető logikai egység ▫ hasonló a RAID blokkhoz ▫ tipikus méret 256-512 MB ▫ tükrözés vagy paritásbitek

• JBOD: just a bunch of disks ▫ az OS csak önálló lemezeket lát, nincsen RAID vezérlő

• Nagy méretek támogatása (zettabájt)

• Szoftveres megoldás a RAID kiváltására? ▫ zvol: 2005 (Sun, ma Oracle) ▫ Storage Spaces: 2012 (Microsoft) • Kapcsolódó modern fájlrendszerek ▫ ZFS - Solaris ▫ BTRFS - Linux ▫ ReFS – Windows 8 Server ▫ Fa alapú ▫ Nem adatbázisokhoz

• FS provisioning ▫ a fájlrendszer csak annyi helyet foglal, amennyi adatot írunk rá ▫ elég később hozzáadni a szükséges lemezeket • Diszkek dinamikusan hozzáadhatók, elvehetők ▫ legkisebb diszk mérete nem korlátozó tényező • Scrubbing ▫ bithibák detektálására ▫ a háttérben fut

6

2012.02.28.

37

38

Fájl API • Bufferelt ▫ Az adatok először egy átmeneti memória bufferbe kerülnek ▫ A szükséges memóriaterület ezután átmásolódik a függvénynek megadott címre ▫ Tetszőleges számú bájt, tetszőleges fájlpozíciónál

• Nem bufferelt ▫ ▫ ▫ ▫

Az adat közvetlenül a megadott memóriacímre másolódik a diszkről Csak blokkméret többszöröse (512 B) Blokk kezdetéhez igazítva Sokkal gyorsabb, mint a bufferelt

(Benchmarking)

• Szinkron / aszinkron ▫ A függvényhívás mikéntje ▫ Aszinkron hívásnál párhuzamosan sok olvasási kérést is indíthatunk

• Függő műveletek [outstanding I/O] ▫ Hány kérés lehet egy időben folyamatban ▫ RAID kártyák 8-16-ot hardveresen támogatnak ▫ a többi kérés sorba rendezését az API valósítja meg

39

I/O Teljesítménymérés

40

Mit akarunk optimalizálni? • Lemezek száma, mérete, sebessége

• Miért mérünk?

▫ Több lemez több tengely gyorsabb ▫ A gyorsabb lemez (10k RPM 2.5”) kisebb kapacitású

▫ Választani akarunk az egyes gyártók közül ▫ Meg akarjuk határozni az adott konfiguráció optimális beállításait

• RAID szint ▫ ▫ ▫ ▫

• Pontosan kell definiálni ▫ A rendszer próbaterhelésének mikéntjét ▫ A mérés módját

• Ehhez ismerni kell az adatbázis majdani felhasználását, de általánosságban igaz:

Mekkora redundanciára van szükség Mennyit fogjuk írni az adatbázist Több RAID konfigurációt is használható egy szerveren belül A RAID cache üzemmódja menet közben is változtatható

• Csíkok mérete, fájlrendszer típusa, blokkmérete stb. ▫ Ezt az adatbázis lapméretéhez kell állítani (ld. később) – 64 kB

▫ Adattárháznál szekvenciális I/O-ra megyünk

41

Mit tudunk mérni? • • • • •

Sebesség [MB/s] Késleltetési idő (latency) [s] I/O művelet [1/s] Processzor használat Függő műveletek száma

• Paraméterek: ▫ ▫ ▫ ▫ ▫ ▫

Olvasás / írás Szekvenciális / random Bufferelt / nem bufferelt Beolvasott/írt blokkok mérete Csíkméret Függő műveletek száma

42

Mérések módja • Mindent többször mérünk • Felvesszük a mért értékek eloszlását ▫ Ha nem gaussi, akkor megnézzük miért Mivel korrelál egy adott mérési érték?

▫ Ha gaussi, akkor megadhatjuk a relatív hibát

• Egy adott terhelési mintázat lehet a fentiek valamilyen arányú kombinációja

7

2012.02.28.

43

44

Hálózatok alapjai • Fizikai réteg ▫ Kábel típusa: réz, optikai

▫ Átviteli sebesség [bit/s] ▫ Átviteli távolság ▫ Topológia Csillag, gyűrű, nagy gráf

• Szoftver réteg ▫ Hálózati kártya meghajtó ▫ Protokoll TCP/IP, stb.

▫ OS hálózati réteg ▫ Hálózati API (programkönyvtár)

45

Lokális hálózat

Külvilági kapcsolat • Internet

• Ethernet ▫ ▫ ▫ ▫

46

▫ Mindig túl lassú ▫ TCP/IP

100 Mb/s, 1 Gb/s, 10 Gb/s UTP kábel néhányszor 10 méter Általában TCP/IP

Folytonos adatátvitelre TCP vagy UDP alapú speciális protokoll

▫ Speciális adatátviteli protokollok

BitTorrent (akár csak két pont között!) FDT (Cern) – Java UDP alapú UDT: A TCP-nél gyorsabb adatátvitelre jó [Grossman et al. 2003]

• InfiniBand

• Dedikált kapcsolat

▫ Maximum 96 Gbit/s elméleti sebesség (sok kábel) ▫ Maximum 15 méter távolság ▫ Speciális protokoll igény, de TCP/IP over IB támogatott

▫ Garantált állandó vagy garantált minimum sebesség ▫ Drága, és nehéz jól kihasználni ▫ Használható saját speciális protokoll

47

A TCP/IP problémái • Kis sebességre és kevés adatra tervezték • A sávszélesség nem feltétlenül jelent átviteli sebességet ▫ A késleltetés erősen le tudja csökkenteni az adatátvitelt (TCP/IP nagy problémája) ▫ Alapértelmezett értékek variálásával némileg javítható (frame mérete, buffer mérete)

• Hibaellenőrző kód nem elég erős: ▫ Véges valószínűséggel kerülhet hiba az átvitt adatba, ha az adatmennyiség nagy

48

Klaszterek, felhık • Számítógép klaszter (Beowulf): ▫ ▫ ▫ ▫ ▫ ▫

Azonos hardver sok processzorral Minimális háttértár az egyes gépekben Központi, hálózaton elérhető nagy háttértár Blade-server kialakítás optimális Garantált, nagy sebességű helyi hálózat Adatintenzív alkalmazásokhoz nem optimális

• Számítási felhő ▫ ▫ ▫ ▫

Szolgáltatók által nyújtott lehetőség (Amazon, Google, MS) Virtualizált platform + fejlesztőeszközök Központi, hálózaton elérhető nagy háttértár Adatintenzív alkalmazásokhoz nem optimális

• Graywulf

• Az adatbázis szerver szoftverek nem támogatnak speciális protokollokat

▫ Dedikált szerverfarm, dedikált hálózattal ▫ Minden elem egy önálló nagy teljesítményű adatbázis szerver ▫ Adatintenzív alkalmazásokra optimalizálva

8

2012.02.28.

49

Fogyasztás és környezetvédelem • Fogyasztási adatok: ▫ ▫ ▫ ▫ ▫

Adatbázis rendszerek az ELTÉ-n • Regionális Egyetemi Tudásközpont adatbázis központja • 3 db Dell PE 2950 szervergép

• A szerverszoba hűtést igényel • Légkondicionáló hatásfokát figyelembe véve a fogyasztás / számítási teljesítmény arány tovább romlik • Megoldási lehetőségek:

Alaplap: 50-100 W Processzor: 80-150 W HDD: 15 W SSD: 1-2 W GPU: 50-150 W

• Könnyen összejön 1,5 – 2 kW szerverenként • Hőként szabadul fel • Szünetmentes tápban nagy akkumulátorok • Léghűtés: zajos, hangszigetelés szükséges

50

▫ 2 x 4 magos Intel Xeon ▫ 16 GB RAM ▫ 2 x Dell PERC 6/e RAID vezérlő

▫ Vízhűtés ▫ Hűtővíz felhasználása fűtésre ▫ Energiatakarékos üzemmód

• 6 db Dell PV MD-1000 tároló egység ▫ Egyenként 15 db 750-1000 GB-os diszk

• Összesen kb.

• 5 év után elavul az egész rendszer: veszélyes hulladék

▫ 1 TFLOP/s számítási kapacitás ▫ 50 TB redundáns tároló kapacitás ▫ 3500 MB/s szekvenciális olvasási sebesség

• Windows 2008 Server + SQL Server

51

52

Adatbázis rendszerek az ELTÉ-n • Informatika doktori iskola • 5 db Supermicro SBB ▫ ▫ ▫ ▫ ▫

két gép egy házban (összesen 10 gép) 2 x 6 magos Intel Xeon i7 (összesen 120 mag) 24 GB RAM LSI 2008 SAS vezérlő 100 TB diszk

• Debian Linux • Különböző szintű szoftver RAID konfigurációk

53

• Miért nem elhelyezni?

érdemes

sok

merevlemezt

egy

tengelyen

• Számítsd ki a RAID 1 és a RAID 1+0 konfigurációk meghibásodási valószínűségét, ha egyetlen lemez meghibásodási valószínűsége egy adott időintervallumban pdisk, a lemezek száma pedig n. • Egy hálózati protokoll úgy működik, hogy a továbbítandó pufferben tárolt adatot csomagokra bontja, majd ezeket egymás után továbbítja. A csomagok a fogadó állomáshoz tetszőleges sorrendben érkezhetnek a hálózati késleltetések miatt. A fogadó állomás a teljes puffer átvitele után a csomagokat sorba rendezi, majd a hibaellenőrző kód segítségével leellenőrzi, hogy sikeres volt-e az átvitel. Ezek után a küldő állomást tájékoztatja, hogy az átvitel sikeres volt, és jöhet a következő átviteli adag. Mi az optimális puffer méret, ha a hálózat sebessége és az átviteli csatorna késleltetése (az az idő, amíg egy kérésre válasz érkezik) adott. Hogyan változik az optimális puffer méret, ha az átviteli csomagok p valószínűséggel elvesznek a továbbítás során?

9

Adattároló rendszerek fogalmai. Merevlemez. Adattároló egységek. Diszk = szalag = Merevlemezek paraméterei ADAT MEMÓRIA DISZK RANDOM IO

Recommend Documents