OZD
2. ledna 2013
1
Pamˇ eti
Hierarchie: • Registry • Cache (nejsou viditeln´e) • Prim´arn´ı pamˇet’ (RAM) • Pamˇet’ druh´e u ´rovnˇe (Disky, trval´a u ´loˇziˇstˇe), pomal´ a • Pamˇet’ tˇret´ı u ´rovnˇe (CD, p´asky)
1.1
Pamˇ eti druh´ eu ´ rovnˇ e
Pracuj´ı po bloc´ıch, nelze operovat s jednotliv´ ymi byty. Sekvenˇcn´ı ˇcten´ı b´ yv´ a rychlejˇs´ı, neˇz n´ahodn´e.
1.2
Pohled
• Logick´ y (Objekty, atributy, . . . ) – objekty stejn´eho typu. • Fyzick´ y (Oddˇelovaˇce, navigaˇcn´ı znaˇcky)
1.3
Pomˇ er mezi z´ aznamy a bloky
Pokud jsou stejnˇe velk´e, vˇse je jednoduch´e, ale m´ alokdy to nast´ av´a. Toto se naz´ yv´ a neblokovan´ e. Kdyˇz jsou z´aznamy mal´e, pak se jich do jednoho bloku d´a uloˇzit v´ıce Pokud by byly ztr´ aty m´ısta mal´e, m˚ uˇze b´ yt (pro n´ahodn´ y ˇ ık´ pˇr´ıstup) v´ yhodn´e, aby jich tam byl celoˇc´ıseln´ y poˇcet. R´ ame tomu blokovan´ e. Pokud jsou z´aznamy vˇetˇs´ı neˇz bloky, ˇr´ık´ ame, ˇze z´ aznamy jsou pˇ rerostl´ e a mus´ı obsadit v´ıce neˇz jeden blok.
1
2
M´ edia (pamˇ eti druh´ e a tˇ ret´ı u ´ rovnˇ e)
2.1
Magnetick´ e p´ asky
Kotouˇc, na tom p´aska, pˇrev´ıjen´ı z jednoho kotouˇce na druh´ y, jede pˇres hlavu. Um´ı pˇrev´ıjet, naj´ıt si zaˇc´atek, pohyb obˇema smˇery. Znaˇcky zaˇc´atku a konce, jednostrann´ a, devˇet stop (8 bit˚ u a parita), dalˇs´ı parita byla na konci bloku. Bloky byly znaˇckovan´e (konce, zaˇc´atky), mezi bloky byly mezery. Jednak pro z´ısk´ an´ı ˇcasu pˇri zpracov´an´ı, jednak kv˚ uli v˚ uli pˇri pˇrepisov´an´ı (ne vˇzdy se tref´ı pˇresnˇe). Velikost bloku nˇekdy ˇsla nastavit, t´ım se mˇenila i kapacita (kdyˇz jsou m´enˇe ˇcasto mezery, vejde se toho v´ıc). Obvykle bylo potˇreba v´ıce p´askov´ ych stojan˚ u (napˇr. pro tˇr´ıdˇen´ı je potˇreba alespoˇ n 3). Dneˇsn´ı pouˇzit´ı: Z´alohy, sekvenˇcnˇe pˇrich´azej´ıc´ı data (mˇeˇren´ı). Dˇr´ıve: Ukl´ ad´ an´ı vˇsech bˇeˇznˇe pouˇz´ıvan´ ych dat.
2.2
Magnetick´ e disky
Kotouˇce, ˇctec´ı hlavy. Nˇekolik hlav nad sebou, max. jedna aktivn´ı, pohybuj´ı se spolu. Je tˇreba velmi pˇresnˇe polohovat hlavy, probl´emy se zahˇr´ıv´ an´ım, nam´ah´ an´ım. Dnes kapacity mezi des´ıtkami gigabajt˚ u a terabajty. Liˇs´ı se rychlost´ı ot´ aˇcek (obvykle mezi 5000-15000 ot´ aˇcek za minutu), ovlivˇ nuje ˇcekac´ı doby pˇri vyhled´ av´an´ı z´aznamu. Pr˚ umˇern´e nastaven´ı hlav/seek – 3-15 ms. Nˇekolik rozhran´ı (SATA, PATA, SCSI, SAS). Parametry disku: seek, pˇrejet´ı z jednoho konce na druh´ y, sousedn´ı stopa, rotation delay/latency, block transfer time. 2.2.1
Diskov´ a pole – RAID
Redundant Array of Inexpensive Disks. Zvyˇsuje kapacitu, rychlost, bezpeˇcnost. Navenek se chov´a jako jedna diskov´a jednotka s pozmˇenˇen´ ymi parametry. R˚ uzn´ a uspoˇr´ ad´ an´ı. St´ale m´ a nev´ yhodu, ˇze je v jednom m´ıstˇe, st´ale nebezpeˇcn´e. • Raid 0: Strip. Sniˇzuje BTT. Probl´em se spolehlivost´ı (ztr´ ata jednoho disku znamen´a ztr´ atu vˇsech dat). Rozˇs´ıˇren´ a podpora v ˇradiˇc´ıch. • Raid 1: Zrcadlen´ı. Z´apis je omezen na pomalejˇs´ı z nich, pˇri ˇcten´ı m˚ uˇze zrychlit. Zvyˇsuje spolehlivost. • Kombinace (Raid 0+1, 1+0). • Raid 3: Pracuje po bitech, jeden z disk˚ u je parita. V pˇr´ıpadˇe potˇreby um´ı dopoˇc´ıtat jeden z trojice disk˚ u. 2
• Raid 4: Podobnˇe jako 3, ale po bloc´ıch. • Raid 5: Data se zapisuj´ı na r˚ uzn´e disky, poˇc´ıt´ a se parita, parita ale nen´ı na jednom dan´em disku, ale stˇr´ıd´ a se to. Z´apis je na r˚ uzn´ ych disc´ıch, m˚ uˇze jich nˇekdy probˇehnout v´ıce nar´ az, nebo prov´adˇet ˇcten´ı. Trochu sloˇzitˇejˇs´ı logika. • Raid 6: Poˇc´ıtaj´ı se dvˇe parity, jedna svisl´a, jedna vodorovn´a. Odoln´e proti selh´ an´ı dvou disk˚ u. Potˇrebuje sloˇzit´e v´ ypoˇcty.
2.3
Optick´ e disky
CD, DVD, blue-ray. Nejsou n´achyln´e na magnetick´a ˇci elektrick´a pole. Vypalovan´ a maj´ı ˇspatnou trvanlivost, lisovan´ a vydrˇz´ı d´ele. Lze na nˇe poˇr´ıdit jukeboxy.
2.4
Flash pamˇ eti
V´ yraznˇe pomalejˇs´ı z´apis neˇz ˇcten´ı, m´ a v podstatˇe nulov´e seeky, nevydrˇz´ı tolik pˇreps´an´ı. Podobn´e tak´e SSD disky.
2.5
Propojov´ an´ı
Lze sd´ılet mezi poˇc´ıtaˇci, napˇr. DAS (Direct Attached Storage), NAS (Network Attached Storage), SAN (Storage Area Network).
2.6
Bezpeˇ cnost dat
Je potˇreba z´alohovat, RAID obvykle nestaˇc´ı. Vhodn´e m´ıt r˚ uzn´e druhy m´edi´ı, nˇekde jinde.
3
Z´ aznam
Logick´ y je kolekce souvisej´ıc´ıch poloˇzek/hodnot atribut˚ u. Fyzick´ y je logick´ y z´aznam doplnˇen´ y o oddˇelovaˇce, definice d´elek, zar´aˇzky. M´ a svoji d´elku – R. Typ z´aznamu je urˇcen jm´enem a sv´ ymi atributy. Kaˇzd´ y atribut je z nˇejak´e dom´eny. Fyzick´ y z´aznam je fyzick´a reprezentace logick´eho z´aznamu na m´ediu. Uplatˇ nuje se blokovac´ı faktor (jestli zabere cel´ y blok, nˇeco zb´ yv´ a, etc.). Soubor je identifikovan´ a kolekce logicky souvisej´ıc´ıch z´aznam˚ u. Jsou-li z´aznamy stejn´eho typu a velikosti, pak se soubor naz´ yv´ a homogenn´ı. Kl´ıˇ c souboru je nˇejak´ a mnoˇzina atribut˚ u, podle kter´ ych lze z´aznamy jednoznaˇcnˇe identifikovat. Vyhled´ avac´ı kl´ıˇ c je jako kl´ıˇc, ale nemus´ı b´ yt jednoznaˇcn´ y. Typy vyhled´ avac´ıch kl´ıˇc˚ u: 3
• Hodnotov´ e – pˇr´ımo hodnoty. • Hashovan´ e – podle transformace. • Relativn´ı – dle pozice. Mohu dˇelat operace: • Insert • Delete • Update
3.1
Sch´ ema organizace souboru
Popis logick´e pamˇet’ov´e struktury. M˚ uˇze popisovat v´ıce logick´ ych soubor˚ u sv´azan´ ych dohromady. Prim´ arn´ı soubor je soubor obsahuj´ıc´ı uˇzivatelsk´a data. 3.1.1
Fyzick´ au ´ roveˇ n
Jak velk´e jsou bloky, jak velk´e jsou z´aznamy v souboru, etc. Potˇrebujeme operace jako vytvoˇren´ı struktury, reorganizace (uveden´ı do nov´eho v´ ychoz´ıho stavu), uzavˇren´ı. 3.1.2
Souborov´ y syst´ em
Star´ a se o soubory, spoustu vˇec´ı zjednoduˇs´ı, ale vytv´aˇr´ı i nˇekter´a omezen´ı. 3.1.3
Dotazy
hit – prvky odpovˇedi na dotaz. • Na u ´ plnou shodu – pt´am se na vˇsechny atributy. • Na ˇ c´ asteˇ cnou shodu – pt´am se na nˇekter´e atributy. ´ • Uplnou intervalovou shodu – interval pro kaˇzd´ y atribut. ˇ asteˇ • C´ cnou intervalovou shodu – interval pro nˇekter´e atributy. Obˇcas se hod´ı zpracovat cel´ y soubor najednou. 3.1.4
Vyv´ aˇ zenost struktury
• Omezen´ı d´elky cesty ve struktuˇre. • Rovnomˇern´ a naplnˇenost str´anek. Struktura splˇ nuj´ıc´ı oboj´ı je dynamick´ a, jinak je statick´ a. 4
3.1.5
Druhy organizace
• Sekvenˇ cn´ı soubor – pˇristupujeme postupnˇe. • Index-sekvenˇ cn´ı soubor – m˚ uˇzeme pˇristupovat postupnˇe a nebo podle jednoho kl´ıˇce. • Indexovan´ y soubor – vyhled´ av´an´ı podle r˚ uzn´ ych atribut˚ u. • S pˇ r´ım´ ym pˇ r´ıstupem – vezmu rovnou spr´ avn´a data. Hromada Nehomogenn´ı soubor, mohou se uv´adˇet i jm´ena ˇci k´ody atribut˚ u. Vyhled´av´an´ı v O(N ). Sekvenˇ cn´ı soubor Velmi ˇcast´ y v d´avkov´ ych syst´emech. Homogenn´ı soubor. Pokud chci vˇsechno, tak je to velmi rychl´e. M˚ uˇzu m´ıt jiˇz uspoˇr´ adan´e podle nˇekter´eho atributu. Lze pot´e hledat pomoc´ı p˚ ulen´ı intervalu. M˚ uˇzu m´ıt jeˇstˇe soubor aktualizac´ı, abych zmˇeny nemusel pˇrepisovat. Pˇri reorganizaci se provede merge zmˇen. Index-sekvenˇ cn´ı soubor V prim´arn´ım souboru bydl´ı data. D´ ale m´ am index, kter´ y mi pom´ah´ a vyhled´avat. D´ ale m´ ame oblast pˇreteˇcen´ı, kter´e se vyuˇz´ıv´ a, pokud v potˇrebn´em bloku nen´ı m´ısto. Index ukazuje na kaˇzd´ y prvn´ı prvek bloku, je tedy mnohem menˇs´ı. M˚ uˇzu postavit v´ıce´ urovˇ novˇe. Oblast pˇreteˇcen´ı lze nahradit kapsou – odkaz na dalˇs´ı blok, kter´ y je logicky souˇc´ast toho aktu´aln´ıho. Zachov´av´a dobr´e vlastnosti sekvenˇcn´ıho souboru, umoˇzn ˇuje rychl´ y pˇr´ıstup dle jednoho kl´ıˇce.
5