Informatika / …file system
KIT.PEF.CZU
kódování znaků
Vlastní návrh kódování
Chci psát text a napsané chci uložit pro další použití. Co udělám? Odhadnu počet symbolů, které budu chtít kódovat (nezbytný kódovací rozsah) Nadefinuji kódovací tabulku (tj. převod mezi symboly a čísly) např.: ‘A’ = 1 ‘B’ = 2 ‘C’ = 3
‘0’ = 70 ‘1’ = 71 ‘2’ = 72 apod.
kódování znaků
To za nás už udělali
Pro potřeby přenosu informace pomocí dálnopisu byly navrženy různé způsoby kódování. Některé kódy byly sekvenčně závislé (význam kódu se lišil podle toho, co předcházelo) - např. u EIA kódu
Svou jednoduchostí a jednoznačností se prosadilo kódování ASCII. I když nevyhovuje dnešním požadavkům (kódování národních jazyků), je dobrým společným výchozím standardem.
ASCII - American Standard Code for Information Interchange
file system (správa souborů)
Vlastní řešení ANIČKO MOJE,.. EVIČKO, EVIČKO,LÁSKO.. LÁSKO..
napíšu text, symboly převedu do číselných kódů, mám magnetofonovou pásku, kódy nahraji
napíšu další text, uložím ho
vznikne problém, když správně nerozliším rozhraní uložených textů proto vsunu nezaměnitelný kód, jako příznak konce textu
file system (správa souborů)
Vlastní řešení a1 ANIČKO MOJE,.. e1 EVIČKO, EVIČKO, LÁSKO.. LÁSKO.. ANČO a2 HLOUPÁ,.. ANČO HLOUPÁ,..
až budu mít hodně pásek plných textů, budu s obtížemi rozpoznávat hledaný text
pro snadnější orientaci předřadím před každý záznam jakýsi identifikátor obsahující jméno nebo poznámku, jaká data následují
pokud k identifikátoru přidružím i údaj o délce záznamu, bude příznak konce záznamu zbytečný
file system (správa souborů)
Vlastní řešení a1|e1|a2 a1|200 ANIČKO MOJE,.. e1|120 EVIČKO, LÁSKO.. a2|837 ANČO HLOUPÁ,..
takže nyní rozpoznám text už podle identifikátoru a začátek dalšího záznamu odvodím z délky chtěl bych ale včas vědět, jestli hledaná data na pásce vůbec najdu, abych ji zbytečně nepřevíjel to by šlo zařídit tak, že bych na začátek pásky umístil seznam identifikátorů - asi takhle ještě lepší by bylo odstranit duplicitu a kompletní informace o datech shromáždit do jedné tabulky
Vlastní řešení
file system (správa souborů) FAT - file allocation table directory - (adresář)
adresář a1|200 e1|120 a2|837
….
ANIČKO MOJE,.. EVIČKO, LÁSKO.. ANČO HLOUPÁ,..
mohu navrhnout např. tabulku pevné délky (čili bude předem řečeno, jaký je maximální počet souborů, které lze na pásku uložit; budou-li soubory krátké, zůstane velký kus pásky nevyužit, protože v tabulce už není místo pro informaci o dalším souboru) tato strategie je využita např. při ukládání dat na disketu nebo i na disk u systémů ukládajících soubory pomocí tzv. FAT tabulky tabulce, v níž se udržují informace o uložených datech se říká adresář
file system (správa souborů)
…a jak to za nás vyřešili
prostor na disketě, disku, mgf. pásce se rozdělí na vhodně velké úseky stejné velikosti - clustery
vytvoří se tabulka v níž se udržuje seznam neobsazených clusterů
navrhne se vhodná struktura, umožňující udržovat důležité informace o jednotlivých souborech (jako název souboru, počáteční cluster, čas vzniku/změny, příznaky stavu, práva přístupu, velikost ...)
vytvoří se soubor obsahující vhodný počet takových záznamů, tj. tabulka pro zaznamenání informací o souborech
-volno...D -volno...D jméno,...U -volnojméno,...D -volno jméno,...U -volno -volnojméno,...S -volnojméno,...U -volnojméno,...U -volno-volno-volno-volno-
nějaká moje data
nějaká moje data
…a jak to za nás vyřešili pomocí FAT
jsou-li velká
root
nějaká systémová data
-volno...D -volno...D jméno,...U -volnojméno,...D -volno jméno,...U -volno jméno,...S -volno-volnojméno,...S -volnojméno,...U -volnojméno,...D -volno-volno-volno-
jméno,...D -volnojméno,...U -volnojméno,...D -volnojméno,...U -volno jméno,...S -volno -volnojméno,...D -volnojméno,...U -volnojméno,...U -volno-volnojméno,...S -volno-volno-
root directory (základní/kořenový adresář)
file system (správa souborů)
ještě o FAT tabulce
FAT tabulka obsahuje řetězce neobsazených clusterů a clusterů použitých při ukládání jednotlivých souborů.
Integrita dat je zajištěna jednoznačností a správností těchto řetězců. Odolnost proti závadě je zvýšena zdvojením. FAT tabulka se udržuje ve dvou kopiích.
Je přípustný stav, kdy soubor je uložen v clusterech, které netvoří na disku souvislé pole.
c:\dopisy\soukr\anicka35.txt
path (cesta k souboru)
cesta k souboru
písmeno s dvojtečkou udává (logické) zařízení a: , c: ... samotné zpětné lomítko ‘\’ udává kořenový (root) adresář jméno s lomítkem ‘dirname\’ udává podadresář (zpětné lomítko má význam oddělovače názvů) zástupné symboly: - tečka ‘.’ nahrazuje název aktuálního adresáře - dvě tečky ‘..’ nahrazují název nejblíže nadřazeného adresáře (nelze použít v root adresáři) - hvězdička ‘*’ je žolík, znamená “všechny možnosti” - otazník ‘?’ je žolík, znamená “jakékoliv písmeno”
Jsou i jiné konstrukce FS
Windows podporují: FAT (File Allocation Table), NTFS (New Technology File System) Linux a Unix: XFS, Ext2FS, ReiserFS a řadu dalších Při rušení souboru se zpravidla ruší jen příslušná položka v adresáři (tj. zaniká logická vazba mezi identifikátorem souboru a konkrétním úložným místem), ale obsah úložného místa se obvykle nemění. To poskytuje možnost obnovy „smazaných“ dat, se všemi kladnými i zápornými důsledky.
dotazy?