Logická struktura pevného disku Slouží k uchovávání základních informací o paměťovém prostoru pevného disku1. Tyto informace umožňují především: přehlednou organizaci a správu dat na pevném disku, nalezení dat při čtení, nalezení volného paměťového prostoru při zápisu dat, oddělení systémových souborů a nainstalovaných aplikací od uživatelských dat. Logickou strukturu tvoří několik na sebe navazujících databázových tabulek (resp. záznamů), v nichž jsou uloženy informace o rozdělení paměťového prostoru disku na oddíly a samotných uložených datech (např. umístění, název, velikost, datum a čas poslední změny, oprávnění atd.). Tyto informace (tzv. metadata, tedy informace o informacích) a programové rozhraní OS, které s nimi pracuje, tvoří tzv. souborový systém disku. Různé souborové systémy mohou mít různá omezení, například: celkovou kapacitu paměťového prostoru, kterou je daný systém schopen adresovat, maximální délka (velikost) souboru, maximální délka jména souboru a přípony, počet zanořených podadresářů, podporovaná znaková sada pro názvy a přípony souborů, možnost definice přístupových práv k souboru či adresáři pro různé uživatele či skupiny, atd. Pro operační systém Windows existují dva základní souborové systémy: 1. FAT (File Allocation Table) 2. NTFS (New Technology File System) Operační systém Linux podporuje souborové systémy ext2, ext3, ext4, ReiserFS, JFS, XFS a mnoho dalších, včetně souborového systému FAT. Těmito souborovými systémy se tento výukový materiál nezabývá. Optické paměti (CD, DVD, BD) obvykle používají zcela odlišné souborové systémy (ISO 9660, popřípadě UDF). Tato tématika je stručně popsána ve výukovém materiálu „Optické paměti“.
1
Souborový systém používají také optické pamětí a externí polovodičové pamětí (např. USB flash disk, SSD atd.)
1. Souborový systém FAT Jedná se o starší souborový systém používaný standardně operačním systémem MS-DOS, Windows 95, Millenium a 98 + se využívá u USB flash disků a paměťových karet s menší kapacitou (řádově jednotky GB) a některých specifických zařízení, např. digitální osciloskopy s rozhraním USB atd. Je podporován také OS Linux. Logická struktura disku obsahuje tyto základní části: a. Systémové oblasti pevného disku Master Boot Record (MBR) – hlavní zaváděcí záznam disku Partition Table – tabulka oblastí (resp. oddílů) Jednotlivé diskové oddíly pak obsahují záznamy souborového systému FAT: Boot Record – lokální zavaděč operačního systému FAT – alokační tabulka; záznam o obsazení disku (resp. jednotlivých clusterů) Root Directory – kořenový adresář; informace o souborech a složkách b. Datová oblast disku
1.1 Master Boot Record (MBR) Starší typ diskového oddílu. Vytváří se obvykle pomocí instalační aplikace operačního systému, můžeme však použít i jiné aplikace pro správu diskových oddílů (diskpart.exe, správu disků v OS Windows, Partition Magic, Acronis Disk Director, atd.). Fyzicky se nachází na úplném začátku záznamové oblasti disku (0. stopa, 1. sektor). Velikost MBR je 512 B a obsahuje tyto základní informace:
zavaděč operačního systému (Boot Loader) – krátký program spuštěný při startu počítače (resp. po úspěšné POST fázi) BlOSem. Jeho úkolem je načíst tabulku oblastí a najít aktivní oblast, ze které se načte operační systém. tabulka oblastí (partition table) – obsahuje seznam logických oddílů na daném fyzickém disku a informace o umístění zaváděcích sektorů (boot sektorů) jednotlivých disků. Tato tabulka může obsahovat maximálně 4 záznamy. Je-li potřeba rozdělit jeden disk na více logických oblastí, potom některý ze 4 záznamů odkazuje na tzv. Extended partition table (Rozšířená oblast):
Jeden fyzický disk se jeví jako několik nezávislých disků, které jsou identifikovány písmenem (C až Z bez diakritiky), mohou obsahovat různou logickou strukturu, různé operační systémy, popřípadě se může jednat pouze o datové oddíly. Každý diskový oddíl lze pojmenovat. Maximální velikost diskového oddílu je u MBR omezena na 2,20 TB (232 × 512 B), tedy přibližně na 2 TB. 1.2 Systémová a datová oblast oddílu Systémové oblasti a datová oblast každého oddílu se vytváří při vysokoúrovňovém formátování (HLF = High Level Format). Souborový systém FAT obsahuje tyto části: Boot Record – lokální zavaděč OS FAT (File Allocation Table) – alokační tabulka Root Directory – kořenový adresář Data Area – datová oblast, zde jsou uloženy veškeré soubory daného oddílu. Boot Record Nachází se na začátku každé logické oblasti (0. sektor). Má velikost 512 B (zabírá jeden sektor) a obsahuje lokální zavaděč operačního systému.
FAT (File Allocatin Table = alokační tabulka souborů) Nachází se hned za Boot Recordem. Obsahuje informace o aktuálním obsazení logického oddílu soubory. Jejím účelem je popsat uložení jednotlivých souborů na logickém oddílu disku. Každému záznamu ve FAT odpovídá jedna alokační jednotka (cluster). Číslo počátečního clusteru souboru je uvedeno v kořenovém adresáři (Root Directory). Záznam o clusteru ve FAT může nabývat různých hodnot (hexadecimálně).: (0000) volný cluster, (FFFE) poškozený cluster, není zde umožněn záznam (FFFF) cluster identifikující konec souboru (EOF= End Of File) (0002 až FFEF) číslo následujícího clusteru souboru. Příklad záznamu o souboru „testy01.txt“:
Obvykle existují 2 kopie FAT (obě jsou uloženy bezprostředně za sebou). Druhá FAT je použita v momentě, kdy se první stane nečitelnou. Root Directory (Kořenový adresář) Jsou zde uloženy veškeré informace o každém souboru na příslušném diskovém oddílu: jméno a přípona souboru, atributy souboru: R (read only), H (hidden), S (system), A (archive). Atribut D (directory) označuje, zda se jedná o soubor nebo podadresář, datum a čas vytvoření a posledního přístupu a zápisu do souboru, odkaz na 1. cluster ve FAT obsazený daným souborem, délka (velikost) souboru.
Pozn.: Téměř všechny informace lze vypsat kliknutím pravého tlačítka myši na ikoně souboru a následně zvolit položku „Vlastnosti“. 1.3 Chyby FAT Fragmentace souborů Je-li soubor rozdělen do více clusterů, které neleží hned za sebou, říkáme, že je soubor fragmentován. Fragmentace je nežádoucí, neboť zpomaluje práci disku. Čtecí a zapisovací hlavy musí přeskakovat mezi stopami. Také je větší nebezpečí, že při poškození malé části FAT, bude poškozeno více souborů. Zároveň komplikuje obnovu smazaného fragmentovaného souboru. K odstranění fragmentace používáme programy pro defragmentaci disku2. Defragmentace je proces, který roztroušené kousky (fragmenty) souborů uspořádá tak, aby obsah jednotlivých souborů byl uložen co nejvíce pohromadě (např. po sobě jdoucích clusterech), čímž se urychlí práce s těmito soubory. Ztracené fragmenty souborů Při zápisu na disk se nejdříve ukládají data do clusterů, zároveň je zapsán řetězec čísel clusterů do FAT a až nakonec je doplněno jméno souboru a ostatní údaje do kořenového adresáře. Pokud dojde během ukládání dat k nějaké chybě, jsou data uložena do clusterů, FAT registruje jejich posloupnost, ale v kořenovém adresáři není zapsáno jméno souboru, kterému obsazené alokační jednotky patří. FAT tedy registruje obsazené clustery, k nimž neexistuje jméno souboru, a blokuje tak místo na disku. K odstranění této chyby se používá program CHKDSK, který převede jednotlivé ztracené fragmenty na soubory, pojmenuje je FILExxxx.CHK (xxxx je čtyřmístné číslo začíná se od 0000) a umístí je do kořenového adresáře. V nich pak lze nalézt ztracená data. Překřížené soubory Chyba vzniká tehdy, pokud více záznamů FAT ukazuje na stejný cluster, tedy pokud jeden cluster patří více souborům. Tuto chybu lze opravit programem CHKDSK, popřípadě se soubory zkopírují do jiné složky čímž se křížícím se souborům přidělí nové clustery a samozřejmě se provede i nový zápis do tabulky FAT Neplatná podsložka Složka je v kořenovém adresáři zapsána stejně jako soubor, má číslo ukazující na první cluster a navíc má atribut D (Directory = adresář). Pokud se číslo ztratí nebo neuloží, jsou veškerá data ve složce ztracena.
2
Snižuje životnost SSD, defragmentaci SSD je doporučeno zakázat, od Windows 7 standardně nepovoleno
Poškození FAT K poškození FAT může dojít např. při použití software pro správu diskových oddílů, chybou uživatele, popřípadě selháním daného programu, při „pádu“ či nekorektní instalaci operačního systému, po nekorektním ukončení (odpojení) přenosného HDD z USB portu, škodlivým softwarem v počítači, atd.
Častý příznak poškozeného souborového systému. Pokud je HDD zobrazen, nejsou mu v nabídce „Tento počítač“ přiřazeny detailní informace. 1.4 Typy FAT FAT 12 - používal 12 bitů pro adresaci clusterů (omezení velikost oddílu na 32 MB). Tento souborový systém se používal u disků, které měly méně než 4096 clusterů (212), tedy nejstarší pevné disky a diskety. Dnes se nepoužívá a není podporován žádným současným operačním systémem. Nepodporoval podadresáře (existoval pouze kořenový adresář). FAT 16 - používal 16 bitů pro adresaci clusterů. Byl tedy schopen adresovat až 65536 clusterů (216). Libovolně velký disk byl při formátování rozdělen na maximálně 65536 clusterů, velikost jednoho clusteru se pohybovala od 512 B do 32 kB (216 × 32 kB = 2 GB). Ve Windows NT 4.0 se používal cluster o velikosti 64 kB, tedy maximální velikost diskového oddílu vzrostla na 4 GB. FAT 32 - používá 32 bitů pro adresaci clusterů. Je tedy schopen adresovat až 4.294.967.296 clusterů (232). Teoretická velikost diskového oddílu je 2 TB (omezení BIOSu), prakticky lze disk naformátovat max. na kapacitu 32 GB. Velikost souboru je omezena maximálně na 4 GB. FAT 32 podporuje dlouhé názvy a přípony souborů (starší FAT pouze 8+3 znaků) s diakritikou. Obsahuje záložní FAT a v případně poškození lze provést obnovu FAT ze zálohy. 1.5 Omezení FAT Souborové systémy FAT neumožňují zabezpečení souborů a složek (přístupová práva pro uživatele a skupiny uživatelů), šifrování, přidělování diskových kvót jednotlivým uživatelům, protokolování, atd. Pro pojmenování souborů používá 8 bitové ASCII kódování. Lze používat i znaky české národní abecedy.
2. Souborový systém NTFS NTFS (New Technology File System) využívají operační systémy Microsoft Windows od verze NT a vyšší (Windows 2000, XP, Vista, 7, 8, 8.1, 10). Starší specifikace NTFS používá 32 bitové adresy (232 – 1) clusterů, novější specifikace NTFS používá 64 bitové adresy (264 – 1) clusterů. Maximální velikost souboru je omezena na 16 TB, limitem je však velikost diskového oddílu. Jelikož je velikost diskového oddílu MBR limitována kapacitou 2 TB a lze vytvářet na jednom fyzickém pevném disku pouze 4 primární oddíly, musí být pro oddíly s větší kapacitou použit místo MBR novější typ diskového oddílu GPT (GUID Partition Table). Umožňuje vytvářet až 128 primárních diskových oddílů na jednom fyzickém pevném disku, každý s teoretickou kapacitou 18 EB. Klasický BIOS však nedokáže bootovat operační systém z GPT diskového oddílu! To umí až nástupce BIOSu, tzv. UEFI3 rozhraní (Unified Extensible Firmware Interface). NTFS podporuje všechny velikosti clusterů, (512 B až 64 kB), kdy 4 kB cluster je považován za standard (výhodný pro velkokapacitní disky). Není vhodné používat NTFS pro disky s kapacitou menší než 400 MB.
2.1 Systémová oblast diskového oddílu Celý souborový systém je řešen jako velká databáze, jejíž jeden záznam odpovídá souboru. Základ tvoří 11 systémových souborů, tzv. metadat, které vznikají bezprostředně po naformátování diskového oddílu. Tyto soubory nelze běžně přístupné pomocí souborového manažeru (Průzkumník, Total Commander, atd.):
MFT jméno
Záznam
Popis
$MFT
0
Master File Table = hlavní část NTFS
$MFTMIRR
1
Kopie prvních 16 záznamů MFT
$LOGFILE
2
Transakční logovací soubor
$VOLUME
3
Obsahuje sériové číslo svazku, čas vytvoření
$ATTRDEF
4
Definice atributů
.
5
Kořenový adresář disku
$BITMAP
6
Obsahuje mapu použití clusterů (použité vs. volné)
$BOOT
7
Boot record jednotky
$BADCLUS
8
Seznam vadných clusterů na disku
$QUOTA
9
Obsahuje informace o uživatelských kvótách
$UPCASE
10
Záznam shody velkých a malých písmen v názvech souborů
3
UEFI = softwarové rozhraní mezi operačním systémem a firmwarem hardwaru (nástupce BIOSu)
Master File Table (MFT) Hlavní část souborového systému NTFS. Obsahuje informace o rozložení všech souborů, adresářů i metadat na diskovém oddílu. V jednom nebo více MFT záznamech NTFS ukládá metadata, která popisují vlastnosti souboru nebo adresáře (přístupová práva uživatelů, atributy) a jeho umístění na disku. Jelikož $MFT je soubor, i on zde má záznam. MFT zabírá oblast začátku disku, přičemž si pro sebe vyhradí větší prostor (asi 12 % diskového oddílu), aby se soubor mohl dále rozrůstat a zůstával nefragmentovaný (rychlé hledání záznamů). Chybí-li na disku místo pro soubory, volné místo určené pro MFT se na nějaký čas zredukuje. Uprostřed disku je záložní kopie nejdůležitějších metasouborů MFT ($MFTMIRR).
Soubor $BITMAP je tvořen velkým polem bitů, kde každému bitu odpovídá cluster na disku. Je-li bit 0, cluster je prázdný, jinak je použitý. NTFS udržuje tento soubor ke sledování volných clusterů na disku k jejich přidělení pro nová data. Dojde-li k chybě při čtení dat, NTFS označí clustery jako vadné, přemapuje umístnění dat jinam a aktualizuje soubor $BADCLUS, čímž se zabrání použití vadného clusteru pro zápis dat. 2.2 Vlastnosti NTFS Žurnálování Všechny zápisy na disk se zároveň zaznamenávají do speciálního souboru, tzv. žurnálu (transakčního souboru) $LOGFILE. Pokud uprostřed zápisu dojde k selhání systému, je následně možné podle těchto záznamů všechny rozpracované operace dokončit nebo stornovat a tím souborový systém opět uvést do konzistentního stavu (transakční zpracování). Přidělování práv Umožňuje nastavení přístupových práv lokálních uživatelů (Users) a uživatelských skupin (Groups) pro jednotlivé soubory a složky. Změnu práv lze pod účtem administrátora provést kliknutím PTM4 na soubor nebo složku, z lokální nabídky zvolit „Vlastnosti“ a práva lze spravovat v záložce „Zabezpečení“.
4
PTM = pravé tlačítko myši
Komprese Komprese, tedy zmenšení objemu dat při zachování informace obsažených v datech přímo na úrovni souborového systému. Kompresi lze použít jak pro jednotlivé soubory a složky, tak pro celý diskový oddíl NTFS. Se soubory zmenšenými pomocí komprese NTFS lze pracovat, aniž by došlo manuální dekomprimaci, vše se děje automaticky bez zásahu uživatele. Práce s komprimovanými soubory je pomalejší. Postup při kompresi celého diskového oddílu: Tento počítač → kliknout PTM na diskový oddíl → „Vlastnosti“ → karta „Obecné“ → zatrhnout položku „komprimovat jednotku a šetřit tak místo na disku“. Postup při kompresi složky nebo souboru: Kliknout PTM na komprimovaný soubor nebo složku → „Vlastnosti“ → karta „Obecné“ → „Upřesnit“ → zatrhnout položku „komprimovat obsah a šetřit tak místo na disku“. Šifrování Šifrování je proces převedení dat do formátu, který je pro ostatní uživatele nečitelný. Se zašifrovanými soubory lze pracovat pouze pod účtem uživatele, který soubory zašifroval. Pod jiným účtem či v jiném počítači jsou šifrovaná data nečitelná! Postup při šifrování složky nebo souboru: Kliknout PTM na šifrovaný soubor nebo složku → „Vlastnosti“ → karta „Obecné“ → „Upřesnit“ → zatrhnout položku „Šifrovat obsah a zabezpečit tak data“. Diskové kvóty NTFS umožňuje nastavit maximálně využitelné místo na diskovém oddíle, pro konkrétního uživatele. Do diskové kvóty se nezapočítávají komprimované soubory, ale jejich reálná velikost. Informace o přidělených kvótách jednotlivým uživatelům jsou uloženy skrytých souborech $quota a $extend. Správa diskových kvót příslušného oddílu: Tento počítač → kliknout PTM na diskový oddíl → „Vlastnosti“ → karta „Kvóta“ → zatrhnout položku „Povolit správu přidělování kvót“. Dlouhé názvy souborů Pro názvy souborů a jejich přípony se používá 16 bitové kódování UNICODE, což umožňuje pojmenovat soubor v libovolném jazyce (podpora např. diakritiky u českých Windows v názvu souboru). Název souboru může mít až 255 znaků.
3. Metody mazání souborů a jejich obnova Existují 3 možné způsoby mazání souborů: Přesun souboru do koše: Při odstranění souboru z vnější paměťové jednotky (HDD, SSD, USB flash disk, paměťová karta atd.) se soubor přesune do speciální složky „Koš“, kde je dočasně uložen až do vyprázdnění koše. To umožňuje jednoduše a bezpečně obnovit soubory, které byly odstraněny omylem, a vrátit je do původního umístění. Ve skutečnosti se tedy nejedná o mazání souboru, z pohledu operačního systému soubor stále na disku existuje a zabírá požadované místo, dojde pouze k jeho přemístění. Běžné smazání souboru Po tzv. vysypání koše, popřípadě po přímém smazání souboru bez přesunutí do koše (klávesová zkratka SHIFT + DELETE) dojde z pohledu operačního systému k odstranění souboru a uvolnění místa na disku. Ve skutečnosti se však soubor stále nachází na disku, v záznamech souborového systému se pouze označí místo (clustery), které soubor zabírá, jako volné. Je-li záznam o smazaném souboru stále uložen v $MFT (resp. FAT) a soubor nebyl přepsán jiným, je obnova takto smazaných souborů možná pomocí specializovaných programů, např. Restoration, Recuva, Get Data Back, atd. Dojde-li k poškození nebo odstranění záznamu o souboru v $MFT (resp. FAT), např. při formátování nebo odstranění diskového oddílu, avšak soubor na disku nebyl přepsán jiným, musí program pro obnovu dat analyzovat každý sektor a hledá typické znaky pro určité typy souborů. Například každý JPEG obrázek začíná hodnotou FFD8 a končí hodnotou FFD9. Mezi tyto programy patří např. TestDisk a ArchiCrypt Rescue-Master. atd. Jsou-li smazaná data na disku fragmentovaná a navíc chybí záznamy o souboru v $MFT (resp. FAT), běžný program pro obnovu dat si s touto situací neporadí. Pro obnovu je pak potřeba použít program, který využívá metodu Smart Carving, např. Adroit Photo Recovery (pouze JPEG a některé RAW soubory). Ten provede nejprve hloubkovou analýzu diskového oddílu. Při rekonstrukci obnoví nejdříve soubory, které nejsou fragmentované. Díky tomu zůstanou na disku jen fragmentované soubory. Pak začne hledání hlavičky souboru. Podle hlavičky se pak hledají další části. Programy hledající soubory podle typických znaků musí „znát“ charakteristiky souboru, v případě metody Smart Carving jde algoritmus ještě dál a prakticky hledá to, co např. na fotografii může být, co odpovídá již nalezeným částem.
Bezpečné smazání souboru Pro bezpečné mazání dat existují programy, které nejsou přímo součástí OS Windows. Bezpečným mazáním se rozumí několikanásobný přepis souboru náhodnými daty. Pro fyzický přepis tyto programy používají algoritmy založené na různých matematických modelech, které mají zabránit obnově takto smazaného souboru. Mazat lze jednotlivé soubory, složky nebo celý diskový oddíl. Tato metoda mazání dat je vhodná při manipulaci s citlivými daty (počítač sdílí několik uživatelů), popřípadě při prodeji paměťového média cizí osobě. Bezpečné mazání dat lze aplikovat jak na plotnovém HDD, tak na polovodičových přenosných pamětech (SSD, paměťová karta, USB flash disk). Mezi nejpoužívanější bezplatné programy pro bezpečné mazání dat patří např.: Hard Disk Eraser – bezpečně odstraní soubory na zvoleném diskovém oddílu.
Freeraser – zobrazuje se jako ikona „odpadkového koše“ na pracovní ploše, soubor se bezpečně smaže přetažením myší na tuto ikonu a potvrzením akce.
Eraser – integruje se do kontextového menu Windows. Stačí kliknout PTM na soubor nebo složku a z místní nabídky zvolit položku Eraser → Erase.