Dnešní téma
Oblasti standardizace v ICT 1. technická infrastruktura transfer a komunikace informací, přístup k informacím, sdílení zdrojů
Případové studie – standardizace v ICT: 1) Znakové sady y HTML 2)) JJazyk
VOŠIS – ZIZ 7
Oblasti standardizace v ICT 2 reprezentace a zpracování dat a informací 2. možnost využívat datové soubory připravené na jednom zařízení prostřednictvím jiného zařízení znakové sady (abeceda) – kódování komunikovaných údajů syntaxe (skladba) – struktura (formát) komunikovaných údajů sémantika – obsah komunikovaných údajů (informace a metadata) VOŠIS – ZIZ 7
přenosová média přenosové protokoly architektura počítačových sítí 1
VOŠIS – ZIZ 7
Oblasti standardizace v ICT 3. rozhraní člověk – stroj možnost shodné komunikace uživatele s jakýmkoli počítačem na úrovni operačního systému nebo aplikačního programu VOŠIS – ZIZ 7
1
Struktura publikovaných informací
VOŠIS – ZIZ 7
5
Reprezentace informací v počítači čísla
instrukce
numerická data
řídí činnost počítače
statická
Struktura publikovaných informací
texty
znakové řetězce
informace
VOŠIS – ZIZ 7
6
Znak (character) jjakýkoli kýk li symbol b l reprezentující t jí í písmeno í abecedy, b d číslici nebo jiný znak, včetně interpunkce, mezer a diakritických znamének LATINSKÉ MALÉ PÍSMENO C S HÁČKEM (LATIN SMALL LETTER C WITH CARON) – 14/08 – U+010D – E8
ostatní
data
grafika zvuky grafika, zvuky…
jsou zpracovávána
metody algoritmy
glyf, font vizuální reprezentace grafického znaku
dynamická znalosti
logická pravidla VOŠIS – ZIZ 7
VOŠIS – ZIZ 7
2
Typy znaků
3 reprezentace znaku 1 slovní, 1. slovní abstraktní definice
grafické deklarativní – co se má zobrazit (glyf)
jednoznačná srozumitelná lidem
2. vizuální, grafická definice – glyf, font
víceznačná ((synonymie, y y homonymie) y ) srozumitelná lidem (a příp. OCR programům)
řídící procedurální – co se má udělat
3. kód (kombinace 0 a 1) jednoznačný srozumitelný softwaru
VOŠIS – ZIZ 7
VOŠIS – ZIZ 7
Konverze – převod z kódu do kódu
Kód pravidla pro způsob, jak mají být reprezentována či transformována data
01100001
VOŠIS – ZIZ 7
a
transkripce zvuk – písmeno (znak) transliterace transliterace písmeno (znak) – písmeno (znak)
VOŠIS – ZIZ 7
3
Konverze – související problémy
Lokalizace ve Windows
lokalizace internacionalizace globalizace
VOŠIS – ZIZ 7
Soubor znaků
(character set, charset)
VOŠIS – ZIZ 7
Soubor znaků
(character set, charset)
též znaková sada, d znaková stránka (codepage), ( d ) kódová tabulka, kódová stránka Množina znaků, kterou lze v daném kódu použít (vyjádřit – tj. zakódovat do 0 a 1) typy kódů podle délky: 7-bitový 8-bitový 16-bitový 32-bitový VOŠIS – ZIZ 7
VOŠIS – ZIZ 7
4
Příklad nejednotnosti – kódové vyjádření některých písmen české abecedy v různých 8-bitových znakových sadách
š
ř
ž
ČSN ISO 8859-2
10011101
00011111
01111101
Windows 1250
11100111
11111101
10100111
KEYBCS2
10101000
10101001
10010001
KOI-8
11010011
11010010
11011010
VOŠIS – ZIZ 7
Mezinárodní standardy
Proč je standardizace znakových sad důležitá? Umožní začlenit do globální elektronické komunikace informací i méně obvyklé jazyky Podle pořadí ve znakové sadě (kódové tabulce) se postupuje při třídění (tj ovlivňuje složení indexů) (tj. Kódování znaků je rozhodující pro výsledek jejich porovnávání při vyhledávání (string matching) VOŠIS – ZIZ 7
Mezinárodní standardy − kompatibilita
7-bitové 7 bitové ČSN ISO/IEC 646 (ISO 7, ASCII)
ISO 10646
8-bitové ČSN ISO/IEC 8859
UNICODE
16-bitové bitové / 32 32-bitové bitové 16 UNICODE
ISO 8859-1 8859 1
32-bitové ISO/IEC 10646 Universal Multiple-Octet Coded Character Set (UCS) VOŠIS – ZIZ 7
ISO 646 VOŠIS – ZIZ 7
5
Řešení problémů s různými znakovými sadami
Doporučený způsob používání češtiny v e-mailu a na webu
a) Konverze (souboru) konverzní programy volba kódování při exportu
v hlavičkách dokumentů uvádějte typ znakové sady <meta http-equiv="Content-Type" content="text/html;charset=iso-8859-2">
b) Přizpůsobení zobrazovacího programu nebo b tiskárny i ká dané d é znakové k é sadě dě browser – kódování (encoding) databáze – jazykový ovladač (driver) tiskárna – download
<meta http-equiv="Content-Type" http equiv Content Type content="text/html;charset=utf-8" />
VOŠIS – ZIZ 7
VOŠIS – ZIZ 7
HTML Hypertext Markup Language
Struktura HTML dokumentu
jazyk (DTD) pro strukturování a formátování WWW dokumentů typ dokumentu HTML: web page (document), tj. jednotka informace přístupná p p v síti WWW hypertextové vazby na jiné dokumenty v síti WWW
složené dokumenty
!DOCTYPE = deklarace typu dokumentu (zpravidla ve formě odkazu na externí DTD) HTML = instance dokumentu HEAD = záhlaví (informace pro browser) META = informace o dokumentu, která není určená pro zobrazení browserem BODY = tělo (informace pro uživatele)
VOŠIS – ZIZ 7
23
VOŠIS – ZIZ 7
24
6
HTML – historie verzí
HTML 2.0 HTML 3.2 HTML 4.0 HTML 4.01 XHTML 1.0 XHTML 1.1 11
HTML technologie
D lší vývoj: Další ý j
validátor lidát HTML editor
HTML 5 XHTML 2
HTML dokument (stránka) HTML konvertor, generátor
ČSN ISO/IEC 15445 (36 9831) Informační technologie – Jazyky pro popis dokumentů a jejich zpracování – Hypertextový vyznačovací jazyk (HTML). Praha : Český normalizační institut, 2002. tzv. ISO HTML – definuje podmnožinu HTML 4.01 VOŠIS – ZIZ 7
25
DTD
parser render d CSS
VOŠIS – ZIZ 7
HTML prohlížeč
browser
26
7