Modemy Prˇenos dat uvnitrˇ domu, area´lu apod. – nejjednodusˇsˇ´ı propojit kabelem (LAN...). Jak prˇena´sˇet data na veˇtsˇ´ı vzda´lenosti? Nejjednodusˇsˇ´ı pouzˇ´ıt existujı´cı´ infrastrukturu, i kdyzˇ byla pu˚vodneˇ navrzˇena´ za u´plneˇ jiny´m u´cˇelem: 1. verˇejna´ telefonnı´ sı´t’ (pevne´ linky) 2. mobilnı´ telefony 3. kabelova´ televize 4. silove´ elektricke´ rozvody. . . ˇ asto jsme nuceni vyuzˇ´ıvat verˇejnou telefonnı´ sı´t’, C odhad 300 mil. telefonu˚ na sveˇteˇ. Telefonnı´ sı´t’ navrzˇena prˇed mnoha lety s u´plneˇ odlisˇny´m cı´lem: prˇenos lidske´ho hlasu ve vı´ceme´neˇ rozpoznatelne´ formeˇ.
KIV/PD 2002 (1)
1
Organizace telefonnı´ sı´teˇ A 1
B 2
C 3
Organizace zjednodusˇeneˇ: od telefonu kroucena´ dvojlinka (1) typicky 1 azˇ10 km (ve meˇstech me´neˇ nezˇ na venkoveˇ) loka´lnı´ u´strˇedny (A) propojujı´ loka´lnı´ hovory, pokud hovor nenı´ loka´lnı´ pak spojenı´ mezi u´strˇednami (B, C) spojenı´ mezi u´strˇednami pu˚vodneˇ analogove´ (nejcˇasteˇji frequency division multiplexing na koaxia´lnı´ch kabelech, vlnovodech), dnes digita´lnı´ (cˇasovy´ multiplexing na opticky´ch vla´knech) Loka´lnı´ smycˇka by mohla prˇena´sˇet 1 azˇ 2 Mbps (podle de´lky), ale omezeno filtry na asi 300-3400 Hz.
KIV/PD 2002 (1)
2
Procˇ je potrˇeba modulace? Sˇ´ırˇka prˇenosove´ho pa´sma telefonnı´ sı´teˇ asi 400 azˇ 3400 Hz:
0.3 kHz
3.4 kHz
Procˇ nemu˚zˇeme naprˇ. prˇipojit dveˇ napeˇt’ove´ u´rovneˇ: „hranaty´“ signa´l obsahuje sˇiroke´ spektrum, ale u´tlum i zpozˇdeˇnı´ jsou frekvencˇneˇ za´visle´ prˇijmeme neˇco jine´ho, nezˇ jsme vyslali
extre´mnı´ prˇ´ıklad – vysˇleme-li kontinua´lnı´ proud bin. 0 nebo 1, vystpuje tata´zˇ napeˇt’ova´ u´rovenˇ. Nutna´ konverze na analogovy´ signa´l na vysı´lacı´ straneˇ, zpeˇt na prˇijı´macı´ – modula´tor a demodula´tor. Protozˇe obvykle obeˇ strany jak vysı´lajı´ tak prˇijı´majı´, kombinovane´ zarˇ´ızenı´ zna´me´ jako modem. 3 za´kladnı´ typy modulace: aplitudova´, frekvencˇnı´, fa´zova´. KIV/PD 2002 (1)
3
Za´kladnı´ modulace Modem kontinua´lneˇ vysı´la´ za´kladnı´ho sinusovy´ to´n s f = 1000 azˇ 2000 Hz, nazy´va´n nosna´ (carrier), moduluje se amplitudoveˇ, frekvencˇneˇ nebo fa´zoveˇ. Amplitudova´ modulace, AM Frekvence vhodna´ pro prˇenos signa´lu v telefonnı´ sı´ti; amplituda prˇepı´na´na mezi neˇkolika u´rovneˇmi. 0
1
0
1
1
0
0
1
Lehce ovlivnitelne´ (sˇum, prˇeslechy) v za´kladnı´ formeˇ se prakticky nepouzˇ´ıva´, nejcˇasteˇji se pouzˇ´ıva´ v kombinaci s fa´zovou modulacı´.
KIV/PD 2002 (1)
4
Za´kladnı´ modulace (pokr.) Frekvencˇnı´ modulace = FM podle bina´rnı´ho proudu dat se meˇnı´ frekvence: 0
1
0
1
1
0
0
1
V za´kladnı´ verzi se pouzˇ´ıvajı´ 2 frekvence, nazy´va´ se take´ digita´lnı´ FM nebo Frequency Shift Keying (FSK). Pouzˇitı´ v nı´zkorychlostnı´ch modemech (3001200 bps). Fa´zova´ modulace = PM Frekvence a amplituda signa´lu konstantnı´, meˇnı´ se fa´ze nosne´: 0
KIV/PD 2002 (1)
1
0
1
1
0
0
1
5
Fa´zova´ modulace Pokud signa´ly s rozdı´lem fa´ze a prˇepı´na´nı´ mezi nimi, musela by prˇijı´macı´ strana udrzˇovat referencˇnı´ signa´l proti ktere´mu se porovna´va´ – na´zev „fa´zoveˇ koherentnı´ “ PM – tento typ je na´chylny´ na zmeˇnu fa´ze v prˇena´sˇene´m signa´lu a na´rocˇny´ na demodulaci. Proto pouzˇ´ıva´na alternativnı´ forma PM, kde posuny na´sledujı´cı´ho bitu oproti prˇedchozı´mu vzˇdy o 90 stupnu˚: 0 = zmeˇna o +90 st. 1 = zmeˇna o 270 st., prˇi demodulaci stacˇı´ zna´t velikost zmeˇny, ne absolutnı´ hodnotu. Mozˇnost vı´ce nezˇ 2 ru˚zne´ hodnoty – beˇzˇneˇ 4 nebo 8, tj. 2 nebo 3 bity prˇi jedne´ zmeˇneˇ.
KIV/PD 2002 (1)
6
Kombinace modulacˇnı´ch technik Pro vysˇsˇ´ı rychlosti kombinace modulacˇnı´ch technik, naprˇ. AM+fa´zova´. Limit dany´ sˇ´ırˇkou pa´sma, pro 3100 Hz je 18600 bps. Obra´zky obsahujı´cı´ lega´lnı´ kombinace amplitudy a fa´ze se nazy´vajı´ konstelacˇnı´ vzory. 45 15
Naprˇ. 0, 90, 180, 270 stupnˇu˚, dveˇ u´rovneˇ amplitudy na zmeˇnu fa´ze. QAM (Quadrature Amplitude Modulation) – vneˇjsˇ´ı 4 (45 stupnˇu˚) + vnitrˇnı´ch 12 (od 15 stupnˇu˚) = 16 bodu˚, tj. 4 bity na baud. Prˇi 2400 Bd 9600 bps. Vysokorychlostnı´ modemy majı´ tak mnoho bodu˚ v konstelacˇnı´m vzoru, zˇe i maly´ sˇum mu˚zˇe zpu˚sobit chybu; proto se do konst. vzoru prˇida´va´ paritnı´ bit a ko´dova´nı´ bodu˚ je vybra´no tak, aby s maximalizovala sˇance detekce chyby = trellisovo ko´dova´nı´. KIV/PD 2002 (1)
7
Proble´m odrazu˚ Odrazy na rozhranı´ mezi loka´lnı´ smycˇkou a da´lkovy´m vedenı´m (2 vodicˇe a 4 vodicˇe). Ilustrace, odraz od okna na rozhr. vzduch-sklo. Efekt – mluvı´cı´ osoba slysˇ´ı sebe s maly´m zpozˇdeˇnı´m, na linka´ch ¿ 2000 km uzˇivatele rusˇ´ı potlacˇovacˇe echa prˇi spojenı´ nad 2000 km. Detekce odkud rˇecˇ prˇicha´zı´ a potlacˇenı´ signa´lu jdoucı´ho opacˇny´m smeˇrem, prˇepnutı´ prˇi zmeˇneˇ rˇecˇnı´ka za 2 azˇ 5 ms. Plny´ duplex nemozˇny´ (modemy umı´ FD i na 2 vodicˇ. vedenı´ alokacı´ cˇa´sti pa´sma pro doprˇedny´ signa´l a cˇa´sti pro zpeˇtny´), prˇepı´na´nı´ pomale´ i pro polovicˇnı´ duplex, pro rˇecˇ stacˇı´. Zadnı´ vra´tka: prˇi prˇ´ıchodu cˇiste´ho to´nu o f=2100 Hz se odpojı´ na dobu, po kterou se vysı´la´ nosna´ = in band signaling. Druha´ mozˇnost simulovat echo a odecˇı´st od dorucˇovane´ho signa´lu; nahrazuje potlacˇovacˇe echa v US a dalsˇ´ıch zemı´ch.
KIV/PD 2002 (1)
8
Rozhranı´ RS-232C/V.24 RS-232 pu˚vodneˇ definova´n EIA (Electronic Industries Association) jako standard pro se´riove´ prˇipojenı´ pocˇı´tacˇe nebo termina´lu (DTE) k modemu (DCE); RS-232C je trˇetı´ (soucˇasna´) revize standardu. V.24 + V.28 doporucˇenı´ ITU-T; V.24 vy´znamy signa´lu˚, odlisˇne´ oznacˇenı´, definuje fce vy´vodu˚ 11–14, 16, 19, 21 a 23. Mechanicka´ specifikace definuje 25 pinovy´ konektor DB-25. Oznacˇenı´ pinu˚: 1
13
14
25
Elektricka´ specifikace definuje u´rovneˇ signa´lu vzhledem k zemi – referencˇnı´mu vodicˇi (viz ), prˇenos do 20 kbps, kabely do 15 m.
logicka´1 logicka´ 0
-3 V azˇ -15 V +3 azˇ +15 V
V.28. Prakticky by´va´ urcˇeno napa´jecı´m napeˇtı´m obvodu˚ rozhranı´, nenı´ neobvykle´ 12 V.
KIV/PD 2002 (1)
9
RS-232C/V.24 – funkcˇnı´ specifikace
—
DTE-DCE
—
KIV/PD 2002 (1)
1 2 3 4 5 6 7 8 20
DB-25
– 3 2 7 8 6 5 1 4
DB-9
AA BA BB CA CB CC AB CF CD
EIA
101 103 104 105 106 107 102 109 108.2
V.24
Frame Ground (FG, SHG) Transmit Data (TD, TxD) Receive Data (RD, RxD) Request to Send (RTS) Clear to Send (CTS) Data Set Ready (DSR) Signal Ground (SG, SIG) Data Carrier Detect (DCD, CD) Data Terminal Ready (DTR)
popis
10
Funkcˇnı´ specifikace definuje vy´znam pinu˚ (prˇesneˇji: vy´znam obvodu˚, spojenı´ s piny). Obvykle je implementova´na pouze podmnozˇina, na´sledujı´cı´ch 9 te´meˇrˇ vzˇdy:
ochran vysı´lan prˇijı´ma vy´zva k prˇiprav DCE prˇ signa´lo detekc DTE prˇ
vy´znam
RS-232C/V.24 – procedura´lnı´ specifikace Procedura´lnı´ specifikace popisuje protokol ve formeˇ akce – reakce. Prˇ´ıklad: prˇi poloduplexnı´ komunikaci: pocˇı´tacˇ chce vysı´lat, nastavı´ RTS modem vysˇle nosnou, za chvı´li nastavı´ CTS pocˇı´tacˇ posˇle data, shodı´ RTS modem prˇestane vysı´lat nosnou. Na straneˇ prˇ´ıjemce CD prˇi detekci nosne´, pak prˇijdou data. Soucˇasne´ modemy (prˇi spra´vne´m nastavenı´):
aktivnı´, pokud moDCD (Data Carrier Detect) dem detekuje nosnou. Sestupna´ hrana – spojenı´ se ztratilo nebo bylo ukoncˇeno.
DTR (Data Terminal Ready) je-li aktivnı´, modem mu˚zˇe pracovat, neaktivnı´ – modem nema´ deˇlat nic. Prˇi sestupne´ hraneˇ modem zaveˇsı´.
aktivnı´, pokud je modem CTS (Clear to Send) schopen prˇijı´mat znaky z DTE.
KIV/PD 2002 (1)
11
Nulovy´ modem Proble´m: pu˚vodnı´ definice s prˇedpokladem „modem poskytuje stejne´ sluzˇby termina´lu i pocˇı´tacˇi“ ˇ esˇenı´ – – co kdyzˇ chci spojit termina´l a pocˇı´tacˇ? R veˇtsˇinou null modem. Zapojenı´ nulove´ho modemu pro duplexnı´ rezˇim: FG
TxD
RxD
RTS
CTS
DSR
SG
DCD
DTR
1
2
3
4
5
6
7
8
20
1
2
3
4
5
6
7
8
20
RS-232C umozˇnˇuje take´: synchronnı´ komunikaci – proto cˇasova´nı´ TxClk, RxClk na pinech 15 a 17 vedlejsˇ´ı datovy´ kana´l – proto STD (Secondary Transmit Data), SRD, SDCD. . .
KIV/PD 2002 (1)
12
Dalsˇ´ı rozhranı´ Nevy´hody RS-232C – rychlost a de´lka kabelu novy´ standard:
RS-449 – mechanicke´, funkcˇnı´ a procedura´lnı´ rozhranı´. Prˇenos asynchronneˇ a synchronneˇ, prˇida´no testova´nı´ (loopback skrze DCE), konektor 37 pinu˚ (kvu˚li RS-422). RS-422-A a RS-423-A – elektricka´ rozhranı´ RS-422-A – vyva´zˇeny´ (diferencia´lnı´) prˇenos, signa´l pa´r vodicˇu˚, azˇ 2 Mpbs na 60 m kabelu RS-423-A – nevyva´zˇeny´ prˇenos, spolecˇna´ zem
V.35 – rozhranı´ s vysokorychlostnı´mi synchronnı´mi modemy, 48–168 kbps, obsahuje vyva´zˇene´ (RxD, TxD) i nevyva´zˇene´ signa´ly, proto plna´ verze sdı´lı´ omezenı´ V.24 (rychlost do 20 kbps, kabely do 15 m).
KIV/PD 2002 (1)
13
Ovla´da´nı´ modemu˚ Modemy od konce 60 let, akusticke´ couplery 3001200 bps. Pu˚vodneˇ uzˇivatel musel vytocˇit cˇı´slo a prˇipojit rucˇneˇ, pozdeˇji automaticke´ vyta´cˇenı´ (ACU). Ovla´da´nı´ ru˚zny´m zpu˚sobem, naprˇ. vedlejsˇ´ı kana´l RS-232C. Fima Hayes ovla´da´nı´ modemu Smartmodem, stalo se de facto standardem. Hayes-kompatibilnı´ modemy prˇ´ıkazy AT (Attention):
AT OK ATDP0,T377491555 CONNECT 2400 datadatadata +++ OK ATH0 NO CARRIER
KIV/PD 2002 (1)
(pr ˇ´ ıkaz AT + Enter) (odpove ˇd’ modemu) (vytoc ˇenı ´ tel. c ˇı ´sla) (spojenı ´ nava ´za ´no) (data se pr ˇena ´ˇ sejı ´) (do pr ˇ´ ıkaz. rez ˇimu) (ukonc ˇenı ´ spojenı ´)
14
Stavy modemu ATD, ATA rezim navazuje spojeni lokalnich prikazu DTR:
rezim transparentniho prenosu +++
ATO prikazovy rezim ATH0 pri navazanem spojeni
Prˇ´ıkazy pro nava´za´nı´/zrusˇenı´ spojenı´: ATD[PT0-9,]* vytocˇenı´ telefonnı´ho cˇı´sla, nava´za´nı´ spojenı´ (Dial) +++
1 s pauza prˇed a za, do prˇ´ıkazove´ho rezˇimu
ATH0
zaveˇsˇenı´, ATH1 – prˇipojenı´ se k lince (Hook)
ATA
spustı´ rezˇim odpoveˇdi (Answer )
Na´vratove´ ko´dy: OK, ERROR, CONNECT xxx, RING, NO CARRIER, NO DIALTONE, BUSY. KIV/PD 2002 (1)
15
Prˇ´ıkazy modemu Na´vratove´ ko´dy ATV1 – rˇeteˇzce (Verbal), ATV0 – cˇı´selne´ na´vratove´ ko´dy ATQ0 – vypisuje, ATQ1 – potlacˇuje (Quiet) ATXn – volı´ mnozˇinu na´vratovy´ch ko´du˚, ATX3 neobsahuje NO DIALTONE. Ostatnı´ prˇ´ıkazy: ATM[012] – prˇ´ıposlech vypnut | zapnut do nava´za´nı´ spojenı´ | zapnut (Monitor ) En – echo v prˇ´ıkazove´m rezˇimu (0 = nenı´ echo) (Echo) Fn – echo prˇi prˇenosu dat (1 = nenı´) (Full Duplex) ATZ – softwarovy´ reset modemu, inicializace podle DIP nebo NVRAM KIV/PD 2002 (1)
16
ATIn – testy RAM, ROM, identifikace modemu (Inquiry) AT&zn, AT%zn – rozsˇ´ırˇena´ sada prˇ´ıkazu˚ (AT&W)
KIV/PD 2002 (1)
17
Vnitrˇnı´ registry modemu
dop. 0 2 50 6 7
jedn. 1 sek. sek. s s
KIV/PD 2002 (1)
reg. S0 S6 S7 S9 S10
vy´znam pocˇet zazvoneˇnı´ prˇed automatickou odpoveˇdı´ cˇeka´nı´ nezˇ modem zacˇne vyta´cˇet doba cˇeka´nı´ na nava´za´nı´ spojenı´ doba detekce nosne´ prˇed nava´za´nı´m spojenı´ doba ztra´ty nosne´ prˇed ukoncˇenı´m spojenı´
ATSn=x – nastavenı´ registru n na hodnotu x ATSn? – vy´pis nastavenı´ registru n Vy´znam vnitrˇnı´ch registru˚:
18
Znakove´ sady do vy´stupnı´ho zarˇ´ızenı´ jsou posı´la´ny znaky v urcˇite´m ko´du (ve vy´stupnı´m zarˇ´ızenı´ je znak deko´dova´n, naprˇ. tiska´rna vytiskne odpovı´dajı´cı´ znak) znakove´ sady pu˚vodneˇ pro vstupy/vy´stupy (kla´vesnice, tiska´rna. . . ), z prakticky´ch du˚vodu˚ i pro vnitrˇnı´ reprezentaci pro komunikaci 8 bitove´ elementy – znak nebo cˇa´st veˇtsˇ´ı hodnoty – oznacˇenı´ „oktet“ pro komunikacˇnı´ u´cˇely nejrozsˇ´ırˇeneˇjsˇ´ı 7 bitu˚ ˜ 128 prvku˚, 8 bitu˚ ˜ 256 prvku˚ – nejcˇasteˇjsˇ´ı 7 bitovy´ ko´d ASCII (ANSI X3.41968) = CCITT IA5 (International Alphabet No 5) = ISO 646-US – existuje rˇada nestandardnı´ch firemnı´ch ko´du˚, nejrozsˇ´ırˇeneˇjsˇ´ı EBCDIC (Extended Binary Coded Decimal Interchange Code, 8 bitovy´ ko´d, pouzˇ´ıvany´ v mnoha zarˇ´ızenı´ch IBM) KIV/PD 2002 (1)
19
Tabulka ko´du ASCII 000
001
010
011
100
101
110
111
0000xxx
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
0001xxx
BS
HT
LF
VT
FF
CR
SO
SI
0010xxx
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
0011xxx
CAN
EM
SUB
ESC
FS
GS
RS
US
0100xxx
SPACE
!
”
#
$
%
&
’
0101xxx
(
)
*
+
,
-
.
/
0110xxx
0
1
2
3
4
5
6
7
0111xxx
8
9
:
;
<
=
>
?
1000xxx
@
A
B
C
D
E
F
G
1001xxx
H
I
J
K
L
M
N
O
1010xxx
P
Q
R
S
T
U
V
W
1011xxx
X
Y
Z
[
“
]
ˆ
1100xxx
‘
a
b
c
d
e
f
g
1101xxx
h
i
j
k
l
m
n
o
1110xxx
p
q
r
s
t
u
v
w
1111xxx
x
y
z
˜
DEL
KIV/PD 2002 (1)
|
20
Tabulka ko´du EBCDIC (1/2) 000b
001b
010b
011b
100b
101b
110b
111b
00h
NUL
SOH
STX
ETX
ST
HT
SSA
DEL
08h
EPA
RI
SS2
VT
FF
CR
SO
SI
10h
DLE
DC1
DC2
DC3
OSC
NEL
BS
ESA
18h
CAN
EM
PU2
SS3
FS
GS
RS
US
20h
PAD
HOP
BPH
NBH
IND
LF
ETB
ESC
28h
HTS
HTJ
VTS
PLD
PLU
ENQ
ACK
BEL
30h
DCS
PU1
SYN
STS
CCH
MW
SPA
EOT
38h
SOS
SGCI
SCI
CSI
DC4
NAK
PM
SUB
40h
SPACE [
.
<
(
+
!
]
$
*
)
;
ˆ
—
,
%
>
?
:
#
@
=
”
48h 50h
&
58h 60h
-
/
68h 70h 78h
KIV/PD 2002 (1)
‘
’
21
Tabulka ko´du EBCDIC (2/2) 000b 80h 88h
h
q
011b
100b
101b
110b
111b
a
b
c
d
e
f
g
k
l
m
n
o
p
s
t
u
v
w
x
B
C
D
E
F
G
K
L
M
N
O
P
S
T
U
V
W
X
2
3
4
5
6
7
i
r ˜
A0h A8h
010b
j
90h 98h
001b
y
z
B0h B8h A
C0h C8h D0h
H
I J
D8h
Q
E0h
“
E8h
Y
Z
F0h
0
1
F8h
8
9
KIV/PD 2002 (1)
R
APC
22
ˇ ´ıdı´cı´ znaky R Veˇtsˇina univerza´lnı´ch ko´du˚ (vcˇetneˇ ASCII, EBCDIC) obsahuje: pı´smena, cˇı´slice, oddeˇlovacı´ znaky = tisknutelne´ znaky rˇ´ıdı´cı´ znaky: – ˇr´ızenı´ forma´tu: BS (backspace), LF (line feed), CR (carriage return), DEL (delete), ESC (escape), FF (form feed) – informacˇnı´ oddeˇlovacˇe: FS (file separator), RS (record separator) – znaky pro rˇ´ızenı´ prˇenosu: SOH (start of heading), STX (start of text), ETX (end of text), ACK (acknowledge), NAK (negative acknowledge), SYN (synchronous idle)
KIV/PD 2002 (1)
23
ISO 2022 Pro beˇzˇnou komunikaci vyzˇadova´na diakritika – rozsˇ´ırˇenı´ ASCII o 128 zn. 8 bitove´ ko´dy podle ISO 2022. V ISO 2022 je prostor pro 8bitove´ znaky rozdeˇlen do 4 regionu˚:
00h - 1Fh:
C0
(Control Characters 0) 20h - 7Fh:
GL
(Graphic Characters Left)
80h - 9Fh:
C1
(Control Characters 1) A0h - FFh:
GR
(Graphic Characters Right)
V GL a GR jsou tisknutelne´ znaky. ISO 2022 bezestavove´ i stavove´ ko´dy; bezestavove´ naprˇ. ISO 8859-1, Stavove´ – vı´ce znakovy´ch sad a escape sekvence mezi nimi prˇepı´najı´. Existujı´ 4 buffery (G0, G1, G2 a G3), znakova´ sada je umı´steˇna do bufferu a pomocı´ ko´du je vyvola´na do GL nebo GR. Naprˇ. rˇ´ıdı´cı´ znak LS2 provede mapova´nı´ G2 do GL.
KIV/PD 2002 (1)
24
Ko´dova´nı´ cˇesˇtiny a slovensˇtiny ˇ S2 – nejcˇasteˇjsˇ´ı diakriticke´ znaky nastaKOI-8 C venı´m 7. bitu, ch a CH jako znak Kamenicˇtı´ (KEYBCS2) v 1986 – minima´lnı´ zmeˇny oproti defaultnı´mu k-odova´nı´ na IBM PC ISO 8859-2 (ISO Latin 2) v 1987 je ISO 2022 kompatibilnı´ ko´d pro soucˇasnou alba´nsˇtinu, chorvatsˇtinu, cˇesˇtinu, mad’arsˇtinu, rumunsˇtinu, slovensˇtinu a slovinsˇtinu, anglicˇtinu a neˇmcˇinu PC Latin 2 = cp852, v man. DOSu jako „Slavic ˇ SN 36 9103 pro PC, ob(Latin II)“, doporucˇeny´ C sahuje vsˇechny tisknutelne´ znaky ISO L2, diakritika v jiny´ch pozicı´ch (zachova´va´ neˇktere´ ra´mecˇky) cp1250 – obsahuje vsˇechny znaky ISO L2, pouzˇ´ıva´ pozice 128–159 (C1) pro tisknutelne´ znaky, 14 znaku˚ na jiny´ch pozicı´ch (z nich se pouzˇ´ıva´ v cˇesˇtineˇ a slovensˇtineˇ male´ a velke´ sˇ, t’, zˇ a l’) KIV/PD 2002 (1)
25
UNICODE ISO/IEC 10646 definuje 2 znakove´ sady, UCS-2 a UCS-4: UCS-4 – 32 bitu˚, snaha vyja´drˇit vsˇechny znaky na sveˇteˇ v jedine´ bezestavove´ znakove´ sadeˇ UCS-2 – 16 bitova´ podmnozˇina UCS-4 ˇ eteˇzce ulozˇene´ v ko´du UCS-2 nebo UCS-4 dveˇma R zpu˚soby – big endian, little endian. Pro zjisˇteˇnı´ ktery´ je na zacˇa´tku souboru magicky´ znak ’zero-width no-breaking space’ s ko´dem 0xffef (v UCS-2) a 0x0000ffef v UCS-4. UNICODE = UCS-2 Znaky 0x0021-0x007e odpovı´dajı´ ASCII 0x21-0x7e.
KIV/PD 2002 (1)
26
UNICODE a UTF-8 UTF-8 - osmibitove´ ko´dova´nı´ UCS-4, kde se do te´ doby uzˇ´ıvaly 8bitove´ ko´dy (souborove´ syste´my; pocha´zı´ v Plan 9): UCS-4
UTF-8
00000000 00000000 00000000 0???????
0???????
00000000 00000000 00000??? ????????
110????? 10??????
00000000 00000000 ???????? ????????
1110???? 10?????? 10??????
00000000 000????? ???????? ????????
11110??? 3 10??????
000000?? ???????? ???????? ????????
111110?? 4 10??????
0??????? ???????? ???????? ????????
1111110? 5 10??????
KIV/PD 2002 (1)
27
Proble´my UNICODE Protozˇe 65536 znaku˚ nestacˇı´: synte´za akcentovane´ho znaku kombinacı´ akcentu a za´kladnı´ho znaku (nevy´hoda: znak je mozˇne´ vyja´drˇit vı´ce nezˇ jednı´m zpu˚sobem, otevrˇeny´ pocˇet mozˇnostı´, znak uzˇ nenı´ konstantnı´ de´lky) vyja´drˇenı´ znaku jako dvou 16bitovy´ch ko´du˚ prvnı´ musı´ by´t v oblasti 0xd800 - 0xdbff, druhy´ 0xdc00 - 0xdfff (vyja´drˇ´ı dalsˇ´ıch 1024 * 1024 znaku˚) snaha o minimalizaci pocˇtu ko´du˚ – UNICODE neobsahuje znaky neˇktery´ch pouzˇ´ıvany´ch znakovy´ch sad, unifikace Han: cˇı´nska´ Hanzi (zjednoˇ ´ına, tradicˇnı´ Taiwan), korejska´ dusˇene´ varianta C Hanja a japonska´ Kanji – podobne´ znaky ko´dova´ny stejny´m ko´dem.
KIV/PD 2002 (1)
28