Zapomenuté informační služby Internetu 20.3.2008
Zapomenuté informační služby Internetu Jiří Peterka, 2008
1
Zapomenuté informační služby Internetu 20.3.2008
představení mé osoby
• učitel – katedra softwarového inženýrství • Matematicko-fyzikální fakulta UK, Praha
• nezávislý konzultant a publicista • "na volné noze"
– zaměření: • • • • • •
– původní zaměření: • architektura počítačů • programování (VPJ i ASM) • mikroprocesorové technologie
– dnes hlavně: • počítačové sítě a komunikace • Internet (TCP/IP)
Internet elektronické komunikace počítačové sítě a komunikace informační společnost egovernment …….
• osobní stránky: – http://jiri.peterka.cz
• archiv článků: – http://www.earchiv.cz
• mail: –
[email protected]
2
Zapomenuté informační služby Internetu 20.3.2008
ujasnění základních pojmů
• služba – … se poskytuje – … využívá se – přináší určitý efekt • příklady služeb: – – – – –
elektronická pošta přenos souborů (FTP, …) vzdálené přihlašování (Telnet, …) WWW …….
• předpoklady: – každá služba má určitá pravidla/způsoby/standardy svého fungování – musí být nějak implementována • skrze nějakou aplikaci
• aplikace – … se spouští • jde o program
– … se ovládá • má uživatelské rozhraní
– má architekturu ….. • příklady aplikací: – poštovní klient • i poštovní server
– WWW browser • i WWW server
– program pro IM (instant messaging) / chat • může/nemusí mít server
– VOIP klient • nemá server 3
Zapomenuté informační služby Internetu 20.3.2008
příklad: elektronická pošta
• služba, spočívající v přenosu zpráv (tzv. "messaging") " – nepředpokládá se využití v reálném čase • jinak by to byl "instant messaging" messaging • zpráva se (co nejrychleji) doručí do poštovní schránky příjemce – ale pak je jen na příjemci, kdy si ji ze schránky vyzvedne
• existuje celá řada variant (koncepcí) elektronické pošty – – – – – –
uucp cc:mail MS Mail Mail602 X.400 SMTP pošta
•
SPT Telecom zprovoznil koncem roku 1995 veřejnou el. poštu CZ MAIL, na bázi X.400 – –
přenos jednotlivých zpráv byl zpoplatněn první 2 KB zprávy po Evropě stály 8,40 Kč • •
každé další 2 KB stály 4,80 Kč do ostatního světa 15,80 Kč / 8,40 Kč
• "internetová pošta", používá se v rámci dnešního Internetu 4
Zapomenuté informační služby Internetu 20.3.2008
distribuční model
• je jednou z možných variant práce s informacemi – elektronická pošta je jednu ze služeb, které vychází z distribučního modelu
(práce s informacemi) autor (zdroj)
vydavatel
• dalšími jsou například Netnews,, elektronické konference, …..
vytvoření rozeslání info
• princip: – "ten, kdo má informace", je rozešle určitému okruhu příjemců • "tak jak jsou" – bez dalších (větších) úprav • optimálně: pošle je těm, kteří o ně skutečně projevili zájem
info info info
– jinak problém spammingu
– příjemce takto dostává informace z více zdrojů, vybírá si z nich (provádí selekci), a "spotřebovává je" (využívá)
selekce uživatel (spotřebitel, konzument)
info spotřeba
5
Zapomenuté informační služby Internetu 20.3.2008
jiný model: zpřístupnění informací
• umožňuje uživateli "vyzvednout si" konkrétní informace – informace jsou někde umístěny a odsud jsou přístupné zájemcům (jsou "zpřístupněny") • zájemce musí vyvinout iniciativu a "dojít si" pro informace
• otázky: – jak se zájemce dozví, kde je co k dispozici? • jak hledá něco konkrétního?
z tohoto modelu vychází např. služby FTP, Gopher, WWW, ….
– jakým způsobem je "evidováno" a "vyjmenováno" to, co je kde k dispozici? • existují nějaké nabídky? Menu? iniciativa
6
Zapomenuté informační služby Internetu 20.3.2008
jiný model: "information push" push
• poskytovatel služby vybere a uspořádá určité informace, a ty dopraví (doslova: "protlačí", anglicky: "to push") až ke koncovým příjemcům – koncový příjemce je pasivní – iniciativa je na poskytovateli služby • on musí vybrat informace, "zabalit je" a dopravit k příjemci
• jiný pohled: – poskytovatel služby vybírá to, co považuje za vhodné pro uživatele • a k uživateli obvykle dopravuje "větší množství" obsahu, ze kterého si uživatel "něco vybere"
• otázky: – jaký obsah vybrat? V jakém rozsahu? – má to vůbec smysl? iniciativa
7
srovnání
Zapomenuté informační služby Internetu 20.3.2008
autor (zdroj) vydavatel
Distribuční model
Zpřístupňující model
vytvoření
vytvoření
rozeslání
uspořádání
info
Model „information push“ vytvoření
vytvoření
vytvoření
vyhledání uspořádání rozeslání
uskladnění info
info
info info info selekce Uživatel (spotřebitel, konzument)
"kanál"
vyhledání
info
info
info
spotřeba
spotřeba
spotřeba
8
Zapomenuté informační služby Internetu 20.3.2008
srovnání
dobře škálovatelné, lze aplikovat i na "hodně velké " objemy informací
• model "information push" se snažil řešit hlavně otázky "výběru" – hledání, selekce, …. • to řešil někdo, kdo na to mohl umět a dělat to efektivněji – být na to specializován
• ale vznikl problém: – každý uživatel může mít/má jiné zájmy a preference •
•
obtížně škálovatelné, nehodí se pro větší objemy informací
hlavní problém: jak uživatel najde "to pravé" ????
ale obsah kanálu byl pro všechny uživatele stejný připravit obsah kanálu tak, aby vyhověl všem, se ukázalo nemožné
9
Zapomenuté informační služby Internetu 20.3.2008
v jiném kontextu ….
• Evropská unie dokončuje směrnici "o " audiovizuálních mediálních službách" – jako aktualizaci původní směrnice "o " televizi bez hranic"
• v nové směrnici rozlišuje mezi: – lineárním obsahem • s pevným programovým schématem, které určuje poskytovatel služby • v praxi: běžné TV vysílání – divák nemůže ovlivnit obsah vysílaného programu
– nelineárním obsahem – alias "obsahem na žádost"
• nemá pevné programové schéma – čas i obsah určuje divák
• v praxi: Video on Demand
» kdy a co dávají
analogie "information push"
analogie zpřístupnění informací 10
Zapomenuté informační služby Internetu 20.3.2008
technické předpoklady
• lineární obsah, resp. "information push"
• nelineární obsah, resp. zpřístupnění informací
– přenos má charakter 1:N • stejný obsah je přenášen od jednoho zdroje ke všem příjemcům současně – "všichni vidí to samé"
• jde o tzv. broadcast – v angličtině: broadcasting
– klasické telekomunikační sítě jsou broadcastingu dobře uzpůsobeny • zemské vysílače, satelity – mohou přijímat všechny přijímače v dosahu
– přenos má charakter 1:1 • ke každému příjemci je přenášen individuální obsah • jde o tzv. unicast
– čím více je příjemců, tím větší je zátěž na přenosovou síť • klasické telekomunikační sítě na to nejsou stavěny • Internet vyhovuje podstatně lépe
– není zapotřebí zpětná vazba !!!! • (stačí když) distribuční sítě jsou pouze jednosměrné
11
Zapomenuté informační služby Internetu 20.3.2008
pozorování
• ve světě "masové zábavy" lineární model (klasické TV vysílání) uspěl – vysvětlení: • alternativa v podobě nelineárního modelu nebyla k dispozici – z technických důvodů : nebylo jak dopravovat různý obsah k různým příjemcům
• "masoví konzumenti" jsou pasivní, nechtějí přebírat iniciativu – nechtějí / nemohou / nedokáží využívat složitější služby
• ve světě Internetu lineární model propadl "na celé čáře" – byl zaveden ve formě tzv. push kanálů • duben 1996: spuštěna služba Pointcast Network (ukončena v roce 2000) • podpora v browserech MSIE 4.0 a Netscape Communicator
– vysvětlení: • uživatelé Internetu jsou spíše aktivní než pasivní • bylo to neefektivní, – velké objemy dat se přenášely ("tlačily", push) zcela zbytečně
• zájmy a preference uživatelů Internetu jsou různé – ale obsah kanálu musel vyhovět všem !!!!! 12
Zapomenuté informační služby Internetu 20.3.2008
Pointcast Network
• služba Pointcast (Pointcast Pointcast Network ) – fungovala jako screensaver nebo jako samostatná aplikace – původně nabízela jen "kanály" • s větší "přidanou hodnotou" v podobě výběru a uspořádání konkrétního obsahu
– později umožnila vytvářet i "spojení" (connections) ( • kde už nebyla (skoro) žádná "přidaná hodnota", • jednalo se o "klasický" obsah, běžné dostupný skrze zpřístupňující model – a pouze převedený do formy kanálu a "dotlačený" k uživateli
fakticky už šlo o odklon od původní myšlenky "information push" 13
Zapomenuté informační služby Internetu 20.3.2008
Příklad (nabídka kanálů/spojení Pointcast)
"již předplacené" kanály/spojení
nabídka dalších kanálů a spojení
aplikace Pointcast 14
Zapomenuté informační služby Internetu 20.3.2008
Příklad: obsah kanálu Pointcast
"sekce" kanálu zobrazovaný kanál
konkrétní části obsahu (články) vlastní obsah (článek)
15
Zapomenuté informační služby Internetu 20.3.2008
Příklad: Pointcast jako screensaver
16
Zapomenuté informační služby Internetu 20.3.2008
Příklad: Pointcast spojení
spojení
články
17
Zapomenuté informační služby Internetu 20.3.2008
Příklad: vytvoření spojení
• spojení v rámci služby Pointcast si mohl vytvořit každý uživatel sám již zadané jméno a URL pro články nový článek • princip: – spojení = několik článků (articles) – článek = 1 WWW stránka • která se v rámci "information push" stáhne do aplikace Pointcast – a je možné ji následně číst i bez připojení
zda obsah stahovat ("push") automaticky
18
Zapomenuté informační služby Internetu 20.3.2008
"Push" v browserech
• podpora pro model "information push" byla v roce 1997 začleněna i do browserů – Microsoft Internet Explorer verze 4.0 • podpora "kanálů" přímo v browseru • technologie od Poincastu
– Netscape Communicator • technologie od firmy Marimba • součástí je Netscape Netcaster – klient pro "information push" 19
Zapomenuté informační služby Internetu 20.3.2008
Příklad: Netscape Netcaster "kanálový volič"
20
Zapomenuté informační služby Internetu 20.3.2008
Příklad: Netcaster Channel Finder kategorie pro výběr kanálů
konkrétní kanály 21
Zapomenuté informační služby Internetu 20.3.2008
obsah kanálu
kanály
Příklad: kanály v MSIE 4.0
22
Zapomenuté informační služby Internetu 20.3.2008
další vývoj "information push"
• model "information push" ve své původní podobě (Pointcast,, kanály v MSIE a Netscape) neuspěl – kvůli neefektivnosti • přenášely se velké objemy dat, mnohdy zbytečně
– kvůli přílišné "hromadnosti" • kanály (spojení) byly málo individuální, neřešily problém vyhledávání
• přesto určité prvky původního modelu "přežily" a ujaly se
• RSS – Rich Site Summary, • Really Simple Syndication
– v zásadě pouze popis (definice) kanálu, ale vlastní obsah se stahuje až na popud uživatele • v případě jeho zájmu
• "push email" • například systém BlackBerry
– princip fungování: • emailová zpráva přijde do schránky a je ihned "dotlačena" (push) do mobilního zařízení klienta 23
model "zpřístupnění informací"
Zapomenuté informační služby Internetu 20.3.2008
• připomenutí podstaty: – informace zůstávají "tam kde jsou" (kde vznikají ???)
autor (zdroj) vydavatel
• jsou přístupné ("zpřístupněné")
vytvoření uspořádání
uskladnění info
– uživatelé si z vlastní iniciativy "stahují" ty informace, o které mají zájem
retrieve
• připomenutí otázek: – jak je prezentován (nabízen) obsah v určité lokalitě? – jak se uživatelé dozví, co je kde k dispozici? • jak hledají? • jak nacházejí? • jak si "vyzvedávají"?
vyhledání Uživatel (spotřebitel, konzument)
info spotřeba 24
Zapomenuté informační služby Internetu 20.3.2008
možné formy zpřístupnění
prostor pro prezentaci obsahu
WWW Gopher
FTP TFTP
• z modelu "zpřístupnění informací" vychází řada různých služeb – liší se zejména v míře, v jaké dávají prostor pro prezentaci nabízeného obsahu (ne nutně jen "informací") • od nulových možností až po "velmi bohaté" možnosti 25
Zapomenuté informační služby Internetu 20.3.2008
TFTP a FTP
• TFTP (Trivial File Transfer Protocol) – maximálně jednoduchý protokol pro přenos souborů • umožňuje přenášet cokoli, co lze "zabalit" do formy souboru
– neumožňuje procházet mezi adresáři • nezná pojem aktuálního adresáře …
– neumožňuje vypsat obsah adresářů souborů – uživatel musí dopředu a přesně vědět, kde se co nachází • dnes jen pro velmi speciální účely
• FTP (File Transfer Protocol) – "plnohodnotný" protokol pro přenos souborů • z/do FTP archivů
– umožňuje přecházet mezi adresáři – umožňuje vypisovat obsah adresáře nepoužívá žádné předem připravené nabídky obsahu (menu)
ale umožňuje jiným službám (vyhledávacím službám), aby si zjistily nabízený obsah 26
Zapomenuté informační služby Internetu 20.3.2008
příklad: služba ARCHIE
• specializovaná vyhledávací služba – pro vyhledávání souborů v FTP archivech • dnes již nepoužívaná
• princip fungování: – pravidelně "obchází" jednotlivé FTP archivy • prochází všechny jejich adresáře, vypisuje si jejich obsah a pamatuje si ho ve svých databázích
– odpovídá na dotazy typu: • "kde najdu soubor XY?"
na ftp.vse.cz
Archie server
zjišťování obsahu kde najdu soubor XY? 27
příklad: klient služby Archie
Zapomenuté informační služby Internetu 20.3.2008
hledaný řetězec (má se vyskytovat je jméně souboru)
kterému Archie serveru bude dotaz položen
omezení prohledávaných FTP archivů jen na určité domény FTP archivy, kde byl soubor nalezen … v adresáři … … jméno souboru .. … o souboru .. 28
Zapomenuté informační služby Internetu 20.3.2008
videoukázka služba Archie videoukázka:
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/archie.php3 galerie.earchiv.cz/videos/archie.php3
29
Zapomenuté informační služby Internetu 20.3.2008
příklad: služba Gopher • Gopher byl vyvinut na University of Minnesota, v USA, v roce 1991 – je to služba pro zpřístupnění informací
• uživateli poskytuje nabídku ve formě menu – jednotlivé položky menu jsou uspořádány lineárně – položky jsou textové (i celé menu) – položka může představovat: • soubor (text, obrázek, .....) • odkaz na jiné menu • přechod (bránu) do jiné služby či aplikace
• gopher = – zool.: pytlonoš kanadský – americký sysel – Minnesoťan (přezdívka)
• nebo je to odvozeno od anglického "to GO FOR information"?
30
Zapomenuté informační služby Internetu 20.3.2008
služba Gopher a Gopherspace
• celá soustava menu služby Gopher byla uspořádána hierarchicky (do stromu) – kořenem bylo hlavní menu Gopher serveru na University of Minnesota
• existovaly "národní podstromy" – a "národní vstupní uzly" služby Gopher • v ČR uzel gopher.cesnet.cz výsledný celek (soustava vzájemně provázaných menu) tvořil tzv. Gopherspace 31
Zapomenuté informační služby Internetu 20.3.2008
služba Gopher a Gopherspace
• vnitřní uzly – jsou vždy odkazem na další menu
• koncové uzly (listy) – jsou odkazem na konkrétní objekt • text • obrázek, video • rozhraní k jiné službě
32
Zapomenuté informační služby Internetu 20.3.2008
Gopher
• dnes již v Internetu funguje jen velmi málo serverů Gopher – např. gopher://gopher.quux.org/
vnitřní uzly (menu) list (obsah)
33
Zapomenuté informační služby Internetu 20.3.2008
Gopher - videoukázka
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/gopher2.php3 galerie.earchiv.cz/videos/gopher2.php3
34
Zapomenuté informační služby Internetu 20.3.2008
Gopher - videoukázka
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/gopher3.php3 galerie.earchiv.cz/videos/gopher3.php3
35
Zapomenuté informační služby Internetu 20.3.2008
osud služby Gopher
• Gopher byl: – relativně jednoduchý • a snadno implementovatelný
– nenáročný na zdroje • výpočetní a přenosovou kapacitu
– pro akademické využití zdarma • ale pro komerční využití (v určitém období) placený
• Gopher vytvářel: – celosvětovou pavučinu • Gopherských menu
• Gopher nebyl: – hypertextový • nevyužíval hypertext – pokud za hypertext nepovažujeme jeho menu
– dostatečně "sexy" • byl poměrně strohý • nedokázal "zabalit" nabízené informace do dostatečně atraktivního obalu – jeho nabídky byly pouze textové + ikona Gopher striktně odděloval nabídku (soustavu menu) od obsahu (listů) 36
Zapomenuté informační služby Internetu 20.3.2008
Gopher vs. WWW
• World Wide Web
• Gopher
– vzniká v letech 1990-2 • nastupuje později než Gopher
– ale (oproti Gopheru): • využívá hypertext • neodděluje nabídku od obsahu – obsah může být nabídkou (hypertext)
– byl dostupný od roku 1991 • v reálné praxi byl využit dříve
– ale postupně prohrával s WWW • až prohrál úplně – a prakticky zanikl
• může být podstatně více grafický – využívá obrázky, animace, …….
Gopher
WWW
2.3. 1994
22
0
1.4.1994
25
5
1.6.1994
27
8
4.10.1994
30
11
2.1.1995
34
22
• je náročnější
2.5.1995
44
42
– má vyšší nároky na přenosovou a výpočetní kapacitu • přišel ve správný čas – když se Internet otevíral komerčnímu využití
1.6.1995
45
45
1.10.1995
48
67
5.1.1998
47
>200
• je více sexy – dokáže "být hezčí"
• je intuitivnější – funguje na principu "ukaž prstem na to, co chceš"
počet serverů v ČR
zdroj: Seznam zdrojů CESNETu / v ČR
37
Zapomenuté informační služby Internetu 20.3.2008
další trend: "platformizace platformizace" služeb
• původně:
• později:
– vznikal velký počet specializovaných služeb • pro každý "účel" samostatná služba
– například: • služba Archie – pro vyhledávání souborů v FTP archivech
• služba WAIS – pro plnotextové vyhledávání v databázích dokumentů
– snaha eliminovat příliš široký repertoár služeb
• jak? – ztrátou jejich samostatnosti … • přestěhováním původně samostatných služeb na jinou platformu – hlavně WWW
• původně:
• služba Veronica
spec. klient
specializovaný server
– pro vyhledávání v rámci Gopheru
• ……..
• problém: – s udržováním a správou velkého počtu specializovaných klientských aplikací – uživatelé se museli učit s nimi pracovat
Archie, WAIS, …
• dnes:
specializovaný server WWW browser
HTTP
WWW server
38
Zapomenuté informační služby Internetu 20.3.2008
příklad: služba WAIS
• Wide Area Information Servers
3. 2.
– od firmy Thinking Machines
1.
• z roku 1991
– sloužila k fulltextovému vyhledávání v rámci individuálních databází dokumentů • nikoli "všude"
• postup dotazu: – nejprve se vybere databáze
dotaz databáze
• v rámci které se bude vyhledávat
– pak se položí samotný dotaz • odpovědí je odkaz na vyhovující dokumenty
nalezené dokumenty
39
Zapomenuté informační služby Internetu 20.3.2008
WAIS - videoukázka
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/wais1.php3 galerie.earchiv.cz/videos/wais1.php3
40
Zapomenuté informační služby Internetu 20.3.2008
•
WWW a el. pošta jako platformy
původně samostatné služby (Archie, WAIS, …) vyžadovaly, aby uživatelé:
•
– používali specifické klientské aplikace
– takové, které původně byly samostatné – elektronická pošta:
• museli si je instalovat, konfigurovat atd.
– používali specifický styl práce • učili se znát ovládání aplikací, příkazy atd.
•
• zprostředkovává též: diskuse (News, NetNews, Usenet), elektronické konference, nástěnky (bulletinboard) apod.
celkový trend vedl k: – minimalizaci klientů
– WWW:
• kvůli správě klientského SW • kvůli nárokům na uživatele • …..
•
• nejrůznější formy vyhledávání – obecné i specializované
• transakce
důsledek: – původně široký repertoár služeb a aplikací v Internetu se postupně zužoval – až zůstaly dvě "hlavní služby" a jejich aplikace (klienti): • WWW (browser) a el. pošta (poštovní klient)
elektronická pošta a WWW se staly platformami, na kterých jsou "stavěny" další aplikace
– objednávání, nakupování, prodej, …
• hry, e-learning, ….. • vzdálené přihlašování ….
•
přesto stále vznikají nové služby a samostatní klienti – např. pro instant messaging apod.
41
Zapomenuté informační služby Internetu 20.3.2008
děkuji za pozornost Jiří Peterka tuto přednášku najdete také na http://www.earchiv.cz ://www.earchiv.cz (sekce přednášky) videoukázky a další archivní materiály najdete na http://galerie.earchiv.cz
42
Zapomenuté informační služby Internetu 20.3.2008
záloha: WWW v roce 1994
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/www1994.php3 galerie.earchiv.cz/videos/www1994.php3
43
Zapomenuté informační služby Internetu 20.3.2008
záloha: Gopher v roce 1994
videoukázku lze shlédnout též na http://galerie.earchiv.cz/videos/gopher1.php3 galerie.earchiv.cz/videos/gopher1.php3
44