Manuel Memoweb3/092000/def
F
11/10/2000 12:25
Page 1
Tables des matières............................
2
Présentation ................................................... La capture........................................................ Paramètrer les préférences générales ..... Contacts ........................................................... Glossaire .......................................................... Licence d’utilisation ......................................
4 8 20 25 26 28
NL Inhoudsopgave.......................................
29
Even voorstellen ............................................ Binnenhalen ................................................... De algemene voorkeuren instellen.......... Contact ............................................................. Woordenlijst ................................................... Licentie van de eindgebruiker ..................
31 35 48 53 54 56
Manuel Memoweb3/092000/def
11/10/2000 12:25
Page 2
Table des matières
2
Présentation .............................................................................................................
4
A quoi sert MemoWeb ?........................................................................................... A qui sert MemoWeb ? ............................................................................................. Comment ça marche ? ............................................................................................... Ce qu’il faut à MemoWeb pour fonctionner ...................................................... Installation ................................................................................................................... Les points forts de MemoWeb 3 ............................................................................ L’interface .....................................................................................................................
4 5 5 6 6 6 7
La capture ...................................................................................................................
8
Capture rapide ............................................................................................................ La préparer ............................................................................................................. Le déroulement de la capture.................................................................... Le résultat ................................................................................................. Capture avancée ......................................................................................................... Limiter la recherche des pages HTML du site ............................................. Les niveaux d’exploration : comment explorer les Webs ?.......................... Les types de document à rapatrier ............................................................ L’analyse des pages HTML et des scripts ................................................... Les autres options .................................................................................... Affiner la capture ....................................................................................................... Les pages HTML ........................................................................................ Les formulaires.......................................................................................... Les images mappées ................................................................................ Les liens inactifs ....................................................................................... Mettre à jour la capture ........................................................................................... Démarrer une capture en différé........................................................................... Qu’est-ce qu’une tâche ? ......................................................................... Création d’une nouvelle tâche .................................................................. Ajout de capture à la tâche ...................................................................... Le lancement de la connexion du modem ................................................. Les autres fonctions du menu Tâche ......................................................... L’exploitation du contenu d’une capture ........................................................... L’outil «recherche» ...................................................................................................
8 8 10 10 10 10 11 12 13 14 14 14 15 15 16 16 16 17 17 17 18 18 18 19
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 3
Paramétrer les préférences générales ......................................
20
Général .......................................................................................................................... Connexions simultanées ........................................................................... Limitations ................................................................................................ Paramètres HTTP et FTP............................................................................. Connexion Internet ................................................................................................... Navigateur Web ......................................................................................................... Logiciels de navigation .............................................................................. Raccourcis et signets ................................................................................. Serveur Proxy ............................................................................................................... Exclusion ...................................................................................................................... Fichiers d’exclusion pour les aspirateurs (Robots.txt) .................................. Liste d’exclusion ........................................................................................ Génération de l’index .............................................................................................. Génération des pages HTML .................................................................... Index des images ...................................................................................... Mise en page des rapports ........................................................................ Options .......................................................................................................................... Structure du Web ..................................................................................... Préférences ............................................................................................... Fenêtre d’aperçu ......................................................................................
20 20 20 20 21 21 21 22 22 23 23 23 23 23 23 23 24 24 24 24
Contacts .......................................................................................................................
25
Glossaire
26
.....................................................................................................................
Licence d’utilisation
......................................................................................
28
3
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 4
Présentation A quoi sert MemoWeb ? MemoWeb est un logiciel qui permet de recréer en local sur votre PC tout site Web disponible sur Internet. MemoWeb se connecte à votre place, navigue automatiquement dans le Web cible et stocke sur votre disque tout ce qu'il rencontre : pages d'information, images, sons, vidéos,... MemoWeb peut récupérer un ou plusieurs sites Web lorsque vous dormez. Il récupère à moindres frais pendant les heures creuses les sites qui vous intéressent : gain de temps et d'argent. Lorsqu'il a terminé son travail, vous pouvez tranquillement consulter le Web capturé hors connexion exactement dans les mêmes conditions que si vous étiez connecté, avec les meilleurs temps de réponse que vous puissiez espérer. MemoWeb est un outil complémentaire de votre logiciel de navigation qui décuple le confort d'utilisation du World Wide Web. MemoWeb pallie à la déficience des logiciels de navigation existants : Qui n'a jamais tenté péniblement de reconstituer en local une page Web avec ses images ? MemoWeb le fait en un clin d'oeil pour une page, mais aussi pour tout un Web et même pour tout Internet si votre PC était équipé de la mémoire nécessaire ! MemoWeb est un agent intelligent explorateur qui surfe à votre place sur Internet, en fonction de critères que vous lui avez fixés. Cet agent possède de nombreuses qualités : Rapide : MemoWeb lit beaucoup plus vite que vous les pages qu'il rencontre pour déterminer les actions à effectuer. Il est également multitâche : C'est comme si vous ouvriez simultanément plusieurs fenêtres du navigateur sur le même Web, sans jamais afficher la même page dans deux fenêtres ! Opiniâtre : Comme un bon explorateur, MemoWeb ne s'arrête pas en cours de route tant qu'il n'a pas été au bout de son voyage. Là où vous pourriez perdre patience devant les temps de réponse du réseau, MemoWeb s'entête. Sélectif : MemoWeb ne perd pas de temps à consulter des informations inutiles. Il sait ce que vous voulez et va à l'essentiel. Méthodique : Rien ne peut lui échapper. Là ou vous pourriez passer à coté d'un lien intéressant, lui ne peux pas le rater. Réciproquement, il ne repassera jamais deux fois par la même page. Lors d'une connexion, combien de fois réaffichez vous la page sommaire d'un site ? Ordonné : Lorsqu'il a terminé sa mission d 'exploration et de capture, MemoWeb génère des pages d'index supplémentaires qui vous permettront de consulter le site Web encore plus simplement.
4
MemoWeb 3 - Présentation
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 5
A qui sert MemoWeb ? A tout le monde ! Parce qu'il est toujours plus agréable de consulter un site hors connexion, sans patienter à chaque page. Parce que MemoWeb vous permet de consulter le web n'importe où et n'importe quand. Parce que MemoWeb optimise les temps de connexion, surtout si vous n'avez pas une liaison permanente à Internet. Parce que MemoWeb ne passe jamais à coté de l'information importante. Aux entreprises équipées d'un réseau local Une seule capture effectuée par MemoWeb permet à l'ensemble des postes du réseau de consulter un site Web. Ainsi, un utilisateur peut facilement mettre ses trouvailles sur le World Wide Web à disposition des autres . Aux enseignants Grâce à MemoWeb, ils peuvent faire découvrir les possibilités d'Internet à leurs élèves malgré le faible taux d'équipement des salles de cours en connexion Internet. Aux concepteurs de services Web MemoWeb leur permet d'effectuer off-line et dans les meilleures conditions la présentation de leurs réalisations à leurs clients et prospects. Les aléas des connexions Internet sont ainsi supprimés pendant les démonstrations. Aux responsables de services Web MemoWeb leur permet de détecter très rapidement les liens erronés ou les fichiers manquants sur un site Web. Une simple capture permet d'avoir immédiatement un compte rendu exhaustif de l'état d'un Web. Aux collectionneurs d'images et de sons Pour tous ceux qui veulent se constituer une collection d'images ou d'objets multimédia à partir d'Internet, car MemoWeb est spécialement étudié pour rechercher, capturer, organiser et présenter les images disponibles sur Internet. Aux conférenciers Ils peuvent s'appuyer sur le HTML et sur les sites Web pour agrémenter leur présentations. Aux éditeurs multimédia MemoWeb peut être utilisé pour transformer simplement un site Internet en CD-ROM multimédia, en gardant éventuellement une partie de l'application on-line.
Comment ça marche ? Pour créer un web local, vous donnez à MemoWeb des points d'entrée dans ce web, sous la forme de l'adresse Internet d'une page HTML (en général, ce sera la page d'accueil du web à capturer). MemoWeb se connecte au web comme vous le feriez avec votre navigateur, envoie la requête correspondante et rapatrie cette page HTML. Dès la réception complète de celle-ci, il analyse le contenu de la page (source HTML) pour déterminer deux types d'éléments : • Les images ou objets multimédia inclus dans la page. Chacun de ces objets est référencé dans la page par son adresse Internet. • Les liens vers d'autres pages HTML, associés à des zones cliquables à l'écran. Ces liens sont analysés en fonction de critères fournis pour déterminer s'il faut les explorer ou non. L'ensemble de ces éléments donne lieu alors à de nouvelles requêtes que MemoWeb envoie au serveur Web. Chaque nouvelle page HTML reçue est traitée selon le même processus. Les autres fichiers (images, sons...) sont simplement stockés sur le disque. La capture du web s'arrête quand il n'y a plus de pages à explorer. A la fin de la capture, MemoWeb exécute un traitement appelé résolution des liens qui consiste à recharger chacune des pages HTML capturées et à remplacer dans le source les adresses Internet des liens ou des images par les noms des fichiers équivalents capturés. MemoWeb 3 - Présentation 5
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 6
MemoWeb reconstitue ainsi sur votre disque dur un web complètement autonome dans lequel chaque page HTML pointe vers d'autres pages locales. La dernière phase consiste à créer des pages HTML supplémentaires contenant les index sur les différentes pages et images de la capture. Ces index permettront une navigation plus facile dans le web local.
Les interactions avec le navigateur MemoWeb est entièrement autonome : il n'a pas besoin du navigateur pour capturer des pages, vous pouvez continuer de surfer sur votre navigateur Web tout en effectuant une capture par MemoWeb. MemoWeb est en fait l'outil complémentaire de votre navigateur Internet. Sa relation avec le navigateur concerne les points suivants : • la consultation d'un web capturé : cette consultation peut se lancer à partir de MemoWeb (bouton Résultats) ou directement à partir du navigateur en chargeant le fichier _accueil.htm dans le répertoire de capture du Web • le choix de l'adresse du web à capturer : à tout moment, il est possible de demander à MemoWeb de réaliser la capture d'un web que vous êtes en train de consulter avec votre navigateur. En effet, lors de la création d'un nouveau web, MemoWeb propose par défaut l'adresse courante du navigateur • la création de raccourcis Internet : chaque web local capturé peut être répertorié comme un raccourci dans votre navigateur. Cette fonction permet de vous constituer une liste à jour de tous les webs locaux et de les consulter plus facilement. • L'interface entre MemoWeb et le navigateur est réalisée par l'utilisation des fonctions d'échange dynamique de données (DDE - Dynamic Data Exchange). L'identification du navigateur et sa localisation sur votre disque sont réalisées automatiquement par défaut. Vous pouvez cependant débrayer ce mécanisme pour utiliser plusieurs navigateurs (voir Configuration du navigateur).
Ce qu’il faut à MemoWeb pour fonctionner • Compatible PC avec WindowsÒ 95, 98 ou NT4 • Modem, navigateur et connexion Internet • 32 Mo de RAM • 4 Mo disponibles sur le disque dur (+ espace pour les sites capturés) • Lecteur CD-Rom et souris
Installation Insérez le CD-Rom dans le lecteur et attendez le lancement automatique de l’ installation, puis suivez les instructions qui apparaissent sur votre écran.
Les points forts de MemoWeb 3 Le Web a trouvé son photocopieur ! Une copie conforme de n'importe quel site sur votre disque dur. Fidèle : Quelques clics de souris et tous les textes, images, et sons souhaités sont capturés, mais pas seulement : vous retrouvez aussi le fruit des dernières technologies d'animation utilisées sur le Web, telles que Shockwave Flash, Javascript, VRML ou Java, ainsi que les images mappées et les adresses e-mail. Le traitement des formulaires est automatique et assisté. Précis : Vous paramétrez avec exactitude l'étendue de votre capture, le type de fichiers à rapatrier ou la taille occupée sur le disque. Des configurations-type de capture automatisent les filtrages souhaités.
6 MemoWeb 3 - Présentation
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 7
Rapide : Vous bénéficiez d'une utilisation optimisée de la bande passante pour lancer des captures sur plusieurs serveurs de front (jusqu'à 64 téléchargements simultanés). Confortable : Grâce à une nouvelle interface, vous pouvez intervenir en temps réel sur le déroulement de la capture ou, au contraire, planifier un rapatriement en différé. Et comme un site n'est jamais figé, MemoWeb actualise vos fichiers capturés.
L’interface 1 2 3
7
6
4 5 1 • la barre des menus regroupe la plupart des options de capture, également accessibles par les boutons des dossiers Web et Outils. Par exemple, Fichier | Nouveau… » vous permet de commencer une nouvelle capture. 2 • la barre des boutons standards offre des raccourcis vers les principales commandes. Pour lancer l’aspiration du site, appuyez sur Capturer. Pour surfer off-line après aspiration, appuyez sur le bouton Résultats. 3 • le dossier Web regroupe le contenu de l’aspiration (pages HTML, images, formulaires…) et les paramètres de capture accessibles par le bouton Propriétés. 4 • le dossier Outils regroupe les fonctions de recherche et gestion des captures en différé. 5 • la barre d’état regroupe les informations relatives au web capturé. 6 • l’arbre des liens reflète la structure du site aspiré. 7 • la fenêtre d’aperçu vous permet de visualiser instantanément le document sélectionné dans l’arbre des liens.
MemoWeb 3 - Présentation 7
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 8
La capture Capture rapide Avant tout lancement de capture d'un site Web, vous devez décrire le plus parfaitement possible les caractéristiques de la tâche que vous confiez à MemoWeb. Cette description repose sur 4 critères principaux : • D'où commencer ? • Où stocker sur votre disque ? • Comment et quoi capturer ? • Quand capturer ? Vous allez voir que ces différents points vont être réglés étape par étape dans la préparation de la capture. Pour l'instant, appuyez sur le bouton Nouveau ou sélectionnez la commande menu Fichier | Nouveau... MemoWeb va maintenant vous guider dans les différents phases de la préparation de votre capture.
La préparer D'où commencer ? C'est l'URL de départ de votre capture. Pour lancer une capture, il faut indiquer à MemoWeb un point d'entrée sur la toile du World Wide Web. Ce point d'entrée est généralement la page d'accueil d'un web, mais peut être également une page située plus profondément dans l'arborescence d'un serveur. L'adresse de base de la capture est une URL (Uniform Ressource Locator) constituée d'un nom de serveur, d'un répertoire et d'un nom de fichier HTML. Exemples : http://www.goto.fr/ http://www.goto.fr/index.htm Si vous le désirez, indiquez le titre de votre capture puis passez à l'étape suivante.
Où stocker sur votre disque ? MemoWeb enregistre les documents rapatriés dans un répertoire : c'est le web local. Ce répertoire contient : • les fichiers capturés • le fichier structure du web : MemoWeb stocke également toute la structure arborescente du web capturé. C'est cette structure qui lui permet entre autres de ne pas demander plusieurs fois le même fichier et de reprendre une capture après interruption. Ce fichier est toujours présent dans un répertoire de capture, sous le nom local.web • les pages de compte rendu (répertoire INDEX) et la page d'index général _accueil.htm. Sélectionnez ce répertoire de destination à l'aide du bouton Parcourir... et passez à l'étape suivante.
8
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 9
Il existe deux façons d'organiser un Web sur le disque : • à plat : Tous les fichiers d'un web sont stockés dans le même répertoire, ce qui simplifie la copie d'un web vers un autre support (disque partagé en réseau, disquette, cdrom,...). Dans ce cas MemoWeb renomme les fichiers en cas de doublons afin d'éviter les collisions • en arbre : MemoWeb recrée localement les répertoires et sous-répertoires qu'il rencontre sur les serveurs au fur et à mesure de son exploration, en y rajoutant un répertoire issu du nom de domaine (Exemple : www.goto.fr/). Pour choisir ce dernier mode, cochez la case Conserver l'arborescence du site lorsque vous lancez une capture. Par défaut MemoWeb donne des noms étendus (format Windows 95) aux fichiers récupérés sauf si l'option Utiliser des noms courts est cochée (lorsque vous lancez une capture), auquel cas chaque fichier capturé a un nom de 8 caractères (format Windows 3.1), inspiré du nom original utilisé pour adresser ce fichier sur Internet. La structure complète du web capturé est enregistrée dans un fichier également dans le répertoire de stockage, dont le nom est local.web. C'est ce fichier qu'il faut sélectionner dans la fonction Ouvrir pour recharger un web capturé précédemment.
Comment et quoi capturer ? Vous allez maintenant indiquer ce que vous voulez capturer et comment le faire. • Le Comment correspond aux limites d'exploration que vous allez imposer à MemoWeb. • Le Quoi correspond aux types de documents que vous voulez capturer. Pour vous faciliter la tâche, MemoWeb vous propose maintenant des configurations préparées d'avance qui regroupent à la fois le Quoi (images, sons, pages HTML) et le Comment (répertoires, tout le site ou uniquement la première page). Par exemple, en choisissant la configuration Toutes les images du site, MemoWeb ne va récupérer que les images du site indiqué par l'URL de départ. Ces configurations-type sont en réalité des exemples que vous pouvez personnaliser à votre guise. Pour créer votre propre configuration, modifiez les configurations de la capture, grâce à le bouton Propriété par exemple. Puis, dans le menu Web, sélectionnez Liste des configurations-type et cliquez sur Enregistrer la configuration actuelle… Pour démarrer la capture, cliquez maintenant sur OK et assurez-vous que la case Démarrer la capture immédiatement (en bas à gauche) est cochée. Si celle-ci est décochée, vous pouvez par la suite lancer la capture en cliquant sur le bouton Capturer.MemoWeb vous propose alors de plusieurs options. Choisissez Capturer complètement (avec réinitialisation du web) pour commencer une capture depuis l’URL de départ. Astuce : par défaut, MemoWeb propose toujours l’option la plus adaptée au type de capture désiré. MemoWeb 3 - La capture
9
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 10
Le déroulement de la capture C'est la phase la moins fatigante pour vous ! Allez donc prendre un café ou laissez le en tâche de fond et faites autre chose sur votre PC. MemoWeb s'arrêtera tout seul lorsque tous les liens auront été explorés, lorsque tous les documents sont récupérés ou lorsqu'une des limites imposées à la capture aura été atteinte. Lorsque la capture est terminée, MemoWeb effectue la phase dite de Résolution des liens. Pendant cette phase, il remplace les liens réels par des liens pointant sur les fichiers récupérés ou sur une page d'erreur si l'option Redirection vers une page locale des liens filtrés ou encore à capturer a été cochée. Pendant cette phase, il génère l’index HTML de votre capture.
Le résultat Appuyez sur le bouton Résultats pour charger l’index dans votre navigateur. Il s’agit d’un compte-rendu précis des éléments capturés qui range les documents par type (Pages HTML, Images, Fichiers) et par état du document (Erreur). Vous pouvez aussi charger dans votre navigateur directement la page sommaire _Accueil.htm. Deux autres options sont disponibles : • Charger la page d’accueil du Web pour consulter hors-ligne les pages que vous venez de capturer. • Charger le bookmarks (voir Configuration) Astuce : pour charger directement la page d’accueil du site aspiré, sélectionnez l’option «Charger la page d’accueil du site aspiré sur appui du bouton Résultats» dans le menu Préférences | Configuration… | Options. Si vous désirez approfondir le paramétrage de votre capture, passez maintenant à la Capture avancée.
Capture avancée Au chapitre précédent, nous avons vu qu'il était aisé de préparer une capture grâce aux configurations-type. Si aucune de celles-ci ne répond à vos besoin, vous pouvez en construire une nouvelle, en définissant les limites d'exploration (recherche des pages HTML du site) et les limites de récupération des documents.
Limiter la recherche des pages HTML du site Qu'est-ce que l'exploration ? Partons de l'adresse que vous avez donnée comme URL de départ de votre capture. MemoWeb récupère d'abord la page issue de cette URL de départ et analyse son contenu afin de repérer les éventuelles URL ( appelé aussi sous la dénomination Lien) qui sont inscrites dans cette page. Pour savoir si ces liens doivent être à leur tour exploré, MemoWeb applique différents filtres qui vont autoriser ou interdire l'exploration de ces liens. MemoWeb vous permet de filtrer les liens à explorer selon plusieurs critères : • les niveaux d'explorations des liens • les types de document à rapatrier • l’analyse des pages HTML et des scripts • le type, la quantité et la taille des fichiers.
10
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 11
Les niveaux d’exploration : comment explorer les Webs ? Différence lien interne / externe. L'adresse WWW initiale est le point de départ de l'exploration. Elle a un niveau de profondeur d'exploration interne de 0. Un lien est dit interne lorsqu'il appartient au même site web que l'adresse initiale, c'est à dire lorsque son URL appartient au même domaine que l'adresse de base (voir la définition d'une URL).
La profondeur de navigation en nombre de niveaux d'exploration des liens internes Chaque fois qu'un lien interne est exploré, le niveau d'exploration interne est incrémenté. Les pages pointées par la page initiale auront donc un niveau 1. Les pages pointées par celle de niveau 1 auront un niveau 2, etc. Vous pouvez limiter l'exploration en fixant le nombre de niveaux internes dans le dossier Exploration. Un niveau 0 correspond à la capture d'une seule page. Par défaut le niveau est fixé à 255, ce qui dépasse les limites de profondeur d'un site moyen.
La profondeur de navigation en nombre de niveaux d'exploration des webs externes Sur le même principe que les liens internes, les liens externes permettent de limiter ou au contraire d'élargir la capture à plusieurs sites Internet. Un lien est dit externe lorsqu'il appartient à un site différent de celui contenant l'adresse initiale de capture, c'est à dire lorsque son URL n'appartient pas au même domaine que l'adresse de base. Chaque fois qu'un lien externe est exploré, le niveau d'exploration externe est incrémenté. Les sites pointés par le site de départ auront donc un niveau 1. Les sites pointés par ceux de niveau 1 auront un niveau 2, etc... Le niveau d'exploration externe ne concerne que les pages HTML et pas les autres types de fichiers. Si une page HTML contient une image située sur un autre web, elle sera capturée même si le niveau d'exploration externe est à 0. Ce paramètre est réglable dans le via le bouton Propriété, onglet Exploration. Par défaut, le niveau d'exploration externe est fixé à 0, ce qui correspond à ne capturer que le web contenant l'adresse initiale.
MemoWeb 3 - La capture
11
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 12
Par exemple : MemoWeb récupère la page issue de l'URL de départ http://www.goto.fr/index.html. Il trouve entre autres dans cette page les liens suivants : http://www.goto.fr/revendeurs/default.htm http://www.goto.fr/mots.htm http://www.webearly.com/index.html http://minitel.goto.fr/index.html Les deux premiers liens font référence au même domaine goto, ils ont donc le même d'exploration des webs externes que celui de la page source à savoir l'URL de départ, donc 0. Le troisième lien fait référence à un domaine différent de celui indiqué dans la page source, il est prend donc le niveau 1. Le dernier lien est un cas particulier : il a le même nom de domaine (goto) mais un autre nom d'ordinateur : minitel. Si l'option Explorer toutes les machines du site est cochée, alors MemoWeb considère que ce lien à un niveau d'exploration identique à l'URL de base (0), sinon il a un niveau augmenté de 1.
Les types de document à rapatrier Lorsque le web distant envoie un fichier, il le précède d'un en-tête contenant le type du fichier sous une forme conventionnelle, appelée type MIME. Le type MIME permet de connaître le type d'information contenue dans le fichier (il n'est pas possible de se baser sur l'extension du fichier contenue dans la requête, car celleci peut varier d'un système à un autre). Par exemple, les pages HTML sont de type text/html et les fichiers image au format gif sont de type image/gif. MemoWeb vous permet de définir quels types de fichiers vous voulez capturer. Une dizaine de types standards sont fournis par défaut et vous pouvez pour chacun indiquer si vous voulez ou non la capture de ce type de fichier. Une extension de nom de fichier est associée à chaque type de manière à permettre à MemoWeb de déterminer le nom à affecter à chaque fichier capturé en fonction de son type. Les fichiers sont regroupés par catégorie : HTML, texte, images, sons, vidéo, scripts etc… mais vous pouvez aussi créer vos propres catégories. Pour ce faire, faites un clic droit ou un double-clic sur une catégorie de fichiers. De cette façon, vous pouvez également spécifier la taille maximum ou minimum du fichier à aspirer. La case Capturer les nouveaux types rencontrés est activée par défaut. Cela signifie que si MemoWeb rencontre un type de fichier qu'il ne connaît pas, il stockera et ajoutera ce nouveau type dans la table des types. Cette table reste accessible après la capture dans le dossier Web | bouton Propriétés | onglet Fichiers. Astuce : Limiter la taille des documents. Lorsque l'on récupère un site, il est impossible de savoir à l'avance, l'espace disque qui sera utilisé par la capture. Il est donc judicieux de limiter la taille des documents ou de limiter le nombre de fichiers à capturer (voir la partie « Autres options » de ce chapitre).
12
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 13
L’analyse des pages HTML et des scripts Cette étape se compose de 3 parties : • la résolution des liens • l’analyse avancée des documents webs (Java, Shockwave Flash et VRML) • l’analyse du code Javascript
La résolution des liens Vous pouvez choisir de rajouter un lien sur l’URL réelle de fin de page. Ou de rediriger vers une page locale les liens filtrés ou encore à capturer. Lorsque MemoWeb rencontre une page non capturée, il remplace le lien par une page en expliquant la raison, qui peut être : • _badlink.htm : le lien n’a pas été capturé car la capture a été interrompue • _erreur.htm : tous types d’erreur fréquents sur Internet (page non trouvée, accès refusé…) • _filterXX.htm : le lien a été filtré par les niveaux d’exploration. Enfin de générer automatiquement les vignettes des pages capturées.
L’analyse avancée Indiquez ici si vous souhaitez que Memoweb détecte les fichiers nécessaires et les liens existants dans les documents de type Java, Shockwave Flash ou VRML. Attention ! Le bon fonctionnement en local de ces documents ne peut être garanti car cela dépend fortement de la structure interne de ceux-ci. Java :
MemoWeb 3 va non seulement récupérer l'applet JAVA (fichier ayant comme extension .CLASS) mais aussi tous les autres fichiers .CLASS nécessaires au bon fonctionnement de cet applet. Pour cela, il suffit de cocher la case applets JAVA.
VRML : Les scènes 3D sont des fichiers texte éditables de type VRML (Virtual Reality Modelling Language) ayant comme extension .WRL. MemoWeb analyse de la même façon que les pages HTML, le contenu de ces scènes afin d'en extraire les liens sur les images, textures et autres scènes liées dans ce document. Il remplace ensuite dans ce document les URL réelles par leur équivalent dans le Web local : c'est la phase de résolution des liens. Il suffit de cocher la case VRML 1.0 & 2.0. Shockwave Flash : MemoWeb va récupérer le fichier .swf de l’animation Flash mais aussi tous les autres fichiers .swf nécessaires au bon fonctionnement de l’animation. Il suffit de cocher la case Macromedia Shockwave Flash.
L’analyse du langage Javascript Certaines pages HTML utilisent le langage Javascript pour créer des actions élaborées: changement d’une image au survol avec la souris (ou actions impliquant onmouseover, onmouseout, onload…), ou encore les formulaires de saisie à titre d’exemple. On distingue 3 formes de Javascript : • le Javascript se lançant automatiquement au chargement d’une page HTML (par exemple, détection du navigateur utilisé pour afficher des pages au contenu différent). • Les actions liées aux événements comme le survol de la souris, le clic sur un lien ou le chargement d’une page. MemoWeb remplace les liens contenus dans les documents à analyser par le nom du fichier local. En d’autres termes, il convertit les fichiers dont l’adresse est http://… en fichier à adresse locale. • Les formulaires simples : MemoWeb est capable de traiter les formulaires simples, c’est à dire ne nécessitant pas une saisie de la part de l’utilisateur (listes déroulante, cases à cocher, boutons radio…). Les autres types de formulaires peuvent être traités après une capture préliminaire (voir Affiner la capture – les formulaires). Dans tous les cas, MemoWeb adapte le code Javascript pour l’exécution hors-ligne. Remarque : les différentes versions de Javascript n’étant pas compatibles avec tous les navigateurs, un menu déroulant vous offre la possibilité de spécifier le navigateur souhaité (Netscape ou Internet Explorer). MemoWeb 3 - La capture
13
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 14
Les autres options Vous pouvez paramètrer ici les options et les limitations de captures désirées.
Les options de capture Spécifiez ici si vous souhaitez : • capturer les images utilisées comme fond de page • capturer uniquement les liens pointant vers d’autres pages • télécharger les documents FTP • fixer la durée maximum de capture • ne pas explorer les pages contenant des frames
Limitations Pour spécifier : • Le nombre maximum de fichiers à capturer • L’occupation maximum sur le disque dur • La taille minimum des fichiers à capturer • La taille maximum des fichiers à capturer Nous avons passé en revue tous les paramètres de la configuration avancée de capture. Pour démarrer la capture, cliquez maintenant sur OK et assurez-vous que la case Démarrer la capture immédiatement (en bas à gauche) est cochée. Si celle-ci est décochée, vous pouvez par la suite lancer la capture en cliquant sur le bouton Capturer. MemoWeb vous propose alors de : • Capturer complètement (avec réinitialisation du web) • Terminer la capture • Mettre à jour la capture • Réessayer les URL erronées et terminer la capture A cela s’ajoutent les possibilités de déconnecter le modem en fin de capture et de capturer plus tard.
Affiner la capture Après une capture préliminaire, chaque type de document rencontré par MemoWeb peut-être capturé au coup par coup grâce au système d’arborescence des liens, assez similaire à « l’explorateur » de Windows. Ce mode est accessible par le dossier Web et les boutons pages HTML, formulaires, images, images mappées, documents, adresses e-mail et liens inactifs.
Les pages HTML Une arborescence vous présente les pages HTML rencontrées par MemoWeb durant la capture ainsi que leur état (page capturée, à capturer ou filtrée par le niveau d’exploration interne ou externe). MemoWeb propose des solutions pour aspirer le lien en fonction de l’état de capture du document. Exemple : en face d’une URL, la description indique l’état Filtré par le niveau d’exploration des webs externes. Cliquez sur le lien ; dans la fenêtre d’aperçu, Memoweb vous propose alors : • De forcer la récupération du document • D’augmenter le niveau d’exploration des domaines externes à 1 niveau • D’explorer le domaine www.nom_de_domaine.com. Vous pouvez par exemple demander à explorer un maximum de 7 niveaux. Une fois votre choix effectué, appuyez sur Valider pour la prise en compte immédiate de ces changements.
14
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 15
Le menu Fichier vous permet également de spécifier la capture ou non de liens en choisissant : • de forcer la récupération du document (concerne un seul lien). • d’interdire la récupération du document restant à capturer (concerne un seul lien). • de forcer la capture des liens contenus dans la page (concerne tous les liens). • d’interdire la capture des liens contenus dans la page (concerne tous les liens). • de ne plus interdire ou forcer la capture des liens, pour annuler toutes les opérations visant à forcer ou à interdire.
Les formulaires Certaines pages sont consultables après avoir renseigné et validé un formulaire. Par exemple, la page d’accueil d’Altavista. MemoWeb recherche toutes les combinaisons simples possibles en vue de leur exécution en local. Ainsi, il vous suffit de remplir le formulaire hors-ligne, puis de le valider, soit en cliquant sur un bouton d’envoi prévu dans le formulaire, soit en faisant un clic droit et en choisissant Valider la requête. MemoWeb va alors générer de nouvelles URL à capturer. Si la capture est arrêtée, il vous faudra la relancer. En local, il suffit ensuite de remplir le formulaire pour atteindre les pages suivantes, après aspiration. Notez que le clic droit sur le formulaire vous permet aussi de supprimer toutes les requêtes n’ayant pas encore été capturées, de réinitialiser le formulaire et générer automatiquement des requêtes.
Les images mappées La norme d'affichage HTML prévoit une fonction qui permet de transformer une image en une sorte de bouton multi-fonctions : Une image peut être découpée en zones géométriques et chaque zone peut être associée à un lien différent. Cette possibilité est utilisée principalement pour afficher des cartes géographiques, mais il est aussi courant de voir sur un web des choix en hypertexte remplacés par une image de ce type.
MemoWeb 3 - La capture
15
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 16
Il existe deux types d'images cliquables : • les images dont le découpage est défini directement dans le source de la page HTML contenant l'image (client side). En capturant la page HTML, MemoWeb capture la définition des zones et peut donc reproduire le mécanisme dans la version locale du web • les images dont le découpage est défini dans un fichier non accessible sur le serveur web (server side). Dans ce cas, lorsqu'on clique dans l'image, le navigateur envoie les coordonnées de la souris au serveur et c'est celui-ci qui décide du lien en fonction des ces coordonnées. Dans le cas d'une capture, il est à priori impossible de simuler tous les positions de clic possibles dans l'image pour reconstituer les réactions du web. MemoWeb utilise une technique spéciale et exclusive pour traiter les images cliquables de type server side. Un clic sur le bouton Images mappées vous présente la liste des images cliquables contenues dans le web capturé. Vous pouvez alors charger chacune de ces images et définir vous même les zones qui vous paraissent correspondre à un lien différent (voir l'éditeur de maps). Une fois toutes les zones définies, sauvez cette définition de zone. La troisième étape consiste à relancer la capture. MemoWeb capture maintenant les liens associés à chaque zone et recrée en local des images cliquables du type client side.
Les liens inactifs Certains liens dits «inactifs» n’ont pas été capturés par MemoWeb pour plusieurs raisons : • le lien a été filtré par le niveau d’exploration des Webs externes • le lien a été filtré par le niveau d’exploration des Webs internes • la page n’a pas été trouvée (erreur 404). Consultez la partie pages HTML évoquée précédemment pour plus de détails.
Mettre à jour la capture Après avoir terminé une première capture, lorsque vous appuyez sur le bouton Capturer, MemoWeb vous propose en fonction de l'état de votre capture de : • Capturer complètement (avec réinitialisation du web) • Terminer la capture • Mettre à jour la capture • Réessayer les URL erronées et terminer la capture Choisissez Mettre à jour la capture. MemoWeb va entamer une phase de rafraîchissement des liens. Pour chaque fichier rapatrié, il demande au serveur s'il n'y a pas eu de modification depuis la dernière capture (en vérifiant la date de la dernière modification du fichier). Si c'est le cas, il remplace le fichier par la nouvelle version et pour une page HTML, analyse le contenu pour en déduire de nouveaux liens à explorer. Enfin, lorsque tous les liens auront été réactualisés, il effectue une opération dite de Suppression des liens orphelins qui consiste à détruire les fichiers qui ne sont plus d'actualité, ce qui vous évite une occupation disque inutile. Attention ! Cette opération ne sera lancée que lorsque tous les liens auront été mis à jour et qu'il n'y plus aucun fichier à récupérer. C'est pourquoi vous pouvez avoir temporairement des fichiers inutilisés dans le répertoire de la capture.
Démarrer une capture en différé Une des fonctions les plus intéressantes de MemoWeb consiste à pouvoir lancer des captures automatiquement à une date et heure de votre choix sans aucune manipulation de votre part. Pour cela, MemoWeb utilise un gestionnaire de capture en différé (lorsqu'il est actif, vous pouvez voir son bouton dans la barre d'applications de Windows).
16
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 17
La capture en différé est accessible par le menu Outils | Travaux en différé ou par le bouton Travaux en différé de l’onglet Outils. Ce gestionnaire de capture en différé agit comme le réveil matin de MemoWeb : • il peut lancer MemoWeb alors que celui-ci n'est pas chargé en mémoire • il gère une liste de tâches.
Qu'est-ce qu'une tâche ? Une tâche est un ensemble de travaux (capture, mise à jour, etc. ) qui vont s'exécuter les unes à la suite des autres. Il n'y a qu'une seule tâche et un seul travail actif à un moment donné (car il ne peut pas y avoir plusieurs copies de MemoWeb simultanément chargées en mémoire). La première opération est donc de créer une nouvelle tâche.
Création d'une nouvelle tâche Cliquez dans le menu Tâche | Nouvelle tâche… | Démarrage. Le paramétrage d'une tâche est simple et se limite à trois paramètres : • Quand démarrer ? • Quand arrêter ? • Que faire lorsque la tâche est terminée?
Quand démarrer ? Vous pouvez choisir de lancer l'exécution de façon mensuelle, hebdomadaire, journalière ou exceptionnelle, le tout à une heure donnée. Il est donc facile de mettre à jour toute une série de webs préférés, le lundi matin en arrivant au bureau ou le midi en partant déjeuner.
Quand terminer ? Il faut fixer la durée maximum d'exécution de la tâche (en minutes). Cette valeur est facultative, si vous ne cochez pas cette case alors la tâche s'arrêtera lorsque tout ses travaux seront terminés.
Que faire lorsque la tâche est terminée ? MemoWeb vous propose de couper la connexion modem, puis de se refermer.
Ajout de capture à la tâche Il vous suffit d'utiliser les commandes du menu Tâche | Nouvelle tâche… | Webs. Une fenêtre de dialogue apparaît, vous proposant la liste de vos dernières captures. Il vous suffit d'en choisir une ou plusieurs (en mode ajout de liste de webs), puis de sélectionner, parmi les types de travaux proposés : • Capturer complètement (avec réinitialisation du web) : MemoWeb reprendra la capture depuis le début, il détruira tous les fichiers et les liens sur les pages seront définitivement perdus. • Terminer la capture : MemoWeb ira récupérer les liens qui ne sont pas encore capturés. • Mettre à jour la capture : MemoWeb effectue une mise à jour des liens capturés sur la date. • Réessayer les URL erronées et terminer la capture Astuce : la résolution des liens peut être longue, il est parfois préférable de l'effectuer hors connexion afin de ne pas alourdir le coût de la communication. Vous pouvez toujours résoudre les liens ultérieurement. Enfin, vous pouvez limiter ce travail à quelques minutes.
MemoWeb 3 - La capture
17
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 18
Le lancement de la connexion modem Si vous avez coché Si la connexion au serveur Internet n'est pas active... dans le dossier Préférences | Configuration… | Connexion Internet, alors MemoWeb établira automatiquement la connexion au lancement de la tâche et coupera la connexion si l'option Couper la connexion modem... est cochée dans les options en fin de tâche.
Les autres fonctions du menu Tâche Une fois qu’une capture en différé est planifiée, vous pouvez agir sur cette programmation par l’intermédiaire du menu Tâche. Vous pouvez ainsi : • Effacer le journal des tâches planifiées : après chaque capture en différé, MemoWeb génère en effet un journal de bord. • Supprimer, copier, coller une tâche • Démarrer, arrêter ou suspendre une tâche. Astuce : Si vous souhaitez que la taille de la fenêtre d’application soit réduite lors de l’exécution d’une capture en différé, sélectionnez Réduire MemoWeb pendant la Capture dans le menu Options de la partie Travaux en différé.
L’exploitation du contenu d’une capture Une fois la capture effectuée, vous avez la possibilité d’exploiter les différents types de fichier aspirés. Par l’intermédiaire du menu Web, vous sont récapitulés les Images, les adresses E-mail, les liens inactifs Documents (les fichiers vidéos .mov par exemple) capturés.
et les autres types de
Tous les documents sont regroupés dans un arbre des liens assez similaire à l’Explorateur de Windows. Notez que l’étoile permet de trier les documents mis à jour. Astuce : la sélection de plusieurs documents HTML fait apparaître l’option Imprimer les pages sélectionnées… dans le menu Edition. En ce qui concerne les Images, les Liens inactifs et les autres types de Documents, un menu similaire vous permet : • d’ouvrir le document • de le charger dans le navigateur • de rechercher les pages propriétaires, pour trouver les pages liées au document • de créer un nouveau web à partir de cette URL, pour considérer cette page comme première page d’un nouveau site • d’enregistrer, copier, imprimer le document • de créer toutes les vignettes HTML • de créer un rapport d’erreur détaillé des liens inactifs. Les adresses E-mail sont directement exploitables par le menu Adresse qui vous permet : • d’exporter les e-mails sélectionnés au format texte (.txt ou .csv) , HTML (.htm) ou dBase III (.dbf) • d’envoyer un message à cette adresse • de copier cette adresse.
18
MemoWeb 3 - La capture
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 19
L’outil «recherche» MemoWeb 3 permet la recherche : • des pages propriétaires d'un lien (pages contenant ce lien) • des pages HTML selon un texte compris dans le contenu des pages ou dans le titre des pages • des URL selon un filtre. Pour cela, il utilise un filtre au format texte acceptant les caractères spéciaux * et ?. Le caractère * représente tout groupe de caractères jusqu'à celui qui suit le *. Le caractère ? tient lieu de tout caractère individuel. Vous pouvez lancer rapidement une recherche des propriétaires d'un lien à l'aide des menus dans les dossiers Pages HTML, Images, Liens ignorés, etc.
MemoWeb 3 - La capture
19
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 20
Paramétrer les préférences générales Le menu Préférences… | Configuration vous offre l’occasion de paramètrer le fonctionnement et l’affichage de MemoWeb.
Général Connexions simultanées • Le nombre de sockets maximum correspond au nombre de liens de connexion pouvant être ouverts en parallèle. Un socket correspond à une ligne de la zone de suivi présentée dans le dossier Capture. Le nombre maximum autorisé est fixé à 16. Si votre machine est relativement lente, il est préférable de ramener le nombre de sockets à 3 ou 4. • Le Temps d'attente maximum définit le délai au-delà duquel une requête n'ayant pas eu de réponse doit être considérée en échec. Ce temps correspondant à un seul essai de requête, il est à mettre en relation avec le nombre de tentatives de connexion avant erreur. Par défaut, le temps d'attente maximum est de 30 secondes. En cas d'encombrement sur le réseau, de serveurs particulièrement sollicités ou pour toute autre raison faisant baisser la bande passante, il peut être intéressant d'augmenter ce délai. • Le Nombre de tentatives de connexion avant erreur correspond au nombre de répétitions à effectuer en cas de requête infructueuse.
Limitations Si l'option est cochée, MemoWeb interrompt la capture si le nombre d'erreurs rencontrées est supérieur à 30 (par défaut). Dans pareil cas, vous pouvez choisir de reprendre la capture en cliquant sur le bouton «Capturer | Réessayer les liens erronés et terminer la capture». Interrompre la récupération d'un fichier si l'espacement entre les données dépasse 30 (par défaut) secondes : le serveur privilégie les fichiers de petites tailles, il y a donc de fortes chances que la capture d'un fichier de plusieurs méga-octets s'éternise. Le meilleur moyen de remédier à cette lenteur est donc de fixer un laps de temps limite entre le rapatriement des paquets. Le débit moyen est fixé sur le même principe mais concerne le flux moyen du téléchargement de fichiers. Limiter le nombre de requêtes par serveur à 3 (par défaut) permet une meilleure utilisation de la bande passante. Quand MemoWeb effectue simultanément une capture sur plusieurs serveurs, cette dernière est répartie plus équitablement et gagne donc en efficacité. Remarque : s'il n'opère que sur un seul serveur, MemoWeb utilise le maximum de connexions.
Paramètres HTTP et FTP Certains serveurs Web requièrent l'identification du logiciel client (l'agent) sous forme d'une signature. Sans cela, ils peuvent rejeter la demande (requête HTTP) du document, entraînant ainsi une erreur dans la capture. Cette information permet donc au serveur de savoir avec quel logiciel il communique afin de fournir une réponse appropriée. Un menu déroulant vous permet d'utiliser la signature d'un navigateur reconnu par les serveurs (exemple : Internet Explorer 5), sauf contre-indication de votre fournisseur d'accès. • Si vous avez coché l'option «Télécharger les documents FTP» dans le dossier de «Configuration», alors MemoWeb a besoin d'un identifiant lorsqu'il se connecte au serveur FTP (login). Cet identifiant ne se caractérise pas un nom d'utilisateur et un mot de passe. Dans la plupart des cas, il effectue une requête FTP de type public anonyme (sans mot de passe) mais nécessitant une adresse e-mail qui sera utilisée comme login.
20
MemoWeb 3 - Paramétrer les préférences générales
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 21
• L'option «Effectuer les requêtes en utilisant le protocole HTTP 1.1» améliore théoriquement la vitesse de connexion et donc de rapatriement des fichiers à aspirer. Le protocole HTTP 1.1 est pris en charge par les serveurs de nouvelle génération et permet une capture «en rafale». • Avec l'option «Accepter et utiliser les cookies», MemoWeb intégrera systématiquement dans toutes ses requêtes les cookies reçus à partir des serveurs. Cette fonction n'est utile que sur certains serveurs, afin d'avoir un comportement identique à celui d'un navigateur.
Connexion Internet MemoWeb peut établir automatiquement la connexion modem chez votre fournisseur d'accès Internet. Pour cela, il utilise l'accès au réseau à distance offert par Windows. Choisissez parmi la liste des connexions disponibles et cochez la case «Utiliser la connexion suivante». Vous pouvez retrouver les différents points d'accès modem dans Windows à l'aide du menu «Démarrer | Programmes | Accessoires | Accès réseau à distance». La coupure de la connexion n'est effective que lorsque l'on coche la case Déconnecter le modem en fin de capture dans les options proposées lorsque l'on appuie sur «Capturer», ou encore lorsque qu'une tâche en différé se termine. «Particularité de Windows NT4» : Sous ce système d'exploitation vous devez indiquer le chemin du répertoire téléphonique (Phone Book) de Windows. Normalement, ce fichier s'appelle «RASPHONE.PBK» et se situe dans le répertoire «System32».
Navigateur Web Logiciels de navigation «Détection du navigateur» Le logiciel navigateur (Browser) a normalement été trouvé automatiquement dès le premier lancement de MemoWeb. Si le chemin et le nom du navigateur n'apparaît pas dans la zone de saisie, cochez la case de «Recherche automatique d'un browser HTML» ou utilisez le bouton «Parcourir». Dans le cas où il existerait plusieurs navigateurs sur le disque dur, la recherche sélectionne automatiquement le dernier ayant servi. Enfin, en cochant la case «Appeler le navigateur en fin de capture», MemoWeb chargera automatiquement le Sommaire _Start.htm dans le navigateur après avoir terminé la phase de «Résolution des liens».
«Ajouter un bouton «Capturer» dans la barre d'outils du navigateur Internet Explorer» Cette fonctionnalité vous permet d'installer un raccourci sur la barre d'outils de votre navigateur pour aspirer directement le site que vous consultez. Celle-ci n'est disponible qu'à partir de la version 5.0 de Microsoft Internet Explorer. Cette option est désactivée si vous n'avez pas choisi Internet Explorer comme navigateur de consultation par défaut. Si, après avoir activé cette option, le bouton n'apparaît dans la barre d'outils d'Internet Explorer, il faut le rajouter manuellement en utilisant la fonction «Personnaliser...» dans le menu «Affichage | Barre d'outils» du navigateur. Particularités Windows NT : Pour pouvoir rajouter un bouton dans Internet Explorer, il faut avoir les droits d'accès Superviseur.
MemoWeb 3 - Paramétrer les préférences générales
21
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 22
Raccourcis et signets La case «Ajout automatique d'un raccourci» offre la possibilité d'intégrer automatiquement : • Un signet dans le fichier de bookmarks du navigateur réservés aux Webs locaux, le signet qui pointera sur la page d'accueil du site capturé. Pour Netscape Navigator, Il vous suffit de rechercher à l'aide de «Parcourir...», le fichier Bookmarks.htm. • Un lien Internet (fichier ayant pour extension .URL) vers la page d'accueil dans le répertoire Favoris. Ces liens favoris sont utilisés par l'Internet Explorer. Par défaut si le navigateur Netscape est employé, MemoWeb se charge de vérifier l'existence du fichier contenant les signets et du dossier concernant les webs locaux. En cas de non-existence, il se charge de les créer automatiquement. Cette fonction permet donc d'accéder directement aux sites locaux à partir du navigateur sans qu'il soit nécessaire de lancer MemoWeb. Enfin, vous pouvez préciser le nom du dossier qui va contenir les raccourcis de capture.
Serveur Proxy Un «Proxy» agit comme un cache local au niveau du serveur. Les fournisseurs d'accès Internet utilisent des serveurs proxy pour des raisons de sécurité (si l'accès se fait par un «firewall») mais surtout pour accroître le débit de la communication client (vous) - serveur, en stockant les pages les plus consultées. Selon votre fournisseur d'accès à Internet, spécifier un proxy peut s'avérer obligatoire, par exemple : adresse proxy : proxy.infonie.fr Port :8080 Attention ! : Memoweb ne gère pas les Proxy utilisant une configuration automatique. Il faut impérativement lui indiquer un nom de machine (ex: proxy.infonie.fr) ou une adresse IP. Le proxy doit utiliser uniquement le protocole HTTP, les autres protocoles (Socks) ne sont pas gérés. Sur un réseau interne d'entreprise, vous devez obtenir ces informations en contactant votre administrateur réseau. Si votre proxy utilise un accès privilégié à l'aide d'un nom d'utilisateur et un mot de passe, précisezles.
Particularité du serveur Web Microsoft IIS Vous devez rentrer comme identifiant, le login et le mot de passe saisis à l'ouverture de la session sur le réseau NT. Si après plusieurs tentatives infructueuses, le message d'erreur retourné par Memoweb est du genre 407 (proxy authentication needed), contactez votre administrateur réseau afin qu'il autorise le mode d'authentification dit «BASIC (cleartext)». Car par défaut, les accès sur ce type serveur se font par l'intermédiaire du cryptage propriétaire «NTLM authentication» du login et du mot de passe. Dans le cas ou proxy FTP est le même (adresse identique et numéro de port identique) que celui du HTTP, cochez la case «Utiliser le proxy HTTP pour toutes les requêtes FTP».
22
MemoWeb 3 - Paramétrer les préférences générales
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 23
Exclusion Fichiers d'exclusion pour les aspirateurs (Robots.txt) Le fichier d'exclusion d'un site limite l'exploration de Memoweb aux répertoires et documents autorisés par le serveur que l'on interroge. La configuration du logiciel permet de demander à ce qu'il soit pris en compte ou ignoré.
Liste globale d'exclusion Comme vous l'avez vu précédemment, MemoWeb limite l'exploration grâce aux liens existants entre les pages composant un web. Toutefois, ces limites d'exploration sont inefficaces lorsque : • les niveaux d'exploration sont élevés et que l'on ne veut pas que MemoWeb se perde dans un dédale de liens à explorer • on ne veut récupérer qu'une partie d'un web, par exemple quelques répertoires ayant un caractère thématique particulier • on veut éviter certains sites (par exemple www.microsoft.com, www.yahoo.com, etc.) • on veut récupérer quelques fichiers d'un type donné contenu dans un répertoire (par exemple un ensemble d'images gif : http://www.goto.fr/*.gif).
Bannières publicitaires Cette option (désactivée par défaut) vous permet de ne pas capturer les images publicitaires rencontrées et de les remplacer en local par une image transparente. MemoWeb place alors une image vide (transparente) à la place de la bannière filtrée, permettant de préserver l'aspect graphique du site capturé.
Génération de l'index Génération des pages HTML MemoWeb a la possibilité de générer des reproductions en miniature des pages HTML : les vignettes. Le format de ces vignettes s'étend de 80x60 à 160x200 pixels. On peut choisir ou non de conserver le fond original des vignettes (image servant comme motif de fond). Dans ce cas c'est la couleur par défaut qui est utilisée. L'affichage des vignettes pendant leur création permet une vérification du rendu mais ralentit le processus. Cette opération étant assez longue (car elle comporte le chargement de la page HTML avec son contenu, le ré-échantillonnage de l'image et la compression au format GIF), il est conseillé de l'effectuer lorsque le site aura été entièrement récupéré.
Index des images Ceci permet de personnaliser l'apparence des images dans les pages d'index en modifiant le nombre de lignes et colonnes ainsi que les dimensions de ces images.
Mise en page des rapports Modifie le nombre de lignes de texte pour les autres pages d'index : pages sur les fichiers divers et pages d'erreurs.
MemoWeb 3 - Paramétrer les préférences générales
23
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 24
Options Structure du Web Cette zone vous permet de saisir le nom du répertoire racine de toutes vos captures. Attention, le choix du répertoire de destination n'est effectif qu'au moment de créer un nouveau Web. Dès que cela est fait, vous ne pouvez plus changer l'emplacement. Par défaut, MemoWeb vous propose un nom de répertoire composé du répertoire par défaut suivi d'un nom déduit de l'adresse Internet du web. Exemples :
Pour l'adresse www.goto.fr, le nom du répertoire proposé sera Goto. Pour l'adresse www.goto.fr/hpjeu.htm, le nom du répertoire proposé sera Hpjeu.
Un répertoire du disque ne peut contenir qu'un seul web capturé. Si le répertoire que vous spécifiez n'existe pas encore, MemoWeb le crée automatiquement. S'il existe et qu'il contient déjà les fichiers d'un web capturé, MemoWeb vous propose d'effacer les fichiers existants. Par défaut, la structure du web (fichier local.Web) est mise à jour sur le disque pendant la capture, tous les 100 liens capturés.
Préférences Paramétrez MemoWeb selon vos goûts et habitudes : • Rajouter un raccourci «Aspirer le web» dans le menu «Démarrer» : lorsque vous surfez sur le web, il vous suffit de sélectionner «Aspirer le web» dans le menu «Démarrer» de Windows pour lancer la capture immédiate de la page sur laquelle vous vous trouvez. • Une fenêtre déroulante vous permet de choisir la page à charger sur appui du bouton «Résultats» : soit la page d'accueil du site aspiré, soit l'index de capture (compte-rendu), ou encore l'ouverture du répertoire de capture. • Emettre un avertissement sonore lorsque la capture est terminée : indiquez le son à jouer. • Fixer la couleur de fond de la barre des dossiers (grise par défaut).
Fenêtre d'aperçu Choisissez ici de visualiser la page HTML en taille réelle ou sous forme de vignette dans la fenêtre de visualisation de MemoWeb.
Affichage des listes Choisissez ici la couleur des liens en fonction de leur état ainsi que le type et la taille de la police.
24
MemoWeb 3 - Paramétrer les préférences générales
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 25
Contacts Retrouvez MemoWeb sur le Web ! www.goto.fr/fr/memoweb3/
Les dernières mises à jour www.goto.fr/fr/memoweb3/maj/
La FAQ (Foire aux Questions) www.goto.fr/fr/memoweb3/faq/ Goto Software se réserve de modifier ou de supprimer sans préavis le contenu des informations présentes sur le site www.goto.fr.
Questions techniques Par email :
[email protected] Par téléphone : +33 (0)3 20 66 55 33 du lundi au vendredi de 9h à 12h30 et de 14h à 18h00 Par fax : +33 (0)3 20 66 55 09
MemoWeb 3 - Contacts
25
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 26
Le glossaire IP (ou TCP/IP) : Internet Protocol Nom du protocole de transfert de données entre deux réseaux distants qui a donné son nom au réseau Internet. Il s'agit d'un protocole de bas niveau qui est complété par un protocole correspondant au type d'application (HTTP, FTP, etc.). Numéro IP : Numéro d'identification d'une machine connectée au réseau Internet. URL : Uniform Resource Locator Syntaxe permettant de localiser un service sur le réseau ainsi que le protocole utilisé pour le dialogue avec l'application. Pour les services Web qui utilisent le protocole HTTP, une URL est de la forme : http://nomdemachine.nomdedomaine.indicatifpays:numérodeport/répertoire/nomdefichier par exemple :http://home.nordnet.fr:80/jeux/bridge.html L'URL est l'adresse d'un service sur Internet. Adresse : voir URL HTML : HyperText Markup Language Langage de description des pages d'information sur le Web. Il permet notamment d'inclure dans les pages de texte des éléments multimédias (images, sons, vidéos) et surtout des liens de type hypertexte vers d'autres pages, qu'elles soient situées ou nom sur le même serveur. Les pages HTML sont émises par le serveur Web en protocole HTTP sous forme de fichier texte (source) et décodées pour leur affichage sur le poste client par le logiciel de navigation (Navigateur). HTTP : HyperText Transfer Protocol Protocole de transfert de données sur Internet entre un serveur Web et un Navigateur dédié aux pages HTML et à leurs éléments associés. FTP : File Transfer Protocol Protocole de transfert de fichiers sur Internet entre un serveur FTP un et un logiciel client FTP. WEB ou World Wide Web ou encore WWW Littéralement : Toile d'araignée mondiale. Ensemble des services d'information multimédia sur Internet utilisant la présentation HTML mêlant textes, sons et images fixes ou animées. Par extension, un Web peut désigner l'un de ces services (le Web de TF1). Serveur Web : système informatique permettant de diffuser des services Web sur Internet. Domaine Réseau informatique connecté sur l'Internet auquel est attribué un nom (nom de domaine) référencé sur l'ensemble du réseau. A un nom de domaine est associé une classe de numéros IP. Les numéros d'une classe portent le même préfixe et permettent d'identifier chacune des machines du réseau. Lien Association d'une URL à une zone cliquable de l'écran. Lorsque l'utilisateur clique sur cette zone, il provoque l'affichage de la page spécifiée dans l'URL. Comme la page spécifiée peut être localisée n'importe où dans le monde, l'action de passer de page en page en cliquant sur les liens proposés est communément appelée surfer sur le Web. Un lien peut-être associé indifféremment à une chaîne de caractères (texte qui en général apparaît souligné à l'écran et change de couleur après avoir été activé) ou à une image (voir ISMAP pour les images comportant plusieurs liens). Dans tous les cas, le Navigateur repère les liens dans les pages et change le curseur souris au survol de ceux-ci. ISMAP Image associée à plusieurs liens en fonction de la position du curseur souris au moment du clic. L'ISMAP peut être client side ou server side. Cette appellation localise la table d'association des coordonnées de la souris avec les URL des liens. En client side, cette table est dans la page HTML et le Navigateur émet directement la requête avec l'URL spécifiée dans la table. En server side, cette table est située sur le serveur, le Navigateur émet une requête spéciale vers le serveur avec les coordonnées de la souris et le serveur qui lui renvoie l'URL à laquelle il doit se connecter.
26
MemoWeb 3 - Glossaire
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 27
Navigateur Logiciel destiné à équiper les postes clients sur Internet et permettant d'effectuer des requêtes vers les serveurs Web et le décodage des pages HTML reçues. Les Navigateurs les plus connus sont Netscape Navigator et Microsoft Internet Explorer (MSIE). MIME : Multipurpose Internet Mail Extensions Classification des objets associés aux pages HTML permettant leur décodage par le logiciel de Navigation. Les différents type MIME concernent notamment les fichiers de son, les images et les vidéos. CGI : Common Gateway Interface Langage de programmation permettant de développer des routines exécutables sur les serveurs Web répondant à des requêtes incluses dans les pages HTML. Les routines CGI sont généralement lancées avec des paramètres en entrée qui peuvent être soit fixés par la page HTML elle-même, soit des données saisies par l'utilisateur (formulaire). Les applications du CGI sont innombrables, allant de la détermination d'une URL en fonction de paramètres contextuels ou l'affichage d'un compteur à des applications plus complexes liées à des bases de données. JAVA Langage de développement d'applications (applets) transmises aux postes clients sous forme de code source et exécutées sur le poste client par l'intermédiaire du Navigateur (qui doit donc être compatible JAVA). Les créateurs du langage JAVA (Sun) y voient pour principal avantage de permettre la conception d'applications indépendantes du système d'exploitation des postes clients. DNS : Domain Name Server Système situé sur un site Internet et permettant de traiter les requêtes en retrouvant les numéros IP à partir des URL demandées. C'est en effet à partir des numéros IP que les routeurs (situés à chaque noeud du réseau) pourront transmettre une requête vers un serveur donné. PROXY Système situé sur un site Internet agissant à la manière d'un cache pour un groupe d'utilisateurs donné. Il stocke sur ses propres unités disque les informations reçues du réseau suivant les demandes des utilisateurs. Lorsqu'il reçoit une nouvelle requête d'un utilisateur, il vérifie d'abord s'il ne détient pas l'information demandée et ne transmet la requête au réseau que s'il ne la détient pas. Un serveur PROXY permet d'accélérer significativement la consultation des serveurs les plus demandés. Shockwave Flash Format d'animation vectoriel utilisé sur l'Internet. lancé par la société Macromedia. Nécessite la présence d’un plug-in spécifique sur votre système pour être lu. Socket Communication logique entre deux systèmes reliés au réseau Internet. Contrairement aux liaisons analogiques (téléphone) où les communications s'établissent physiquement entre deux utilisateurs et durent pendant tout le temps de la communication, les liaisons numériques ne sont établies que pour le temps de l'échange des données entre le client et le serveur. L'établissement d'une requête par un poste client va ouvrir un socket avec le serveur que le serveur va fermer dès qu'il aura émis les données demandées. Dans le cas d'une connexion par modem, fermer un socket n'est pas synonyme de coupure de la communication. Une connexion modem peut permettre d'ouvrir plusieurs sockets simultanés. VRML (Virtual Reality Modelling Language) Le VRML est un système de navigation en trois dimensions élaboré notamment par Silicon Graphics et Intervista Software.
MemoWeb 3 - Glossaire
27
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 28
LICENCE D’UTILISATION D’UN LOGICIEL GOTO SOFTWARE Vous avez acquis un logiciel de la gamme GOTO Software (ci-après dénommé le Logiciel) et nous vous en remercions. Cette acquisition ne fait pas de vous le propriétaire du Logiciel mais le bénéfi ciaire des droits pour son utilisation dont les conditions sont détaillées ci-après. En ouvrant la pochette contenant le Cédérom ou en téléchargeant le logiciel, vous acceptez sans réserve de vous conformer aux termes de la présente Licence. Si vous n’acceptez pas les clauses du contrat, vous devez retourner le Cédérom sans rompre son emballage d’origine ainsi que le matériel l’accompagnant à l’endroit où vous avez acheté le Produit afin d’en obtenir le remboursement, ou refuser le téléchargement du produit en cas d’un achat en ligne. Les droits du Licencié sur le logiciel sont spécifiés dans la présente Licence, à l’exclusion de ceux qui n’ont pas été expressément concédés par les présentes. I • ETENDUE DE LA LICENCE Sauf stipulation contraire établie de façon expresse par GOTO, la Licence d’utilisation du logiciel vous est concédée pour un seul ordinateur en un seul lieu. En cas de contrôle, un justificatif d’achat (disquette ou Cédérom original, facture ou ticket de caisse) sera demandé pour chaque installation constatée du Logiciel. Dans le cadre d’un achat en ligne, il vous est donc conseillé d’imprimer la facture correspondante. Le transfert physique du Logiciel d’un ordinateur à un autre est autorisé à condition que le Logiciel ne soit utilisé que sur un ordinateur à la fois. La copie de sauvegarde est seule autorisée et devra être effectuée conformément aux dispositions de l’article 2 ci-dessous. L’utilisateur n’est pas non plus autorisé à copier la documentation imprimée du Logiciel, celle-ci étant protégée par les droits de propriété intellectuelle. Toute utilisation non prévue au paragraphe précédent est interdite et en particulier, sans que ce ne soit limitatif, vous ne pouvez pas sans l’autorisation écrite de GOTO : Diffuser, céder, louer, vendre, donner en crédit bail, sous licencier, donner ou distribuer tout ou partie du logiciel à un Tiers, de quelque façon que ce soit Altérer, désassembler, décompiler, adapter, créer des œuvres dérivées, intégrer dans un autre logi ciel, traduire ou modifier de quelque façon que ce soit, tout ou partie du Logiciel Effectuer des copies de tout ou partie du Logiciel (autres que la copie de sauvegarde dans les conditions définies ci-après) IL EST NOTAMMENT PRECISE QU’IL EST INTERDIT DE METTRE TOUT OU PARTIE DU LOGICIEL A DISPOSITION DU PUBLIC PAR LE BIAIS D’INTERNET, DE BBS OU DE SERVEURS MINITEL SANS L’AUTORISATION PREALABLE ECRITE DE GOTO. II • COPIE DE SAUVEGARDE Dans le cas d’achat du Cédérom ou de la disquette d’origine et si c’est le Cédérom ou la disquette d’origine qui sont utilisés pour l’exploitation du Logiciel, la présente Licence vous autorise à dis-
poser d’une copie de sauvegarde de la forme de votre choix. En revanche, dès lors que le programme est copié sur disque dur, c’est le Cédérom d’origine qui fera office de sauvegarde. Dans le cas d’un achat en ligne, vous êtes autorisé, en plus de l’installation du logiciel sur votre disque dur, à disposer d’une copie de sauvegarde de la forme de votre choix. Cette copie a pour seul but de régénérer le logiciel original en cas de détérioration accidentelle. En aucun cas elle ne pourra être utilisée à d’autres fins. Conservez là en lieu s˚r. Attention, votre responsabilité pourra être engagée en cas d’utilisation illicite par un Tiers. La présente Licence s’applique à la copie de sauvegarde. III • PROPRIETE GOTO dispose de tous les droits d’édition et de reproduction sur le Logiciel et sa documentation et sur toute copie autorisée dans le cadre de la pré sente Licence conformément à la législation sur les droits d’auteurs. Vous prendrez en conséquence toutes les mesures nécessaires à la protection desdits droits et en particulier respecterez et ferez respecter toutes les mentions et avertissements relatifs à ces droits qui sont portés sur les éléments constitutifs du logiciel ou de sa copie de sauvegarde. IV • DUREE • RESILIATION La présente Licence est concédée pour une durée indéterminée sauf manquement de votre part aux termes et conditions de la présente Licence qui conférera à GOTO la faculté de résilier automatiquement la présente Licence sans préavis et sans préjudice des autres recours dont elle pourra dis poser. En cas de résiliation, vous vous engagez à en cesser toute utilisation et à retourner à GOTO, sans délai et sur simple demande de GOTO, le Logiciel ainsi que sa copie de sauvegarde le cas échéant. V • GARANTIE ET RESPONSABILITE GOTO ne garantit en aucune façon que le Logiciel réponde à quelque fonctionnalité que ce soit ni aux spécifications de l’utilisateur, qu’elles aient été écrites ou non préalablement à l’acquisition. En particulier, GOTO ne garantit en aucune manière que le Logiciel passe l’an 2000 sans dysfonctionnement et/ou dommage et/ou blocage. Les informations que nous fournissons sur le passage à l’an 2000 peuvent être consultées sur le site web http://www.goto.fr/html/an2000.htm. Ces informations ne constituent en aucun cas une extension de garantie du Logiciel GOTO qui décline toute responsabilité en cas d’erreur ou d’omission. GOTO ne pourra être tenu pour responsable des dommages ou problèmes causés par le logiciel sous Licence et qui pourrait résulter de son utilisation. Ceci comprend de manière non exhaustive le matériel informatique, les logiciels, le système d’exploitation ou tout autre accessoire informatique quel qu’il soit. La garantie est strictement limitée au support matériel, qui sera échangé en cas de vice constaté.
La présente garantie s’applique pour une durée de 6 mois suivant la date d’acquisition étant entendu qu’en cas de retour du produit, les frais de port restent à la charge de l’expéditeur. NONOBSTANT CE QUI PRECEDE, GOTO NE POURRA EN AUCUN CAS ETRE TENUE POUR RESPONSABLE DE QUELQUE DOMMAGE, DIRECT OU INDIRECT, CAUSE A VOUS OU A UN TIERS, NOTAMMENT, A TITRE PUREMENT INDICATIF ET NON LIMITATIF, LES MANQUES A GAGNER, DEPENSES, PERTES DE LOGICIEL, DETERIORATIONS OU PERTES DE MATERIELS SUPPORTES PAR VOUS MEME OU PAR UN TIERS, Y COMPRIS LES FRAIS DE RECUPERATION, REPRODUCTION, OU DE REPARATION DE TELLES PERTES OU DETERIORATIONS. Vous indemniserez GOTO pour tout dommage résultant de la mise en cause de GOTO et ayant son origine dans un manquement à la présente Licence ou dans l’utilisation du Logiciel. VI • ASSISTANCE A L’UTILISATION La présente Licence n’entraîne aucune obligation d’assistance de GOTO concernant l’utilisation du Logiciel. L’utilisateur trouvera des compléments d’informations, une aide permanente à l’utilisation et sera averti des évolutions et des nouvelles versions du logiciel soit à l’adresse http://www.goto.fr soit au site web consacré au produit s’il existe. VII • PRECAUTIONS A PRENDRE POUR L’UTILISATION D’UN JEU VIDEO Certaines personnes étant susceptibles de troubles physiques lors de l’utilisation prolongée de jeux vidéo, il est recommandé, si tel a été votre cas dans le passé, de consulter un médecin avant toute utilisation. Si des troubles apparaissent pendant l’utilisation (pertes de conscience, vertiges, contractions involontaires des muscles, troubles de la vision ou de l’orientation, convulsions) cessez immédia tement de jouer et consulter un médecin. Dans tous les cas : • Vérifier l’éclairage de la pièce où est situé votre ordinateur • Ne fixez pas l’écran de trop près, et d’autant plus que votre écran est de grande taille • Placez vous de telle façon que vous regardiez votre écran plutôt vers le bas • Faîtes une pause de dix à quinze minutes toutes les heures VIII • DISPOSITIONS GENERALES La présente Licence est soumise au droit français. Le tribunal compétent pour connaître de tout litige relatif à l’utilisation du produit ou à l’interpré tation de la présente Licence est le tribunal de Paris. La présente Licence est concédée pour la France Métropolitaine. La présente Licence est consentie à la personne indiquée en tête, telle qu’elle a été référencée sur le service accessible par Minitel.
GOTO Software, S.A. au capital de 1.080.000 FF, RC Tourcoing B 325 060 952 • 111, rue de Croix - 59510 Hem - France
Edition Septembre 2000
© 2000 - GOTO Software - Tous droits réservés Les logiciels, ordinateurs et marques cités dans ce manuel sont des marques déposées et ne sont cités qu’à titre d’exemple. Minitel est une marque déposée de l’Etat Français.
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 29
Inhoudsopgave Even voorstellen
...............................................................................................
31
Waar dient MemoWeb voor? ................................................................................. Voor wie is MemoWeb bedoeld? ......................................................................... Hoe werkt het? ........................................................................................................... Wat u nodig heeft om met MemoWeb te kunnen werken ........................... De sterke punten van MemoWeb 3 ...................................................................... Interface ........................................................................................................................
31 32 32 33 33 34
Binnenhalen .............................................................................................................
35
Snel binnenhalen ........................................................................................................ Voorbereiding ........................................................................................................ Hoe het binnenhalen werkt ................................................................................. Het resultaat ........................................................................................................... Geavanceerd binnenhalen ....................................................................................... Het doorzoeken van HTML-webpagina's beperken ......................................... Zoekniveaus: hoe worden websites doorzocht? ............................................... Types van af te halen documenten ..................................................................... Analyse van HTML-pagina's en scripts ............................................................... Andere opties ......................................................................................................... Het binnenhalen verfijnen....................................................................................... HTML-pagina's ....................................................................................................... Formulieren ............................................................................................................ Gemapte afbeeldingen ......................................................................................... Niet-werkende links .............................................................................................. De binnengehaalde website bijwerken ............................................................... Het binnenhalen op een ander tijdstip laten plaatsvinden ........................... Wat is een opdracht?............................................................................................ Een nieuwe opdracht aanmaken ........................................................................ Websites toevoegen aan de opdracht ................................................................ Met de modem een verbinding tot stand brengen .......................................... De andere functies van het menu Opdracht ..................................................... De inhoud van een binnengehaalde site gebruiken ........................................ De zoekfunctie ............................................................................................................
35 35 37 37 38 38 38 39 40 41 42 42 43 43 44 44 44 45 45 45 46 46 46 47
29
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 30
De algemene voorkeuren instellen..............................................
48
Algemeen...................................................................................................................... Gelijktijdige verbindingen..................................................................................... Beperkingen ........................................................................................................... HTTP- en FTP-parameters ..................................................................................... Internetverbinding ..................................................................................................... Webbrowser ................................................................................................................. Browsersoftware.................................................................................................... Sneltoetsen en bladwijzers ................................................................................... Proxyservers .................................................................................................................. Bestanden uitsluiten .................................................................................................. Uitsluitingsbestanden voor zoekrobots (Robots.txt) ......................................... Algemene uitsluitingslijst...................................................................................... Reclamebanners .................................................................................................... De index genereren .................................................................................................. Aanmaken van HTML-pagina's ........................................................................... Afbeeldingenindex ................................................................................................ Opmaak van rapporten ........................................................................................ Opties ............................................................................................................................. Webstructuur ......................................................................................................... Voorkeuren ............................................................................................................ Overzichtsvenster .................................................................................................. Lijsten tonen...........................................................................................................
48 48 48 48 49 49 49 50 50 51 51 51 51 51 51 51 51 52 52 52 52 52
Contact ...........................................................................................................................
53
Woordenlijst ............................................................................................................
54
Licentie van de eindgebruiker ...........................................................
56
30
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 31
Even voorstellen Waar dient MemoWeb voor? MemoWeb is een programma waarmee u lokaal op uw PC elke website van het internet kunt opslaan. MemoWeb brengt automatisch een verbinding tot stand, navigeert automatisch op het web en zet welgericht alles op uw vaste schijf wat het tegenkomt: pagina's met informatie, afbeeldingen, geluiden, videofragmenten, enz... U kunt MemoWeb een of meer websites laten binnenhalen terwijl u slaapt. Het programma haalt dan tijdens de daluren en bijgevolg met lage kosten de websites binnen die u interesseren: u wint tijd en geld. Nadat MemoWeb zijn opdracht heeft afgewerkt, kunt u rustig de binnengehaalde website off line bekijken onder dezelfde omstandigheden als bij een lopende verbinding. Bovendien zullen de reactietijden uw stoutste verwachtingen overtreffen. MemoWeb is een instrument dat uw browsersoftware aanvult en het gebruikscomfort bij internetactiviteiten aanzienlijk verhoogt. MemoWeb vangt de nadelen op van de bestaande browsers: wie is er ooit zonder veel moeite in geslaagd om op zijn of haar PC een website inclusief afbeeldingen op te slaan? MemoWeb doet dat in een handomdraai, ongeacht of u één enkele pagina opslaat of een hele website binnenhaalt. Was uw PC uitgerust met voldoende geheugen, dan kon u zelfs heel het internet binnenhalen! MemoWeb is een intelligent programma dat in uw plaats op het internet rondsurft volgens door u vastgelegde criteria. De voordelen van MemoWeb zijn talrijk: Snel: MemoWeb leest de pagina's veel sneller dan u het zou kunnen om te bepalen wat er moet gebeuren. Het programma doet bovendien aan multitasking: het is alsof u op een site tegelijk verschillende browservensters zou openen zonder ooit eenzelfde pagina twee keer te openen! Grondig: Zoals het een goed ontdekkingsreiziger betaamt, stopt MemoWeb pas aan het einde van de reis. Zelf zou u allang uw geduld hebben verloren door de trage reacties van het internet. MemoWeb gaat door tot het gewenste is binnengehaald. Selectief: MemoWeb verliest geen tijd met het raadplegen van onnuttige informatie. Het programma weet wat u wilt en zoekt naar wat belangrijk is. Methodisch: MemoWeb ziet niets over het hoofd. Het kan u overkomen dat u een interessante link over het hoofd ziet: dat kan MemoWeb niet gebeuren. Bovendien zal het programma nooit twee keer eenzelfde pagina aanroepen. Hoeveel keer komt u niet telkens opnieuw bij de hoofdpagina van de website terecht? Ordelijk: Als MemoWeb het zoeken en binnenhalen heeft beëindigd, genereert MemoWeb pagina's met bijkomende indexen waardoor u de website nog eenvoudiger kunt raadplegen.
MemoWeb 3 - Even voorstellen
31
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 32
Voor wie is MemoWeb bedoeld? Voor iedereen! Omdat het altijd aangenamer is om een website zonder lopende verbinding te raadplegen en zonder bij elke pagina te moeten wachten. Omdat MemoWeb u in staat stelt om het internet te raadplegen op gelijk welk moment en op de plaats waar u dat wenst. Omdat MemoWeb uw internetverbindingen optimaliseert, vooral wanneer u geen permanente internetverbinding heeft. Omdat MemoWeb nooit belangrijke informatie over het hoofd ziet. Voor ondernemingen met een lokaal computernetwerk Een website hoeft maar één keer met MemoWeb te worden binnengehaald. De site kan vervolgens aan alle computers van het netwerk ter beschikking worden gesteld. Gebruikers kunnen hun vondsten op die manier gemakkelijk ter beschikking stellen van anderen. Voor zij die in het onderwijs staan Dankzij MemoWeb kunnen mensen die in het onderwijs staan, hun leerlingen laten kennismaken met de mogelijkheden van het internet. Dat veel scholen niet uitgerust zijn met een internetaansluiting, is hier geen hinderpaal. Voor ontwikkelaars van internetdiensten MemoWeb stelt hen in staat om off line en onder de gunstigste voorwaarden hun creaties voor te stellen aan klanten en geïnteresseerden. Tijdens demonstraties krijgen ze niet af te rekenen met onverwachte problemen met de internetverbinding. Aan zij die verantwoordelijk zijn voor dienstverlening via het internet MemoWeb stelt deze personen in staat om zeer snel niet-actieve links op te sporen evenals bestanden die op een website ontbreken. Ze hoeven de website maar één keer binnen te halen en kunnen vervolgens de toestand van een website grondig onderzoeken. Voor verzamelaars van afbeeldingen en geluiden Voor iedereen die via het internet een verzameling plaatjes of multimediaobjecten wil aanleggen. MemoWeb is immers bijzonder geschikt om internetafbeeldingen op te sporen, binnen te halen, te organiseren en weer te geven. Voor sprekers en voordrachthouders Zij kunnen gebruikmaken van HTML en van websites om hun presentaties te verfraaien. Voor samenstellers van multimediamateriaal MemoWeb kan worden gebruikt om van een internetsite een multimediale CD-ROM te maken. Indien nodig kan een deel van de on line applicatie mee op de CD worden gezet.
Hoe werkt het? Om lokaal een website te creëren, geeft u MemoWeb een aantal «toegangspunten». Dat gebeurt in de vorm van een internetadres van een HTML-pagina (doorgaans de hoofdpagina van de binnen te halen site). Net zoals u dat met uw browser zou doen, brengt MemoWeb een verbinding met het internet tot stand, verstuurt de bijbehorende instructie en haalt de HTML-pagina in kwestie af. Zodra de site volledig is binnengehaald, analyseert MemoWeb de inhoud van de pagina (de HTML-code) en maakt daarbij een onderscheid tussen twee types elementen: • Afbeeldingen of multimediale objecten die in de pagina zijn vervat. Deze objecten worden binnen de pagina geïdentificeerd aan de hand van hun internetadres. • Links naar andere HTML-pagina's die gekoppeld zijn aan aanklikbare zones op het scherm. Deze links worden geanalyseerd volgens ingestelde criteria, die bepalen of ze moeten worden doorzocht of niet. Al deze elementen samen zijn vervolgens de basis voor nieuwe zoekinstructies die MemoWeb naar de server op het internet stuurt.
32
MemoWeb 3 - Even voorstellen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 33
Elke nieuwe, binnengehaalde HTML-pagina wordt volgens datzelfde procédé verwerkt. Andere bestanden (afbeeldingen, geluiden...) worden gewoon op de schijf opgeslagen. Het binnenhalen van de website wordt gestopt als er verder geen pagina's meer zijn die doorzocht moeten worden. Nadat de site is binnengehaald, doorzoekt MemoWeb de site op links. Dit houdt in dat elk van de binnengehaalde HTML-pagina's opnieuw wordt ingeladen en dat in de broncode de internetadressen van de links of van de afbeeldingen worden vervangen door de overeenkomstige namen van de binnengehaalde bestanden. MemoWeb stelt op uw vaste schijf zo opnieuw een volledig autonome website samen waarin elke HTMLpagina op zijn beurt naar andere pagina's op de schijf verwijst. Het laatste stadium bestaat erin, bijkomende HTML-pagina's te creëren met indexen van de verschillende pagina's en afbeeldingen van de binnengehaalde website. Deze indexen stellen de gebruiker in staat om gemakkelijker in de binnengehaalde website te kunnen navigeren.
Interacties met de browser MemoWeb is volledig autonoom: het programma heeft geen browser nodig om pagina's binnen te halen. U kunt met uw browser gerust rondsurfen terwijl MemoWeb een en ander binnenhaalt. MemoWeb is eigenlijk een instrument dat uw internetbrowser aanvult. De relatie met de browsersoftware heeft betrekking op de volgende punten: • raadpleging van een binnengehaalde website: de site kan worden geraadpleegd vanuit MemoWeb (knop Resultaten) of rechtstreeks vanuit de browser door het bestand _Start.htm in de directory van de binnengehaalde website te laden • keuze van het adres van de binnen te halen website: u kunt MemoWeb op elk moment verzoeken om de website binnen te halen die u op dat ogenblik met uw browser raadpleegt. Bij het aanmaken van een nieuwe site stelt MemoWeb standaard voor om het huidige adres van de browser te gebruiken. • aanmaken van snelkoppelingen naar het internet: elke lokaal opgeslagen website kan in uw browser met een snelkoppeling worden weergegeven. Met behulp van deze functie kunt u een actuele lijst samenstellen van alle lokale websites en kunt u ze zo gemakkelijker raadplegen. De interface tussen MemoWeb en de browser komt tot stand met gebruik van dynamische functies voor gegevensuitwisseling (DDE - Dynamic Data Exchange). De identificatie van de browser en de locatie ervan op uw schijf vindt automatisch standaard plaats. Het gebruik van één browser is echter niet verplicht: het staat u vrij om meerdere browsers te gebruiken (zie Browsersoftware).
Wat u nodig heeft om met MemoWeb te kunnen werken • Een compatibele PC met Windows 95, 98 of NT4 • Browsersoftware en internetaansluiting • 32 Mb RAM • 6 Mb beschikbaar op de vaste schijf (+ schijfruimte voor de binnen te halen websites) • CD-ROM-lezer en muis
De sterke punten van MemoWeb 3 Kopieer uw websites! Een waarheidsgetrouwe kopie van elke willekeurige website op uw vaste schijf. Waarheidsgetrouw: Met enkele muisklikken haalt u alle gewenste teksten, afbeeldingen en geluiden binnen. Maar dat is niet alles: ook het resultaat van de nieuwste animatietechnologieën die op het internet worden gebruikt, zoals Shockwave Flash, Javascript, VRML en Java, evenals gemapte afbeeldingen en emailadressen worden mee binnengehaald. Formulieren worden automatisch en met ondersteuning verwerkt.
MemoWeb 3 - Even voorstellen
33
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 34
Nauwkeurig: U stelt zelf met hoge precisie de draagwijdte van de opdracht in, evenals de binnen te halen bestandstypes en de plaats die ze op uw schijf mogen innemen. Filteracties worden geautomatiseerd met typeconfiguraties. Snel: Uw bandbreedte wordt optimaal benut doordat via verschillende frontservers websites worden binnengehaald (tot 64 gelijktijdige downloads). Comfortabel: Dankzij een nieuwe interface kunt u in real-time ingrijpen in het binnenhaalproces. Ook het omgekeerde is mogelijk: u kunt het binnenhalen plannen op een tijdstip in de toekomst. En aangezien websites regelmatig veranderen, zorgt MemoWeb ervoor dat uw binnengehaalde bestanden worden geactualiseerd.
Interface 1 2 3
7
6
4
5
1. De meeste downloadopties vindt u op de menubalk, maar ze zijn ook toegankelijk via de knoppen van de mappen Web, Extra en Help. Zo kunt u bijvoorbeeld via de map Bestand | Nieuw een nieuwe download starten. 2. De standaardknoppenbalk bevat snelkoppelingen naar de belangrijkste opdrachten. Klik op Binnenhalen om het binnenhalen van de site te starten. Klik op de knop Resultaten om off line te surfen na het binnenhalen. 3. In de map Web vindt u de inhoud van de downloads (HTML-pagina’s, beelden, formulieren) en de downloadparameters die toegankelijk zijn via de knop Eigenschappen. 4. In de map Extra vindt u de functies voor zoekopdrachten en beheer van downloads op een later tijdstip. 5. In de statusbalk vindt u informatie over de binnengehaalde webpagina. 6. De boomstructuur van de links geeft de structuur van de binnengehaalde site weer. 7.Via het overzichtsvenster krijgt u meteen een visuele voorstelling van het document dat werd geselecteerd in de boomstructuur.
34
MemoWeb 3 - Even voorstellen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 35
Binnenhalen Vooraleer u start met het binnenhalen van een website, moet u zo nauwkeurig mogelijk de kenmerken omschrijven van de opdracht die u MemoWeb toevertrouwt. Deze beschrijving is gebaseerd op vier hoofdcriteria: • Vanaf waar beginnen? • Waar opslaan op uw schijf? • Hoe en wat binnenhalen? • Wanneer binnenhalen? U zult vaststellen dat deze punten bij de voorbereiding van het binnenhalen stap voor stap aan bod komen. Druk hier op de knop Nieuw of selecteer het commando menu Bestand | Nieuw... MemoWeb zal u nu begeleiden bij de verschillende stadia die de voorbereiding van het binnenhalen in beslag neemt.
Snel binnenhalen Voorbereiding Vanaf waar beginnen? Er wordt gestart vanaf de uitgangs-URL. Vooraleer het binnenhalen kan worden gestart, moet u MemoWeb het punt aanduiden op het internet waarop het programma moet beginnen zoeken. Dit startpunt is doorgaans een hoofdpagina (welkomstpagina) van een website, maar kan ook een pagina zijn die zich dieper in de boomstructuur van de server bevindt. Het basisadres van de binnenhaalopdracht is een URL (Uniform Resource Locator). Die bestaat uit de naam van de server, een map en de naam van een HTML-bestand. Voorbeelden:
http://www.goto.fr/ http://www.goto.fr/ACH/achpreswe.htm (de http:// is facultatief)
Als u dat wilt, kunt u de binnenhaalopdracht een naam geven. Ga vervolgens naar de volgende stap. Tip: Het rolmenu rechts van het logo van uw browser geeft u de mogelijkheid om een adres te openen uit de favorieten van uw Internet Explorer of uw Netscape Navigator. Waar opslaan op uw schijf? MemoWeb slaat de binnengehaalde documenten op in een map. Die map vormt de lokale website. Deze map bevat: • de binnengehaalde bestanden • het bestand met de structuur van de website MemoWeb slaat tevens de boomstructuur op van de binnengehaalde website. Het is deze structuur die het programma onder meer in staat stelt om eenzelfde MemoWeb 3 - Binnenhalen
35
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 36
bestand geen twee keer op te vragen en om het binnenhalen na een onderbreking verder te zetten. Dit bestand bevindt zich steeds in een directory met binnengehaalde bestanden, die local.web heet. • de overzichtspagina's (map INDEX) en de pagina met de algemene index_Start.htm. Selecteer deze doelmap met behulp van de knop Bladeren... en ga naar de volgende stap. Er zijn twee manier om websites op een schijf op te slaan: • in één map: alle bestanden van een website worden opgeslagen in dezelfde directory, wat het kopiëren van een website naar een andere drager (een via het netwerk gedeelde schijf, een diskette, een CD-ROM, enz.) vereenvoudigt. Bij dubbele bestandsnamen hernoemt MemoWeb de bestanden om problemen te vermijden. • in een boomstructuur: MemoWeb reproduceert lokaal de mappen en submappen naarmate het deze op de servers tegenkomt, en voegt er een map aan toe op basis van de domeinnaam (vb. www.goto.fr/). Als u kiest voor de boomstructuur, moet u het vakje Boomstructuur van site behouden aanvinken vooraleer u begint met binnenhalen. MemoWeb kent standaard lange namen toe (formaat Windows 95) aan de bestanden die het binnenhaalt, behalve wanneer de optie Korte namen gebruiken werd aangevinkt (vooraleer u de site binnenhaalt). De binnengehaalde bestanden krijgen dan een naam van 11 karakters in het formaat van Windows 3.1 (8 voor de naam + 3 voor de extensie) op basis van de oorspronkelijke naam die wordt gebruikt om dit bestand op het internet te adresseren. De volledige structuur van de binnengehaalde website wordt opgeslagen in een bestand dat zich eveneens in een opslagmap bevindt met de naam local.web. Het is dit bestand dat u moet selecteren bij het Openen om een eerder binnengehaalde website te raadplegen.
Hoe en wat binnenhalen? U gaat nu aanduiden wat u wilt binnenhalen en hoe dat moet gebeuren. • Hoe u het doet, hangt af van de zoekbeperkingen die u MemoWeb oplegt. • Wat u binnenhaalt, hangt af van de documenttypes die u wilt binnenhalen. Om het u wat makkelijker te maken, stelt MemoWeb u nu reeds voorbereide configuraties voor waarin zowel Wat (afbeeldingen, geluidsbestanden, HTML-bestanden) als Hoe (mappen, heel de site of enkel de eerste pagina) aan bod komt. Kiest u bijvoorbeeld voor de configuratie Alle afbeeldingen van de site, dan zal MemoWeb enkel de afbeeldingen van de site binnenhalen die door de uitgangs-URL zijn aangeduid. Deze typeconfiguraties zijn eigenlijk voorbeelden die u naar believen kunt personaliseren. Om uw eigen configuratie te creëren, wijzigt u de configuratie-instellingen voor het binnenhalen. Dat kan bijvoorbeeld via de knop Eigenschappen. In het menu Website selecteert u Lijst met typeconfiguraties en klikt u op De huidige configuratie opslaan.
36
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 37
Klik nu op OK om het binnenhalen te starten en zorg ervoor dat het vakje Onmiddellijk starten met binnenhalen (onderaan links) aangevinkt is. Als het vakje niet aangevinkt is, kunt u het binnenhalen vervolgens starten door op de knop Binnenhalen te klikken . MemoWeb geeft nu een aantal opties. Selecteer Volledig binnenhalen (met herinitialisering van de website) om het binnenhalen te starten vanaf een uitgangs-URL. Tip: MemoWeb stelt standaard steeds de optie voor die het meest geschikt is voor het type binnen te halen informatie.
Hoe het binnenhalen werkt Dit is voor u het minst vermoeiende gedeelte. U kunt nu koffie gaan drinken of MemoWeb op de achtergrond laten werken en andere dingen doen op uw PC. MemoWeb stopt het binnenhalen als alle links werden doorzocht, als alle documenten werden afgehaald of als de grenswaarden die voor het binnenhalen werden vastgelegd, bereikt zijn. Na het binnenhalen onderzoekt MemoWeb de toestand van de links. In dit stadium worden reële links vervangen door links die verwijzen naar de binnengehaalde bestanden of naar een foutpagina als de optie Doorverwijzing naar een lokale pagina van gefilterde of nog binnen te halen links werd aangevinkt. In dit stadium wordt de HTML-index van de binnengehaalde site aangemaakt.
Het resultaat Druk op de knop Resultaten om in uw browser de index te laden. De index is een nauwkeurig overzicht van de binnengehaalde elementen en rangschikt de documenten per type (HTML-pagina's, afbeeldingen, bestanden) en volgens de toestand van het document (vb. fouten). U kunt ook rechtstreeks in uw browser de samenvattende pagina _Start.htm laden. Er zijn nog twee andere opties: • De welkomstpagina van de website laden om off line de pagina's te bekijken die u net binnenhaalde. • Bladwijzers (bookmarks) laden (Zie Configuratie) Tip: Om onmiddellijk de welkomstpagina van de binnengehaalde site te laden, selecteert u de optie Welkomstpagina van binnengehaalde site laden bij indrukken van de knop «Resultaten» in het menu Voorkeurinstellingen | Configuratie | Opties. Als u de instellingen van het binnenhalen wilt verfijnen, ga dan naar Geavanceerd binnenhalen.
MemoWeb 3 - Binnenhalen
37
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 38
Geavanceerd binnenhalen We zagen eerder al dat het gemakkelijk is om met typeconfiguraties websites binnen te halen. Als geen enkele van deze configuraties voldoet aan uw wensen, kunt u zelf een nieuwe aanmaken en zelf de zoekbeperkingen (voor het doorzoeken van de HTML-pagina's van de site) vastleggen evenals de beperkingen betreffende het binnenhalen van documenten.
Het doorzoeken van HTML-webpagina's beperken Wat wordt bedoeld met “zoeken”? Laten we vertrekken van het adres dat u ingaf als uitgangs-URL voor de website die u wou binnenhalen. MemoWeb haalt eerst de pagina van de uitgangs-URL en analyseert de inhoud ervan om naar eventuele URL's (links) te zoeken die de pagina eventueel zou bevatten. MemoWeb past verschillende filters toe om te weten of deze links op hun beurt moeten worden doorzocht. Deze filters zorgen ervoor dat links worden doorzocht of dat dit net niet gebeurt. Met MemoWeb kunt u de te doorzoeken links filteren op basis van erschillende criteria: • het zoekniveau van de links • de types van binnen te halen documenten • analyse van HTML-pagina's en scripts • type, aantal en omvang van de bestanden
Zoekniveaus: hoe worden websites doorzocht? Het onderscheid tussen interne en externe links. Het initiële WWW-adres is het vertrekpunt van de zoekactie. De interne zoekdiepte van die website is 0. Een link wordt beschouwd als een interne link als hij tot dezelfde website behoort als het initiële adres, d.w.z. als de URL ervan tot hetzelfde domein behoort als het basisadres (zie de definitie van URL).
De zoekdiepte uitgedrukt in het aantal zoekniveaus van interne links Telkens een interne link wordt doorzocht, stijgt het zoekniveau. Pagina's waarnaar door de eerste pagina wordt verwezen, hebben dus niveau 1. Pagina's waarnaar door pagina's van niveau 1 wordt verwezen, krijgen niveau 2, enz. U kunt de zoekdiepte beperken door het aantal interne zoekniveaus te beperken in Doorzoeken. Een niveau 0 komt overeen met het binnenhalen van één enkele pagina. Het niveau is standaard vastgelegd op 255, wat hoger ligt dan de zoekdiepte van een doorsneesite.
38
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 39
De zoekdiepte uitgedrukt als zoekniveaus van externe websites Is gebaseerd op hetzelfde principe als voor interne links, met dat verschil dat externe links het mogelijk maken om het binnenhalen te beperken tot of juist uit te breiden naar meerdere websites. Een link wordt beschouwd als extern als de link deel uitmaakt van een site die niet de site is die het initiële, binnen te halen adres bevat, d.w.z. als de URL ervan niet tot hetzelfde domein behoort als het basisadres. Telkens een externe link wordt doorzocht, stijgt het externe zoekniveau. Aan websites waarnaar de startsite verwijst, wordt niveau 1 toegekend. Sites waarnaar wordt verwezen door sites van niveau 1, krijgen niveau 2, enz. Het externe zoekniveau heeft slechts betrekking op HTML-pagina's en niet op andere types van bestanden. Als een HTML-pagina een afbeelding bevat die zich op een andere site bevindt, wordt de afbeelding binnengehaald ook al is het externe zoekniveau 0. Deze parameter kan worden ingesteld met behulp van de knop Eigenschappen, tabblad Doorzoeken. Het externe zoekniveau bedraagt standaard 0, wat betekent dat enkel de site met het initiële adres wordt binnengehaald. Voorbeeld: MemoWeb haalt de pagina binnen van de uitgangs-URL http://www.goto.fr/index.html. Op deze pagina treft het programma de volgende links aan: http://www.goto.fr/REV/RevAcc.htm http://www.goto.fr/hpmin.htm http://minitel.goto.fr/index.html De twee eerste links verwijzen naar hetzelfde domein, namelijk goto, en hebben bijgevolg hetzelfde externe zoekniveau als de bronpagina (de uitgangs-URL): niveau 0. De derde link verwijst naar een domein dat verschilt van het domein dat in de bronpagina wordt vermeld en krijgt bijgevolg niveau 1 toegekend. De laatste link is een geval apart: deze link heeft dezelfde domeinnaam (goto) maar een andere computernaam: minitel.
Types van af te halen documenten Als de op het internet gesitueerde site u een bestand toestuurt, dan wordt deze voorafgegaan door een hoofding met het bestandstype. Dat gebeurt in een conventioneel formaat, dat MIME heet. Het MIME-type stelt uw systeem in staat om het type informatie te kennen dat het bestand bevat (uw systeem kan zich niet baseren op de extensie van het bestand aangezien deze kan variëren van systeem tot systeem). HTML-pagina's bijvoorbeeld zijn van het type tekst/html, terwijl GIF-afbeeldingen van het type afbeelding/gif zijn. MemoWeb stelt u in staat om zelf te bepalen welke bestandstypes er worden binnengehaald. Er worden standaard een twaalftal veel voorkomende types meegeleverd en u kunt voor elk van deze types aangeven of u bestanden van het formaat in kwestie al dan niet wenst binnen te halen. De extensie van een bestandsnaam wordt gekoppeld aan elk type, zodat MemoWeb in staat zou zijn om de naam te bepalen die aan elk bestand in functie van het type moet worden toegekend. MemoWeb 3 - Binnenhalen
39
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 40
De bestanden worden ingedeeld in categorieën: HTML, tekst, afbeeldingen, geluidsfragmenten, videoclips, scripts, enz. U kunt evenwel ook eigen categorieën aanmaken. Hiertoe klikt u met de rechtermuisknop op een bestandscategorie of dubbelklikt u erop. U kunt zo eveneens de maximum- of minimumomvang van het binnen te halen bestand specificeren. Het vakje Nieuwe aangetroffen types binnenhalen is standaard aangevinkt. Dit betekent dat wanneer MemoWeb een bestandstype tegenkomt dat het programma niet kent, het dit zal opslaan en toevoegen aan de tabel met bestandstypes. Deze tabel kunt u openen door na het binnenhalen Website | knop Eigenschappen | tabblad Bestanden aan te klikken. Tip: Beperk de omvang van de documenten. Als een site wordt binnengehaald, is het onmogelijk om op voorhand te weten hoeveel schijfruimte de bestanden zullen innemen. Het is bijgevolg verstandig om de omvang van de documenten te beperken of het aantal binnen te halen bestanden te beperken (zie Andere opties).
Analyse van HTML-pagina's en scripts Dit stadium bestaat uit drie gedeelten: • de resolutie van de link • geavanceerde analyse van webdocumenten (Java, Shockwave Flash en VRML) • analyse van Javascript-code
De resolutie van links Het is mogelijk om aan het MemoWeb-logo onderaan de pagina een link toe te voegen naar de oorspronkelijke URL om naar de binnengehaalde site te kunnen gaan. In MemoWeb Flash kan deze optie niet worden uitgeschakeld. Er wordt tevens voorgesteld om de gefilterde of nog binnen te halen links naar een lokale pagina te doen verwijzen. Als MemoWeb een niet-binnengehaalde pagina tegenkomt, wordt deze vervangen door een pagina waarop de reden van het niet-binnenhalen wordt uiteengezet: • _badlink.htm: de link werd niet binnengehaald omdat het binnenhalen werd onderbroken • _erreur.htm: alle types frequente foutmeldingen op het internet (pagina niet gevonden, toegang geweigerd...) • _filterXX.htm: de link werd weggefilterd door de zoekniveaus. Er worden automatisch thumbnails aangemaakt van de binnengehaalde pagina's. Zo krijgt men een overzicht van de lokale site.
Geavanceerde analyse Duid hier aan of u wenst dat MemoWeb de nodige bestanden en de bestaande links in documenten van het type Java, Shockwave Flash of VRML moet detecteren. Opgelet! Of binnengehaalde documenten ook daadwerkelijk functioneren, kan niet worden gegarandeerd. Dat hangt immers in sterke mate af van de interne structuur van de documenten. Java:
40
MemoWeb 3 haalt niet alleen JAVA-applets binnen (bestanden met de extensie .CLASS), maar tevens alle andere .CLASS-bestanden die noodzakelijk zijn om deze applet goed te laten functioneren. Het volstaat dat u hiertoe het vakje JAVA-applets aanvinkt.
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
VRML:
11/10/2000 12:26
Page 41
3D-scènes zijn editeerbare tekstbestanden van het type VRML (Virtual Reality Modelling Language) en met extensie .WRL. MemoWeb analyseert op dezelfde manier als bij HTML-pagina's de inhoud van deze scènes om naar links te zoeken in afbeeldingen, patronen en andere gelinkte scènes in het document. Vervolgens vervangt het programma de werkelijke URL's door hun equivalent op de lokale site: dit is het stadium waarin de resolutie van de links plaatsvindt. Hiertoe moet enkel het vakje VRML 1.0 en 2.0 worden aangevinkt.
Shockwave Flash: MemoWeb haalt het .swf-bestand van de Flash-animatie binnen evenals alle andere .swf-bestanden die nodig zijn om de animatie goed te laten functioneren. Hiertoe vinkt u het vakje Macromedia Shockwave Flash aan.
Analyse van de Javascript-taal Sommige HTML-pagina's maken gebruik van Javascript om uitgebreide acties uit te voeren: voorbeelden zijn het wijzigen van een afbeelding als de muisaanwijzer eroverheen gaat (of acties bij onmouseover, onmouseout, onload) en invulformulieren. Er zijn drie soorten Javascript: • Javascript dat automatisch start als een HTML-pagina wordt geladen (vb. detecteren van de browser die wordt gebruikt om pagina's met verschillende inhouden te tonen). • Acties die gekoppeld zijn aan gebeurtenissen, zoals het passeren met de muisaanwijzer, het klikken op een link of het laden van een pagina. MemoWeb vervangt de links in de te analyseren documenten door de naam van het lokale bestand. Het programma zet het http://-adres met andere woorden om in een bestand met een lokaal adres. • Eenvoudige formulieren: MemoWeb is in staat om eenvoudige formulieren te verwerken, d.w.z. formulieren die de gebruiker niet hoeft in te vullen (rollijsten, aan te vinken vakjes, radioknoppen). Andere types van formulieren kunnen worden verwerkt nadat ze eerst werden binnengehaald (zie Formulieren). MemoWeb past steeds de Javascript-code aan om het script off line te kunnen uitvoeren. Opmerking: Omdat de verschillende versies niet compatibel zijn met alle browsers, geeft een rolmenu u de mogelijkheid om de gewenste browser uit te kiezen (Netscape of Internet Explorer).
Andere opties Hier kunt u voor het binnenhalen de gewenste opties en beperkingen instellen.
Opties voor het binnenhalen» Specificeer hier als u: • afbeeldingen wilt afhalen die als achtergrond worden gebruikt • enkel links wilt binnenhalen die naar andere pagina's verwijzen • FTP-documenten wilt afhalen • de maximale duur van het binnenhalen wilt vastleggen • geen pagina's met frames wilt binnenhalen
Beperkingen De volgende beperkingen kunnen worden ingesteld: • Het maximumaantal binnen te halen bestanden • De plaats die de bestanden maximaal op de vaste schijf mogen innemen • De minimumomvang van de binnen te halen bestanden • De maximumomvang van de binnen te halen bestanden Alle instellingen voor geavanceerde configuraties zijn aan bod gekomen. Klik nu op OK om het binnenhalen te starten en zorg ervoor dat het vakje Onmiddellijk starten met binnenhalen (onderaan links) aangevinkt is.
MemoWeb 3 - Binnenhalen
41
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 42
Als het vakje niet aangevinkt is, kunt u het binnenhalen vervolgens starten door op de knop Binnenhalen»te klikken MemoWeb stelt u voor om: • de site volledig binnen te halen (met herinitialisering van de website) • het binnenhalen af te ronden • de binnengehaalde site bij te werken • foute URL's uit te testen en het binnenhalen af te ronden Daarbij komen nog de mogelijkheden om de modem na het binnenhalen de verbinding te laten verbreken en om het binnenhalen op een later tijdstip te plannen.
Het binnenhalen verfijnen Nadat de site een eerste keer werd binnengehaald, kan elk documenttype dat MemoWeb tegenkomt, een voor een worden binnengehaald dankzij de boomstructuur van de links, die functioneert op een manier die vergelijkbaar is met de Verkenner van Windows. Deze modus is toegankelijk via Website en de knoppen HTML-pagina's, formulieren, afbeeldingen, gemapte afbeeldingen, documenten, e-mailadressen en niet-werkende links.
HTML-pagina's Een boomstructuur toont u de HTML-pagina's die MemoWeb bij het binnenhalen aantrof evenals de status ervan (binnengehaalde pagina, binnen te halen pagina of pagina gefilterd door het interne of externe zoekniveau). MemoWeb stelt een aantal oplossingen voor om de link binnen te halen al naargelang de documentstatus. Voorbeeld: tegenover een URL staat een beschrijving die de status Gefilterd door het zoekniveau voor externe websites aangeeft. Klik op de link; in het overzichtsvenster stelt MemoWeb u het volgende voor: • het binnenhalen van het document forceren • het zoekniveau van de externe domeinen verhogen met 1 niveau • het domein «www.domeinnaam.com» te doorzoeken. U kunt het programma bijvoorbeeld vragen om maximaal 7 niveaus te doorzoeken. Nadat u uw keuze heeft gemaakt, klikt u op Accepteren. MemoWeb houdt onmiddellijk rekening met uw wijzigingen. Het menu Bestand geeft u tevens de mogelijkheid om het al dan niet binnenhalen van links te specificeren. Dat doet u door het volgende te kiezen: • Het binnenhalen van een document forceren (heeft betrekking op één enkele link). • Het afhalen van het nog binnen te halen document te verbieden (heeft betrekking op één enkele link). • Het binnenhalen van de links die een pagina bevat, te forceren (heeft betrekking op alle links). • Het binnenhalen van links die een pagina bevat, te verbieden (heeft betrekking op alle links). • Het binnenhalen van de links niet langer verbieden of forceren; alle acties annuleren die het binnenhalen forceren of verbieden.
42
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 43
Formulieren Sommige pagina's kunnen worden bezocht nadat de bezoeker een formulier heeft ingevuld en gevalideerd. Dat is bijvoorbeeld het geval bij zoekmachines. MemoWeb zoekt naar alle mogelijke eenvoudige combinaties, zodat het programma deze lokaal zou kunnen uitvoeren. Zo hoeft u enkel het formulier off line in te vullen en het te valideren. Dat gebeurt ofwel door op een bevestigingsknop te klikken die in het formulier is voorzien, ofwel door te klikken op de rechtermuisknop en Formulier valideren in te vullen. MemoWeb genereert vervolgens nieuwe, binnen te halen URL's. Na het binnenhalen moet u de site opnieuw laden. Lokaal volstaat het dat u vervolgens het formulier [formulaires.eps] invult om naar de volgende pagina's te kunnen gaan. Merk op dat u met een druk op de rechtermuisknop in het formulier ook alle binnenhaalverzoeken kunt annuleren, het formulier kunt herinitialiseren en automatisch verzoeken kunt genereren.
Gemapte afbeeldingen De weergavestandaard HTML is voorzien van een functie waarmee afbeeldingen worden getransformeerd tot multifunctionele knoppen: een afbeelding kan in geometrische zones worden opgedeeld, waarbij elke zone aan een andere link wordt gekoppeld. Deze mogelijkheid wordt vooral gebruikt om geografische kaarten weer te geven, maar op websites ziet men vaak dat een keuzemogelijkheid, die in hypertekst wordt weergegeven, wordt vervangen door een afbeelding van dit type. Er zijn twee soorten aanklikbare afbeeldingen: • afbeeldingen waarvan de opdeling rechtstreeks is vastgelegd in de broncode van de HTML-pagina die de afbeelding bevat (client side). MemoWeb haalt met de HTML-pagina ook de definiëring van de zones mee binnen en kan het mechanisme op die manier reproduceren in de lokale versie van de website. • afbeeldingen waarvan de opdeling is vastgelegd in een bestand dat niet toegankelijk is en zich op de server op het internet bevindt (server side). Als de gebruiker op de afbeelding klikt, verstuurt hij hiermee de coördinaten van de muisaanwijzer naar de server. Op basis van die informatie stuurt de server de gebruiker door naar een welbepaalde link. Bij het binnenhalen is het per definitie onmogelijk om alle mogelijk klikposities van de afbeelding te simuleren om het reactiegedrag van de website weer samen te stellen. MemoWeb gebruikt een speciale en exclusieve techniek om aanklikbare afbeeldingen van het type server side te verwerken. Als u op de knop Gemapte afbeeldingen klikt, krijgt u een lijst te zien van de aanklikbare afbeeldingen die de binnengehaalde website bevat. Dankzij dit systeem kunt u elk van deze afbeeldingen laden en zelf de zones bepalen die naar uw mening naar een andere link verwijzen (zie Editeren).
MemoWeb 3 - Binnenhalen
43
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 44
Als alle zones werden gedefinieerd, sla de zonedefiniëring dan op. Het derde stadium bestaat erin, de binnengehaalde site te openen. MemoWeb haalt nu de links binnen die aan elke zone zijn gekoppeld en stelt lokaal de aanklikbare afbeeldingen van het type client side weer samen.
Niet-werkende links Sommige niet-werkende links worden door MemoWeb om uiteenlopende redenen niet binnengehaald: • de link werd weggefilterd door het zoekniveau voor externe websites • de link werd weggefilterd door het zoekniveau voor interne websites • de pagina kon niet worden gevonden (fout 404). Raadpleeg deel HTML-pagina's (zie eerder) voor meer details.
De binnengehaalde website bijwerken Als u de voorbereidende binnenhaalprocedure achter de rug heeft, stelt MemoWeb u met een druk op Binnenhalen en al naargelang de status van uw binnenhaalactie het volgende voor: • de site volledig binnen te halen (met herinitialisering van de website) • het binnenhalen af te ronden • De binnengehaalde site bijwerken • foute URL's uit te testen en het binnenhalen af te ronden Selecteer Binnengehaalde site bijwerken. MemoWeb begint nu de links bij te werken. Voor elk binnengehaald bestand vraagt MemoWeb aan de servers of er sinds de laatste keer geen wijzigingen hebben plaatsgevonden (verifiëring van de datum van de laatste wijziging van het bestand). Als dat het geval is, wordt het bestand vervangen door de nieuwe versie. Bij HTML-pagina's wordt de inhoud geanalyseerd om na te gaan of er nieuwe links zijn die moeten worden doorzocht. Nadat MemoWeb de links op een tijdstip in de toekomst geactualiseerd zal hebben, voert het programma de functie Wissen van dode links uit. Dit houdt in dat bestanden, die niet langer actueel zijn, worden gewist zodat op de vaste schijf onnodige plaatsverspilling wordt vermeden. Opgelet! Dit vindt maar plaats als alle links bijgewerkt zullen zijn en er geen enkel bestand meer moet worden binnengehaald. Hierdoor is het mogelijk dat de map met binnengehaalde gegevens ongebruikte bestanden bevat.
Het binnenhalen op een ander tijdstip laten plaatsvinden Een van de interessantste functies van MemoWeb bestaat erin, dat het programma automatisch op een welbepaalde dag en een welbepaald tijdstip, zonder enige interventie van uwentwege sites of bestanden kan binnenhalen. MemoWeb maakt hiertoe gebruik van een planningssysteem (als deze manager actief is, ziet u de knop ervan op de programmabalk van Windows). Het binnenhalen op een later tijdstip stelt u in via Extra | Geplande werkzaamheden of via de knop Geplande werkzaamheden van het tabblad Extra. Deze manager voor het binnenhalen op een later tijdstip functioneert als een wekker: • de manager kan MemoWeb starten als het programma niet geladen is • de manager beheert een takenlijst.
44
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 45
Wat is een opdracht? Een taak is een geheel van werkzaamheden (binnenhalen, bijwerken, enz. ) die na elkaar worden uitgevoerd. Er kan op een gegeven moment slechts één enkele taak en één enkele werkzaamheid bezig zijn (dat komt omdat slechts één exemplaar van MemoWeb tegelijk in het geheugen geladen kan zijn). De eerste actie is dus het Een nieuwe opdracht aanmaken.
Een nieuwe opdracht aanmaken Klik achtereenvolgens op Taak | Nieuwe taak... | Starten. • Taken kunnen gemakkelijk worden ingesteld. Hiertoe hoeven slechts drie zaken te worden ingesteld: Wanneer starten? Wanneer stoppen? Wat moet er gebeuren als de taak is afgewerkt?
Wanneer starten? U kunt ervoor kiezen om de taak maandelijks, wekelijks, dagelijks of op ongeregelde momenten uit te voeren, op een door u gekozen tijdstip. U kunt bijgevolg op eenvoudige wijze al uw favoriete websites op maandagmorgen laten bijwerken zodat de taak is afgewerkt als u op kantoor komt, of op maandagmiddag terwijl u gaat eten.
Wanneer stoppen? U moet de maximumduur (in minuten) instellen die de taak in beslag mag nemen. Deze waarde is facultatief. Als u dit vakje niet aankruist, zal de taak stoppen als alle werkzaamheden zijn afgerond.
Wat moet er gebeuren als de taak is afgewerkt? MemoWeb stelt voor om de modemverbinding te verbreken en om vervolgens het programma af te sluiten.
Websites toevoegen aan de opdracht Dit doet u eenvoudigweg met de commando's Taak | Nieuwe taak... | Websites. Er verschijnt een dialoogvenster met de lijst van de laatst binnengehaalde sites. Kies een of meerdere sites (in de modus toevoegen aan lijst) en selecteer vervolgens de uit te voeren werkzaamheden: • De site volledig binnenhalen (met herinitialisering van de website): MemoWeb zal het binnenhalen opnieuw starten van het begin en zal daarbij alle bestanden wissen. Alle links in de pagina's zijn in dat geval definitief verloren. • Het binnenhalen stoppen: MemoWeb zal de links binnenhalen die nog niet werden binnengehaald. • De binnengehaalde site bijwerken : MemoWeb werkt op die datum de binnengehaalde links bij. • foute URL's uit te testen en het binnenhalen af te ronden Tip: de resolutie van de links kan veel tijd in beslag nemen. Daarom kan het beter zijn om dit niet te doen bij een lopende verbinding om de communicatiekosten niet al te hoog te laten oplopen. U kunt de resolutie van de links op een later tijdstip uitvoeren. U kunt deze activiteit beperken tot enkele minuten.
MemoWeb 3 - Binnenhalen
45
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 46
Met de modem een verbinding tot stand brengen Als u bij Voorkeurinstellingen | Configuratie | Internetverbinding de optie Er is geen internetverbinding... heeft aangevinkt, zal MemoWeb automatisch een verbinding tot stand brengen als het programma de taak gaat uitvoeren. Nadien verbreekt MemoWeb de verbinding na het uitvoeren van de opdracht als u bij de opties het vakje Modemverbinding verbreken... aanvinkte.
Andere functies van het menu Taak Als u het binnenhalen op een later tijdstip heeft gepland, kunt u uw planning nog wijzigen via het menu Taak. Op deze manier kunt u: • De geplande taken wissen: als een geplande binnenhaalactie werd beëindigd, maakt MemoWeb een logbestand aan. • Taken wissen, kopiëren of plakken • Taken starten, stoppen of onderbreken. Tip: Als u de grootte van het programmavenster wilt verkleinen bij de uitvoering van een binnenhaalactie op een later tijdstip, selecteer dan MemoWeb verkleind weergeven tijdens binnenhalen in het menu Opties van het gedeelte Werkzaamheden later plannen.
De inhoud van een binnengehaalde site gebruiken Nadat de bestanden werden binnengehaald, heeft u de mogelijkheid om de verschillende types binnengehaalde bestanden te gebruiken. Via het menu Website krijgt u een overzicht van de Afbeeldingen, de E-mailadressen, de Niet-werkende links en de andere types van Documenten (vb. videofragmenten van het type .mov) die werden binnengehaald. Alle documenten worden opgenomen in een boomstructuur van links die veel weg heeft van de Verkenner van Windows. Merk op dat u met de ster bijgewerkte documenten kunt sorteren. Tip: Als u verschillende HTML-documenten selecteert, verschijnt in het menu "Editeren" de optie Geselecteerde pagina's afdrukken. Voor Afbeeldingen, Niet-werkende links en andere types van Documenten is er een gelijkaardig menu dat u in staat stelt om: • het document te openen • het document in uw browser te openen • de homepage te doorzoeken om pagina's te vinden die gekoppeld zijn aan het document • om een nieuwe website te creëren vanaf deze URL en deze pagina zo te beschouwen als de eerste pagina van een nieuwe site • om het document te registreren, te kopiëren of af te drukken • alle HTML-thumbnails aan te maken • een gedetailleerd rapport aan te maken van de niet-werkende links. E-mailadressen kunnen rechtstreeks worden gebruikt via het menu Adres, dat u de mogelijkheid biedt om: • e-mails te exporteren in tekstformaat (.txt of .csv) , HTML (.htm) of dBase III (.dbf) • naar dit adres een bericht te sturen • dit adres te kopiëren.
46
MemoWeb 3 - Binnenhalen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 47
De zoekfunctie Met MemoWeb 3 kunt u: • pagina's die welbepaalde links bevatten, doorzoeken • HTML-pagina's doorzoeken op tekst in de pagina of in de paginatitels • URL's doorzoeken met filters. Het programma gebruikt hiertoe een filter in tekstformaat die de speciale karakters * en? aanvaardt. Het karakter * vertegenwoordigt elke groep karakters tot het karakter dat volgt op het karakter *. Het karakter? vervangt één individueel karakter. U kunt snel pagina's doorzoeken op een link met behulp van de menu's in HTML-pagina's, Afbeeldingen, Onbekende links, enz.
MemoWeb 3 - Binnenhalen
47
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 48
De algemene voorkeuren instellen Met het menu Voorkeurinstellingen | Configuratie kunt u de werking en de weergave van MemoWeb instellen.
Algemeen Gelijktijdige verbindingen • Het aantal maximumsockets komt overeen met het aantal verbindingen dat tegelijk kan openstaan. Een socket komt overeen met een lijn in de opvolgingszone in de map Binnenhalen. Het toegelaten maximumaantal is vastgelegd op 16. Als u een relatief trage computer heeft, verdient het de voorkeur om het aantal sockets te verlagen tot 3 of 4. • De maximale wachttijd bepaalt de periode waarna een onbeantwoord verzoek als mislukt wordt beschouwd. Deze periode komt overeen met één verzoekpoging en moet worden gekoppeld aan het aantal pogingen om een verbinding tot stand te brengen vooraleer het verzoek als mislukt wordt beschouwd. De maximale wachttijd bedraagt standaard 30 seconden. Bij grote drukte op het internet, bij overbelaste servers of als gevolg van andere redenen die een vermindering van bandbreedte tot gevolg hebben, kan het nuttig zijn om deze wachttijd te vergroten. • Het aantal pogingen om een verbinding tot stand te brengen vooraleer een foutmelding wordt gegeven, komt overeen met het aantal herhalingen bij vergeefse verzoeken.
Beperkingen Als deze optie is aangevinkt, onderbreekt MemoWeb het binnenhalen als het aantal aangetroffen fouten groter is dan 30 (standaardwaarde). In een dergelijk geval kunt u het binnenhalen hervatten door op de knop Binnenhalen | Mislukte verbindingen opnieuw proberen en het binnenhalen afsluiten. Het binnenhalen van een bestand onderbreken als de tijdsafstand tussen de gegevens groter wordt dan 30 seconden (standaardwaarde): de server geeft voorrang aan kleine bestanden en de kans is bijgevolg groot dat het binnenhalen van bestanden van verschillende megabytes maar blijft duren. De beste oplossing hiervoor bestaat erin, de transmissieperiode tussen de gegevenspakketjes te begrenzen. De gemiddelde transmissiesnelheid is gebaseerd op hetzelfde principe maar heeft betrekking op de gemiddelde snelheid waarmee bestanden worden binnengehaald. Door het aantal verzoeken per server te beperken tot drie (standaardwaarde) kan de bandbreedte beter worden benut. Als MemoWeb van verschillende servers tegelijk bestanden binnenhaalt, is de activiteit evenwichtiger verdeeld en is ze bijgevolg efficiënter. Opmerking: als MemoWeb slechts op één server actief is, gebruikt het programma het maximum aantal verbindingen.
HTTP- en FTP-parameters Sommige webservers eisen dat de clientsoftware (de zgn. agent) zich identificeert aan de hand van een handtekening. Zonder deze handtekening kunnen ze de aanvraag (het HTTP-verzoek) van het document weigeren, wat bij het binnenhalen een foutmelding geeft. Dankzij deze informatie weet de server met welke software hij communiceert zodat hij op een geschikte manier kan reageren. Via een rolmenu kunt u het gebruik van een handtekening van een bij de servers bekende handtekening (vb. die van Internet Explorer 5) instellen, tenzij uw internetaanbieder dit zou afraden. • Als u de optie FTP-documenten downloaden in de map Configuratie aanvinkte, moet MemoWeb
48
MemoWeb 3 - De algemene voorkeuren instellen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 49
zich kunnen identificeren als het een verbinding met een FTP-server tot stand brengt. Die identificatie gebeurt met een gebruikersnaam en een wachtwoord. In de meeste gevallen vindt een FTP-verzoek van het type anonymous plaats (zonder wachtwoord). Daarbij wordt evenwel gebruik gemaakt van een e-mailadres, dat als login dienst doet. • De optie Verzoeken uitvoeren met HTTP-protocol 1.1 verbetert theoretisch gezien de snelheid van de verbinding en bijgevolg van de snelheid waaraan bestanden worden binnengehaald. HTTP-protocol 1.1 wordt gebruikt door servers van de nieuwe generatie en maakt binnenhalen in één snelle beweging mogelijk. • Met de optie Cookies aanvaarden en gebruiken integreert MemoWeb systematisch bij alle verzoeken de cookies die het van servers ontving. Deze functie is maar nuttig bij welbepaalde servers en heeft tot doel, het programma als een browser te laten functioneren.
Internetverbinding MemoWeb kan via uw modem automatisch een internetverbinding tot stand brengen. Het programma maakt hiertoe gebruik van de netwerkmogelijkheden van Windows. Selecteer een verbinding uit de lijst met beschikbare verbindingen en kruis het vakje De volgende verbinding gebruiken aan. De verschillende inbelmogelijkheden onder Windows vindt u met behulp van Starten | Programma's | Accessoires | Netwerkverbinding. De verbinding wordt maar verbroken als men bij de voorgestelde opties het vakje Modemverbinding verbreken na het binnenhalen aanvinkt, als men op Binnenhalen klikt of nadat een geplande taak werd uitgevoerd. Bijzonderheden van Windows NT4: Onder dit besturingssysteem moet u het pad van de map met het telefoonboek (phone book) van Windows aanduiden. Dit bestand heet normaal RASPHONE.PBK en bevindt zich in de map System32.
Webbrowser Browsersoftware Detectie van de browser De browsersoftware wordt normaal automatisch gedetecteerd als MemoWeb voor het eerst wordt gestart. Als het pad en de naam van de browser niet in het invoerveld verschijnen, kruis dan het vakje Automatische detectie van de HTML-browser aan of gebruik de knop Zoeken. Als op de schijf verschillende browsers staan, selecteert MemoWeb automatisch de laatst gebruikte. Als u het vakje Browser starten na binnenhalen aankruist, zal MemoWeb automatisch de samenvatting _Start.htm openen in de browser nadat een Resolutie van de links heeft plaatsgevonden.
Een knop Binnenhalen toevoegen aan de werkbalk van Internet Explorer Met deze functie kunt u een snelkoppeling plaatsen op de werkbalk van uw browser, zodat u rechtstreeks de site kunt binnenhalen die u op dat moment bezoekt. Een dergelijke snelknoppeling is evenwel maar mogelijk vanaf versie 5.0 van Microsoft Internet Explorer. Deze optie is uitgeschakeld als u Internet Explorer niet instelde als standaardbrowser. Als u deze optie inschakelde maar de snelkoppeling niet verschijnt in de werkbalk van Internet Explorer, moet u hem manueel toevoegen met de functie Personaliseren... in het menu Weergave | Werkbalk van de browser.
MemoWeb 3 - De algemene voorkeuren instellen
49
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 50
Bijzonderheden Windows NT: Om in Internet Explorer een knop te kunnen toevoegen, moet men de toegangsrechten van Administrator hebben.
Sneltoetsen en bladwijzers Het vakje Automatisch snelkoppeling toevoegen geeft de mogelijkheid om automatisch de volgende elementen te integreren: • Een bladwijzer in het bestand met de bookmarks van de browser en die gereserveerd is voor lokale websites. De bladwijzer verwijst naar de welkomstpagina van de binnengehaalde site. Bij Netscape Navigator kunt u het bestand Bookmarks.htm doorzoeken met behulp van Zoeken... . • Een internetlink (een bestand met de extensie .URL) naar de welkomstpagina in de map Favorieten. Deze favoriete links worden gebruikt door Internet Explorer. Als u gebruik maakt van Netscape, zal MemoWeb standaard nagaan of er een bestand is met bladwijzers en of er een map is met lokale websites. Als er geen dergelijke map is, wordt deze automatisch aangelegd. Met deze functie kunt u dus rechtstreeks lokale websites openen vanuit uw browser zonder dat u MemoWeb hoeft te starten. Ten slotte kunt u nog de naam van de map invoeren waarin de snelkoppelingen van de binnengehaalde bestanden moeten komen.
Proxyservers Een proxy functioneert als een lokaal cachegeheugen van de server. Internetaanbieders maken niet alleen gebruik van proxyservers om redenen van veiligheid (de proxy functioneert als een firewall), maar ook om de snelheid van de clientserver-communicatie op te drijven door de meest geraadpleegde sites op te slaan. Afhankelijk van uw internetaanbieder kan het verplicht zijn om een proxyserver te specificeren. Voorbeeld: Proxy-adres: proxy.infonie.fr poort:8080 Opgelet! MemoWeb beheert geen proxy's die gebruik maken van automatische configuraties. Het invoeren van een servernaam (vb. proxy.infonie.fr) of een IP-adres is verplicht. De proxy mag enkel gebruikmaken van het HTTP-protocol. Andere protocollen (socks) worden niet ondersteund. Als u op een intern bedrijfsnetwerk zit, moet u contact opnemen met uw netwerkbeheerder voor de nodige gegevens. Als uw proxy gebruikmaakt van een toegang die beveiligd is met een login en een wachtwoord, vul deze dan in. Bijzonderheden van de IIS-server van Microsoft U moet zich identificeren met de login en het wachtwoord dat u gebruikt om een sessie te openen op het NT-netwerk. Als u na verschillende vruchteloze pogingen van MemoWeb een foutmelding te zien krijgt van het type 407 (proxy authentication needed), neem dan contact op met uw netwerkbeheerder om de identificatiemodus BASIC (cleartext) te activeren. Standaard vindt de toegang tot dit type server plaats door middel van een eigen versleuteling (NTLM authentication) van de login en het wachtwoord. In de gevallen waarin de FTP-proxyserver dezelfde is als de HTTP-proxyserver (zelfde adres en zelfde poort), kruis dan het vakje HTTP-proxy gebruiken voor alle FTP-verzoeken aan.
50
MemoWeb 3 - De algemene voorkeuren instellen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 51
Bestanden uitsluiten Uitsluitingsbestanden voor zoekrobots (Robots.txt) Het uitsluitingsbestand van een site beperkt de zoekacties van MemoWeb tot de mappen en documenten waartoe de aangeroepen server toegang verleent. Via de configuratie van het programma kan worden ingesteld wat moet worden binnengehaald en wat niet.
Algemene uitsluitingslijst Zoals we eerder zagen, beperkt MemoWeb zijn zoekacties dankzij de links tussen de pagina's waaruit een website bestaat. Deze zoekbeperkingen zijn echter niet doeltreffend als: • er met hoge zoekniveaus wordt gewerkt en u niet wil dat MemoWeb een doolhof van links moet doorzoeken • u slechts een deel van een website wilt binnenhalen, zoals een paar samenhorende mappen • u sommige sites wilt vermijden (zoals www.microsoft.com, www.yahoo.com, enz.) • u een aantal bestanden van een welbepaald type, die zich in een map bevinden, wilt binnenhalen (vb. een geheel van samenhorende GIF-afbeeldingen: http://www.goto.fr/*.gif).
Reclamebanners Deze optie (die standaard uitgeschakeld is) geeft u de mogelijkheid om reclame bij het binnenhalen over het hoofd te zien en om de reclameboodschappen op uw PC te vervangen door de transparante afbeelding. Waar normaal de (weggefilterde) reclamebanner zou staan, plaatst MemoWeb dus een lege (transparante) afbeelding, zodat het grafische aspect van de binnengehaalde site behouden blijft.
De index genereren Aanmaken van HTML-pagina's MemoWeb biedt de mogelijkheid om miniatuurreproducties (zgn. thumbnails) van HTML-pagina's aan te maken. Het formaat van deze thumbnails varieert van 80x60 tot 160x200 pixels. Men kan de originele achtergrond van de thumbnails al dan niet behouden (afbeelding die als achtergrond dient). In dat geval wordt de standaardkleur gebruikt. Het tonen van de thumbnails tijdens het aanmaken ervan stelt de gebruiker in staat om het weergegevene te verifiëren. Dit vertraagt echter het proces. Aangezien deze operatie redelijk lang duurt (immers, eerst moet de HTML-pagina met de inhoud ervan worden geladen, vervolgens moet de afbeelding bewerkt en geconverteerd worden naar het GIF-formaat), wordt aangeraden om dit te doen als de site volledig is binnengehaald.
Afbeeldingenindex Deze functie geeft u de mogelijkheid om de weergave van de afbeeldingen in de indexpagina's te personaliseren. Dat gebeurt door het aantal rijen en kolommen evenals de afmetingen van de afbeeldingen aan te passen.
Opmaak van rapporten Wijzigt het aantal tekstregels voor de andere indexpagina's, d.w.z. de pagina's met diverse bestanden en de pagina's met foutmeldingen.
MemoWeb 3 - De algemene voorkeuren instellen
51
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 52
Opties Webstructuur In deze zone kunt u de naam van de hoofdmap vastleggen voor alle bestanden die u binnenhaalt. Opgelet! De keuze van een doelmap treedt pas in werking als een nieuwe website wordt gecreëerd. Als u deze map eenmaal heeft ingesteld, kunt u dit nadien niet meer wijzigen. MemoWeb stelt standaard een mapnaam voor die bestaat uit de standaardmap en een naam die afgeleid is van het internetadres van de site. Voorbeelden:
Voor het adres www.goto.fr stelt MemoWeb de mapnaam Goto voor. Voor het adres www.goto.fr/hpjeu.htm stelt MemoWeb de mapnaam Hpjeu voor.
Een map op de schijf kan slechts één binnengehaalde website bevatten. Als de map die u specificeert nog niet bestaat, zal MemoWeb de map automatisch aanleggen. Als de map bestaat en reeds bestanden van binnengehaalde sites bevat, stelt MemoWeb voor om de aanwezige bestanden te wissen. De structuur van de website (bestand local.web) wordt tijdens het binnenhalen standaard constant bijgewerkt, en wel na elke honderdste link die wordt binnengehaald.
Voorkeuren Stel MemoWeb in volgens uw wensen en gewoonten: • Voeg een snelkoppeling Website binnenhalen toe aan het startmenu: terwijl u aan het surfen bent, selecteert u in het startmenu van Windows Website binnenhalen om onmiddellijk te starten met het binnenhalen van de pagina waarin u zich bevindt. • Via een rolmenu kunt u de te laden pagina kiezen. Dat gebeurt met een druk op de knop Resultaten: ofwel wordt de welkomstpagina van de binnengehaalde site geladen, ofwel wordt de map met de binnengehaalde bestanden geopend. • Een geluidssignaal laten horen als het binnenhalen beëindigd is: duid het geluid aan dat u te horen wilt krijgen. • De achtergrondkleur van de mappenbalk wijzigen (standaardkleur grijs).
Overzichtsvenster Kies hier om de HTML-pagina in het visualiseringsvenster van MemoWeb in werkelijke grootte weer te geven of in de vorm van een thumbnail.
Lijsten tonen Kies hier de kleur van de links al naargelang hun status evenals het lettertype en de grootte ervan.
52
MemoWeb 3 - De algemene voorkeuren instellen
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 53
Contact De site van MemoWeb vindt u op het volgende adres: www.goto.fr/nl/memoweb3/
De nieuwste updates www.goto.fr/nl/memoweb3/maj/
De VVV (Veel Voorkomende Vragen) www.goto.fr/nl/memoweb3/faq/ Goto Software behoudt zich het recht voor om de informatie die op de website www.goto.fr wordt aangeboden, zonder kennisgeving te wijzigen of te verwijderen.
Technische vragen (Schrijf in het Frans of in het Engels) Per e-mail:
[email protected] Per fax: +33 (0)3 20 66 55 09 Ontdek alle producten van Goto Software: www.goto.fr/nl .
MemoWeb 3 - Contact
53
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 54
Woordenlijst Adres: zie URL CGI (Common Gateway Interface): Programmeertaal waarmee uitvoerbare routines kunnen worden ontwikkeld voor webservers die reageren op aanroeping door HTML-pagina's. CGI-routines worden doorgaans gestart bij het openen van de pagina en met een aantal parameters die door de HTML-pagina zelf of door gegevens van de gebruiker (formulier) vastgelegd kunnen zijn. CGI-toepassingen zijn zeer talrijk. Zo worden ze gebruikt om URL's te zoeken op basis van contextuele parameters, om tellers weer te geven en om complexere applicaties uit te voeren die gekoppeld zijn aan databanken. DNS (Domain Name Server): Een systeem dat zich op een internetsite bevindt en verzoeken behandelt om IP-nummers te achterhalen op basis van een meegedeelde URL. Routers (deze bevinden zich op elk knooppunt in het netwerk) versturen verzoeken naar servers op basis van IP-nummers. Domein: Op het internet aangesloten computernetwerk waaraan een naam (domeinnaam) wordt toegekend die geldt voor dat netwerk als geheel. Aan een domeinnaam is een klasse IP-nummers gekoppeld. De IPnummers van een klasse hebben dezelfde prefix, waardoor ze als computers van eenzelfde netwerk kunnen worden geïdentificeerd. FTP (File Transfer Protocol): Transmissieprotocol voor de verzending van bestanden via het internet tussen een FTP-server en FTP-client". HTML (HyperText Markup Language): Taal die informatiepagina's op het web beschrijft. Dankzij HTML kunnen in tekstpagina's multimediale elementen worden opgenomen (afbeeldingen, geluiden, videofragmenten) en met name hypertekstlinks naar andere pagina's, ongeacht of deze zich al dan niet op dezelfde server bevinden. HTML-pagina's worden met behulp van het HTTP-protocol ter beschikking gesteld door webservers in de vorm van tekstbestanden (broncode) en worden ten behoeve van de weergave gedecodeerd door de client met behulp van browsersoftware. HTTP (HyperText Transfer Protocol): Protocol voor de transmissie van gegevens via het internet tussen een webserver en een browser die met HTML-pagina's en daaraan gekoppelde elementen werkt. IP of TCP/IP (Internet Protocol): Naam van het protocol voor de transmissie van gegevens tussen twee verwijderde netwerken en waarvan het begrip «internet» is afgeleid.... Het gaat om een protocol van laag niveau dat wordt aangevuld door een protocol dat beantwoordt aan het applicatietype (HTTP, FTP, enz.). ISMAP: Afbeelding die gekoppeld is aan verschillende links in functie van de positie van de muisaanwijzer op het moment van aanklikken. De ISMAP kan «client side» of «server side» zijn. Dat is afhankelijk van de koppelingstabel, die de coördinaten van de muisaanwijzer koppelt aan de URL van de links. Bij «client side"»maakt de tabel deel uit van de HTML-pagina en voert de browser rechtstreeks de opdracht uit met de URL die in de tabel wordt gespecificeerd. Bij «server side» bevindt de tabel zich op de server en roept de browser de server aan met de coördinaten van de muisaanwijzer. De server deelt de browser vervolgens de aan te roepen URL mee. JAVA: Taal voor het ontwikkelen van applicatie (applets) die naar clientsystemen in de vorm van broncode worden verstuurd en die op die clientsystemen worden uitgevoerd door de browser (die bijgevolg JAVA moet ondersteunen). Volgens de makers van JAVA (Sun) ligt het grootste voordeel van de taal in de ontwikkeling van applicaties die onafhankelijk zijn van het besturingssysteem van de clientcomputer. Link: Koppeling van een URL aan een deel van het scherm dat aangeklikt kan worden. Als de gebruiker de zone in kwestie aanklikt, wordt de pagina getoond die door de URL wordt gespecificeerd. Aangezien de gespecificeerde pagina overal ter wereld gelokaliseerd kan zijn, kan men van de ene pagina naar de andere gaan door op de voorgestelde links te klikken. Dat wordt «surfen» genoemd. Een link kan aan een reeks karakters (tekst die doorgaans blauw onderlijnd op het scherm verschijnt en verandert van kleur als de link werd aangeklikt) zijn gekoppeld of aan een afbeelding (zie ISMAP voor afbeeldingen die verschillende links bevatten). In al deze gevallen neemt de browser deze links over in de pagina's en verandert de muisaanwijzer als men over de links passeert.
54
MemoWeb 3 - Woordenlijst
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 55
MIME (Multipurpose Internet Mail Extensions): Classificatie van objecten die gekoppeld zijn aan HTMLpagina's waardoor de browsersoftware ze kan decoderen. De verschillende MIME-types hebben met name betrekking op geluidsbestanden, afbeeldingen en videofragmenten. Browser (bladerprogramma): Programma waarmee clientsystemen op het internet zijn uitgerust en waarmee verzoeken naar webservers kunnen worden gestuurd en ontvangen HTML-pagina's gedecodeerd kunnen worden. De bekendste browsers zijn Netscape Navigator en Microsoft Internet Explorer (MSIE). IP-nummer: Identificatienummer van een computer die op het internet is aangesloten. PROXY: Systeem dat zich op een internetsite bevindt en dat functioneert als een cachegeheugen voor een welbepaalde groep gebruikers. De proxyserver slaat op verzoek van de gebruikers op zijn eigen schijven alle internetinformatie op. Als de server van een gebruiker een nieuw verzoek krijgt, controleert hij eerst of hij niet zelf over de gevraagde informatie beschikt. Pas wanneer hij niet zelf over de informatie beschikt, «verbindt hij door» met het internet. Door gebruik te maken van een proxyserver kan de toegang tot de meest geraadpleegde servers aanzienlijk worden versneld. Shockwave Flash: Vectorieel animatieformaat dat in gebruik is op het internet en werd gelanceerd door het bedrijf Macromedia. Veronderstelt de aanwezigheid van een specifieke insteekmodule (plug-in) op uw systeem, zodat deze laatste het Flash-formaat zou begrijpen. Socket: Logische communicatie tussen twee systemen die via het internet met elkaar in verbinding staan. In tegenstelling tot analoge verbindingen (telefoon), waarbij de communicatie fysiek tussen twee gebruikers tot stand komt en die blijft duren tot het einde van de verbinding, komen digitale verbindingen maar tot stand gedurende de tijd die nodig is om gegevens uit te wisselen tussen de client en de server. Bij de verzending van een verzoek door een clientsysteem, wordt met de server een socket geopend, die door de server wordt gesloten zodra de gevraagde gegevens werden verstrekt. Bij modemverbindingen betekent het sluiten van een socket niet dat de communicatie wordt verbroken. Zolang de modemverbinding bestaat, kunnen tegelijk verschillende sockets geopend worden. URL (Uniform Resource Locator): Syntax aan de hand waarvan een dienst kan worden gelocaliseerd op het internet evenals het protocol dat wordt gebruikt om de dialoog met de applicatie tot stand te brengen. Bij internetdiensten die gebruikmaken van het HTTP-protocol, neemt de URL volgende vorm aan: http://naamcomputersysteem.domeinnaam.landaanduiding:poortnummer/map/bestand snaam De URL is het adres van een dienst op het internet. VRML (Virtual Reality Modelling Language): VRML is een driedimensioneel browsersysteem dat vooral door Silicon Graphics en Intervista Software werd ontwikkeld. WEB, World Wide Web of WWW: Letterlijk: «Wereldwijd web». Geheel van multimediale informatiediensten op het internet. Wordt weergegeven met behulp van HTML en biedt teksten, geluiden en vaste of bewegende illustraties aan. Een site omvat één van deze diensten (vb. de website van TV1). Webserver: computersysteem waarmee via het internet webdiensten kunnen worden verstrekt.
MemoWeb 3 - Woordenlijst
55
Manuel Memoweb3/092000/def
11/10/2000 12:26
Page 56
LICENTIE VAN DE EINDGEBRUIKER en die mogelijk voortvloeit uit het gebruik ervan. Dit omvat op niet-beperkende wijze computermaterieel, software, besturingssystemen en alle andere computeruitrusting. De garantie beperkt zich strikt tot de materiële drager, die zal worden vervangen als er fouten worden vastgesteld. De onderhavige garantie geldt voor II - RESERVEKOPIE Als een CD-ROM werd aangeschaft en de CD- een periode van zes maanden volgend op de datum van aanschaf. Als het product wordt ROM wordt gebruikt om de Software te draaien, heeft u krachtens deze Licentie toestemming om teruggestuurd, vallen de verzendingskosten ten over een reservekopie te beschikken in een vorm laste van de verzender. die u zelf mag kiezen. Als het programma NIETTEGENSTAANDE HET VOORGAANDE ZAL daarentegen wordt gekopieerd naar een vaste GOTO IN GEEN ENKEL GEVAL AANSPRAKELIJK WORDEN GESTELD VOOR schijf, dient de originele CD-ROM als reservekopie. KUNNEN Bij een aanschaffing on line heeft u het recht RECHTSTREEKSE OF ONRECHTSTREEKSE SCHADE om naast het geïnstalleerde exemplaar op uw DIE U OF EEN DERDE ZOU LIJDEN, WAARONDER, vaste schijf te beschikken over een reservekopie BIJ WIJZE VAN LOUTER INDICATIEVE EN NIETin een vorm die u zelf kiest. Deze kopie heeft BEPERKENDE OPSOMMING, INKOMENSVERLIES, enkel en alleen tot doel, de originele software ONKOSTEN, VERLIES VAN SOFTWARE, SLECHT opnieuw te kunnen installeren na toevallige FUNCTIONEREN OF VERLIES VAN UITRUSTING beschadiging. De reservekopie zal in geen enkel WAARVAN U OF EEN DERDE HET SLACHTOFFER geval voor andere doeleinden mogen worden ZOU ZIJN, MET INBEGRIP VAN KOSTEN VAN gebruikt. Bewaar de reservekopie op een veilige RECUPERATIE, REPRODUCTIE OF VERGOEDING plaats. Opgelet! U bent aansprakelijk als een VAN DERGELIJKE VERLIEZEN OF SLECHT Derde op ongeoorloofde wijze gebruikmaakt van FUNCTIONEREN. de Software. De onderhavige Licentie is van U zult GOTO vergoeden voor alle schade die de I - DRAAGWIJDTE VAN DE LICENTIE ingebrekestelling door GOTO met zich meebrengt Behoudens andersluidende, uitdrukkelijke toepassing op de reservekopie. en het resultaat is van het niet-naleven van de bepalingen van GOTO wordt de onderhavige Licentie of van het gebruik van de Gebruikerslicentie van de software u verleend III - EIGENDOM voor één enkele computer op één plaats. Bij GOTO bezit overeenkomstig de wetgeving op Software. auteursrecht alle editeeren controle zal voor elk aangetroffen, geïnstalleerd het exemplaar van de Software worden gevraagd reproductierechten van de software en de VI - BIJSTAND VAN GEBRUIKERS een aankoopbewijs voor te leggen (originele documentatie en van alle kopieën die in het kader De onderhavige Licentie brengt voor GOTO geen diskette of CD-ROM, factuur of kasticket). Bij van de onderhavige Licentie toegestaan zijn. U enkele verplichting tot bijstand mee ten aanzien een aanschaf on line wordt dan ook aangeraden moet bijgevolg alle maatregelen treffen die van het gebruik van de Software. Gebruikers om de bijbehorende factuur af te drukken. De noodzakelijk zijn om de vermelde rechten te vinden alle aanvullende informatie, permanente Software mag fysiek van de ene naar de andere beschermen. U moet alle vermeldingen en gebruikershulp en informatie over ontwikkelingen computer worden verzonden, op voorwaarde waarschuwingen betreffende deze rechten, die en nieuwe softwareversies ofwel op het adres evenwel dat de Software slechts op één computer op de samenstellende delen van de Software of http://www.goto.fr, ofwel in voorkomend geval tegelijk wordt gebruikt. Het maken van een de reservekopie worden vermeld, naleven en op de website die aan het product is gewijd. reservekopie is slechts toegelaten en moet worden doen naleven. uitgevoerd overeenkomstig de bepalingen van VII - ALGEMENE BEPALINGEN artikel 2 hieronder. De gebruiker mag evenmin IV - DUUR - OPZEGGING de gedrukte documentatie van de Software De onderhavige licentie wordt verstrekt voor Op de onderhavige Licentie is het Franse recht van kopiëren. Deze is immers beschermd door het onbepaalde duur tenzij u de voorwaarden en toepassing. De rechtbank die bevoegd is om auteursrecht. Het is elke gebruiker die niet in de bepalingen van de onderhavige licentie niet zou kennis te nemen van elk geschil betreffende het voorgaande paragraaf wordt bedoeld, verboden naleven. De onderhavige licentie geeft GOTO gebruik van het product of betreffende de het recht om automatisch en zonder interpretatie van de onderhavige Licentie is ofwel om: • de Software op enigerlei wijze te verspreiden, voorafgaande kennisgeving de onderhavige het kantongerecht (tribunal d'instance) ofwel de over te dragen, te verhuren, te verkopen, in licentie op te zeggen, zonder dat dit afbreuk rechtbank van eerste aanleg (tribunal de grande leasing te geven, in onderlicentie te geven, doet aan de andere verhaalmiddelen waarover instance) van PARIJS als de gebruiker een privéweg te schenken of geheel of gedeeltelijk te GOTO beschikt. Bij opzegging verbindt u zich persoon is en de rechtbank van koophandel ertoe, alle gebruik van de Software te stoppen en (tribunal de commerce) van PARIJS als de distribueren aan Derden • de Software geheel of gedeeltelijk te wijzigen, de Software en in voorkomend geval ook de gebruiker een onderneming is . GOTO zal te desassembleren, te decompileren, aan te reservekopie onverwijld en op eenvoudig verzoek gerechtelijke stappen ondernemen tegen iedereen die de bepalingen van de onderhavige Licentie passen, als basis te gebruiken voor afgeleide van GOTO terug te bezorgen aan GOTO. niet naleeft. producten, te integreren in andere software, te V - GARANTIE EN AANSPRAKELIJKHEID vertalen of op enigerlei wijze te veranderen • kopieën te maken van de Software of van delen GOTO kan niet aansprakelijk worden gesteld ervan (andere dan een reservekopie zoals hierna voor schade of problemen die worden veroorzaakt door de in licentie gegeven software is vastgelegd)
GEBRUIKSLICENTIE VOOR MEMOWEB 3
U heeft een programma aangeschaft uit het gamma van GOTO Software, hierna de Software genoemd. We zijn u erkentelijk voor uw aankoop. Deze aanschaf maakt van u niet de eigenaar van de Software. U verwerft de gebruiksrec hten ervan. De voorwaarden van het gebruik van de Software worden hieronder uiteengezet. Door de verpakking van de CD-ROM te openen of de software te downloaden, verbindt u er zich zonder voorbehoud toe om de bepalingen van de onderhavige Licentie na te leven. Als u deze contractuele bepalingen niet aanvaardt, moet u de CD-ROM met ongeopende, originele verpakking evenals het materiaal dat werd meegeleverd, terugsturen naar de plaats waar u het Product kocht. Het Product wordt u dan terugbetaald. Bij aanschaf on line moet u afzien van het downloaden van het product. De rechten van de Licentieverkrijger worden gespecificeerd in de onderhavige Licentie. Rechten die er niet uitdrukkelijk in worden toegekend, zijn uitgesloten.
HET IS ZONDER VOORAFGAANDE SCHRIFTELIJKE TOESTEMM ING VAN GOTO UITDRUKKELIJK VERBODEN OM DE SOFTWARE GEHEEL OF GEDEELTELIJK TER BESCHIKKING TE STELLEN VAN DERDEN.
GOTO Software, S.A. au capital de 1.080.000 FF, RC Tourcoing B 325 060 952 • 111, rue de Croix - 59510 Hem - France
© 2000 - GOTO Software