Overzicht
Tekstmanipulatie Week 1 Gosse Bouma
[email protected] Informatiekunde Rijksuniversiteit Groningen
2007/2008
Doel van de cursus
Doel van de cursus
Tekstmanipulatie: tekst automatisch bewerken en onderzoeken I
Bewerken I I I I
I
Waarom Linux? I
I I
woorden, woordgroepen en zinnen sorteren, tellen gemiddelde woordlengte, zinslengte berekenen Welke woorden in de tekst staan wel/niet in een woordenlijst?
Toepassingen I
I
Informatie Extractie: afkortingen en hun betekenis zoeken, geboortedata zoeken in 4 jaargangen krantentekst Tweetalig woordenboek maken mbv Wikipedia
Handig programmeerplatform I
I
I
veel tools standaard beschikbaar, combineren is gemakkelijk
Eindeloze hoeveelheid (gratis) software beschikbaar I
I
stabiel, multi-user, multi-tasking
Ideaal voor werken met (grote hoeveelheden) tekst I
Onderzoek I
I
Converteren naar lower/upper case 1 woord, zin per regel ASCII omzetten in UTF-8 Alle persoonsnamen, geografische namen uit een tekst halen
open source, gratis
Wordt gebruikt in practica
Overzicht van de cursus
Overzicht van de cursus
1 Inleiding Linux I I I
Waarom Linux, Linux voor Windowsgebruikers, Filesysteem
2 Inleiding Linux II I I
editors permissies, variabelen, bashrc, ssh
3 Tekstmanipulatie I I
Zoeken en vervangen in tekst, woorden tellen Reguliere Expressies
5 Tekstmanipulatie III I I I
Tekst downloaden Automatiseren van handelingen Scripts, Make
6 tot slot I I
Linux voor thuis, Eindopdracht
4 Tekstmanipulatie II I I
Meer woorden tellen, Woordenboeken maken Pipes (Linux als Lego)
Toetsing
Linux voor Windows-gebruikers
Linux als Windows I
Wekelijkse opdrachten (40%)
I
Eindopdracht (20%)
I
Schriftelijk tentamen (40%)
Linux (KDE) Kmenu Konqueror Firefox, Konqueror Kate, Kwrite, vi, emacs Open Office Acroread Thunderbird
Windows Start Menu Windows Explorer Internet Explorer wordpad MS Office Acroread Outlook, Thunderbird
Konqueror
Kate
Shell/terminal
Terminal
Shell van besturingsysteem (Wikipedia) Een shell is een computerprogramma waarmee een gebruiker commando’s kan geven aan zijn computer. De shell is een stuk software dat invoer van de gebruiker verwerkt en uitvoer terug geeft.
Filesysteem
Nuttige commando’s
ls mkdir Opdracht1 cd Opdracht1 cd .. pwd
Navigatie
Informatie over bestanden ls -l ls -a
I
Het argument van ls en cd is een pad
I
Directory/Subdirectory/File
ls ls ls ls ls ls ls ls ls
Opdracht1 .. Opdracht1/Verslag ../Opdracht2 ~ ~gosse / /bin Opdracht1/*.txt
list de inhoud van je huidige directory make directory Opdracht1 change directory naar Opdracht1 Ga naar het bovenliggende directory geef de naam van de present working directory
Subdirectory Opdracht1 bovenliggende directory Subdir Verslag binnen subdir Opdracht1 naastliggende directory Je home directory Home directory van gebruiker gosse Het allerhoogste directory Subdir van het hoogste directory alle bestanden die eindigen op .txt
Listing met details List ook verborgen files
Files
Meer informatie
cp ~/gosse/tm/week1/opdracht.txt opdracht.txt copy een bestand cat opdracht.txt schrijft inhoud van bestand naar het scherm less opdracht.txt schrijft inhoud van bestand naar het scherm kate opdracht.txt open een bestand met de editor kate mv opdracht.txt nieuw.txt move bestand naar nieuw bestand rm nieuw.txt remove bestand rmdir Opdracht1 remove (empty) directory rm -r Opdracht1 remove recursively directory Opdracht1
Meer informatie
less
I
hoe kun je scrollen?
I
Kun je naar het eind/begin van een file?
I
Kun je zoeken naar tekst?
Commando’s vinden en hergebruiken
I
I
hoe kun je scrollen?
I
Kun je naar het eind/begin van een file?
I
Kun je zoeken naar tekst?
Man pages I
less
man less
I
Geeft alle informatie over bediening van less,
I
Geeft alle opties bij less
TAB doet command & filename completion thunder[TAB] wordt aangevuld tot thunderbird ls Tekstman[TAB] wordt aangevuld tot ls Tekstmanipulatie I
I I
Bij meerdere opties geeft het systeem alle mogelijke completions
CTRL-R, ⇑ geeft het vorige commando Command-lines kun je editen I I I
Backspace wist tekens, Invoegen door te typen Gebruik ⇐, ⇒ om de cursor binnen een command-line te verplaatsen,
Gebruik van de shell
Meer informatie
I I I
Knippen en Plakken: I I
I
I I
Selecteer tekst met de linker muisknop Plak tekst met de middelste muisknop
CTRL-C : stop dit proces (commando)
Zie Nestor → tekstmanipulatie → Literatuur & Links Literatuur voor deze week:
I
Linux Tutorial, lesson 1 & 2 Linux cursus, pg 22-40 (linux commandos, les 1 (start) & 2 (filesysteem)
Opdracht voor deze week (Practicum) I I I I
Verkennen van Linux, filesysteem Maken van directories, files, editen Zie Opdrachten Mail resultaten (via mailbox.rug.nl) naar
[email protected]