Assignment 3
Arjan Dekker (23-02-05)
Dit document beschrijft twee onderzoeken uitgevoerd in opdracht van de afdeling ICT van Administratiekantoor Dekker BV. Deze afdeling wil achterhalen wat de beste manier is om de belangrijke gegevens te back-uppen en hoe gebruikers het beste hun bestanden vanaf thuis kunnen benaderen. In dit document zal uitvoerig onderzoek worden gedaan naar het huidige netwerk en de oplossing zullen hierop afgestemd worden.
Waarom Gegevens zijn belangrijk. Wanneer deze gegevens verloren gaan kan dit veel geld kosten. Orders kunnen verloren raken, door apparatuur dat stuk gaat of door het per ongeluk verwijderen van gegevens. Om ervoor te zorgen dat deze gebeurtenissen niet het bedrijf in problemen laat komen, is het van belang om de belangrijke gegevens te back-uppen. In dit document wordt beschreven hoe de back-ups moeten worden gerealiseerd. Het tweede onderzoek betreft de mogelijkheden om vanaf thuis bestanden te raadplegen. Wanneer medewerkers nog thuis even willen doorwerken aan bestanden is het van belang dat deze bestanden op een veilige manier getransporteerd worden. Als gebruikers bestanden kunnen raadplegen buiten kantoortijden, kunnen ze 's avonds nog het bepaalde zaken voorbereiden voor de volgende dag. Dit komt de bedrijfsvoering ten goede. Om niet voor elke gebruiker een laptop te hoeven aanschaffen om toch de bestanden bij zich te dragen, kan dit opgelost worden door middel van een VPNverbinding of via SSH. Dit heeft tevens als voordeel dat er minder kans is dat er verschillende versies van dezelfde bestanden in omloop zijn. Op een laptop kunnen bestanden aangepast worden en bijvoorbeeld een week later weer op het netwerk worden gezet. Door middel van VPN of SSH moeten gebruikers de bestanden na wijzigingen wel weer op het netwerk zetten, anders kunnen ze deze bestanden niet binnen het bedrijf gebruiken. In dit document zal worden gekeken wat de beste manier is om dit te realiseren.
Het netwerk In het netwerk zijn verschillende servers aanwezig, namelijk: • Web-server (voor het Internet) • Web-server (voor het Intranet) • Database-server • File-server (hierop staan de home-directory's) • Mail-server • Applicatie-server • DHCP- en DNS-server Het netwerk bestaat uit de bovenstaande servers en een 150-tal clients. Alle servers gebruiken Linux en alle clients Windows XP als operating system. Er zijn twee verschillende web-servers, namelijk één voor het interne netwerk en één voor het internet. Op de web-server die gebruikt wordt voor het internet staan gegevens over het bedrijf en een aantal nieuwsberichten. De web-server die gebruikt wordt voor intern gebruik bevat een administratie-applicatie. Deze applicatie is web-based en gemaakt in Perl. Beide servers maken gebruik van dezelfde database-server. De database-server en de web-server voor het intranet zijn de belangrijkste servers van het gehele netwerk. Deze servers worden gebruikt voor de meest noodzakelijke taken van het bedrijf, namelijk het beheren van de administratie-gegevens. De file-server bevat de home-directory's van de gebruikers. Deze gebruikers moeten alle bestanden opslaan op deze server. Elke client heeft een verbinding met deze file-server.
Omdat er binnen Dekker BV veel gecommuniceerd moet worden, gebeurt er een groot deel van deze communicatie via email. Alle ontvangen en verstuurde email van de gebruikers wordt op de mail-server bewaart. Deze mail-server draait SMTP en IMAP waardoor alle mail van alle gebruikers zich op deze server bevindt. De applicatie-server bevat een aantal applicaties die gebruikers vanaf hun client kunnen opstarten, zoals bijvoorbeeld Microsoft Office. De laatste server is de DHCP- en DNS-server. Deze server regelt de IP-adressen van de clients en zorgt ervoor dat de servers gevonden kunnen worden binnen het netwerk.
Backup Binnen het netwerk zijn verschillende servers aanwezig. Elke server heeft een specifieke taak en vraagt daarom ook om specifieke back-up methodes. Alle servers hebben een extra netwerkkaart die verbonden is met een back-up-netwerk. Dit houdt in dat wanneer een back-up gemaakt wordt van een server, het gebruikers-netwerk hier geen hinder van ondervindt. Enkel de response-tijd van de server(s) zullen omlaag gaan. De web-servers De data op beide web-servers is niet aan veel verandering onderhevig. De web-server die zorgt voor het laten zien van een website op het internet, haalt alle gegevens uit de database. De website zelf bestaat uit veel scripts en dergelijke, maar die zijn één keer gemaakt en veranderen verder weinig. Daarom volstaat het om van deze web-server één keer in de week een back-up te maken. De grootte van alle bestanden is maximaal 250 MB. Hierdoor volstaat het om een back-up-server in te richten, een desktop-pc met veel harde schijf ruimte in RAID 1, waarop één keer per week alle data vanaf de web-server naar deze back-up-server wordt gekopieerd. Voor de interne web-server is dit ook een oplossing die volstaat, indien het kopiëren elke avond gebeurt. De data op deze web-server is maximaal 1 GB en kan daarom makkelijk door de back-up-server worden verwerkt. De database-server De data op de database server is heel belangrijk en onderhevig aan veel aanpassingen. Hierdoor is het van belang dat deze data veelvuldig wordt geback-upped. Omdat de database draaiende moet blijven tijdens de back-up-fase is de volgende manier aan te raden: De server heeft 3 harde schijven tot zijn beschikking. Deze drie schijven staan in RAID 1. Dit houdt in dat als één van deze schijven uitvalt er niks aan de hand is, omdat de data dan precies hetzelfde op de andere schijf staat. 'S avonds wordt één van deze schijven losgekoppeld en wordt gebackupped. Op deze manier blijft de database in de lucht en wordt toch een back-up gemaakt. Na het back-uppen wordt de schijf weer aangekoppeld waardoor deze weer automatisch overschreven wordt met de nieuwste data afkomstig van de andere twee schijven. Wanneer nu één schijf stuk gaat moet deze vervangen worden, data raakt hierdoor niet verloren omdat er altijd nog één schijf is waarop alle data staat. De losgekoppelde schijf die wordt geback-upped wordt volledig op een tape gezet. Hiervoor voldoet een tape-streamer van 200 GB. Op dit moment is de database 12 GB groot en groeit sinds het begin gestaag met 5% per week. Hierdoor voldoet deze oplossing minimaal 50 maanden lang. De gehele database wordt op een tape gezet. Elke drie maanden worden de oude tapes weer overschreven met de nieuwe database. Elke back-up van de eerste dag van de maand wordt apart bewaart, omdat deze niet overschreven dient te worden wegens wettelijke verplichtingen. Hierdoor zijn per jaar 3 * 31 tapes nodig en hiervan worden er per jaar 12 niet meer gebruikt (wegens het niet mogen overschrijven). Dus daarom moeten elk jaar weer 12 nieuwe aangeschaft worden. Tapes ouder dan 3 jaar dienen vervangen te worden, omdat de kwaliteit van de tapes niet meer gegarandeerd kan worden.
De file-server en mail-server Deze servers bevatten de home-directory's en mail van de gebruikers. Deze moet elke avond worden geback-upped. Dit kan het beste gebeuren op de volgende manier: 'S avonds wordt van elke van deze server nauwelijks gebruik gemaakt. Hierdoor kan met gemak de data op deze servers worden gekopieerd naar een tape die extern aan de elke server hangt. In het weekend wordt de volledige data op tape gezet en doordeweeks alleen de veranderingen (incremental back-ups). Door tapes te gebruiken van 200 GB kan deze oplossing een lange tijd gebruikt worden, omdat er een quota van 1 GB is gesteld aan de grootte van de home-directory's en mail van de gebruikers. Hierdoor kan de back-up maximaal 150 * 1 GB groot worden per server. Door middel van compressie kan ook bij groei van het aantal medewerkers deze oplossing nog ruimschoots voldoen. De tapes worden elke 3 maanden weer overschreven en elke maand wordt één tape apart gezet, waardoor hetzelfde aantal tapes als bij de database-server gebruikt wordt. Gebruikers kunnen dus maximaal bestanden van 3 maanden oud terughalen of indien het bestand op één van de maandelijkse weggelegde back-ups kunnen ze van ouder dan 3 maanden worden teruggehaald. Dit is te doen door op een formulier op het intranet de locatie en datum van het bestand in te vullen. Vervolgens zullen de SA's de bestanden opzoeken. Bestanden terugplaatsen duurt maximaal 2 dagen, doordat de tapes extern worden bewaart en het zoeken naar bestanden ook nog even duurt. De Applicatie-server en DHCP- en DNS-server Deze servers zijn niet onderhevig aan veel veranderingen. Hierdoor voldoet een wekelijkse back-up, waarbij alle data over de oude data wordt gekopieerd. Op de eerdergenoemde back-up-server is er plaats genoeg om deze data kwijt te kunnen. De grootte van de data verandert ook niet vaak, omdat de applicaties minimaal 3 jaar lang worden gebruikt (wegens licenties). Elk weekend wordt de data van deze server gekopieerd naar de back-up-server. In het geval dat één van deze servers stuk gaat, kan met de data afkomstig van de back-up-server de server weer snel in de lucht worden gebracht.
Remote File Access Zoals reeds eerder vermeld, is het voor gebruikers handig als zij de mogelijkheid hebben om thuis bestanden te raadplegen die op het bedrijfsnetwerk staan. Er zijn twee veilige mogelijkheden, namelijk: •
VPN
•
SSH
Andere mogelijkheden zoals FTP zijn niet veilig genoeg om in een bedrijfsnetwerk met belangrijke informatie te gebruiken. Dit komt met name omdat de verbinding geen encryptie gebruikt, waardoor wachtwoorden zijn te achterhalen.
VPN Bij VPN wordt een verbinding gemaakt tussen de huis-computer en het bedrijfsnetwerk. Het grote voordeel van VPN is dat er een netwerkshare bij komt, waardoor het als ware lijkt of je op het bedrijfsnetwerk zit. Door de verschillende directory's is te bladeren en bestanden zijn te openen en op te slaan op dezelfde wijze als dat je op het bedrijfsnetwerk gewent was. Voor VPN is wel een snelle verbinding noodzakelijk. VPN moet ingesteld worden op elke thuis-computer die gebruik wilt maken van het bedrijfsnetwerk. Wanneer gebruikers dus veel wisselen van computers is dit lastig, omdat dan elke keer alles ingesteld moet worden. Als een gebruiker even snel een bestand wilt ophalen vanachter een computer waarvan hij/zij niet de eigenaar is, is dit geen goede manier. Wanneer een gebruiker een laptop tot zijn beschikking heeft is dit de ideale oplossing, mits een snelle verbinding. Nog een voordeel van VPN is dat bestanden niet verspreid raken en hierdoor
minder kans ontstaat op verschillende versies. Vergeleken VPN Software: •
OpenVPN (www.openvpn.org)
•
FreeSWAN (www.freeswan.org)
De server-kant van OpenVPN is wat moeilijker te installeren dan die van FreeSWAN. Maar als deze eenmaal werkt, dan is het een fluitje van een cent om dit aan de client-kant te gebruiken. Bij FreeSWAN is dit juist andersom. Vandaar dat mijn voorkeur uitgaat naar OpenVPN, omdat de gebruiker dit simpel voor elkaar moet krijgen, en dat is bij OpenVPN wel het geval door middel van de in Windows XP ingebouwde wizards. Dit is toch het operating system dat de meeste gebruikers thuis tot hun beschikking hebben. OpenVPN werkt op basis van SSL en FreeSWAN op basis van IPsec, waardoor FreeSWAN in theorie sneller moet werken, maar toch stel ik het gebruikersgemak boven snelheid. Dus daarom raad ik OpenVPN aan.
SSH Bij SSH kan gebruik worden gemaakt van SCP of SFTP. Dit zijn manieren om bestanden heen en weer te kopiëren op een veilige manier. Voor een gebruiker is dit met een simpele handleiding goed in te stellen, net zoals een VPN. Met behulp van Open Source software, zoals FileZilla of winSCP, kan op een gratis wijze een programma worden gebruikt die via SFTP of SCP werkt. Dit werkt makkelijker als even snel een bestand opgehaald moet worden op een computer die niet van de gebruiker zelf is. Bij SCP/SFTP hoeft de verbinding minder snel te zijn, omdat het bestand eerst wordt opgehaald en wanneer de gebruiker klaar is met het bestand wordt het weer terug gekopieerd. Het grote nadeel hiervan is dat er een grote kans is dat een gebruiker vergeet een bestand terug te kopiëren en hierdoor dus verschillende versies ontstaan. Vergeleken SSH Software:
Server: •
OpenSSH (www.openssh.org)
•
Fressh (www.fressh.org)
Client: •
FileZilla (http://sourceforge.net/projects/filezilla/)
•
winSCP (http://winscp.sourceforge.net/eng/index.php)
Aan de server-kant zou ik OpenSSH gebruiken, omdat deze een grotere community heeft. Hierdoor worden bugs eerder ontdekt en verholpen. Tevens heeft OpenSSH veel meer documentatie tot zijn beschikking waardoor het installeren eenvoudiger wordt. Voor de client-kant raad ik winSCP aan, omdat dit een heel eenvoudige applicatie is, die ook geen complete installatie behoeft. Met behulp van een simpele online handleiding kunnen gebruikers deze applicatie gebruiken.
Referenties • • • • • • • • • • •
http://www.aplawrence.com/Basics/vpn.html http://www.bath.ac.uk/bucs/network/connectin.shtml#vpn http://www.ajlc.waterloo.on.ca/courses/VPN.html http://www.wissh.com/Technology.htm http://computing.ee.ethz.ch/remote_access/file_access.en.html http://www.vpnlabs.org/ http://opencd.dischosting.nl/theopencd14nl/extras/html/programs/Internet_nl.html http://www.ictforyourbusiness.nl/main.asp?ChapterID=2766 http://winscp.sourceforge.net/eng/index.php http://www.fressh.org/ http://www.freeswan.org/