NetOpus: Oktober 2007 Thema: Beveiliging Rubriek: Focus Titel: Sata II vs. Sas Auteur: Bram Dons Pagina’s: 20 - 24
Sata II vs. sas
Prijs, prestaties en snelheid De vraag naar opslagcapaciteit groeit jaarlijks met een percentage van tussen de 40 en 60 procent. Door de geslonken IT-budgetten gaan steeds meer ondernemingen over tot de aanschaf van sata-disks voor hun primaireof secundaire opslagsysteem. Want sata-disks zijn immers goedkoper per gigabyte en hebben over het algemeen een grotere opslagcapaciteit dan de traditionele enterprise scsi-drives of de nieuwe sas-drives. In dit artikel onderwerpen we sata II en sas aan een uitgebreide vergelijking. Bram Dons taties bieden dan een vergelijkbare sata-configuratie. Voor veel applicaties kunnen sata-drives echter voldoende prestaties leveren.
Toepassingsmodellen
F
abrikanten zijn continu bezig de prestaties en betrouwbaarheid van sata-disks te verbeteren, maar toch kennen ze enkele beperkingen zoals tragere toegangstijden, minder bestand tegen trillingen van buitenaf en een hogere foutmarge. Toch worden sata-disks voor steeds meer toepassingen gebruikt waar voorheen scsi-disks werden ingezet. Hoewel sata-disks bij random operaties niet op hetzelfde niveau presteren als een enterprise sas- of scsi-disk, zijn ze uitstekend geschikt voor veel omgevingen waar de kosten van disks en hoge opslagcapaciteit van meer belang zijn. Sas-disks zijn er in 15.000 rpm snelheden (de meeste sata-disks
Afbeelding 1. Adaptec 3405 sata en sas raid-controller
zijn slechts 7.200 rpm) en hebben een beduidend lagere access latency. Verder biedt sas een groter aantal I/O’s een tot 50 procent grotere ‘sustained throughput’, in vergelijking tot een doorsnee sata-disk. Sas-disks zijn ook dusdanig ontworpen dat ze tegen een hogere Rotational Vibration Interference (RVI) bestand zijn (van belang bij toepassing in een disk array) en ze hebben een lagere Mean-Time-Between-Failure (MTBF) en een lagere Bit Error Rate (BER). Voor latency-gevoelige, transactiegebaseerde opslagomgevingen kan een sas-diskconfiguratie tot vier maal betere random I/O-pres-
Alhoewel iedere opslagserver uniek is, zijn bij de meeste toepassingen toch een aantal gemeenschappelijke karakteristieken te ontdekken. Zo vereisen de e-commerce applicaties een opslagsysteem dat de talrijke web requests snel kan afhandelen. De statische- en dynamische werkbelasting bestaat bijna uitsluitend uit read-requests en zijn random van aard. Studies hebben aangetoond dat ongeveer 84% van de webserverrequests minder dan 16 KB bedragen, waarbij de resterende requests gelijk verdeeld zijn tussen de 32 KB tot 1 MB (hoofdzakelijk video, audio en afbeeldingen). De beste webserverprestaties zijn te bereiken met behulp van een raid-controller die is voorzien van een dynamische caching policy, waardoor de controller overhead wordt gereduceerd. Oltp-applicaties werken met online transacties, zoals database applicaties met decision support/data-warehousing, webgebaseerde e-commerce en business reporting. De door database queries gegenereerde I/Orequests tenderen klein te zijn, in het algemeen minder dan 16 KB, en eerst de oorspronkelijke waarde lezen, ge-
Sata II vs. sas • Focus
volgd door een wijziging en daarna een schrijf- of verificatieopdracht. Transaction servers zijn zeer gevoelig voor responstijden. Ze moeten immers de data-integriteit kunnen waarborgen bij de volgorde van uitvoering (atomic) van requests bij een gemengde lees/ schrijf-werkbelasting en bij minimale controller-overhead. Al deze strikte eisen vormen de sleutel tot een hoog presterende database. Fileservers zijn een aparte uitdaging omdat gebruikersrequests meestal betrekking hebben op meerdere disks met bepaalde hot spots. Deze hot spots, die doorgaans informatie bevatten over bestansdstructuren, open file updates, page swapping regions en andere frequent bezochte data, hebben ook voordeel van een effectief werkende array cache. Een ideale raid-controller voor fileserving is in staat om een groot aantal gebruikers-
verzoeken af te handelen, wat zich vertaalt in lagere responstijden, zelfs bij de meest veeleisende file servers. In Grafiek 1 zie je een vergelijking tussen de prestaties van sas, scsi en sata 150 drives, zoals die nog enkele jaren geleden gold. Nu zijn er echter nieuwe sata-drives op de markt verschenen die veel beter presteren. Bovendien zijn er nieuwe sas/sata-controllers die in combinatie met sata-disks beter presteren dan de thans bestaande controllers. De firma Adaptec heeft voor de nieuwe hoogpresterende sas/sata II-drives een aantal geavanceerde sas/ sata-controllers op de markt gebracht, waaronder de Adaptec 3405, die we hierna verder zullen testen.
Sata of sas?
De opmerkelijke kosteneffectiviteit van ata-diskdrives zijn altijd het handelsmerk geweest en recente verbeteringen in de prestaties (3 Gbps) en beschikbare capaciteit (tot 1 TB) hebben de positie van sata als onbedreigde leider op het gebied van efficiënte opslag alleen maar versterkt. De toepassing van sata-drives binnen een optimale opslaginfrastructuur Schema 1. Toepassingsgebieden fiber channel, scsi, sas, sata en tape vormt de sleutel tot het maximaal profijt halen van sata. sata heeft het voordeel van de meer moderne, heldere strategie die de opslagindustrie heeft gehad bij de ontwikkeling van een compatibele seriële interface; dit in tegenstelling tot destijds de ontwikkeling van de incompatibele parallelle scsi- en Grafiek 1. Vergelijking sas, Ultra320 scsi en sata 150 drive parallelle ata-stan-
daarden. De ontwikkeling van sas begon na die van de sata 1.0 standaard en de ontwikkelaars van de sas-standaard begrepen, maar al te goed het belang van sata’s toenemende rol in de enterprise. De comptabiliteit met sata werd daarom een belangrijke sleutelfeature van sas waardoor sas- en satadrives van dezelfde enterprise-class opslaginfrastructuur gebruik kunnen maken. sas-kabels, connectoren en raid-controllers zijn dan ook volledig compatibel met sata- en sas-drives. Verder kunnen sas-controllers zonder problemen een sata-drive identificeren en daarmee communiceren, waardoor een sas-controller net zo efficiënt sata-commando’s kan uitgeven als een sata-controller. sata en sas spelen een duidelijk verschillende rol in de enterprise. De twee technologieën zijn complementair in plaats van concurrerend, waarbij sata-disks geoptimaliseerd zijn voor de laagste kosten per Gigabyte terwijl sas-drives meer geschikt zijn voor transactionele, hoogbeschikbare applicaties. Samen kunnen ze efficiënt een breed spectrum bieden voor enterprise opslagsystemen.
Sata-met sas controller De mogelijkheid om sas- en sata-disks in dezelfde infrastructuur te mixen is een enorme stap voorwaarts richting een efficiënt meerlaags opslagsys teem. Om een aantal redenen is het zinvol om een sata-drive gebaseerde infrastructuur op basis van een sascontroller te implementeren. Er zijn een aantal zaken die van invloed zijn op de schaalbaarheid, comptabiliteit, prestaties en data-integriteit van een op sata-controller gebaseerd opslagsysteem. De meeste sata-gebaseerde opslagoplossingen kunnen in drie basisconfiguraties worden opgesplitst: (1) direct verbonden via een één-opéén verbinding met de server; (2) een interconnect backplane op de server en (3) een externe backplane op een jbod. De eenvoudigste en meest voor de hand liggende configuratie betreft een
rechtstreekse één-op-één verbinding van elke sata-drive met de corresponderende poort op de sata-controller van de server. Dat betekent dat er voor elke drive een aparte kabel naar de controller nodig is, met als gevolg een kluwen van kabels, verspilde ruimte en nadelige invloed op de interne koeling van de server. De vraag is wat er gebeurt als er meer sata-drives moeten worden geïnstalleerd. Toevoeging van meer disks, aan bijvoorbeeld een achtpoorts sata-controller, is kostbaar. Een alternatief is om de controller toe te passen met een die een hoger aantal poorten heeft of de toepassing van een inefficiënte port multiplier. Het gebruik van een sas-controller daarentegen heft deze 1:1 port/drive-beperking op door van de ‘expander’ technologie gebruik te maken. In plaats van de acht drives van een achtpoorts sata-controller, ondersteunt een achtpoorts sas-controller tot 128 sata en/of sas drives per poort. Door een externe poort naast de interne poort te gebruiken, biedt een sas-controller eenvoudig de mogelijkheid om tientallen meer drives via een externe kast bij te schakelen. Voor de interne verbinding maakt de sas-controller gebruik van SFF-8484 connectors, elk met vier uitgaande connectors voor sata-drives. Voor de verbinding van acht drives zijn slechts twee SFF-8484 connecties nodig. Deze ruimtebesparende connectoren staat de toepassing van ‘half-size’ controller boards toe en nemen minder ruimte in beslag voor de bekabeling en beide verbeteren de luchtstroom binnen de server. Als we naar de kosten per drive kijken bij een sas-controller met acht interneen twaalf externe-diskverbindingen, dan bedragen de kosten per drive $30, wat 40 procent minder is dan bij een sata-controller. Zoals we zagen, satadrives kunnen alleen op een één-opéén basis worden verbonden met de controller. Dat betekent in de praktijk dat het aantal benodigde drives bij de aanschaf van een sata-controller vooraf bekend moeten zijn, zo niet dan moet
daarna extra worden geïnvesteerd in de hardware. In een dynamische opslagomgeving verandert voortdurende de aard en hoeveelheid opslagcapaciteit. Sata-controllers hebben een gebrek om efficiënt en kosteneffectief extra diskdrives te kunnen toevoegen. De kosten per disk, niet de initiale aanschafprijs, is de uiteindelijke maatstaf voor de gebruikswaarde van een diskdrive controller op langere termijn. Geavanceerder zijn de interne sas/sata backplanes, waarbij nog minder connectors en kabels nodig zijn voor de verbinding met sata-drives. De SFF8087 Mini connectoren nemen nog minder ruimte in dan de SFF-8484. De toepassing van multifunctie ses-chips die de controller van diskinformatie voorzien, bevatten bovendien ook logica voor de toepassing van hot-pluggable diskdrives. De opslag van grote hoeveelheden data vereist een groot aantal disk drives. jbod’s zijn daarvoor een efficiënte en kosteneffectieve opslagmethode. Een sas-controller biedt via een daarvoor speciaal ontworpen poort voor de verbinding met een extern opslagsysteem. Via de ‘daisy-chain’ verbindingsmethode laten zich meer jbod’s onderling verbinden. Dit biedt IT-managers de mogelijkheid om grote hoeveelheden disks op een kosteneffectieve manier te implementeren. In een enkel sas-domein kunnen zo meer dan 16.000 diskdrives worden geplaatst.
Unified Serial Controllers De Unified Serial Controllers van Adaptec bieden een uiterst flexibele opslagomgeving met hoge capaciteit sata-drives en/of hoogpresterende sas-drives. De controllers zijn ontwikkeld op basis van de Adaptec Raid Code (ARC), die ondermeer voorziet in een dynamisch algoritme dat De cache en de code flow policies kan bijstellen voor het bereiken van optimale prestaties op basis van I/O-karakteristieken en statistieken. ARC ondersteunt een geavanceerde databeschermingsset, waaronder de hot spare performance (raid 5EE) en een gepatenteerde raid 6/60 technologie. Een disk array wordt tot maximaal 512 TB ondersteund met totaal 128 aan sas- of sata-drives. De controllers ondersteunen PCI Express en hebben, afhankelijk van het type een 128 of 256 MB ECC-beschermde datacache. Ondermeer de volgende features worden ondersteund: raid 0, 1, 1E, 10, 5, 50, 5EE, 6 en 60, raid level migratie, Native Command Queueing (NCQ), online disk expansie, copy back hot spare en levert 3Gb/s per poort. Er zijn drivers beschikbaar voor Windows, Linux Red Hat of Suse, NetWare, OpenServer, Solaris, UnixWare, VMware en FreeBSD.
Uitval van disks De Adaptec Storage Manager bevat een wizard waarmee logische drives te configureren zijn. Met de Express configuratiemethode cre-
Grafiek 2. Prestaties random throughput
Sata II vs. sas • Focus
ëert de Storage Manager automatisch logische drives door disks van gelijke fysieke grootte te bundelen, waarna een raid-niveau wordt toegekend op basis van het aantal fysieke diskdrives. Default stelt de Storage Manager de grootte van de logische drive in, maar de gebruiker kan ook handmatig voor een bepaalde grootte kiezen. Het is mogelijk om dezelfde diskdrive in twee verschillende logische drives op te nemen door slechts een deel van de diskr uimte te gebruiken. Van een logiche drive zijn ondermeer de volgende parameters instelbaar: stripe size; write en read cache; initialisatieprioriteit en -methode; de streeplengte is instelbaar in hoeveelheden KB, cache op writethrough en write-back. Write-through bevestigt het OS dat de data goed is ontvangen en wordt toegepast als snelheid minder belangrijk is dan databescherming. Bij write-back daarentegen conformeert de controller het OS dat de data goed is ontvangen, waarna het de data naar disk stuurt. Men kiest voor de laatst genoemde optie als snelheid belangrijker is dan databescherming. ‘Read caching enabled’ biedt de beste prestaties bij gelijkmatige- en sequentiële leesoperaties en ‘read caching disabled’ bij random werkbelastingen of als de system I/O-requests kleiner zijn dan de stripe-size. De ‘initialize priority’ setting bepaald de prioriteit waarmee de logical drive wordt geïnitialiseerd: ‘build’; ‘clear’ en ‘quick’. De build-methode is de langzaamste en de standaardinstellnig voor de meeste logische drives. Voordeel hiervan is dat de drive direct is te gebruiken. Bij de clear-methode wordt ieder diskblok binnen de logische drive overschreven, waarbij alle data wordt verwijderd. Nadeel is dat de drive pas na afloop van de initialisatieperiode bruikbaar is. De quick-methode is de standaard instelling voor raid 1, 1EE en 10 logische drives waarbij de logical drive ook onmiddellijk voor de gebruiker beschikbaar is.
Afhankelijk van het raid-type en de beschikbaarheid van hot spare zal de controller in veel gevallen de uitval van een fysieke disk kunnen opvangen. Afhankelijk van het type fout is de raid-controller in de volgende gevallen in staat om de uitval van een of meer disks op te vangen:
gang tot de data te versnellen. Ter controle kunnen logische drives automatisch, handmatig en in de achtergrond worden geverifieerd. Tenslotte, Adaptec beveelt aan om sas- en sasdiskdrives niet in dezelfde logische drive te combineren.
• Een logische drive, beschermd
Naast de bescherming tegen diskuitval biedt de controller bescherming tegen het verloren gaan van data, waarvoor de Adaptec Advanced Data Protection Suite twee additionele methoden bevat. Door middel van een (optionele) snapshot kan op een bepaald tijdstip een bevroren image van een logische drive worden gemaakt. De snapshot kan naar een andere logische schijf worden gekopieerd. Er zijn twee opties: ‘snapshot backup’ en ‘nobackup’. De snapshot backup kopieert alle data naar een logische drive, zodat die van de ene server naar de andere kan worden getransporteerd. Let wel, om een gecorrumpeerde snapshot te voorkomen moeten alle geopende en in gebruik zijnde bestanden vooraf worden afgesloten. Bij de snapshot backup wordt een tijdelijke kopie van een logische drive gecreëerd voor het maken van een backup naar tape. Door middel van een third-party data-backup of een tool op besturingssysteemniveau kan de snapshot naar een tapedrive of andere server worden geschreven. Helaas worden snapshots alleen ondersteund op Windows en L inux.
door een hot spare.
• Diskuitval, gelijktijdig op meer dan één logische drive.
• Raid 0 logische drive. • Meerdere diskdrives bin-
nen dezelfde logische drive.
Als een, door een hot spare beveiligde, logische diskdrive uitvalt, dan wordt deze automatisch door de hot spare vervangen. Als bijvoorbeeld een raid 5 logische schijf uitvalt, dan vindt met behulp van de hot spare een zogenaamde ‘rebuild’ van de resterende drives plaats. Gedurende die tijd is de logische drive voor gebruikers niet beschikbaar. Bij gelijktijdige uitval van meerdere drives in een logische drive, waarbij deze beschermd zijn door hot spares, worden de logische drives ook herbouwd. Er zijn wel wat beperkingen. Een hot spare moet minstens gelijke capaciteit hebben als de falende drive en uitgevallen schijven moeten in volgorde van uitval door hot spares worden vervangen. Als er meer falende disks zijn dan er hot spares beschikbaar zijn, dan moet deze worden vervangen door nieuwe disks, waarna ook een rebuild plaatsvindt. Behalve in raid 6 en 60 logische drives, gaat bij gelijktijdige uitval van een fysieke- en logische drive de data verloren. Diskruimte is daarna aan een logische drive toe te voegen. De voorwaarde is alleen dat de uitgebreide logische drive een capaciteit heeft die groter of gelijk is aan het origineel. Als er behoefte aan bestaat, dan kan het raidniveau van een logsiche drive worden gewijzigd. Een reden kan bijvoorbeeld zijn: toevoeging van redundantie ter bescherming van de data of de toe-
Bescherming van data
Test drives Om te zien tot welke prestaties de nieuwe sas- en sata-diskdrives in staat zijn, testen we de Western Digital sata II Caviar SES16 WD75000 AAKS en Fujitsu’s sas MAU3036RC. De leveranciers geven de volgende prestatiespecificaties van hun drives:
• Western Digital 750 GB 72.000
RPM: average latency 4,2 ms; data transfer rate buffer tot disk 70 MB/s en buffer to host 3 Gbps.
Sata II vs. sas • Focus
• Fujitsu 73.5 GB; 15.000 RMP:
average latency 2.00 ms; transfer rate buffer to disk 147 MB/s en buffer to host 3 Gbps.
Beide diskdrives testen we in configuratie met raid 0 en 2 diskdrives met Intel’s Iometer test. Hierbij gebruiken we de volgende parameters: 4 raid 0 gebaseerde lun’s, 4 disk managers met elk 8 I/O workers, 64 outstanding I/O’s per worker, 1 minuut testtijd en 15 seconden ramp-up. De testen bestaan uit een 100 % random test (33% write, 67% read) en een 100% sequentiële 100% read test. Als we na de test de testresultaten analyseren, dan komen we in het kort tot de volgende conclusies. De random throughp ut is bij sas bijna het dubbele van sata en het aantal I/O’s het drievoudige. Sequentieel levert de sata-disk meer
throughput dan de sas-drives; bij blocklengtes van 8 tot 64 K zelfs het dubbele! Bij de sequentiële test tussen sata en sas presteert de satadrive, afhankelijk van de blocklengte, in alle gevallen beter dan de sas-drive (behalve de 512 byte blocklengte). Kort en goed, sas-disks presteren nog steeds beter bij random I/O, maar de nieuwe sata II disks bieden soms al betere prestaties bij sequentiële I/O. De testgrafieken geven meer inzicht in de testresultaten.
Prijs of prestatie Deze test bevestigt de algemene opvatting over het gebruik van sas- of sata-drives bij bepaalde toepassingen. In het algemeen kan gesteld worden dat bij applicaties met een hoge transactieratio, zoals databases, de sas-drive de voorkeur geniet, Advertentie
- Continue beschikbaar, geen downtime ! - Voor bedrijfskritische applicaties - Complete hardware redundancy - Verzekert u van 99,999 % beschikbaarheid - Behoud van alle data ! - Ondersteunt elke Windows applicatie - Geen kostbare cluster-aware versies nodig - Standaard server hardware voldoende - Geen SAN noodzakelijk
Marathon everRun™ de wereld ná Clusters Voor een test of een demo bel: 0416-365141 of kijk op www.raxco.nl en overtuig u van de mogelijkheden van Marathon everRun™
omdat deze over alle blocklengtes een hogere doorvoersnelheid en I/O’s biedt. Voor applicaties waar grote bestanden alleen worden gelezen, zoals video en imaging, kan de sata-drive ook prima worden gebruikt. Niet alleen de grotere capaciteit en betere prijs/capaciteit maken dat de satadrive daarvoor beter geschikt is. In deze test presteert de sata II drive sequentieel ook beter dan de sasdrive. Als we naar de door Gartner voorspelde geproduceerde aantal disk-units voor het komende jaar kijken, dan zien we een continuering van de toename van het aantal satadrives en een kleine afname van het aantal scsi/sas-drives. Daarom zou je kunnen concluderen dat de nieuwe hoogpresterende sata II drives geleidelijk op steeds meer terreinen de scsi/sas-drives gaan vervangen. «