2 COMPRESSIE Dankzij compressie kunnen we een bestand verkleinen zodat het • makkelijker (sneller) door te sturen is, en • minder plaats in neemt bij het opslaan.
2.1 Tekstcompressie Als je vaak programma’s of bestanden van het Internet downloadt, dan ben je waarschijnlijk al ZIP en SIT bestanden tegengekomen. ZIP en SIT zijn erg handige compressiemethodes voor op het web, omdat het je het totale aantal bits en bytes van een bestand vermindert, zodat het sneller kan verzonden worden over een trage internetverbinding. Bij het downloaden gebruikt de computer programma’s als WinZip of StuffIt om het bestand terug te brengen tot zijn oorspronkelijke grootte. Dit uitgebreide bestand is identiek aan het originele bestand van voor de compressie. Daarom noemen we de gebruikte compressiemethode “lossless”, zonder verlies.
Het overtollige De meeste soorten computerbestanden bevatten veel overtollige informatie: ze bevatten steeds opnieuw dezelfde informatie. Compressieprogramma’s schrappen de overtollige informatie. In plaats van een brok informatie telkens opnieuw te hernemen, geeft een compressieprogramma deze informatie één keer weer om later, wanneer deze informatie opnieuw opduikt in het originele programma, hiernaar terug te verwijzen. Laten we bij wijze van voorbeeld eens kijken naar een informatiesoort waar we al mee vertrouwd zijn: zinnen. In John F. Kennedy's inaugurele rede uit 1961, spreekt hij deze zin uit: Ask not what your country can do for you - ask what you can do for your country. Deze zin bevat 17 woorden, 61 letters, 17 spaties, 1 streepje en 1 punt. Wanneer elke letter, spatie of interpunctie 1 byte in beslag nemen, hebben we een totale bestandsgrootte van 80 bytes. Om het bestand in grootte te verminderen, moeten we op zoek gaan naar overtollige gegevens. We merken op dat de volgende woorden twee keer in de tekst voorkomen:
• • • • • • • •
ask what your country can do for you
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.22
Wanneer we het verschil tussen hoofd- en kleine letters negeren, is zowat de helft van de zin overtollig. Negen woorden - ask, not, what, your, country, can, do, for, you – geven ons bijna alle informatie die we nodig hebben voor de volledige zin. Om de tweede helft van de zin op te bouwen, kunnen we verwijzen naar de woorden in de eerste helft en vullen we de spaties en de interpunctie in.
Woordenboek De meeste compressieprogramma’s gebruiken een variant van het LZ adaptive dictionary-based algorithm om bestanden te verkleinen. “LZ” verwijst naar Lempel en Ziv, de bedenkers van het algoritme, “dictionary” (woordenboek) verwijst naar de methode om stukjes data te catalogiseren. Het systeem om woorden te rangschikken kan verschillen, maar het kan ook zo eenvoudig zijn als een genummerde lijst. In ons voorbeeld nemen we de woorden die herhaald worden en plaatsen we deze in een genummerde index. Vervolgens gebruiken we het nummer in plaats van het hele woord te schrijven. Wanneer dit onze “dictionary” is: 1. ask 2. what 3. your 4. country 5. can 6. do 7. for 8. you Wordt onze zin: "1 not 2 3 4 5 6 7 8 - 1 2 8 5 6 7 3 4." Wanneer je het systeem kent, kan je de originele zin gemakkelijk reconstrueren, enkel door gebruik te maken van het woordenboek en de nummers. Dat is wat het expansieprogramma op je computer doet wanneer het het gedownloade bestand terug brengt tot de oorspronkelijke grootte. Maar hoeveel ruimte hebben we werkelijk uitgespaard met dit systeem? “1 not 2 3 4 5 6 7 8 – 1 2 8 5 6 7 3 4.” is zeker korter dan “Ask not what your country can do for you – ask what you can do for your country.”, maar we mogen niet uit het oog verliezen dat we het woordenboek samen met het bestand moeten bewaren. Vertrekkende van de idee dat elk karakter en elke spatie één byte inneemt, zagen we reeds dat de volledige zin staat voor 80 bytes. Onze gereduceerde zin (inclusief de spaties) bevat 38 bytes, het woordenboek (woorden en getallen) bevat 37 bytes. Als resultaat geeft dit een bestandsgrootte van 75 bytes. Erg veel hebben we de bestandsgrootte dus niet gereduceerd. We hebben hier echter slechts één zin voor ons. Wanneer het compressieprogramma de volledige rede van Kennedy zou bewerken, zou het ongetwijfeld meermaals een herhaling van deze en andere woorden vinden.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.23
Op zoek naar patronen In ons voorbeeld haalden we er alle woorden uit die herhaald werden en plaatsten deze in een woordenboek. Voor ons is dit de meest vanzelfsprekende manier om een woordenboek op te stellen. Een compressieprogramma kent het concept van afzonderlijke woorden niet, en gaat op zoek naar patronen. Om de bestandsgrootte zo veel mogelijk te reduceren, selecteert het programma patronen en neemt die op in een woordenboek. Wanneer we de zin op deze manier benaderen, krijgen we een volledig ander woordenboek als resultaat. De eerste overtollige informatie die het compressieprogramma in Kennedy’s zin ontdekt, is de herhaling van de letter “t” gevolgd door een spatie (in “not ” en in “what ”). Dit patroon wordt echter niet voldoende herhaald om zijn plaats in het woordenboek te behouden en zal door het programma overschreven worden. Het volgende patroon dat het programma opmerkt is “ou”, zowel in “your” als in “country”. Wanneer dit een langer document zou zijn, zou het opnemen van dit patroon in het woordenboek veel ruimte uitsparen, daar deze combinatie veelvuldig voorkomt in de Engelse taal. In deze zin echter zal het compressieprogramma al snel een betere combinatie ontdekken om toe te voegen aan het woordenboek. Niet enkel “ou” wordt herhaald, maar de volledige woorden “your country” worden herhaald. In dit geval zal het programma in het woordenboek “ou” overschrijven door “your country”. “can do for” wordt ook herhaald, de ene maal gevolgd door “your”, wat verder door “you”. Dit geeft als resultaat een herhaling van het patroon “can do for you”. 15 karakters (inclusief spaties) stemmen hier overeen met één nummer, terwijl “your country” slechts 13 karakters omvat en dus minder voordelig is. “your country” wordt in het woordenboek vervangen door “r country”. Het programma onderzoekt dus de volledige tekst door herhalingen te detecteren en te berekenen welk patroon opgenomen moet worden in het woordenboek. De mogelijkheid om het woordenboek te herschrijven, vormt het “adaptieve” onderdeel van LZ adaptive dictionary-based algoritm. Door deze diepgaande zoekmethoden kan het bestand efficiënter verkleind worden dan wanneer je woorden uit de tekst zou lichten. Wanneer we gebruik maken van bovenstaande patronen en “_” toevoegen voor de spaties, komen we tot het volgende resultaat: 1. 2. 3. 4. 5.
ask_ what_ you r_country _can_do_for_you
De zin wordt dan: “1not_2345_-_12354.” Deze zin neemt 18 bytes in beslag, het woordenboek 41 bytes. De volledige bestandsgrootte is dus verminderd van 80 naar 59 bytes. Dit is slechts één manier om de zin te comprimeren, en niet noodzakelijk de beste.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.24
Hoeveel kan je comprimeren? De bestandsreductie ratio is afhankelijk van een aantal factoren, o.a. het bestandstype, de bestandsgrootte en het compressieschema. In de meeste wereldtalen verschijnen bepaalde letters en woorden vaak samen in hetzelfde patroon. Omwille van de vele herhalingen zijn tekstbestanden gemakkelijk te comprimeren. De meeste programmeertalen bevatten ook veel herhaalde informatie, aangezien ze gebruik maken van slechts een beperkt aantal commando’s, die vaak in dezelfde combinatie voorkomen. Bestanden die een grote hoeveelheid aan unieke informatie bevatten, zoals grafische bestanden of audiobestanden, kunnen niet met dit systeem gecomprimeerd worden aangezien ze slechts zelden patronen herhalen. Wanneer er veel herhalingen van patronen voorkomen in een bestand, neemt de reductie ratio toe met de bestandsgrootte. M.a.w. hoe groter het bestand, des te efficiënter een woordenboek is. Dat zie je aan ons voorbeeld; als we meer van Kennedy’s speech hadden, zouden we veel vaker naar het woordenboek kunnen verwijzen. En op die manier zouden we meer hebben aan elk patroon in ons woordenboek. Meer zelfs, als we over de volledige speech zouden beschikken, dan zouden we betere patronen kunnen ontdekken. De efficiëntie is ook afhankelijk van het specifieke algoritme dat gebruikt wordt door het compressieprogramma. Bepaalde programma’s zijn bijzonder geschikt om patronen te ontdekken in bepaalde bestandstypes, en zullen deze dan ook beknopter reduceren. Andere hebben woordenboeken in woordenboeken, een compressietechniek die vooral efficiënt is bij grote bestanden maar niet bij kleinere. Ook al werken alle compressieprogramma’s volgens hetzelfde basisidee, toch zijn er een groot aantal variaties op de manier van reduceren.
Lossy en lossless Wanneer je gebruik maakt van lossless compressie (compressie zonder verlies) kan het originele bestand achteraf exact gereproduceerd worden. Later vergroten we het tot de oorspronkelijke grootte, zodat we het opnieuw kunnen gebruiken. Alle tekstcompressie programma’s (zoals WinZip en StuffIt) werken zo. Lossy compressie werkt op een andere manier. “Onnodige” bits aan informatie worden geëlimineerd, zodat je een afgeslankte versie van het bestand krijgt. Deze compressietechniek wordt gebruikt om de bestandsgrootte van onder andere audiobestanden en bitmap afbeeldingen te reduceren. Wanneer je gebruikt maakt van lossy compressie, kan je later, na de compressie, het originele bestand niet meer reproduceren. Je zit dan opgescheept met de interpretatie die het compressieprogramma van het origineel heeft gemaakt. Daarom kan je deze compressiemethode niet toepassen op alles wat exact gereproduceerd moet worden, zoals software toepassingen, databases en inaugurele redes.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.25
2.2 Fotocompressie Op het web zijn er drie verschillende bestandsformaten die veelvuldig gebruikt worden bij afbeeldingen zoals foto’s, logo’s en ook animaties: • JPEG • GIF • PNG
JPEG JPEG staat voor Joint Photographic Experts Group. Het is een lossy compressie techniek voor afbeeldingen in kleur en grijstinten, en slaagt er in fotobestanden terug te brengen tot 5% van hun oorspronkelijke grootte. JPEG is ontworpen om gebruikt te worden op zgn. continue-tint afbeeldingen, dat zijn fotorealistische afbeeldingen. Vandaar dat een JPEG-bestand tot 16,7 miljoen verschillende kleuren kan weergeven. Het JPEG compressie algoritme gooit overtollige data weg. Afhankelijk van de settings die je gebruikt, zal het al dan niet opvallen dat er data is weggegooid. Als je een foto comprimeert tot JPEG, dan moet je altijd een afweging maken tussen kwaliteit en bestandsgrootte. Hoe kleiner de bestandsgrootte, des te slechter de kwaliteit zal zijn. Vermits het een lossy techniek is, kan je de originele foto niet meer reconstrueren uit de JPEG-versie ervan. Progressieve JPEG’s werken op een zelfde manier als geïnterlinieerde GIF’s. Er wordt aan de website bezoeker eerst een lage-resolutie versie getoond, die daarna in verschillende stappen scherper zal worden. In een foto-editor zoals Photoshop kan je het aantal stappen bepalen.
GIF GIF staat voor Graphics Interchange Format. In tegenstelling tot JPEG is GIF een lossless compressie techniek, en ondersteunt het slechts maximaal 256 kleuren. GIF gebruikt een LZW compressie-schema om de kleuren uit een afbeelding in een kleurenpalet te zetten. Elke pixel in een GIF-afbeelding heeft een waarde die verwijst naar het kleurenpalet. Die verwijzing neemt minder plaats in dan de kleur zelf. GIF werkt het best voor afbeeldingen die slechts enkele verschillende kleuren bevatten, zoals lijntekeningen, zwart-wit afbeeldingen, kleine tekst en logo’s, m.a.w. niet-fotorealistische afbeeldingen. Het GIF compressie algoritme is eigendom van Unisys/CompuServe, en firma’s die het algoritme willen gebruiken, moeten er een licentie voor nemen. GIF afbeeldingen kunnen samengevoegd worden tot een animatie. GIF laat ook transparantie toe; je kan een kleur uit het kleurenpalet doorzichtig maken. Het resultaat is dat de kleur van de onderliggende webpagina zichtbaar wordt.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.26
Interliniëren geeft van de afbeelding de indruk dat hij sneller laadt, in een webpagina. Wat er gebeurt is dat de GIF-afbeelding in verschillende stappen getoond wordt. Bij de eerste stap is de afbeelding nog wazig, maar naarmate meer data wordt gedownload, wordt het de afbeelding steeds scherper. Geïnterlinieerde GIF’s zijn ietsje zwaarder dan niet-geïnterlinieerde.
PNG PNG (uitgesproken als “ping”) staat voor Portable Network Graphics. Het is het derde en het recentste bestandsformaat voor afbeeldingen op het web. Oude browsers ondersteunen het formaat echter niet. PNG is ontwikkeld als patentvrij antwoord op GIF, maar het is ook een verbetering van de GIF techniek. Een afbeelding als PNG opgeslagen, kan 5 tot 25 procent kleiner zijn dan hetzelfde beeldje als GIF opgeslagen. PNG gaat verder op het gebied van transparantie door een graad van transparantie aan te wenden, opaciteit genoemd. Een PNG afbeelding verkleinen, opslaan, terug vergroten en opnieuw opslaan, vermindert de kwaliteit niet. Er wordt vanuit gegaan dat PNG ooit GIF zal vervangen. Nochtans zal GIF niet helemaal verdwijnen, vermits PNG geen animatie toelaat.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.27
2.3 Videocompressie
MPEG MPEG (The Moving Pictures Experts Group) is een standaard om geluid- en beeldbestanden te comprimeren tot een handig formaat om van het internet te downloaden, en op een CD of DVD schijfje te doen passen. Het MPEG-formaat is een lossy compressie techniek. Gewoonlijk wordt MPEG gebruikt om video- en filmdata op een kleinere ruimte te doen passen. De MPEG-1 standaard streamt video en audio aan 150 kilobytes per seconde, dat is dezelfde datastroom als bij een single-speed CD-ROM drive. MPEG-1 neemt bij video om de paar seconden een zgn. sleutelscène om daarna enkel de veranderingen van de tussenliggende ruimte op te slaan, in plaats van de volledige beelden. Jammer genoeg levert MPEG-1 maar middelmatige kwaliteit, ver onder de kwaliteit van standaard televisie. Dat komt omdat de resolutie beperkt is tot de helft van wat voor televisie wordt gebruikt. MPEG-1 is ongeveer evenwaardig aan VHS, maar lijkt soms beter, alleen al omdat het beeld stabieler is. CD-i en video-CD –twee formaten die 10 jaar geleden in omloop waren- maakten gebruik van MPEG-1 om een speelfilm op twee CD schijfjes te zetten. Met MPEG-1 krijg je namelijk iets meer dan één uur film op CD gebrand. Gebruik van de MPEG-2 compressie verbetert de kwaliteit aanzienlijk. Door MPEG-2 kan een gecomprimeerde video getoond worden aan bijna laser-disc kwaliteit, met een soundtrack die van audio-CD-kwaliteit is. Om deze reden maken hedendaagse media, zoals digitale satellietuitzendingen, HDTV en DVD, gebruik van MPEG-2. Het MPEG compressie systeem bevat een subsysteem om geluid te comprimeren, nl. MPEG-1 Audio Layer-3. We kennen het onder de afkorting MP3. Meer hierover in hoofdstuk 2.4. De laatste MPEG versies zijn MPEG-4 en MPEG-7. MPEG-4 is de opvolger van huidige geluid- en videocompressieformaten zoals MPEG-1 en MPEG-2, en is bedoeld voor video op het internet. Het is gebaseerd op de QuickTime-technologie: audio en video zijn de kern van MPEG-4, maar het ondersteunt ook 3D objecten, foto’s, tekst en andere types van media. De ontwikkelaars van het MP3-formaat hebben een nieuwe codec ontworpen als onderdeel van MPEG-4: AAC (Advanced Audio Coding), die een efficiëntere compressie toepast dan MP3. En als dat nog niet tot genoeg hype rond MPEG-4 heeft geleid, dan is er nog het interactieve karakter. De content kan zich aanpassen aan de interactie van de gebruiker. Het is bijvoorbeeld mogelijk om zelf het einde van de film te bepalen of spelletjes te spelen. Al moet dat met een korreltje zout genomen worden.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.28
DivX DivX is een recente compressie techniek (een codec) voor digitale video. DivX werd ontwikkeld door de firma DivXNetworks, en is een gepatenteerde merknaam. De DivX codec is gebaseerd op de MPEG-4 compressie standaard. DivX maakt gebruik van MPEG-4 voor de video compressie en van MP3 of WMA (Windows Media Audio) voor de audio compressie. MPEG-4 biedt een sterkere compressie in vergelijking met andere codecs zoals MPEG-2 (die op DVD's gebruikt wordt). ‘Sterker’ wil hier zeggen dat de codec in staat is een film van anderhalf uur zo te comprimeren dat hij op een CD-ROM past. Zoals je weet is de opslagcapaciteit van een DVD veel groter dan die van een CD-ROM. De codec die gebruikt wordt voor films op DVD –MPEG-2 met name– comprimeert dus minder sterk dan de codec die gebruikt wordt voor films op CD-ROM te passen: DivX reduceert een film tot 15% van z’n grootte op DVD. Op de vorige bladzijde kon je al lezen dat MPEG-1 films zo comprimeert dat ze uiteindelijk op twee CD-ROM’s passen. De DivX compressie is m.a.w. sterker dan MPEG-1, en bovendien geeft DivX een beter resultaat: DivX is aan MPEG2 gewaagd, terwijl MPEG-1 eerder VHS-kwaliteit levert. Met DivX kan je voor het eerst films aan DVD-kwaliteit downloaden over het internet, tenminste, als je een breedbandconnectie hebt. Je kan die film daarna op CD-ROM branden in het Video-CD formaat, of het SVCD formaat. Als je dan een DVD-speler hebt die ook Video-CD’s of SVCD’s afspeelt, kan je de film op TV bekijken. DivX mag je niet verwarren met DIVX. Dat laatste staat voor Digital Video Express, en was een Amerikaanse poging om films op DVD’s te beveiligen, waarbij je betaalde per gebruik. Als je bijvoorbeeld een film op DIVX kocht, mocht je die één keer bekijken. Wou je vaker kijken, dan moest je extra betalen. Een DIVX-speler had een internet modem en decryptiesysteem, die zorgden voor het contact met de centrale server en de decodering. De naam DivX is dan wel van DIVX afgeleid, maar daar houdt de overeenkomst op. Wil je ook DivX-films op je pc kunnen bekijken, dan moet je over drie zaken beschikken. Ten eerste: een DivX-codec, en die kan je downloaden op www.divx.com/divx. Wel opgelet voor de gratis pro-versie, want die komt met spyware aan boord. Ten tweede heb je een DivX-speler nodig, maar die heb je wellicht al: je kan je met Windows Media Player uit de slag trekken. Ten derde: een DivX-film. Gratis én legaal gaan hier blijkbaar moeilijk hand in hand, tenzij je je tevreden stelt met filmtrailers zoals op www.divxcrawler.com.
XviD XviD is een recente video codec die aan de MPEG-4 specificaties voldoet, en niet er enkel op gebaseerd is, zoals DivX. Het is een zgn. open source project van een stel programmeurs die er niet voor betaald worden. Iedereen die het kan, mag de video codec veranderen naar z’n eigen goesting. Daarin verschilt het van DivX, dat door een firma gecommercialiseerd wordt. Een XviD film neemt slechts 15% van de bestandsgrootte in t.o.v. dezelfde film op DVD (in MPEG-2 dus).
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.29
2.4 Audiocompressie
MP3 De bron van vrijwel elk MP3-bestand is een audio-CD. De maximale capaciteit van zo'n CD ligt rond de 747 MB, wat neerkomt op een goeie 74 minuten muziek in het CD-audioformaat (CDA). De reden hiervoor is dat die CDA-bestanden bestaan uit een aantal samples, meer bepaald 44.100 per seconde. Die samplefrequentie is nodig om muziek van hoge kwaliteit te kunnen genereren en werd niet zo maar willekeurig vastgelegd. Uit onderzoek (van Nyquist) is namelijk gebleken dat de samplefrequentie minstens tweemaal zo hoog moet zijn als de hoogste tonen die je wilt registreren. Blijf je daaronder, dan zal de muziek niet langer natuurgetrouw klinken. Aangezien het menselijk oor een toonhoogte van maximaal 20.000 Hz kan waarnemen, moet de samplefrequentie dus minstens dubbel zo hoog zijn; vandaar die 44.100 samples per seconde. Als je nu weet dat een sample uit 2 bytes (of 16 bits) bestaat en dat er voor elk stereokanaal een sample nodig is, dan kun je de datastroom per seconde berekenen: 44.100 x 16 x 2 = 1.411.200 bits per seconde. Delen we dit getal door 8, dan krijgen we 176.400 bytes per seconde of 172 Kilobytes (KB) per seconde (1 KB = 1.024 bytes). Een minuut muziek is dus goed voor 60 x 172 = 10.320 KB of ongeveer 10 MB (1 MB = 1.024 KB). Een doorsnee song van 4 minuten neemt in CDA-formaat dus al snel een 40 MB in beslag. Nu is een dergelijke datastroom voor een computer niet onoverkomelijk groot om te verwerken, maar als je een song van 4 minuten (40 MB) via een analoge modem met een snelheid van 56 Kilobits per seconde van het internet moet downloaden, dan ben je al snel een paar uur zoet. Het kost je niet alleen veel tijd maar ook geld, want je telefoonteller blijft natuurlijk lopen. Als je op die manier een aantal CD's binnenhaalt, dan raakt je harde schijf bovendien in geen tijd barstensvol, met alle gevolgen van dien, zoals een acuut gebrek aan schijfruimte. Geen wonder dus dat een aantal schrandere geesten op zoek ging naar een manier om de omvang van die bestanden in te perken. Ze kwamen tot de ontdekking dat er in muziekbestanden heel wat informatie zat die kon worden weggelaten zonder dat de kwaliteit daar erg onder te lijden had: het menselijk oor kan bijvoorbeeld bepaalde geluiden niet horen en kan sommige geluiden beter waarnemen dan andere. En van twee gelijktijdig klinkende tonen, kunnen we alleen de luidste horen. Met dergelijke wetenswaardigheden in het achterhoofd en door gebruik te maken van lossless compressietechnieken, kon de omvang van muziekbestanden met een factor 10 worden beperkt mét behoud van bijna CD-kwaliteit. En zo ontstond het MP3-formaat, wat voluit staat voor MPEG-1 audio layer 3. Concreet houdt MP3 in dat een bestand met een bitrate van 128 Kbit per seconde bijna dezelfde kwaliteit biedt als een CDA-bestand, maar ongeveer 10 maal minder plaats in beslag neemt.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.30
MP3-spelers Aanvankelijk was MP3 gebonden aan het computerplatform, maar al vrij snel ontstond de behoefte om die MP3-muziek te exporteren naar kleinere, draagbare toestellen, het succes van de walkman en mini-CD-speler indachtig. Het ZuidKoreaanse Saehan bracht in 1998 met de MPman de eerste hardwarematige MP3speler aan de man en daarmee was het hek van de dam: de markt werd in een mum van tijd overspoeld door fabrikanten, de ene al bekender dan de andere, die elk hun eigen MP3speler introduceerden. De meeste toestelletjes kunnen via een USBverbinding de muziekbestanden van de PC naar hun geheugen downloaden. Maar binnen een MP3-speler gebeurt er nog veel meer: in feite is het niets anders dan een kleine, gespecialiseerde computer. Voor je dus een noot muziek kan beluisteren moet een speler nog een aantal taken uitvoeren: binnenin de speler stuurt de microprocessor alle onderdelen aan en zendt de data vervolgens vanuit het geheugen naar de digital signal processor (DSP). Die krijgt instructies om de gecomprimeerde data uit te pakken en ze door te sluizen naar de digitaal-naaranaloogconvertor (DAC). Daar worden de digitale samples vertaald naar een analoog geluidssignaal. Na een ommetje langs de versterker wordt dat signaal ten slotte doorgestuurd naar de hoofdtelefoon. Zowel de versterker als de microprocessor luisteren voortdurend naar de commando's die via de bedieningsknoppen worden gegeven. Een MP3 speler bevat dus een microprocessor, geheugen, een interface, een DSP, een DA-convertor , een scherm, bedieningsknoppen, een versterkertje en een voeding. Je kan MP3-spelers opdelen volgens het opslagmedium dat ze gebruiken: 1. flashgeheugen 2. CD-ROM 3. harde schijf 1. Flashgeheugen is een soort ROM-geheugen dat geen stroom nodig heeft om zijn inhoud te bewaren. Bovendien heeft flashgeheugen geen bewegende onderdelen en dat maakt het, in tegenstelling tot een CD-speler en een harde schijf bijvoorbeeld, uitermate geschikt voor draagbare toepassingen omdat het schokbestendiger is. Dit soort van MP3-spelers zijn bovendien erg klein en licht. De stroomvoorziening bestaat over het algemeen uit één of twee AA-batterijtjes van 1,5 Volt, of een ingebouwde oplaadbare batterij. Aangezien er geen bewegende delen in een flash-type MP3-speler zitten, gaan die batterijen vrij lang mee. De eerste MP3-spelers hadden 32 MB intern geheugen aan boord, maar omdat je daarop amper een half uurtje muziek in MP3 kunt bewaren, is 512 MB of zelfs 1 GB nu de standaard geworden. Sommige apparaatjes kiezen trouwens voor losse geheugenkaartjes zoals CompactFlash, SmartMedia of Memory Stick. Het voordeel daarvan is dat je die ook voor andere toepassingen kan inschakelen (digitale fotografie, PDA, enzovoort). Sommige flash MP3-spelers (zoals de iPod shuffle) kan je ook als USB-stick gebruiken. In de bijhorende software bepaal je dan hoeveel ruimte je reserveert voor muziek, en hoeveel ruimte voor andere bestanden.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.31
2. Naast de flash MP3-spelers zijn er varianten op de markt die andere opslag- en afspeeltechnieken hanteren. Zo zijn er draagbare CD-spelers die ook MP3 CDROM’s kunnen afspelen. Dat zijn gewone CD-R schijfjes waarop je met behulp van brandsoftware je muziek in MP3-formaat in plaats van in CDA (WAV of AIFF dus) kunt schrijven en die door een “gewone” audio-CD-speler niet herkend worden. Op zo’n CD'tje kun je, dankzij het MP3-formaat, 10 keer meer songs proppen dan in het CD-audioformaat. Het nadeel van dergelijke spelers ten opzichte van de flash-varianten is dat ze niet alleen groter en dus minder draagbaar zijn, maar dat ze ook een hoger stroomverbruik kennen. Bovendien is het erg vervelend van telkens opnieuw een nieuwe CD te moeten branden, als je je playlist wil veranderen, of ik zeg maar, slechts enkele nieuwe nummers wil toevoegen. 3. Het derde type MP3-speler is uitgerust met een heuse harde schijf waarop ettelijke gigabytes en dus honderden uren muziek passen. In vergelijking met de flash-varianten zijn ze veel goedkoper, uitgedrukt in Euro per GB, welteverstaan. In tegenstelling tot wat je zou denken, zijn MP3-spelers met harde schijf heel goed bestand tegen schokken. Dat komt omdat er ook een klein stukje flashgeheugen mee aan boord zit. Bovendien kan je dit soort spelers gelijktijdig gebruiken als externe harde schijf – het toestel is slim genoeg je muziek en andere bestanden uit elkaar te houden. De iPod (20 GB), iPod photo (30 GB) en iPod mini (4 of 6 GB) zijn zulke toestellen.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.32
AAC, MP3 Pro en AAC Plus AAC staat voor Advanced Audio Coding. Net zoals MP3 een onderdeel is van MPEG-1, is AAC een onderdeel van MPEG-4. Van MP3 bestaat er trouwens al een opvolger: MP3 Pro. Net als AAC levert het dezelfde kwaliteit met de helft van de bitrate, namelijk 64 Kbit per seconde. Grofweg zijn AAC- en MP3 Pro -bestanden dus de helft zo groot als hun MP3-collega's. Maar ook AAC heeft een opvolger klaar: AAC Plus. Het belooft eenzelfde kwaliteit als MP3, maar gebruikt slechts een bitrate van 48 kbps. Een AAC Plus bestand is dus net ietsje groter dan één derde van een MP3. Dat maakt het de beste audiocompressie standaard van dit ogenblik.
WMA Het succes van MP3 was een doorn in het oog van Microsoft en daarom bracht het een eigen variant uit: Windows Media Audio of Kortweg WMA, dat standaard in de Windows Media Player zit ingebakken en dezelfde kwaliteit biedt als MP3. Hét verschil met MP3 is dat WMA kan worden beveiligd zodat je niet zomaar altijd en overal bestanden kan afspelen. Dat was koren op de molen van de muziekindustrie, die totnogtoe haar tanden op het MP3-formaat heeft stukgebeten. Maar ondanks die sterke achterban van WMA, blijft MP3 nog altijd veruit het populairste formaat.
MiniDisc (ATRAC) Sony heeft een lange traditie in draagbare audio. De MiniDisc-spelers zijn lang een speerpunt geweest in dat segment. Een MiniDisc (MD) is een klein optisch schijfje dat in een bescher-mend doosje van hard plastic zit. Een MD kan je gebruiken in de huiskamer, om muziek op te nemen van CD bijvoorbeeld, maar je kan een MD-speler ook aan een PC hangen. Niet om MP3’s te kopiëren, wel om zogenaamde ATRAC-bestanden over te pompen. En ATRAC kan je beschouwen als de MP3’s van Sony. Het zijn dus ook gecomprimeerde muziekbestanden, maar ze kunnen enkel worden aangemaakt via de bijgeleverde software, SonicStage. Die kopieert en converteert een CD in een kwartier naar je MiniDisc. Op één MD krijg je grofweg vier CD’s. Er bestaan sinds kort ook MD’s waar 320 minuten aan muziek op past. Op de Sony-site kan je lezen dat een MD “CDA kwaliteit” levert, maar dat is eenvoudigweg niet waar. ATRAC is een compressietechniek, en net zoals alle gecomprimeerde audio hoor je het verschil met een audio-CD. Tenminste als je de muziek via luidsprekers beluistert in je huiskamer, niet als je in de stad rondloopt met een hoofdtelefoontje. Er is echter één groot bezwaar: nergens op het internet kan je ATRAC-bestanden uitwisselen. Je kan dus enkel je eigen CD’s converteren naar ATRAC. Je zou ook MP3’s van het internet kunnen halen en die omvormen naar ATRAC, maar dan vertrek je van de inferieure geluidskwaliteit van een MP3 die nog eens verslechtert door het om te vormen naar ATRAC. ATRAC lijkt een gevecht te voeren tegen de bierkaai, in casu het MP3-formaat en de enorme verspreiding ervan.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.33
2.5 Streaming versus downloadable media Als je een filmpje op het web bekijkt, of een stukje audio beluistert, dan kan dat volgens één van twee principes: streaming, of downloadable.
Streaming Een streaming filmpje wordt niet op je harde schijf opgeslagen vooraleer je het kan bekijken. De data stroomt over het internet je computer binnen, wordt gebufferd (om een vlot afspelen te garanderen), maar wordt niet opgeslagen. Bijgevolg kan je het filmpje wel bekijken, maar kan je het niet bewaren. Dat is vooral een groot voordeel voor de producenten die de willen vermijden dat er illegale kopies van worden gemaakt. Maar het is ook een voordeel voor jou: je zou toch niet willen dat het radioprogramma waar je naar hebt geluisterd, ruimte op je harde schijf inneemt. Het is een groot misverstand te denken dat streaming media live moeten zijn. Streaming media kunnen live zijn (denk maar aan live internet radio), maar ook eerder opgenomen materiaal kan streaming uitgezonden worden, zoals bijvoorbeeld het TV-journaal van eerder op de dag, een video uit het archief van een grote nieuwszender, of een radioprogramma van eerder van de week.
Downloadable Bij downloadable video wordt het hele filmpje wel op je harde schijf gezet. Als het een MPEG-1 filmpje is, moet je wachten tot het helemaal is gedownload vooraleer je kan beginnen kijken. Andere formaten, zoals Windows Media, Real Media en QuickTime, beginnen het filmpje reeds af te spelen wanneer slechts een klein deel is gedownload. Er zijn drie verschillende formaten die heel populair zijn: Windows Media, Real Media (van Realnetworks) en QuickTime. Alle drie werken zowel op PC als op Mac, en gebruiken een eigen player om het af te spelen. Zo heb je Windows Media Player, Real One Player en QuickTime Player. Van elk van de drie formaten heb je zowel een streaming als een downloadable versie.
Met elk van de drie players kan je trouwens ook andere formaten afspelen dan het eigen formaat. Zo kan je op alle players naar MP3’s luisteren of MPEG-1 filmpjes bekijken. Het komt er gewoon op aan van de juiste codec geïnstalleerd te hebben. Omdat alle drie de formaten populair zijn, stelt dat webmasters wel voor een praktisch probleem. Om een groot publiek te bereiken zijn ze verplicht hetzelfde filmpje in alle drie de formaten te encoderen. Meer zelfs: omdat een deel van de surfers via een analoge telefoonmodem het net op gaat, en een ander deel van de surfers via breedband, wordt elk formaat zowel in breedband als in smalband geëncodeerd. Je eindigt dus met hetzelfde filmpje in zes verschillende versies. Vandaar dat webmasters hopen dat MPEG-4 een waar multi-platform formaat wordt zoals MP3 dat nu voor muziek is. Een video haalt bovendien in MPEG-4 dezelfde kwaliteit als in MPEG-2. Er is geen verschil zichtbaar, behalve dan in de bestandsgrootte: een MPEG-4 filmpje is veel kleiner dan de MPEG-2 variant.
Huenga.com/multimedia | 1CM | © april 2005 |
[email protected] |
p.34