Wouter Snoei
Disintegration
1
Wouter Snoei - Disintegration Werkbeschrijving
Inleiding
Disintegration is een volledig synthetisch tape-stuk, voltooid in 1998. Alle gebruikte klanken zijn dus opgewekt met electronica; geen van de klanken is geregistreerd of zelfs maar beïnvloedt door concrete geluiden uit de buitenwereld. Het stuk is volledig binnen een computersysteem (digitaal) gegenereerd, bewerkt en gemixed en wordt pas tot “echt” geluid op het moment dat het wordt uitgevoerd. Al het brongeluid is afkomstig van één - in essentie betrekkelijk eenvoudig - digitaal proces, waaraan ik ongeveer acht maanden (met tussenpozen) heb geprogrammeerd en gesleuteld om het onder controle te krijgen. Het gebruikte computer-programma hierbij is M.I.T.’s Csound. Van dit proces heb ik ook een “realtime”-versie geprogrammeerd, die ook “real-time” beïnvloedbaar is. Deze heb ik gebruikt om het proces beter te leren kennen alvorens ermee te gaan componeren.
Csound
Opzet
Dit stuk is dus volledig gebaseerd op één klankproces. Het is van het begin af aan mijn bedoeling geweest om dat proces in al zijn aspecten te etaleren, weliswaar in de vorm van een muzikaal verhaal, omdat ik vond dat het proces op zich interessant genoeg was. Uiteindelijk heb ik besloten om het proces gedeeltelijk “puur” te laten horen, en gedeeltelijk bewerkt als ware het een concreet (“gesampled”) geluid. Het stuk bestaat uit drie delen, die ieder zowel de eerste (pure) als de tweede (bewerkte) vorm bevatten, maar wel steeds op een andere manier. Een tweede aspect van de compositie is het eveneens vooraf geplande principe van een voorgrond- en een achtergrondlaag, die zich onderscheiden door volume en plaats in de ruimte. Oorspronkelijk was ik van plan om de voorgrondlaag alleen op de voorste twee speakers te plaatsen, en de achtergrond/omgevings-laag zowel voor als achter te laten klinken (Disintegration is een quadrafonisch stuk). Ook was het de bedoeling dat de achtergrond laag het hele stuk door constant aanwezig zou zijn, d.w.z. zonder stiltes en zonder grote dynamiek-verschillen. Dat laatste heb ik tijdens het componeren aan de kant gezet ten behoeve van de dramatiek en tegelijkertijd de “luchtigheid” van het gehele stuk. De nadruk ligt nog steeds vrijwel het gehele stuk door op de voorste twee speakers. Het resultaat van dit compromis is dat de “achtergrondlaag” voor een groot gedeelte van het stuk stil is, op sommige plaatsen (zoals in het begin) de oorspronkelijke funktie van zacht omgevingsgeluid heeft, en op andere momenten meer aanvulling is op de voorgrondlaag (met name in het tweede gedeelte). In het laatste gedeelte is zelfs sprake
Wouter Snoei
Disintegration
2
van enkele imitaties van de voorgrondlaag. De oorspronkelijke ruimtelijke opzet is wel gehandhaafd. Disintegration bestaat dus uit drie gedeelten. In het eerste (en kortste) deel wordt eerst het proces, in zijn eenvoudigste vorm, min of meer geïntroduceerd. Ook het achtergrond/voorgrond principe komt er direct aan de orde. Het deel ontwikkelt naar een amplitude-modulatie-achtige bewerking en sterft vervolgens uit. Het tweede gedeelte start met wederom een “instantie” van het proces, ditmaal gevolgd door een lange beweging (± 2,5 minuut) en ontwikkeling naar een ruisachtigere klankwolk structuur. Deze beweging wordt in de vijfde minuut (5’01”) abrupt afgebroken, waarbij slechts enkele zachte klanken in de voor-/ en achtergrondlaag doorgaan. Hier volgt een nieuwe instantie van het proces, die al snel wegvalt en gevolgd wordt door de complexere ruisachtige structuur waar de zojuistgenoemde lange beweging al naartoe ontwikkelde. Over dit gedeelte valt weinig meer te zeggen dan dat het een combinatie is van verschillende stochastische klankwolk-bewerkingen en amplitude-modulatie bewerkingen van concrete samples van het proces. Na ongeveer anderhalve minuut (6’40”) wordt een nieuwe bewerking geïntroduceerd (in de achtergrondlaag!), namelijk een “gestretchde” (in tijd verlengde) versie van het proces door middel van zgn. Wavesetstretching (MarcoHack). Hierna verplaatst het totale geluidsbeeld zich langzaam naar beneden (in frequentie/spectrum) om vervolgens langzaam weg te sterven. Hierbij is zacht in de voorgrondlaag al wel materiaal van het derde en laatste deel aanwezig. Op het moment dat het tweede deel volledig is weggestorven (8’52”) zet het derde deel in met wederom een instantie van het bekende proces. Tijdens het maken van de compositie heb ik nog aanvullingen en veranderingen aangebracht in het programma dat het proces opwekt en aanstuurt. Het gevolg daarvan is dat het proces in het laatste deel beduidend anders klinkt dan in de voorgaande delen. In dit laatste gedeelte is voornamelijk het “pure” proces te horen, waarvan de inzetten georganiseerd zijn aan de hand van stochastische principes en enkele transposities. Ook komt de eerder gebruikte amplitude-modulatie bewerking nog even terug. In dit laatste deel zit niet zozeer een duidelijke ontwikkeling; hier ligt de nadruk meer op de complexiteit en tegelijkertijd ook samenhang tussen de hoorbare geluidsgroepen en lagen. Toch is er wel een gebaar aanwezig over de gehele lengte van dit laatste gedeelte (± 4,5 minuut). Dat gebaar is vooral goed waarneembaar in de quadrafonische versie waar de nadruk verplaatst van voor naar achter en vervolgens weer terug. Voor dat uitsterven (“uitfaden”) is bewust gekozen om nog eens extra te benadrukken dat het laatste gedeelte meer een constante klankwereld is dan dat er sprake is van een verhalende gestiek. Kort samengevat bestaat het stuk dus uit een “introductie/inleiding” van het proces, een “ontwikkeling” naar verschillende variaties en een soort “constante eindtoestand”.
Wouter Snoei
Disintegration
3
Multiplied Feedback
Het in Disintegration gebruikte klankmateriaal vindt zijn oorsprong in een eenvoudige terugkoppelings-schakeling. Deze van oorsprong analoge schakeling heb ik digitaal gesimuleerd, in eerste instantie om te kijken of ik zo’n proces ook op de computer onder controle zou kunnen krijgen, en in tweede instantie om de gebruiksmogelijkheden ervan te vergroten (het is nu bijvoorbeeld geen probleem meer om een groot aantal van deze schakelingen gelijktijdig en onafhankelijk van elkaar te laten werken - zie ook digitaal versus analoog). De schakeling in zijn eenvoudigste vorm ziet er alsvolgt uit:
De ring-modulator1 ( * ) geeft de klank een complexe niet-harmonische formant-structuur die karakteristiek is voor dit proces. Verder bracht de computer-implementatie nog wat andere karakteristieke eigenschappen met zich mee, waaronder de scherpe harde aanzet (zie Computer-Implementatie). Door de frequentie van de sinustoon, de delay- (= vertragings-) tijd en andere (in dit eenvoudige schema weggelaten) parameters te manipuleren kan deze schakeling een bijna oneindige hoeveelheid verschillende (weliswaar karakteristieke) klanken produceren. Het resultaat van een gekozen parameterinstelling is niet volledig te voorspellen, hoewel een zelfde setting wel altijd dezelfde klank zal opleveren. De schakeling is qua klank ook gevoelig voor programma-technische omstandigheden, zoals bijvoorbeeld de block-size (in Csound). Een verandering van deze block-size maakt het resultaat soms scherper of doffer, afhankelijk weer van de andere parameter-settings. Dit geeft ook al aan dat deze schakeling, hoe eenvoudig hij ook lijkt, zich niet zo makkelijk laat vangen in een digitale omgeving... Computer Implementatie
Om de “Multiplied Feedback” -schakeling goed te kunnen implementeren de computer moesten eerst een problemen worden opgelost. Ik zal programmeren zo uitgebreid mogelijk proberen toe te lichten zonder computer-technische termen te vervallen, mede om weer te geven computer het uiteindelijke klinkende resultaat heeft beïnvloed.
en gebruiken op het proces van daarbij in strikt in hoeverre de
Het principe van de Multiplied Feedback schakeling is alsvolgt: Een sinustoon wordt in een vermenigvuldiger (multiplier, ring modulator1) gevoerd. De uitgang van de vermenigvuldiger wordt vertraagd met behulp van een delay-unit, of, in de analoge situatie, met een tapeecho2. Vervolgens wordt deze in de tweede ingang van de vermenigvuldiger gevoerd (zie
Wouter Snoei
Disintegration
4
Multiplied Feedback - eenvoudig schema). Hier ontstaat de terugkoppeling; de sinus-toon wordt vermenigvuldigd met een vertraagde versie van zijn eigen vermenigvuldiging van een vertraagde versie van zijn eigen vermenigvuldiging met een vertraagde...enz.. Tevens ontstaan hier de problemen met de computer-implementatie: Ten eerste: Het proces komt niet op gang, omdat in een computer een vermenigvuldiging met nul altijd nul is. In de analoge versie wordt dit probleem in feite opgelost door de imperfectie van het systeem; de analoge multiplier is nooit helemaal stil, hij “lekt” een beetje van het signaal uit beide ingangen. Ook tape-echo geeft altijd een beetje ruis waardoor er dus altijd in beide ingangen van de vermenigvuldiger signaal komt. Omdat deze ruis en lekkage in een digitaal systeem niet optreed moest ik die er zelf aan toevoegen. Dit heb ik gedaan door in de implementatie een beetje (± 0,01 %) sinussignaal te laten buiten de vermenigvuldiger om naar de delayline te voeren en ook een beetje (± 0.001%) ruis aan de schakeling toe te voegen. In principe slechts één van deze twee toevoegingen al genoeg zijn voor het laten starten van de klank. Ten tweede: Wanneer we twee geluidssignalen met elkaar gaan vermenigvuldigen lopen de waarden (we hebben het hier over een digitaal proces - alles werkt met getallen!) al gauw ver buiten het maximale bereik, en helemaal wanneer we terugkoppeling erbij betrekken. Dit resulteert in een zeer extreem overstuurde klank die ik esthetisch niet erg aantrekkelijk vindt. De oplossing voor dit probleem heb ik gevonden in compressie. Het programma meet het gemiddelde niveau (Random Mean Square, RMS) van het signaal binnen de schakeling en zodra dat boven de 76.2%(3) uitkomt, past hij het niveau zo aan dat het daar weer onder komt.
Wouter Snoei
Disintegration
5
Aangezien we niet het exacte niveau meten maar het gemiddelde, reageert deze compressie-”unit” enigzins traag. Gevolg hiervan is de harde scherpe aanzet, waar de waarden toch even buiten het maximale bereik vallen. Dit laatste heb ik bewust binnen het proces gehouden omdat juist die “attack” de klanken erg interessant maakt. Inmiddels ziet het schema er dus alsvolgt uit:
Om de klank de eerder genoemde complexe formant-structuur te geven moeten op dit schema enkele toevoegingen gedaan worden. Ten eerste moet de frequentie van de sinustoon gevarieerd worden, zodat de vermenigvuldiging met het vertraagde signaal som- en verschiltonen produceert. Ten tweede moet er galm toegevoegd worden om de verschillende frequenties uit te spreiden in de tijd. In mijn implementatie heb ik twee galmunits gebruikt; één voor de terugkoppeling (direkt op de sinus), en één binnen de terugkoppeling, vóór de compressie om de RMS-meting constanter te laten verlopen. De plaatsing van de tweede galm-unit zorgt ook voor de scherpte en het ruisachtige karakter van de “attack”, aangezien de ongecomprimeerde waardes ook buiten het bereik van deze galm-unit vallen en dus “clipping” (oversturing) veroorzaken. De frequentie-variatie heb ik op vier plaatsen toegepast: één direkt op de sinusgenerator zelf, één ná de eerste galmunit en twee achter elkaar in serie binnen de terugkoppeling. Deze unit’s heb ik modulatie genoemd, ze variëren alle vier de frequentie in de vorm van een sinus-golf met 2 tot 10 Hz. Bij de parameters kan één modulatie-snelheid worden opgegeven waaruit die van de andere drie wordt berekend (om ervoor te zorgen dat ze allemaal verschillend zijn). Bovendien kan er ook nog een funktie-grafiek worden ingevoerd voor het totale frequentieverloop van de sinustoon.
Wouter Snoei
Disintegration
6
Een volgend probleem waar ik tegenaan liep was dat weliswaar de klank erg aantrekkelijk was, maar er wel grote fluctuaties in het volume aanwezig waren. De oorzaak hiervan bleek te liggen in door het proces mede gegenereerde “infrasone” frequenties (tonen onder de 15Hz worden niet meer waargenomen door het menselijk oor). Dit probleem was dus eenvoudig op te lossen door een High Pass filter (hoog doorlaat, HPF) in de schakeling binnen de terugkoppeling te plaatsen. Inmiddels ziet ons schema er alsvolgt uit:
Het klankmateriaal dat dit schema opleverde is gebruikt in het eerste deel en tweede deel van Disintegration. Tijdens het maken van het stuk heb ik een variatie op dit schema gemaakt, waarmee ook het laatste aspekt van de analoge versie is geïntroduceerd: filtering. Ik heb binnen de terugkoppeling twee Band Pass filters geplaatst die constant in frequentie variëren. Deze twee filters staan parallel aan elkaar en bij de parameters kan bepaald worden in hoeverre ze in het signaal gemengd kunnen worden. De bandbreedte van het eerste filter is 1000 Hz, en van het tweede 10.000; voor deze grote waarden heb ik gekozen omdat met kleinere bandbreedtes de frequentie van het signaal naar mijn smaak teveel bepaalden, waardoor ook de complexiteit afnam. De frequentie van beide filters verloopt in willekeurige (random) volgorde, binnen een vastgesteld gebied. (zie tweede volledige schema op de volgende pagina) In mijn computer implementatie van het multiplied feedback proces kan de gebruiker (ikzelf dus) behalve de frequentie, delay-tijd, modulatie-snelheid, het ruisniveau, het “lekkage”niveau en het verloop van de frequentie over tijd ook de tijdsduur, het totaalniveau, een volumeverloop (aanzwellen/afsterven) en een positie in het stereoveld bepalen. Bovendien is men in staat om meerdere “instanties” van het proces tegelijkertijd te laten klinken. Voor de realisatie van mijn compositie heb ik van deze mogelijkheden uitgebreid gebruik gemaakt, hoewel ik ook bewerkingen heb gemaakt van losse klankresultaten met andere computerprogramma’s.
Wouter Snoei
Disintegration
7
Aangezien de uiteindelijke hoeveelheid rekenwerk die de computer moet uitvoeren relatief klein is, is het mogelijk om het proces ook “real-time” te gebruiken. Met de huidige computersystemen beperkt die mogelijkheid zich echter tot één enkele instantie tegelijk. In mijn implementatie heb ik de mogelijkheid gecreëerd om ter plekke met de muis de frequentie en het volume van de sinustoon te kunnen beïnvloeden. Zoals in de inleiding reeds vermeld heb ik dit gebruikt om zelf de klank van het proces te kunnen ontdekken en te onderzoeken.
Digitaal versus Analoog
Het principe van de Multiplied Feedback-schakeling is min of meer geïmporteerd uit de analoge studio (van het Instituut voor Sonologie) waar een vorm van deze schakeling in het lesmateriaal is opgenomen. Toch zijn er een aantal essentiële verschillen tussen mijn computer-implementatie en de analoge versie (zie ook schema analoge versie op volgende bladzijde). Het meest opvallende verschil is het begin van de klank: Waar in de analoge versie de klank zich langzaam opbouwt tot een klankbaan, ontstaat in de digitale versie de klank met een scherpe tik. Dit is te wijten aan de methode van compressie en het digitaal-zijn van de vermenigvuldiging. In een analoge versie is het eenvoudig mogelijk om een geleidelijk volume-verloop te realiseren door de amplitude te meten en deze vervolgens omgekeerd op het signaal toe te passen (m.b.v.. amplitude demodulatie, inversie en amplitude
Wouter Snoei
Disintegration
8
modulatie - AMD, INV, V-AMM). Dit is met Csound momenteel niet mogelijk, althans niet op een goed controleerbare manier. De extreme amplitude-waarden die een multiplier al snel uitstuurt wanneer er een gebrek aan besturings-mogelijkheden is klinken bij de digitale versie aanzienlijk scherper (hoog-frequenter) dan bij de analoge versie. De analoge versie gebruikt de zojuist beschreven compressie-methode om deze oversturing te voorkomen. Wanneer we in de analoge versie een compressie-techniek gebruiken met een soortgelijke werking als mijn digitale compressor (RMS Limiter), wordt de aanzet al wel even snel en plotseling als de digitale maar blijft hij minder scherp en ruisachtig. Een minder opvallend maar wel essentieel verschil met de analoge versie is de galm en de filtering. In de analoge versie wordt gebruik gemaakt van de ouderwetse (maar wel mooie) galm van de “Digital Reverbrator” (DRV). Dit apparaat heeft behalve een zeer karakteristiek geluid ook ingebouwde modulatie. In de digitale Csound-omgeving zijn dit soort modulerende galmen niet beschikbaar, en moet de modulatie dus zelf geprogrammeerd worden. Mijn keuze om dat met verschillende sinusvormige modulatoren te doen heeft een duidelijk hoorbare invloed op het resulterende geluid. Voor de filtering geld een soortgelijk verschil: dit wordt in de analoge versie met het zéér karakteristieke “Third Octave Filter” (THF) gedaan, terwijl in de digitale versie verlopende bandfilters worden gebruikt. Een soortgelijk filter als het analoge derde-octaaf-filter is in principe wel na te bootsen met een computerprogramma, maar dat kost erg veel tijd (zowel van de processor als van de programmeur) en zal nooit helemaal hetzelfde klinken, om nog maar niet te spreken van het grote aantal parameters wat hiervoor moet worden toegevoegd (één per terts).
Schema analoge versie
Verklaring van het schema: MAT: Manual Trigger - een drukknop voor handmatige triggering, AC-MUP: MultiPlier voor audio signalen. AMD: Amplitude Demodulator - volgt het volumeverloop van een audiosignaal en zet die om in een struurspanning. De rest van de in dit schema gebruikte termen zijn terug te vinden in H1 - Bronmateriaal en Werkwijze. Iedere keer wanneer de
Wouter Snoei
Disintegration
9
MAT wordt ingedrukt verandert de invoerfrequentie, waardoor de klank zich opnieuw gaat opbouwen. In een digitale vorm is de klank van de schakeling wel moeilijk controleerbaar, maar als dat eenmaal gelukt is worden de gebruiksmogelijkheden mijns inziens groter dan die van de analoge versie. Een belangrijk voordeel is het grote aantal processen wat nu tegelijk in gang gezet kan worden en, met als enige limiet de hoeveelheid geheugen in de computer. Een ander voordeel is de mogelijkheid het verloop van de parameters van te voren te kunnen plannen, waar dat in de analoge versie hooguit achteraf kan (door editing). Een derde voordeel is het de absoluut perfecte geluidskwaliteit van de digitale versie, hoewel ik begrijp dat dat niet door iedereen gewaardeerd wordt. In mijn stuk ben ik vooral blij met het totale gebrek aan bandruis bij editing, aangezien ik daardoor de mogelijkheid kreeg om iedere gewenste hoeveelheid klankbanen op elkaar te stapelen zonder kwaliteitsverlies. Een nadeel van het digitaliseren van het proces is de toevoeging van ruis door de delayline. Dit is het gevolg van het verschil tussen de frequentie(s) van het signaal en de lengte van de delay-line, wat bij alle feedback-situaties in een digitale omgeving optreed. Ook in Disintegration is deze ruis op enkele plaatsen te horen (bijv.:2’38”. De reden dat ik deze ruis in het stuk niet weglaat is dat ik het proces in al zijn facetten wilde laten horen, ook in de esthetisch minder aantrekkelijke. Vaak wordt als argument tegen digitaal geluid in muziek ook het gebrek aan “warmte” genoemd. In sommige gevallen ben ik het hiermee eens, maar in het geval van Disintegration niet. Van het begin af aan ben ik van plan geweest op het stuk als het af zou zijn even over te zetten op een analoge tape om deze “warmte” alsnog te kunnen genereren. Toen het stuk eenmaal af was vond ik dat niet meer nodig, aangezien het resultaat al “warm” genoeg klonk op een normale CD-speler.
1
) De term “Ring-modulator” wordt in de meeste synthesizers gebruikt om een vermenigvuldiger (multiplier) aan te duiden, hoewel de
”klassieke” vorm van de ringmodulator één van de twee ingangs-signalen omvormt tot een blokgolf alvorens te vermenigvuldigen met het andere signaal. Deze toevoeging zorgde theoretisch voor een complexer en dus onvoorspelbaarder uitgangs-signaal, hoewel praktisch vooral een erg karakteristieke kleuring te horen was. In mijn model gebruik ik slechts een Multiplier, de aanduiding Ringmodulator is dus eigenlijk misplaatst (maar wel conventioneel). 2
) Een tape-echo ontstaat wanneer men bij een klassieke 1/4- 1/2- of 1inch tape-recorder de opname- en afluisteringskoppen tegelijk
actief maakt. Aangezien er een afstand zit tussen deze twee (afhankelijk van de desbetreffende recorder) ontstaat er een tijdsvertraging tussen het opgenomen en weer afgespeelde signaal en zijn origineel, instelbaar met de afspeelsnelheid van de tape. Dit is op de digitale delay na de kwalitatief beste methode om een vertragingstijd of een echo-effect te realiseren (in een analoge omgeving). 3
) Het getal 76,2% is zo gekozen omdat: ten eerste bij 80 tot 100 procent het resultaat toch nog overstuurd werd als gevolg van de trage
reactie van de RMS-meting; ten tweede ik voor het gemak de ronde amplitude-waarde 25000 gekozen heb, wat 76,2% is van de (in Csound gebruikelijke) hoogst mogelijke amplitude-waarde 32768.