VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY
ANALÝZA POČÍTAČOVÉ SIMULACE ZVUKU A JEJÍCH LIMITŮ
Vypracoval: Bc. Ondřej Hlavsa Vedoucí práce: PhDr. Ing. Antonín Pavlíček, PhD. Rok vypracování: 2010
PROHLÁŠENÍ Prohlašuji, že jsem tuto diplomovou práci vypracoval samostatně. Veškeré použité podklady, ze kterých jsem čerpal informace, jsou uvedeny v seznamu použité literatury a citovány v textu podle normy ČSN ISO 690.
V Ústí nad Labem dne 3.5.2010
Ondřej Hlavsa
2
PODĚKOVÁNÍ Rád bych tímto poděkoval svému vedoucímu práce PhDr. Ing. Antonínu Pavlíčkovi, PhD. za jeho podnětné rady a všem vyučujícím fakulty, kteří mi za dobu studia předali celou řadu cenných znalostí.
3
ABSTRAKT Tato práce se zabývá možnostmi věrné simulace zvuku hudebních nástrojů na osobních počítačích. Úvodní kapitoly jsou věnovány základním vlastnostem zvukové informace, jejímu vnímání a digitální podobě zvuku. Dále je pak podrobně rozpracována problematika počítačové simulace s ohledem na strukturu skutečných záznamů. Výstupem z této části jsou i formulované hypotézy. V dalších částech jsou pak analyzovány softwarové přístupy a metody tvorby počítačového zvuku. Hlavním výstupem práce jsou pak výsledky průzkumu formou poslechového testu, v němž se autor snaží potvrdit stanovené hypotézy a odpovědět tak na základní otázku. Klíčová slova zvuk, syntéza zvuku, syntetizér, sampler, MIDI, VST, počítačová simulace, hudební software
ABSTRACT This thesis is focused on the question whether it is possible to fully simulate the sound of real musical instruments on the personal computer. The opening chapters deal with basic characteristics of sound information, its perceiving and also its digital form. Futher there is an elaborate analysis of computer simulation in comparison with legitimate records. The output of this part are worded assumptions. The next parts offer a detailed look at programming approaches and methods of computer sound creation. The research leads to a hearing test in which author tries to confirm the hypotheses as well as to answer the primary question. Key words sound, sound synthesis, synthesizer, sampler, MIDI, VST, computer simulation, music software
4
OBSAH PROHLÁŠENÍ ................................................................................................................................................... 2 PODĚKOVÁNÍ.................................................................................................................................................. 3 ABSTRAKT....................................................................................................................................................... 4 OBSAH................................................................................................................................................................... 5 1 ÚVOD.................................................................................................................................................................. 7 1.1 VÝBĚR TÉMATU ....................................................................................................................................... 8 1.2 CÍLE ............................................................................................................................................................. 9 1.3 STRUKTURA PRÁCE................................................................................................................................. 9 2 ZVUKOVÁ INFORMACE A JEJÍ VNÍMANÍ ............................................................................................. 11 2.1 VLASTNOSTI ZVUKU............................................................................................................................. 11 2.2 DRUHY SIGNÁLU.................................................................................................................................... 12 2.3 VNÍMÁNÍ ZVUKU.................................................................................................................................... 13 3 DIGITÁLNÍ ZVUK ......................................................................................................................................... 16 3.1 PRINCIP DIGITALIZACE ZVUKU ......................................................................................................... 16 3.2 AD/DA PŘEVODNÍKY............................................................................................................................. 18 3.3 HARDWAROVÉ VYBAVENÍ.................................................................................................................. 19 4 PROBLEMATIKA SIMULACE ZVUKOVÝCH ZDROJŮ ....................................................................... 20 4.1 VYMEZENÍ POJMŮ ................................................................................................................................. 21 4.2 ANALÝZA SIMULACE............................................................................................................................ 23 4.3 TECHNOLOGIE ........................................................................................................................................ 27 4.3.1 MIDI ................................................................................................................................................... 27 4.3.2 VST ..................................................................................................................................................... 31 4.4 EKONOMICKÉ HLEDISKO..................................................................................................................... 32 4.5 METODY SIMULACE .............................................................................................................................. 34 5 SIMULACE POMOCÍ ALGORITMŮ .......................................................................................................... 39 5.1 SPEKTRÁLNÍ MODELOVÁNÍ ................................................................................................................ 39 5.1.1 ADITIVNÍ SYNTÉZA .......................................................................................................................... 39 5.1.2 SUBTRAKTIVNÍ SYNTÉZA ................................................................................................................ 40 5.2 FM SYNTÉZA ........................................................................................................................................... 41 5.3 FYZICKÉ MODELOVÁNÍ ....................................................................................................................... 43 6 SIMULACE POMOCÍ ZVUKOVÝCH ZÁZNAMŮ.................................................................................... 46 6.1 WAVETABLE SYNTÉZA ........................................................................................................................ 46 6.2 SAMPLOVÁNÍ .......................................................................................................................................... 48 7 TEST SOUČASNÝCH METOD SIMULACE .............................................................................................. 52
5
7.1 METODIKA POROVNÁNÍ....................................................................................................................... 52 7.1.1 POPIS TESTU .................................................................................................................................... 52 7.1.2 CÍL TESTU ......................................................................................................................................... 54 7.1.3 PRAVIDLA TESTU............................................................................................................................. 54 7.1.4 POUŽITÉ VYBAVENÍ ........................................................................................................................ 55 7.2 VYHODNOCENÍ VÝSLEDKŮ ................................................................................................................ 56 7.3 FORMULACE ZÁVĚRŮ........................................................................................................................... 57 7.4 ZHODNOCENÍ TESTU............................................................................................................................. 58 7.5 OSOBNÍ ZKUŠENOST ............................................................................................................................. 59 8 ZÁVĚR.............................................................................................................................................................. 61 8.1 ZHODNOCENÍ DOSAŽENÝCH CÍLŮ .................................................................................................... 61 8.2 SLOVO ZÁVĚREM................................................................................................................................... 62 9 POUŽITÉ ZDROJE......................................................................................................................................... 64 9.1 KNIHY A ČLÁNKY .................................................................................................................................. 64 9.2 INTERNETOVÉ ZDROJE......................................................................................................................... 66 SEZNAMY........................................................................................................................................................... 67 SEZNAM OBRÁZKŮ ..................................................................................................................................... 67 SLOVNÍK ZKRATEK A POJMŮ ................................................................................................................... 67 PŘÍLOHY ............................................................................................................................................................ 71 I. SEZNAM ZÚČASTNĚNÝCH EXPERTŮ................................................................................................... 71 II. PŘEHLED POSLECHOVÉHO MATERIÁLU........................................................................................... 72 III. DOTAZNÍK ............................................................................................................................................... 74
6
1 ÚVOD Hudba, alespoň tak, jak je chápána dnes, je součástí digitálního světa stejně jako mnoho dalších aspektů lidské činnosti. Jen těžko si lze představit hudební nahrávku, která by byť jen z části neprošla počítačovým zpracováním. Zvuk v digitální podobě představuje v hudebním průmyslu standard. S nástupem počítačů a digitálních zařízení se proces hudební tvorby a její produkce více propojil s vědeckými a zvláště pak technickými zdroji společnosti. Extenzivní využití počítačů při generování a zpracování zvuku vyvolalo u skladatelů a producentů vzájemnou závislost mezi vědeckým a hudebním myšlením. Věda a technologie jednoznačně obohatily současnou hudbu. Jednou ze základních a charakteristických vlastností výpočetní techniky je programovatelnost. Vyšší programovací jazyky představují prostředky, díky nimž mohou být počítače přístupné pro nejrůznější disciplíny. Použití technologie v hudbě jistě není nic nového. Nicméně s razantním vývojem počítačových systémů dosáhlo zcela nové úrovně. Podle Johna Chowninga1 ze Stanford University v Kalifornii programování zahrnuje mentální procesy, které jsou velmi podobné těm v hudební tvorbě. Není proto překvapující, že první umělci, kteří dokázali skutečně využít počítače, byli skladatelé. Integrace vědeckých znalostí a konceptů do hudebního vědomí byla hnána především dvěma důvody. Tím prvním byla obecně myšlenka počítačové zvukové syntézy. Tím druhým byl potenciál programování ve vztahu k hudební struktuře a procesu kompozice. Přestože z počátku byla zvuková syntéza zejména používána k oživení hudebního díla novými syntetickými zvuky, objevila se přirozeně i myšlenka počítačové simulace (zvuku) tradičních hudebních nástrojů. Zcela logicky se vnucuje otázka: Lze vůbec osobní počítač využít pro plnohodnotnou simulaci zvuku hudebního nástroje? A pokud ano, za jakých podmínek? Na tyto otázky se
1
John Chowning (1934) je americký hudebník, vědec a vynálezce algoritmu FM syntézy.
7
v průběhu zkoumání podstaty zvukových záznamů hudebních nástrojů a analýzy jejich počítačové simulace pokusím nalézt odpovědi.
1.1 VÝBĚR TÉMATU K výběru tématu mé práce mě vedla především snaha spojit svůj dlouholetý osobní zájem o tuto problematiku se studijním zaměřením na katedře systémové analýzy. Objektivně uznávám, že je to téma, které na první pohled působí možná zvláštně, přesto se však domnívám, že má své opodstatnění. Za prvé po technické stránce spadá zcela jednoznačně do oblasti IT. Za druhé v českých podmínkách zatím prakticky neexistují ucelené publikace či texty zabývající se tímto tématem. Navíc vzhledem k dynamickému a téměř až překotnému vývoji v oblasti informatiky se dá analogicky očekávat reflexe i na poli počítačové hudby. Tyto a zároveň i osobní důvody mě přivedly na myšlenku pokusit se zpracovat téma, které je svým způsobem unikátní, a vzhledem k přímé závislosti na vývoji IT technologií i velmi aktuální. Věřím, že moje práce může být ve svém oboru platným odborným přínosem a snad i inspirací a platformou pro další analýzy této oblasti. Protože se nejedná o obecně známou problematiku, jsem nucen některé části vysvětlovat podrobněji. Nicméně u svých čtenářů předpokládám běžné počítačové znalosti, alespoň základní znalosti z audio oblasti a v neposlední řadě znalost anglického jazyka. Často jsem nucen používat cizí (většinou anglické) termíny. Důvodem je, že buď jsou samostatně jen velmi těžko přeložitelné, nebo by jejich překlad porušil zažitou uzanci. Pojmy, či zkratky, které nejsou běžně známé, jsou vždy na patřičném místě vysvětleny. Považuji je za důležité pro pochopení následných úvah i rozboru uvedených přístupů a mou snahou je, aby logická návaznost a vzájemná provázanost kapitol utvářela pevný rámec diskutované problematiky. Tam, kde je to vhodné, rovněž uvádím četné příklady, aby si čtenář mohl převést teoretický základ do reality.
8
1.2 CÍLE Cílem mé diplomové práce je pokud možno komplexně obsáhnout problematiku počítačové simulace hudebních nástrojů a toto s sebou přirozeně nese celou řadu aspektů, které je nutné postihnout. Ve své diplomové práci jsem si spolu se svým vedoucím práce stanovil následující cíle:
Deskripce současného stavu vývoje digitálního zvuku a role počítačů v hudebním průmyslu.
Teoretická analýza problematiky věrné simulace zvukových zdrojů.
Zpracování uceleného rozboru a porovnání různých metod a softwarových i hardwarových přístupů v oblasti počítačové simulace hudebních nástrojů.
Na základě průzkumu pomocí poslechového testu nalézt odpověď na otázku, zda je možné na počítači věrně simulovat zvuk hudebních nástrojů (v hudebním kontextu). Tato práce se v žádném případě nezabývá uměním obecně. Ačkoli hudba
samotná má úzkou spojitost s tak exaktní vědou jako je například matematika, toto úsilí ochotně přenechám jiným. Předmětem mého zájmu je pouze využití současných technologií při tvorbě moderní hudby. Mou snahou je ukázat, kam až sahají možnosti běžné výpočetní techniky a dnešního hudebního hardwaru a softwaru.
1.3 STRUKTURA PRÁCE Struktura práce vychází ze zadaných cílů. V úvodních kapitolách se snažím nahlédnout do základů audio oblasti, včetně principů digitalizace zvuku. Dále předkládám teoretický základ podstaty propojení počítačů s hudbou a definuji základní pojmy a vztahy, ze kterých pak vychází jádro celé práce. V dalších částech se věnuji problematice počítačové simulace zvuku obecně, včetně podrobné analýzy simulace a stanovení základních hypotéz. Potom následuje ucelený přehled existujících metod a přístupů simulace, z nichž některé se stanou předmětem zkoumání poslechového testu. Závěrečné kapitoly se věnují poslednímu zvolenému cíli. Toto zahrnuje průzkum pomocí poslechového testu (jehož se zúčastnili odborníci z této oblasti), vyhodnocení výsledků a vyvození závěrů. Veškeré materiály popisující detaily poslechového testu jsou uvedeny v příloze. Jednotlivé hudební ukázky jsou k dispozici na přiloženém CD, 9
které slouží pouze pro edukační účely. Všechna obsažená díla jsou majetkem uvedených autorů a chráněna autorským zákonem. Zde bych rád předeslal, že jsem byl z důvodů rozumného rozsahu textu a svých kapacitních možností nucen dopustit se drobných zjednodušení na různých místech, týkajících se ať už fyzikální problematiky vlastností zvuku, nebo analýzy uváděných přístupů. Jistá doplňující či související vysvětlení jsou uvedena v poznámkovém aparátu pod čarou.
10
2 ZVUKOVÁ INFORMACE A JEJÍ VNÍMANÍ V této kapitole jsou obsaženy základní pojmy týkající se oblasti vlastností zvuku, zvukových jevů a některé aspekty vnímání zvuku obecně. Přítomnost všech těchto prvků v textu není v žádném případě samoúčelná. Uváděné pojmy a jevy mají přímou souvislost s danou problematikou a jejich plné porozumění a pochopení považuji za důležité ve vazbě na zadané cíle.
2.1 VLASTNOSTI ZVUKU Zvuk není nic jiného než mechanické vlnění, které je schopno vyvolat v lidském uchu sluchový vjem. Frekvence tohoto vlnění leží v rozsahu přibližně od 20 Hz až do 20 kHz. Za jeho hranicemi člověk zvuk sluchem nevnímá (v širším smyslu lze za zvuk označovat i vlnění s frekvencemi mimo tento rozsah). Zvuk se vždy šíří nějakým prostředím (vodičem). Slovo prostředí je příznačné, neboť se nemusí jednat pouze o vzduch, ale třeba o vodu, dřevo, kov, a různá jiná látková prostředí. Samotná zvuková vlna je dána periodickým stlačováním a rozpínáním hmotného prostředí, v němž postupuje rychlostí závislou na okamžitých fyzikálních podmínkách (např. tlak, teplota, vlhkost). V různých prostředích se zvuk šíří různě rychle, čímž se zeslabuje. Zvukové vlny jsou podélné a mají tendenci se šířit do všech směrů od svého zdroje. Zvuk má vždy svůj zdroj. Abychom jej mohli vnímat, je zapotřebí detektor, neboli snímač. Zdrojem zvuku může být každé chvějící se těleso. Snímačem zvuku bývá typicky lidské ucho, mikrofon nebo jiný snímač. Zajímavým jevem je tzv. Dopplerův efekt: pokud se zdroj zvuku pohybuje směrem k nám, vnímáme frekvenci vyšší, než ji ve skutečnosti zdroj vydává, a naopak, jestliže se zdroj pohybuje směrem od nás, vnímáme frekvenci zdánlivě nižší (Robertson, 2003). Zvuk charakterizují čtyři základní vlastnosti: 1) Hladina intenzity zvuku – té odpovídá v podstatě hlasitost zvuku, a zpravidla se udává v decibelech (dB) 2) Frekvence (kmitočet) – udává výšku tónu 3) Průběh kmitání – ovlivňuje zabarvení tónu 4) Trvání zvuku – určuje délku trvání daného zvuku.
11
Hlasitost zvuku je subjektivní veličina, která je určena velikostí akustického tlaku, kterým působí zvukové vlny na sluch. Nejnižší hodnotě intenzity zvuku odpovídá práh slyšení (0,00001 Pa), nejvyšší intenzita zvuku určuje práh bolesti (100 Pa). Rozdíl mezi intenzitou nejtiššího a nejhlasitějšího zvuku se pak nazývá dynamika zvuku. Výška zvuku je dána jeho frekvencí, čím vyšší je frekvence, tím je vyšší tón. Výšku tónu rozlišujeme absolutní a relativní. Absolutní výšku tónu určuje frekvence jednoduchých zvuků s harmonickým průběhem. Obvykle ji nelze určit sluchem (výjimku tvoří lidé, kteří mají vrozený absolutní sluch). Naopak relativní výšku tónu sluchem subjektivně posuzovat můžeme (například běžně při ladění nástroje). Jedná se totiž o podíl frekvence daného tónu vůči frekvenci referenčního tónu.2 Základní tón je podle akustiky určen na frekvenci 440 Hz (tzv. komorní A). I při stejné výšce tónu (frekvenci) se zvuky mohou lišit zabarvením tónu. Barvu zvuku určuje počet vyšších harmonických tónů ve složeném tónu a jejich amplitudy. Jedině tak jsme totiž komplexně schopni rozeznávat různé zdroje zvuku – třeba různé hudební nástroje, lidské hlasy, apod. Zajímavou kapitolou jsou tzv. alikvotní tóny (vyšší harmonické frekvence), což jsou celistvé násobky frekvence základního tónu. Obecně platí, že čím je intenzita harmonických frekvencí větší, tím ostřeji či chladněji tón zní. Naopak čím je jejich intenzita menší, tím je tón jemnější, „kulatější“. Právě toto je jednou z důležitých charakteristik každého hudebního nástroje.
2.2 DRUHY SIGNÁLU Zvuky lze dělit podle různých kritérií. Např. na základě tvaru křivky plynoucí v čase, nebo frekvenčního spektra, je dělíme do dvou kategorií. Časové a frekvenční oblasti jsou spojeny mechanismem, který je znám jako tzv. Fourierova transformace (Watkinson, 2002). První kategorií je zvuk mající podobu periodického signálu. Ideální periodický signál se vždy opakuje po nějaké konstantní době a neurčitě dlouho plyne v čase. Ve frekvenční oblasti bude takový druh signálu obsahovat svou
2
Například tón s dvojnásobnou frekvencí zní pro lidské ucho o jednu oktávu výše.
12
základní frekvenci spolu s vyššími harmonickými tóny (ty vznikají jako celistvé násobky původní frekvence). Jak již bylo řečeno výše, barvu nástroje determinuje jeho harmonická struktura zvuku. Pokud zvuk žádné harmonické tóny nemá, obsahuje pouze jednu (základní) frekvenci. Potom se jedná o nekonečnou sinusovou vlnu.
Obrázek 1 – Signály. (a) Periodický a (b) aperiodický signál. Zdroj Watkinson (2002).
Druhým typem je aperiodický signál, jenž bývá nazýván jako tzv. bílý šum (white noise).3 Ve frekvenční oblasti se vyznačuje konstantní spektrální hustotou, tzn. obsahuje všechny frekvence. Právě bílý šum se často používá v počítačové syntéze při napodobení zvuků, které mají ve svém spektru silnou složku šumu (např. činely, efekty, apod.). Na obrázku 1 jsou znázorněny oba typy signálu.
2.3 VNÍMÁNÍ ZVUKU Jak člověk zvuk vnímá, je velmi složitý proces. Z fyziologického pohledu je vlnění zachycováno boltcem a dále postupuje zvukovodem až k bubínku. Kmitání bubínku se přenáší na oválné okénko hlemýždě obsahující nervové buňky. Ty přeměňují chvění na nervové vzruchy, které jsou vedeny do sluchových center mozku. Z obou uší vedou do mozku stejné dráhy. Tímto způsobem vnímáme jednotlivé tóny a veškeré zvuky obecně (Beranek, 1965). Primární sluchová oblast zaujímá oblast horní části spánkových laloků – tzv. Heschlovy závity. Neurony reagující na různé tóny (nízké a vysoké) nacházíme v odlišných částech Heschlových závitů. Pokud máme funkční obě uši, dostane se zvuk k uchu vzdálenějšímu od zdroje o něco později, a je navíc nepatrně oslaben. Tyto nevelké rozdíly dokáže mozek rozlišit a určit polohu i případný pohyb zdroje zvuku. Informace z obou uší se dostávají do sluchových oblastí obou hemisfér.
3
Název vznikl z důvodu analogie s bílým světlem, které také obsahuje všechny frekvence.
13
Spoje s protilehlou stranou jsou však o něco silnější. To přispívá mimo jiné také k analýze místa zdroje zvuku, složitých zvukových vzorců i zvukových komunikačních signálů (Orel, 2009).
Obrázek 2 – Zvuková vlna. Ukázka posunu zvukové vlny v případě, že pravé ucho je od zdroje vzdálenější. Zdroj: na základě Watkinson (2002) upravil autor.
Na obrázku 2 je vidět fázový posun, který je způsoben tím, že v tomto případě pravé ucho je od zdroje zvuku vzdálenější. Také zvuky s různou frekvencí, vnímá lidské ucho s různou citlivostí. Z toho důvodu například basové tóny musí být obyčejně produkovány s vyšší intenzitou, aby byly vnímány stejně hlasitě jako tóny vyšší. Lidské ucho je nejcitlivější na frekvence zhruba od 2 kHz do 5 KHz. Podle Prof. Josefa Syky z Ústavu experimentální medicíny Akademie věd je důvodem podobná frekvence zvuku řeči, jíž je člověk zvyklý naslouchat. Vysoké frekvence (zhruba nad 7 kHz) lidské ucho vnímá nepatrně zkresleně. Důvodem je Bazilární membrána Cortiho orgánu (ve vnitřním uchu), která se vzruchem postupně rozechvívá i ustálí (Orel, 2009). Výsledkem je tak postupný náběh (attack) i dozvuk (decay), jak vidíme na obrázku 3. Ve skutečnosti jde o změny ve tvaru křivky v řádu milisekund.
Obrázek 3 – Funkce Bazilární membrány. (a) Zvuk o vysoké frekvenci. (b) Pohyb Bazilární membrány. Zdroj: na základě Watkinson (2002) upravil autor.
14
Je rovněž zajímavé, že dříve se v nahrávkách frekvence zvuku pod 40 Hz považovaly za nadbytečné. Dnes je ovšem zřejmé, že produkce frekvencí dolů až na hranici 20 Hz zvyšuje opravdovost a plnost zvuku. Dále je nutné podotknout, že proces vnímání zvuku je u každého jedince subjektivní. Cesta, kterou se zvuková informace dostane z ucha do mozku člověka je jasná. Avšak reakce, nálady, či pocity, které daná skutečnost vyvolá, už nemusí být tak jasné a uchopitelné. Přestože cílem této práce není analyzovat psychologické pochody probíhající v mysli člověka při vnímání hudby, ve čtvrté kapitole poukážu na jeden podstatný aspekt.
15
3 DIGITÁLNÍ ZVUK Digitální zvuk má poměrně krátkou, ale velice zajímavou historii. Vzešel náhle z prostředí technických laboratoří, aby se teoretické myšlenky mohly zakrátko přeměnit v dostupná zařízení. Tento rychlý vzestup s sebou přirozeně přinesl i řadu problémů svého druhu, z nichž jistě ne ten nejmenší je dilema uživatelů, kteří mají zkušenosti pouze s analogovým vybavením. Digitální audio se stalo vyžadovanou normou. Je proto důležité pochopit jeho základní principy. Tato kapitola se tedy věnuje stručnému nástinu charakteristik digitálního zvuku a práce s ním. Čtenář si tak může oživit, či snad i doplnit elementární informace o některých technických aspektech digitálního zvuku a najde i pár drobných doporučení poněkud subjektivního charakteru o vhodném hardwarovém vybavení.
3.1 PRINCIP DIGITALIZACE ZVUKU Analogová reprodukce zvuku se vyvinula během posledních let do vysoké úrovně, nicméně analogové nahrávání je samo o sobě podstatně limitováno svými vlastnostmi. Příkladem za všechny, budiž kopírování analogového záznamu, kdy se s každou další kopií přidává šum. O nevýhodách editování analogového záznamu se není třeba vůbec zmiňovat. Přestože se čas od času v lepších nahrávacích studiích stále používají analogové efekty, aby kupříkladu přidaly záznamu onen „sametový“, a v hudebním průmyslu tak vyhledávaný zvuk, jsou tyto pouze mezistupněm v celém jinak digitálním procesu. Je jasné, že digitální technologie dominuje a analogová zařízení tak pro nás zůstávají spíše hezkou nostalgií. Digitalizace obecně spočívá v převedení signálu z analogové formy do číslicové. Jak víme, výpočetní technika dokáže pracovat pouze s diskrétními (tj. nespojitými) veličinami. Proto si digitalizaci analogového signálu můžeme názorně představit jako rozdělení dané křivky na mnoho drobných částic. Protože o část informace tímto způsobem vždy přicházíme, je třeba volit pokud možno co nejmenší (nejjemnější) rozlišení. Proces digitalizace zvuku se nazývá vzorkování (sampling). Sampling
stručně
řečeno
spočívá
v pravidelném
měření
hodnoty
analogového signálu. Kvalitu výsledného obrazu zvuku ovlivňuje jednak frekvence vzorkování (sample rate, sampling rate), a jednak množství informací uložených pro každý vzorek (bitové rozlišení, bitová hloubka). Je samozřejmé, že pro stereo 16
signál je nutné zaznamenávat zvlášť oba kanály. Digitální vyjádření analogového signálu se někdy zkráceně nazývá PCM (pulse-code modulation), kde jednotlivými impulzy jsou zmiňované vzorky. Nyní se přirozeně vnucuje otázka, jaké zvolit hodnoty pro sampling rate a bitové rozlišení, aby byl audio záznam kvalitní. Na to poskytuje odpověď tzv. Nyquist-Shannonův vzorkovací teorém (Nyquist–Shannon sampling theorem). Ten říká, že pro dokonalou rekonstrukci signálu je potřeba alespoň dvakrát vyšší frekvence, než je maximální frekvence daného signálu (Shannon, 1949). Pokud tomu tak není, chybějící informace tak mohou způsobit horší audio kvalitu. Protože, jak už víme, lidské ucho vnímá frekvenci maximálně do 20 kHz, na základě teorému je určena standardní frekvence 44,1 kHz pro kvalitní audio záznam (typicky například u hudebních CD).
Obrázek 4 – Digitalizace. (a) Sinusová křivka analogového signálu. (b) Samplovaná verze též křivky v AD převodníku. Každý sloupec reprezentuje jeden vzorek. Každý vzorek je uložen v paměti jako číslo udávající výšku sloupce. (c) Rekonstrukce samplované křivky pomocí lowpass filtru. Zdroj: Roads (2003).
Co se týče bitového rozlišení, dalo by se lakonicky prohlásit, že „čím více, tím lépe“. Záleží však na tom, zda se jedná o pouhou reprodukci zvuku, či rekonstrukci. Při běžném přehrávání hudby bohatě postačí 16 bitů. Ovšem při editování audio záznamu (zvláště při přidávání různých efektů) je lepší volit vyšší hodnoty, běžně 24, někdy i 32. Při aplikování efektů na daný záznam totiž musí procesor znovu a 17
znovu přepočítávat a dělit jednotlivé hodnoty a při nižší bitové hloubce tak hrozí, že se část informace ztratí.
3.2 AD/DA PŘEVODNÍKY AD převodníky jsou zařízení, která nám umožňují převést analogový signál do digitální podoby způsobem popsaným výše. Bývají součástí zvukových karet a jsou de facto jakýmsi základem pro zachycení veškerého digitálního zvuku. Je nutné zdůraznit, že kvalita těchto převodníků podstatně určuje kvalitu audio záznamu (a to zejména vzorkovací frekvencí a počtem bitů). Při nahrávání z MIDI klávesnice do počítače je důležitá i udávaná latence, což je zpoždění (obvykle udávané v ms) signálu při zápisu.
Obrázek 5 - Proces přehrávání digitálního zvuku. Ten je nejprve načten do vyrovnávací paměti a odtud putuje jako proud jednotlivých vzorků do DA převodníku, který jej převede na mechanické vlnění. Zdroj: Watkinson (2002).
Poněvadž lidské ucho dokáže jako zvukový vjem vnímat pouze mechanické vlnění, je nutné převést digitální zvuk zpět do mechanické podoby. Na to se používají DA převodníky, které – laicky řečeno – spojí vrcholy samplované křivky a tak zpětně rekonstruují původní signál. To se děje prostřednictvím filtrů (např. low pass, high-pass filtru). Jedině tak jsme schopni slyšet jakoukoli digitální nahrávku. Mezi AD a DA převodníky se tak skrývá celý proces tvorby zvukového záznamu, který mimo samotné snímání zvuku zahrnuje také processing (přidávání různých efektů), míchání (úprava poměrů a spojení více audio stop do jedné), a
18
mastering (jakási finální úprava za účelem zesílení, projasnění zvuku).
3.3 HARDWAROVÉ VYBAVENÍ Na tomto místě považuji za vhodné zmínit se zejména o hardwarovém vybavení výpočetní techniky. Při práci se zvukem obecně je třeba mít výkonný počítač s dostatkem operační paměti, což při neustále klesajících cenách spotřební elektroniky není již zdaleka takový problém. Jak již bylo řečeno, na kvalitu počítačem přehrávaného zvuku má největší vliv zvuková karta. Na běžné přehrávání audia obvykle postačí vestavěná karta, pro seriózní recording či tvorbu počítačové hudby je nutné pořídit kartu profesionální, jejíž cena se může (v případě nejvyšších modelů) vyšplhat i na několik desítek tisíc korun. Dalším důležitým bodem jsou bezesporu reproduktory. Pro kritický nebo referenční poslech (a tedy i pro posuzování kvality záznamů a simulace zvuku) osobně doporučuji jedině studiové monitory, jež mají co možná nejvyrovnanější frekvenční spektrum, tzn. že vydávají všechny frekvence se stejnou intenzitou (nepřidávají basy ani výšky, ani jinak zvuk nezkreslují a často mají jasný, „syrový“ zvuk). Bohužel ceny opravdu kvalitních studiových monitorů opět sahají až do desítek tisíc korun. Samozřejmě není mým úmyslem zde popisovat všechna studiová zařízení pro práci se zvukem jako jsou mikrofony, zesilovače, mixážní pulty, apod., ale spíše poukázat na klíčové prvky hardwaru zvláště v souvislosti s danou problematikou počítačové simulace zvuku. Za zmínku tak už snad stojí jen dostatečná velikost grafického monitoru pro rozsáhlé hudební aplikace.
19
4 PROBLEMATIKA SIMULACE ZVUKOVÝCH ZDROJŮ Tradiční hudební nástroje tvoří velmi bohatý zvukový prostor, ale jejich (alespoň částečně) komplexní zvládnutí na profesionální úrovni se obecně považuje za značně náročné. Moderní technologie nám nyní přinášejí možnosti, které ještě před pár lety nebyly zdaleka tak dostupné (nebo prakticky použitelné).4 Fyzika, psychologie, informatika a matematika poskytují významné nástroje a koncepty. Pokud se podle Roadse (1996) tyto koncepty integrují spolu s hudebními znalostmi a sluchovou vnímavostí, umožní muzikantům, vědcům, a technikům, pracujícím dohromady, ustanovit nové koncepty fyzického a psychofyzického popisu zvuku v takovém detailu, jaký potřebuje skladatel při plnění nároků lidského sluchu a představivosti. Jak ukazuje i tato práce, první takřka hmatatelné výsledky zmiňované integrace se již objevily. Na obecné úrovni nyní existuje mnohem hlubší porozumění barvě zvuku a skladatelé a aranžéři mají poněkud širší paletu tvorby jednotlivých zvuků. Byly objeveny nové efektivní metody syntézy zvuku, založené na modelování vnímaných atributů zvuku spíše než na simulaci fyzických atributů. Byly vyvinuty výkonné aplikace pro editaci počítačově generovaného a digitálního zvuku. Experimenty v této oblasti vedly k neobyčejnému a hudebně užitečnému výzkumu identifikace zdrojů zvuku a zkoumání auditivních obrazů obecně. A konečně, moderní hudební tvorba se stala dostupnou bez přehánění téměř každému zájemci o tuto problematiku. Zásadní změnou je skutečnost, že muzikanti nemusí fyzicky spoléhat pouze na klasické nástroje, ale mohou chtít simulovat tyto nástroje pomocí počítače5. Naskýtá se otázka, co by je, k tak na první pohled složité operaci vedlo. Důvodů může být celá řada. Příkladem za všechny budiž příběh dánského producenta, skladatele a baskytaristy Thomase Hansena Skarbye. Ten ke konci 90. let z důvodu nervové vady zápěstí (díky níž ztrácel cit v rukou) musel zanechat milované hry na basovou kytaru. Jako skladatel zejména televizní hudby tak hledal jiné způsoby tvorby basových partů, a postupně začal pracovat na počítačové simulaci
4 O skutečně věrné a zároveň široce dostupné simulaci hudebních nástrojů se dá hovořit až po roce 2000. 5
A samozřejmě mohou využívat nekonečné možnosti elektronických zvuků, což je však téma, které
tato práce z důvodu jeho rozsahu neobsahuje.
20
baskytary. První pokusy byly úspěšné a staly se základem jeho společnosti Scarbee, z níž se zakrátko stal oblíbený výrobce prvotřídních zvukových bank a virtuálních nástrojů.6 Důvodem pro počítačovou simulaci ale může být i fakt, že daný člověk na konkrétní nástroj hrát jednoduše neumí, popř. kvalitní zvukový záznam by byl příliš drahý, apod. I zdatný hudební skladatel nebo aranžér zpravidla dobře ovládá pouze pár nástrojů, o poloprofesionálních či amatérských nadšencích ani není třeba se zmiňovat. Za pomoci patřičného softwaru je tak skutečně téměř každý schopen simulovat zvuk hudebních nástrojů a vytvářet vlastní kompozice a aranžmá.
4.1 VYMEZENÍ POJMŮ Na tomto místě považuji za důležité vymezit některé pojmy, které jsou pro tuto práci naprosto klíčové, a jedině pokud jsou řádně vysvětleny, dávají smysl celému textu. Jelikož ústředním tématem pro následující analýzu je počítačová simulace hudebních nástrojů, je nutné toto blíže specifikovat. Prvním pojmem, jenž si zaslouží větší pozornost, je hudební nástroj, ovšem ne z obecného pohledu, nýbrž ve vztahu k danému tématu. Text je věnován simulaci hudebních nástrojů tradičních. Právě u nich totiž má smysl hovořit o skutečné simulaci, počítačovému napodobování přirozených zvuků. Zvuky, které jsou v hudbě pro lidské ucho nejpřirozenější pocházejí zpravidla z tradičních hudebních nástrojů, jak akustických, tak elektrických. Za tradiční nástroje v tomto smyslu lze pak považovat klávesové nástroje (klavír, upright piano, elektrické piano), strunné nástroje (akustická či elektrická kytara, basová kytara, harfa), bicí nástroje (bicí souprava, perkuse, tympány), smyčcové nástroje (housle, viola, cello, kontrabas) a žesťové nástroje (trubka, pozoun, saxofon). Tento výčet samozřejmě není úplný, spíše má demonstrovat podstatu simulace jako napodobování něčeho reálného. Z toho vyplývá, že nepůjde o simulaci např. syntezátorů, což by byl vlastně rozpor. Syntezátor sám o sobě slouží k simulaci vyjmenovaných nástrojů, k nimž přidává zvuky syntetické. Je
6
Scarbee Professional Audio Tools, http://www.scarbee.com/home.php.
21
nutné připustit, že v době analogových syntezátorů tomu tak nebylo7, ovšem dnes už digitální syntezátory a samplery plní zpravidla obě funkce a je otázka, nakolik má smysl hovořit o digitální simulaci už tak syntetického zvuku. V žádném případě nepodceňuji význam využití elektronických zvuků v hudbě, nicméně tyto spadají do oblasti, jež je sama o sobě tak rozsáhlá, že zabývat se jimi by zabralo prostor pro celou další práci. Domnívám se, že i z pohledu každého hudebníka je zajímavější (a tedy i přínosnější) sledovat, zda lze s pomocí počítačového vybavení simulovat zvuk, který jinak vzniká třeba z dřevěného nástroje naprosto přirozenou cestou už desítky, někdy i stovky let. Uvedené rozdělení hudebních nástrojů je samozřejmě poplatné tématu této práce a nemusí v žádném případě korespondovat s podobným rozdělením v klasické hudební teorii. Dalším pojmem, který je třeba více nastínit, je samotná simulace. Samotné slovo pochází z latinského simulare, což znamená předstírat. Zde simulací hudebního nástroje pak rozumíme co možná nejvěrnější zvukové napodobení notového partu hraného na daný nástroj. Při hraní určitého partu vzniká celý proud zvuků, který se skládá z několika složek, a navozuje tak dojem živě hraného nástroje. Z toho plyne premisa, že jakákoli reálná (věrná) simulace zvuku nástroje dostává smysl pouze v konkrétním hudebním kontextu. Simulace izolovaného tónu odtrženého od daného kontextu postrádá evidentně význam. Z výše uvedeného bude nutné vycházet především v poslechovém testu. Přestože konkrétními metodami simulace zvuku se budu zabývat v další kapitole, je nutné ještě zmínit následující podmínku: Výsledná simulace musí být de facto ekvivalentem notového partu. To znamená, že jednotlivé tóny musí být samostatně předmětem simulace a být tak všechny zapsány v MIDI (viz část MIDI této kapitoly). Tím jsme omezili například použití záznamů o několika tónech (třeba části vystříhaného sóla nástroje), které by se tak snadno mohly vydávat za vlastní simulaci. V případě využití zvukových bank samplovaných (skutečně fyzicky nahraných) nástrojů je možné mít maximálně jeden tón (či zvukový efekt) na jeden vzorek (sample). V případě zvuků generovaných počítačem tuto
7
Zejména v 70. letech 20. století sloužily analogové syntezátory k produkci zvláštních, a v té době
nových zvuků.
22
podmínku klást nemusíme, neboť je jasné, že jakákoli řada tónů musela být simulována, jinak by vůbec nevznikla. Nyní již zbývá vysvětlit pojem počítačová simulace. V tomto případě je simulace počítačová tehdy, pokud je při ní k zápisu not i produkci zvuku využito počítače. Zápis not může být proveden buď přímo editací v daném softwaru (nejčastěji se používá tzv. key editor, či score editor) nebo pomocí MIDI klávesnice připojené k počítači. Zvuk pak ve spolupráci s daným softwarem generuje zvuková karta.
4.2 ANALÝZA SIMULACE Při posuzování kvality počítačové simulace jakéhokoli zvuku je třeba se zaměřit na pocit, jaký vnímaný zvuk v mozku člověka vyvolá. Dojem, díky němuž víme, že nahrávka je živá, skutečná, autentická. Leman (1997) toto nazývá jako hudební vědomí (musical cognition). Hudební vědomí se tak jeví jako schopnost určovat a plně prožít autentičnost nahrávky včetně provedení zvukové analýzy (schopnost poznat a předjímat harmonii, rozeznat jednotlivé nástroje, hlasy, apod.). Může být závislé na mnoha faktorech jako je určitá vrozená dispozice, zkušenosti, vzdělání, atd. Vysoké úrovně dosahuje u profesionálních hudebníků právě v souvislosti se zvukem jejich nástroje. Pokud si představíme například jednu stereo stopu záznamu skladby na klasickou kytaru, slyšíme celou řadu zvuků. Při pozorném poslechu (a s kvalitním vybavením) můžeme vnímat hranou harmonii či melodii, rytmickou i intonační nepřesnost, různý způsob techniky hraní v různých částech skladby (staccato, glissando, atd.), rychlý pohyb prstů po pražcích (fret noise), apod. To, co z nahrávky dělá nahrávku autentickou, není žádná magie. Evidentně se jedná o velmi komplexní soubor zvuků a ruchů, které jsou v určitém přirozeném pořadí za sebou, mají různou hlasitost a celou řadu dalších vlastností. Popsané zvuky pak ve výsledku utvářejí v mysli člověka obraz živě nahraného nástroje.8
8
Totéž samozřejmě platí i pro zpěv, a obecně pro jakýkoli známý zvuk.
23
Při simulaci bude z hlediska počítačové logiky nutné celý proces rozložit na jednotlivé prvky. Při simulaci hudebního kontextu musíme postihnout minimálně tyto základní aspekty:
Tvorba zvuku – představuje samotné generování jednotlivých tónů včetně všech jejich elementárních vlastností.
Aspekt časový – představuje řazení jednotlivých tónů za sebou a pracuje s fenoménem vnímání rytmické přesnosti a nepřesnosti.
Aspekt intonační – Zasahuje zpětně do původní vlastnosti tónu, ovšem jakoby druhotně. Tvorba zvuku se bytostně týká generování základního zvuku počítačem a je
úzce spjata se softwarovými přístupy a metodami, jež budou diskutovány v dalších kapitolách. Jestliže nicméně pro tuto chvíli abstrahujeme od technického řešení vzniku počítačově generovaného tónu, lze lépe nahlédnout na analýzu charakteru zvuku nástroje. V obecné rovině zvuky běžné hudební nahrávky můžeme při simulaci dělit do dvou základních a vzájemně souvisejících skupin: 1) Notové zvuky - jsou vlastní podstatou hudebního díla (harmonie, melodie) a dají se tak přesně zapsat do notového zápisu. Je však třeba mít na zřeteli, že už tyto zvuky mohou být různého charakteru v závislosti na hrané technice, apod. (zde však záleží na typu nástroje). Jelikož jsou již nějakým způsobem zaznamenané, samy o sobě vytvářejí základ pro autentičnost nahrávky. 2) Nenotové zvuky nebo ruchy, které nenesou hlavní informaci, nicméně jsou nedílnou součástí hry na daný nástroj a dokreslují tak právě jeho autentičnost. Nejsou součástí notového zápisu (výjimku mohou tvořit např. značky pro nadechnutí, apod. – ty ale u profesionálních hráčů postrádají smysl a v praxi se nepoužívají). Je evidentní, že simulovat nenotové zvuky, tedy různé ruchy a efekty, nebude příliš velký problém. Naopak mnohem těžší bude simulovat první zmíněnou kategorii, tedy zvuky notové. Při hře na hudební nástroj, jehož zvuk člověk určuje do značné míry totiž žádný tón není nikdy úplně stejný. Přidejme pak všechny možné techniky hry na daný nástroj a máme tak široký rejstřík možných zvuků, že není jednoduché se v něm orientovat.
24
Pouze přirozená kombinace výše uvedených zvuků včetně jejich vlastností vytváří dojem autentické nahrávky. Přesto, že se z technického pohledu jedná o pouhou sadu různých zvuků, už teď je jasné, že simulace něčeho takového nebude vůbec snadná (pokud vůbec možná). Dalším aspektem, který je třeba vzít při posuzování autentičnosti záznamu (nebo simulace) v úvahu, je časové hledisko. To uspořádává po sobě jdoucí tóny do celku orámovaného tempem, který nám může poskytnout informace o vjemu rytmické přesnosti či nepřesnosti. Tyto vlastnosti se týkají jednotlivých tónů a do značné míry vyvolávají dojem živého hraní. I ten nejpřesnější hráč není stoprocentně (strojově) přesný, ač se snaží sebevíc. Přiznejme, že u většiny hudebních nástrojů je při hře jemná rytmická nepřesnost vlastně žádoucí, a mimoděk tak pomáhá umělci přednést komplexní hudební dílo se správným výrazem. Samotné řazení jednotlivých tónů v čase by tak při simulaci mělo být podřízeno těmto kritériím. Tím se paradoxně dostáváme do situace, kdy budeme simulovat lidskou nepřesnost, jejíž implementace bude určitě jednodušší než jakákoli lidská snaha dosáhnout původní přesnosti. Tato zvláštnost pochopitelně vyznívá pro naše potřeby simulace příznivě a nutno podotknout, že se jí dosti využívá. Posledním uvedeným aspektem je intonační přesnost. Nemusí nutně platit, že počítačem generovaný tón bude vždy ladit, tzn. bude kmitat na standardní frekvenci nějakého známého tónu. Kvalita vzniklého zvuku pochopitelně silně závisí na použité metodě, nicméně připusťme onen předpoklad, že: počítačem vygenerovaný tón bude z hlediska intonace vždy ve správném ladění. Potom je třeba zajistit, aby tomu tak bylo jen tehdy, kdy je taková vlastnost opravdu žádoucí. U některých hudebních nástrojů nejsou totiž drobné intonační nepřesnosti nebo tónové skluzy výjimkou, a vlastně tvoří nedílnou součást jejich projevu. V takovém případě se musí ladění vzniklých tónů jakoby druhotně na počítači pozměnit. Pokud se nám na počítači podaří všechny zmiňované aspekty alespoň částečně propojit, můžeme hovořit o tzv. virtuálním nástroji, jež zvukově splňuje všechny charakteristiky nástroje skutečného. Uvedené označení se ovšem používá bez ohledu na to, zda simulace pomocí daného virtuálního nástroje je zdařilá, či nikoli. Jeví se jako přirozené, že možnosti plnohodnotné simulace budou u jednotlivých typů nástrojů různé. Určité hudební nástroje se 25
napodobují snáze, jiné hůře, u některých je věrná simulace zatím pouze zbožným přáním. Proč se např. klávesové či bicí nástroje simulují relativně lehce, zatímco smyčcové a dechové nástroje potřebují komplexnější přístupy? Odpověď hledejme ve způsobu hry a následně ve vzniku zvuku daného nástroje. Zdá se totiž, že nástroj, na jehož zvuku se člověk podílí jen velmi málo, má vyšší předpoklady stát se předmětem úspěšné simulace. A naopak, nástroj, jehož zvuk člověk do značné míry ovlivňuje a tím pádem spoluvytváří (hmatem nebo dechem), je jen těžko napodobitelný. Tuto úvahu tak můžeme shrnout do o něco rozumněji znějící teze, že: čím více se člověk podílí na zvuku hudebního nástroje, tím hůře jej lze simulovat. Při poslechovém testu v závěru práce bude zajímavé sledovat, zda se tato myšlenka na reálných příkladech potvrdí. Za zmínku stojí ještě jeden fakt, který zároveň svědčí ve prospěch odvozeného předpokladu, a sice, že lidský hlas (jehož celkovou podobu člověk absolutně ovlivňuje a žádný další vliv zde nemůže hrát roli) se plnohodnotně simulovat zatím nedá.9 Zda tomu tak bude i v budoucnu, lze jen velmi těžko odhadnout. Podstatou simulace je tedy vyvolat v člověku dojem živě nahraného nástroje. Je však nutné předeslat, že vycházíme z konceptu více aspektů a zvuk samotný není (překvapivě) cílem, nýbrž prostředkem k dosažení takového dojmu. Přestože tedy při simulaci vycházíme ze zvuku konkrétního hudebního nástroje (a velmi často se jedná o určitou značku, či daný model), cílem paradoxně není stoprocentně napodobit jeho zvuk do nejmenšího detailu, ale napodobit hru na tento nástroj do nejmenšího detailu.10 Vždyť pokud například máme dvě různé kytary téhož modelu a značky, budou obě znít možná jinak, ale určitě budou obě znít živě. Koncertní křídlo Steinway Black Grand bude znít ve studiu v Berlíně jinak než v odlišném studiu v Londýně. Nechme na každém volbu jeho oblíbeného zvuku a posuzování, který zvuk je lepší, a který horší. To se již týká velice subjektivního vkusu, zatímco vnímání autentičnosti záznamu a hudební vědomí obecně je přece jen o něco objektivnější záležitostí.
9
Samozřejmě existují pokusy počítačově napodobit lidský hlas např. v mluveném slově, které jsou
do značné míry úspěšné, ovšem snahy simulovat lidský zpěv nadále ztroskotávají. 10
Možná bychom mohli rovněž říci, že cílem je napodobit zvuk určitého typu nástroje.
26
Proto při posuzování kvality simulace se nutně každý posluchač bude nepatrně lišit v určení bodu, kdy je simulace natolik věrná, že ji již nelze odlišit od reálné nahrávky. Protože hudební vědomí roste spolu se zkušenostmi, tréninkem, atd., u jedinců s vysoce vyvinutým hudebním vědomím se tyto body budou blížit jednomu společnému bodu, což je hranice sta procent. Důležité je slovo „blížit“, neboť je možné, že ani expert při dostatečně dobré simulaci, nedosahující však stále dokonalosti, již nerozezná původ zdroje zvuku. Poněvadž hudební věda není exaktní, příliš nezáleží na přesné pozici onoho bodu.11 Je ale jasné, že čím výše na stupnici bude tento bod, tím je těžší dosáhnout věrné simulace. V poslechovém testu na konci této práce jsme využili právě hudebních odborníků pro zajištění větší objektivnosti a vypovídající hodnoty průzkumu. Při simulaci tedy klademe na první místo dojem, jaký v nás vyvolá. Nicméně věrná zvuková simulace konkrétního nástroje je určitě správným krokem k danému cíli a mezistupněm k dokonalé simulaci celé hry. Zároveň se tím více vyjevila i pravdivost počáteční hypotézy, že posuzování takové simulace dává smysl pouze v daném hudebním kontextu.
4.3 TECHNOLOGIE 4.3.1 MIDI S postupnou digitalizací zvuku a nástupem využívání počítačů se fenomén zvukové simulace začal více rozvíjet až koncem 70. let 20. století. Do té doby bylo syntetické zpracování a přehrávání zvuku předmětem zkoumání pouze laboratorních specialistů (Roads, 1996). První hudební nástroje, u kterých začaly první pokusy o počítačovou simulaci, byly klávesové nástroje – v té době tedy různé typy akustických klavírů, či klasická elektronická piana (např. Rhodes, apod.). Důvodem byl fakt, že právě klávesové nástroje se díky své podstatě dají relativně snadno simulovat. Hráč nemůže ovlivnit barvu, či samotný charakter jednotlivých tónů jinak, než různou dynamikou a délkou úhozu do kláves. Samozřejmě že každý klavírista může hrát jiným způsobem, ovšem úder kladívka do struny uvnitř nástroje mohou ovlivnit pouze dvě zmíněné charakteristiky.
11
Pravděpodobně bude ležet někde mezi 90 a 100 procenty.
27
Tato svázanost, jež se mnohdy jeví jako určité výrazové omezení, je v případě klavíru při simulaci zvuku naopak výhodou. Notové zvuky tak představují ne příliš široký rejstřík, a nenotové zvuky se s klidem mohou omezit na zvuk uvolňujícího se tlumícího pedálu či kladívka (hammer release). Nutno však podotknout, že v počátcích se samozřejmě veškerý zájem soustředil na základní simulaci notových zvuků, a to ve velmi primitivní podobě. O skutečnou simulaci klávesových nástrojů tak ve skutečnosti nešlo. Snaha věrně napodobovat zvuk klasických hudebních nástrojů přišla až později (Manning, 2004). Při prvních pokusech o počítačovou simulaci se dlouho hledal vhodný způsob přehrávání generovaného zvuku. Podle Lemana (1997) bylo průlomem až definování MIDI (Musical Instrument Digital Interface) roku 1982. MIDI je speciální protokol, který umožňuje klávesovým ovladačům, syntezátorům, samplerům a zvukovým kartám navzájem komunikovat a přenášet tak systémová data. V oblasti počítačové hudby se MIDI považuje za standard. MIDI nevysílá žádný audio signál, ani jakékoli multimediální soubory, vysílá však: 1) Zprávy o jednotlivých událostech (event messages) jako je např. výška tónu, délka tónu, apod. 2) Kontrolní signály pro parametry typu volume, modulation, apod. 3) Časové signály pro stanovení tempa a všech vzájemných rytmických relací. MIDI tedy samo o sobě žádné zvuky nenese ani negeneruje, může však předat příkaz k přehrání zvuku. Zjednodušeně se tedy dá říci, že MIDI pouze přenáší příkazy zahrát určitý sled not o dané hlasitosti, a dalších vlastnostech, v určitém tempu. Protokol je tedy nezávislý na konkrétním zvuku. Přestože už vzniklo množství nových formátů (.XMF, .KAR) a nadstaveb (GM, GS, XG), stále se využívá specifikace MIDI 1.0 (Schaffer, 1997). Virtuální noty zapsané v MIDI mohou mít celou řadu vlastností, které se definují pomocí jednotlivých parametrů (controllers). Těch se používá velmi mnoho, mezi základní však patří tyto:
Volume – ovládá celkovou hlasitost jedné stopy nástroje.
Velocity – určuje intenzitu jednotlivých not nástroje.
Pitch Bend – parametr, který umožní změnu výšky až o jeden tón (tzv. glissando).
28
Pan – Určuje panoramatičnost zvuku, tedy poměr mezi levým a pravým kanálem.
Modulation – Umožňuje simulovat techniku hry vibrato.
Aftertouch – Snímá intenzitu stisku klávesy po úhozu (Note-On) do jejího uvolnění (Note-Off). Jak je již z popisu parametrů zřejmé, MIDI vzniklo v interakci s klávesovými
nástroji a také se tak při simulaci nejčastěji používá (tedy s MIDI klávesnicí). Není však výjimkou, kdy se jednotlivé hodnoty parametrů zadávají přímo v daném softwaru. Pro každý parametr lze podle MIDI specifikace zadat číslo od 0 do 127.
Obrázek 6 – Key Editor. Notový zápis MIDI zobrazen pomocí key editoru v aplikaci Cubase 5. V mřížce vidíme jednotlivé tóny v taktech, dole je pak zobrazen parametr, v tomto případě velocity. Zdroj: autor.
Co se týče zobrazení a samotné editace MIDI, existuje několik základních možností v závislosti na konkrétním softwaru. Nejčastěji se používá tzv. key editor, jehož možnou podobu vidíme na obrázku 6. Prakticky se jedná o ekvivalent notového zápisu, ovšem jeho výhodou je názornost, přehlednost, a především jednoduchost. Z hlediska skladatelské i aranžérské praxe si troufám tvrdit, že MIDI protokol ve spojení s key editorem je skutečně revolučním prvkem na poli moderní hudební tvorby, poněvadž znatelně posouvá hranice nutných teoretických znalostí, prohlubuje rytmickou i intonační představivost, a zpřístupňuje po celá staletí jinak velmi uzavřený obor i běžnému uživateli. Zápis v key editoru se obvykle dá zobrazit i pomocí klasických not, a to díky tzv. score editoru, jak je vidět na obrázku 7. Zde již vidíme standardní notový zápis, který se může vygenerovat na 29
konci celého procesu a předat tak např. interpretům. V závislosti na dané aplikaci může existovat ještě tzv. drum editor (upravený key editor speciálně pro snazší simulaci bicích nástrojů), popřípadě list editor, což je pouze jakýsi seznam všech po sobě jdoucích událostí a jednotlivých signálů určujících hodnoty parametrů.
Obrázek 7 – Score editor. Tentýž zápis (z obrázku 6) v zobrazení klasických not pomocí score editoru. Zdroj: autor.
U simulace některých nástrojů (zejména klávesových) je klíčovou vlastností plynulý barevný přechod u jednotlivých dynamických vrstev (velocity layers). Jak totiž zesilujeme dynamiku hraní, postupně se mění i barva tónu. Aby byl však pro posluchačovo ucho přechod plynulý, je třeba použít větší množství jednotlivých vrstev.12 Typickým problémem je totiž situace, kdy na jednom tónu překročíme za sebou hranici dvou vrstev (např. velocity 99 a 100), a ozve se nám najednou úplně jiná barva tónu, přehnaná, nepřirozená. Tímto rysem se vyznačuje většina horších virtuálních nástrojů. U klávesových nástrojů je plynulý dynamický přechod jedním ze základních a velmi snadno rozpoznatelných indikátorů kvality simulace, jenž přispívá ke vnímání kompaktnosti zvuku. S tím souvisí i způsoby simulace jednotlivých technik hry na daný nástroj. Protože chceme kvůli přehlednosti mít jeden nástroj pouze v jedné stopě (tracku), musíme být schopni změnu rejstříku zvuku (artikulace) provést v rámci tohoto tracku.13 Změnu zvuku lze zásadě provést dvěma cestami. Buď je tato simulace automaticky naprogramována přímo do softwaru nástroje (např. tak, že v případě splnění určité podmínky začne program zvuk sám přepínat), nebo, a to je častější, je nutné vytvořit vlastní přepínač (switch). Přepínačem může být typicky nějaký nepoužívaný tón (mimo hratelný rozsah nástroje), obvykle ve velmi nízké, nebo
12
Počet vrstev se v závislosti na nástroji může lišit, ale doporučuje se minimálně 6 - 10. Špičkové
virtuální nástroje disponují i 16 dynamickými vrstvami. 13
Vždy je vhodné mít jeden nástroj pouze v jednom tracku. Pokud toho nelze z jakýchkoli důvodů
dosáhnout, vždy počet tracků na nástroj alespoň minimalizujeme.
30
naopak vysoké poloze. Při úhozu na tento tón je pak zvuk přepnut na jiný rejstřík, přičemž nezáleží na tom, zda používáme MIDI klávesy, či nikoli. Přepínačů je možné mít několik podle počtu různých artikulací. Velmi rychle lze tak přepínat mezi různými typy zvuků podle potřeby, což jednoznačně přispívá k větší variabilitě a tím pádem i ke kvalitnější simulaci. Síla MIDI tkví jednoznačně ve spojení snadné zvukové simulace s flexibilní kompozicí. Během několika kliknutí je skladatel či aranžér schopen slyšet to, co ještě před několika lety musel nejdříve nahrát celý orchestr (pokud pomineme geniální skladatele typu Bedřicha Smetany, kteří disponovali absolutním sluchem). Stejně jako např. psaní textu dostalo až s počítači úplně nový rozměr, který umožňuje nekonečné množství úprav, hudební tvorba, i přes svou nepochybnou složitost, není v tomto ohledu výjimkou. Dnes si již nelze představit jakoukoli tvorbu hudby na počítači bez MIDI. V podstatě každý počítač je schopen přehrávat MIDI, ať už pomocí vestavěného hardwaru nebo softwarového syntetizéru. Noty pro filmovou či televizní hudbu vznikají nejdříve v MIDI, často jako pracovní, někdy pro určité nástroje i jako finální verze.14 Dokonce i zvonění v mobilních telefonech bývají přehrávány v MIDI formátu.
4.3.2 VST VST (Virtual Studio Technology) je zkratka pro univerzální rozhraní vyvinuté německou firmou Steinberg, jež slouží k integraci softwarových syntetizérů a efektových pluginů s audio editory a nahrávacími systémy. VST technologie využívá digitální processing signálu za účelem simulace vybavení tradičních nahrávacích studií. Dá se říci, že VST interface se stal standardem pro tvorbu rozhraní hudebního softwaru. Dnes existují tisíce pluginů a VST je podporováno většinou profesionálních DAW15 aplikací (jako je kupř. Pro Tools, Cakewalk Sonar, Cubase, apod.).
14
MIDI Manufactures Association, http://www.midi.org/aboutmidi/index.php.
15
Digital Audio Workstation – jedná se o komplexní nahrávací software pracující jak s MIDI, tak
s audio signálem.
31
Na jedné straně tedy máme hostitelské aplikace podporující VST, na straně druhé VST pluginy, které se dají dále dělit na VST nástroje (VSTi), VST efekty a VST MIDI efekty. VST nástroje využívají noty zapsané v MIDI. VST pluginy obecně poskytují svoje rozhraní, přičemž se snaží napodobit vzhled tradičního vybavení (včetně táhel a otočných regulátorů).
Obrázek 8 – VST instrument. Virtuální nástroj Lounge Lizard EP-3 simulující elektrické piano jako VST plugin. Lze jej použít samostatně nebo v jakékoli DAW aplikaci podporující VST. Zdroj: Applied Acoustics Systems.
MIDI zprávy mohou být využity k ovládání parametrů jak VST instrumentů, tak efektů. Většina hostitelských aplikací umožňuje přesměrovat audio výstup z jednoho VST pluginu do vstupu jiného VST pluginu. Např. výstup z VST syntetizéru může být poslán do vstupu VST reverb efektu k dalšímu zpracování. To je velkou výhodou, neboť processing v reálném čase velmi zkracuje čas strávený nad každým projektem. V současné době již nelze seriózně uvažovat o hudební tvorbě, zahrnující téměř jakoukoli z diskutovaných činností, bez technologií MIDI a VST. Tato svázanost není vývojářům virtuálních nástrojů a příbuzného softwaru překážkou – ba právě naopak – mohou těžit z možností jasně definovaného rozhraní (bez obav, že nový produkt bude mít problémy s kompatibilitou), a veškeré programátorské úsilí věnovat jádru, jímž je praktická hudební použitelnost.
4.4 EKONOMICKÉ HLEDISKO V průběhu analýzy simulace už možná čtenáře napadla jedna stručná, ale podstatná otázka: Vyplatí se to vůbec? Stojí tak komplexní napodobení 32
hudebních nástrojů na počítači za námahu? Není levnější a celkově efektivnější si nahrávku pořídit záznamem? To vše záleží na daných okolnostech. Je jasné, že argument typu „musí se to vyplatit, když se to používá“, je velmi vágní a není možné jej přijmout. Podmínek, které efektivitu simulace přímo ovlivňují, je celá řada. Záleží především na simulovaném nástroji (popř. nástrojích), délce a složitosti skladby a požadovaném zvuku. V případě nástrojů je třeba sledovat dvě na sobě nezávislé vlastnosti: náročnost jeho kvalitní simulace a na druhé straně náročnost pořízení kvalitního záznamu. To se samozřejmě u jednotlivých typů nástrojů liší. Např. bicí nástroje jsou relativně velmi snadno napodobitelné na počítači, a zároveň náročnost jejich kvalitního záznamu je vysoká (zejména
díky obtížnému snímání)16.
To je jednoznačně pro simulaci
upřednostňuje, ale podstatným faktorem je i složitost hudebního díla. V praxi potom vidíme, že u jednoduchých partů se simulace mnohonásobně vyplatí (někdy zvukem dokonce i předčí živý nástroj), u velmi složitých skladeb už o něco méně, neboť by zabrala mnohem více času a ztratila tak na efektivitě. Je nutné si uvědomit, že časovou náročnost simulace je vždy nutno posuzovat v relaci s časovou náročností živého záznamu; z toho důvodu nemůžeme stanovit absolutní hranici, ani pro jednotlivé druhy nástrojů. Finanční náročnost se neposuzuje už tak snadno, nicméně v tomto případě bývá zásadním kritériem (a to i pro profesionální skladatele, producenty, apod.). Zde velmi záleží na konkrétní situaci, a proto na tomto místě není rozumné brát v úvahu přesné ceny (hráčů, nahrávacího studia, hardwaru, softwaru, apod.). Pokud náročnost simulace a náročnost záznamu vyjádříme číselně a poté dáme do vzájemného poměru tak, že v čitateli máme náročnost záznamu (číslo od 1 do 10, přičemž 1 znamená nejnižší náročnost, 10 nejvyšší) a ve jmenovateli náročnost simulace (opět číslo od 1 do 10), dostaneme číslo, které můžeme nazvat simulační index (Is). Pohybuje se v rozmezí od 0,1 do 10 a udává, zda je hudební nástroj vhodný pro simulaci, či nikoli. Čím je vyšší simulační index Is, tím větší je předpoklad efektivní simulace. Je ovšem jasné, že se do indexu nezapočítává např. složitost skladby, apod., jedná se čistě o charakteristiku daného nástroje. Stanovit hodnoty obou náročností lze expertním odhadem (za podmínky, že známe veškeré vstupující faktory).
16
Jedná se o autorovu několikaletou osobní zkušenost.
33
Ukažme si výpočet indexu na příkladu uvedených bicích nástrojů. Náročnost záznamu odhadněme na 7 (z důvodu značných nákladů na získání opravdu kvalitního výsledného zvuku), náročnost simulace stanovme 2 (z důvodu snadného programování a velmi dobrého „volitelného“ zvuku)17. Index Is potom vyjde takto: 7/2 = 3,5, což je poměrně vysoké číslo (pokud porovnáme s jinými nástroji – ty, které jsou těžko napodobitelné, často ani nepřesáhnou hranici 1). Co se týče např. délky nebo složitosti hudebního díla, nemá příliš smysl uvádět konkrétnější příklady, ale je jasné, že vyšší délka a větší složitost (závislá na daném hudebním stylu) hovoří spíše proti počítačové simulaci, neboť její doba pak roste přímo úměrně. Přesto, že se nedá efektivita počítačové simulace zvuku nijak paušalizovat, je evidentní, že existují hudební nástroje, které k tomu mají jasně lepší předpoklady, než jiné. V této chvíli však nebudeme více spekulovat, počkejme si na výsledky poslechového testu, které budou jistě zajímavé a přinesou základní odpovědi a poznatky, a další upřesnění.
4.5 METODY SIMULACE Poněvadž jeden z fundamentálních předpokladů týkající se návrhu počítačového programovacího jazyka je určitá míra obecnosti, rozsah praktické aplikace takového jazyka je enormní, a evidentně zahrnuje i hudbu. Píší se programy mnoha různými jazyky pro velké množství různých hudebních záměrů. Ty, které se ukázaly jako nejužitečnější v tom smyslu, že skladatelé díky nim získali nejvíce zkušeností, jsou programy pro syntézu a zpracování zvuku a aplikace, které dokážou přeložit specifikace hudebního díla do fyzických charakteristik vyžadovaných syntézou. Získání základních znalostí programování může i pro hudebního skladatele být značnou výhodou, protože je to klíč k základnímu porozumění počítačových systémů. Přestože se takové systémy skládají z dosti komplexních programů,
17
Složitost simulace bicích nástrojů je (bez ohledu na komplexnost skladby) dána především
počtem různých typů úderů na jeden konkrétní nástroj (snare drum, kick drum, hi-hat, atd.), což si lze představit jako jednotlivé tóny u melodického nástroje. Různorodost úderů při simulaci pak může být naprogramována ručně, nebo automaticky v závislosti na daném softwaru, zvukové bance, apod. Vzhledem k faktu, že počet takových tónů často nepřekročí 10, zatímco např. piano jich má standardně 88, vidíme, že simulace bicích nástrojů je podstatně zjednodušena.
34
napsaných metodami, které není lehké se naučit, určité programovací schopnosti umožní skladateli pochopit funkčnost celého systému, což se odrazí v možnosti jeho lepšího využití. Navíc člověk získá jistou nezávislost v oblasti, kde je snad nejvíce potřeba – v syntéze. Podobně jako v tradiční instrumentaci, je i syntéza tónů, jež má co do činění s barvou zvuku a artikulací, často velmi subjektivní. Celý proces pak může být obohacen schopností skladatele měnit algoritmy syntézy zcela volně. Max Matthews v knize The Technology of Computer Music (1969) doslova napsal: „The two fundamental problems in sound synthesis are (1) the vast amount of data needed to specify a pressure function—hence the necessity of a very fast program—and (2) the need for a simple, powerful language in which to describe a complex sequence of sounds.“18 Dnes se ukazuje, že první problém je díky masivnímu rozvoji technologií vyřešen. Výkon procesorů rostl za posledních 15 let průměrně o více než 30% každý rok a tento trend nevykazuje žádné známky oslabení.19 Dnes na osobních počítačích je v reálném čase možno bez potíží provádět syntézu i více hlasů (nástrojů) najednou. Druhý problém je vyřešen pouze částečně, a v principu zřejmě nemůže být nikdy vyřešen zcela, poněvadž komplexita studované problematiky to ani neumožňuje (nebo jen do určité omezené míry). Neznamená to však, že by simulace nebyla vůbec možná, ale spíše skutečnost, že dostupné techniky nejsou pochopitelně dokonalé. Tvorba počítačového zvuku se postupně stává populárnější mezi širokou řadou hudebníků po celém světě. Na jedné straně, výrobci MIDI syntetizérů (až na některé výjimky) zatím nebyli schopni ve velkém měřítku vyprodukovat mnoho použitelných technik syntézy zvuku.20 MIDI protokol sám o sobě není schopný poskytnout flexibilní, výrazové parametry pro ovládání komplexních technik syntézy (Miranda, 2002). Na straně druhé, možnosti zpracování zvuku na osobních
18
Překlad: Dva podstatné problémy syntézy zvuku jsou (1) obrovské množství dat požadovaných
k definování funkce – a tedy potřeba velmi rychlého programu – a (2) požadavek po jednoduchém, ale účinném programovacím jazyku popisujícím komplexní posloupnost zvuků. 19
CSDL Computer Magazine, http://www.computer.org/portal/web/csdl/magazines/computer#1.
20
Přestože jednotlivých technik je nyní k dispozici několik desítek. Viz téměř úplný přehled syntéz
podle Smithe na obrázku 8.
35
počítačích rostou, a tím se stávají běžnému uživateli dostupnější. Dá se říci, že při současném vývoji IT je téměř každý počítač za pomoci vhodného softwaru schopen v reálném čase generovat zvuky na základě téměř jakékoli metody, jakou si jen můžeme představit. Existuje celá řada způsobů jak naprogramovat virtuální hudební nástroj na počítači a volba vhodného způsobu je pro dosažení efektivních výsledků klíčová. Některé techniky mohou pro určité barvy a charaktery zvuku sloužit lépe než jiné, nicméně nemáme pro výběr přesná kritéria; do jisté míry se jedná o otázku zkušenosti a subjektivního přístupu a vkusu. Obecně platí, že čím intuitivnější a flexibilnější daná metoda je, tím se stává atraktivnější. Například techniky, jejichž parametry poskytují smysluplný způsob návrhu nástroje a barvy zvuku, jsou obvykle preferovány před těmi, jejichž parametry jsou cele založeny na abstraktních matematických vzorcích. Je třeba si také uvědomit, že historicky první techniky syntézy vznikaly dlouhá léta ve vědeckých laboratořích, než se dostaly do rukou hudebníků ve fyzické podobě. Dnes je vývoj nových metod a přístupů výhradně záležitostí průmyslu. Proto už stěží v Computer Music Journal čteme o nové syntéze. Místo toho na nás křičí nic neříkající marketingová hesla z webových stránek výrobců, a nutno poznamenat, že mnohdy o kvalitní simulaci nemůže být ani řeč. Metod zvukové simulace bylo vynalezeno a celosvětově používáno velmi mnoho. Nicméně prakticky neexistuje široce uznávaná taxonomie pro jejich studium a analýzu. Můžeme již ale říci, že každá metoda simulace je založena na určitém modelu. Některé modely třeba mají tendenci využívat volné matematické abstrakce, zatímco jiné se pokoušejí přímo napodobit mechanické a akustické jevy. Pokud se dostaneme až k původní podstatě existence zvuku na počítači, je jasné, že zvuk mohl vzniknout pouze dvojím způsobem. Stručně řečeno, buď byl přímo počítačově simulován, nebo se jedná o záznam nějakého zvuku (který mohl být zase nejdříve generován, nebo fyzicky snímán). Na první pohled se tak může zdát, že onen druhý způsob simulací zvuku vlastně není, vždyť se jedná o nějaký wave soubor, který někdo předtím zaznamenal a počítač jej pouze přehraje. To je do jisté míry pravda, ale je třeba si uvědomit, že hovoříme o komplexní simulaci hry hudebního nástroje, a jestliže vezmeme v úvahu podmínku vyslovenou v předchozí kapitole (tj. jeden sample odpovídá jednomu tónu), zjistíme, že i druhý způsob se v průběhu 36
celého procesu stává simulací. Je totiž třeba napodobit všechny jednotlivé prvky skutečného záznamu hudebního nástroje. Navíc ne vždy se využívají celé samply tak, jak byly původně zaznamenané. Někdy je možné wave soubory mezi sebou různě kombinovat a vytvářet tak jiné typy zvuků.21 Více se však dozvíme v šesté kapitole. Záznamy
Spektrální
Fyzické
Abstraktní
zvuku
modelování
modelování
algoritmy
Wavetable syntéza
Aditivní syntéza
Waveguide
VCO, VCA, VCF
Samplování
Phase vocoder
Modální syntéza
FM syntéza
Vektorová syntéza
PARSHL
Mozaiková syntéza
Waveshaping
Granulární syntéza
Serra
Phase Distortion
Wavelet
Chant
Karplus-Strong
VOSIM Subtraktivní syntéza LPC Inverzní FFT Xenakis Line Obrázek 9 – Metody simulace. V tabulce vidíme možnou taxonomii všech známých typů syntéz. Zdroj: na základě Smith (1999) upravil autor.
Na obrázku 8 je vidět možné rozdělení technik simulace zvuku podle Smithe (1999). Většina známých autorů se věnuje zvláště prvnímu typu mnou uvedených simulačních metod (snad s výjimkou wavetable syntézy), a druhý způsob ponechávají stranou, přestože se z ekonomického hlediska prokazatelně stále jedná o největší skupinu těchto produktů na trhu, která tak v oblasti simulace hudebních nástrojů tvoří klíčovou složku. Metody simulace zvuku se tedy obecně dají dělit na dvě kategorie: 1) Metody využívající algoritmy 2) Metody využívající zvukové záznamy. Toto nejzákladnější dělení vystihuje samo o sobě filozofie přístupu ke vzniku počítačového zvuku na elementární úrovni. Jakékoli další členění
21
Typické je např. použít jeden typ attacku pro všechny tóny z důvodu úspory paměti, apod.
37
jednotlivých metod a technik se často u konkrétních autorů diametrálně liší. Zatímco někteří volí např. hledisko typu modelu, jiní zase dávají přednost frekvenčnímu či časovému hledisku. Není však příliš důležité, jaké dělení použijeme. Daleko potřebnější je pokusit se porozumět podstatě obou přístupů, abychom tak mohli lépe pochopit celý proces simulace. Osvojení základních znalostí těchto metod dává každému uživateli, který se zajímá o tuto problematiku, mnohem výhodnější startovní pozici při vytváření opravdu věrné simulace. V následujících kapitolách se zaměřím na celosvětově nejvýznamnější metody, jež tak zároveň mohou sloužit jako odrazové můstky pro další analýzu a jako ukázkové příklady obou základních přístupů k modelování zvuku na počítači. Uvedené metody jsou rozebrány do takové úrovně detailu, aby bylo možné snadno a stručně postihnout jejich principy.
38
5 SIMULACE POMOCÍ ALGORITMŮ Systémová hudební věda (systematic musicology) se v zásadě zatím nezabývá moderními přístupy lidské kreativní tvorby za využití nových technologií. Je ale příznačné, že vynálezci jednotlivých simulačních metod byli obvykle nejen vědci a programátoři, ale zároveň i hudebníci. Jen plné pochopení fyzikálních charakteristik zvuku a prolínání různých disciplín může vést ke vzniku technik, které budou skutečně běžně použitelné a skončí implementací do nejrůznějšího vybavení. Simulace na základě syntézy, tedy určitého skládání zvuku, jsou přístupy, které demonstrují základní význam počítačově generovaného zvuku. Strojem vytvořený zvuk je jistě pozoruhodným fenoménem. Pro reálné využití je ale důležitější spíše jakási postupná kultivace barvy zvuku a právě na ni je třeba klást důraz. Proto nás více zajímá celý algoritmizovaný proces úpravy zvuku více, než fyzický vznik. Některé z analyzovaných metod se kdysi staly základem úspěchu slavných syntezátorů a posunuly hudební tendence kupředu. Pro použití na osobních počítačích se virtuální nástroje využívající algoritmů dnes často dodávají ve formátu softwarových pluginů, typicky VST (podporující MIDI), Výhodou je pak především kompatibilita. Algoritmických technik existuje velké množství a modulární otevřenost umožňuje uživatelům daný software téměř jakkoli kombinovat.
5.1 SPEKTRÁLNÍ MODELOVÁNÍ 5.1.1 ADITIVNÍ SYNTÉZA Spektrální modelování zahrnuje celou řadu různých technik, ovšem zaměřme se dvě základní: aditivní a subtraktivní syntézu. Aditivní syntéza (additive synthesis) vytváří specifickou barvu zvuku, která se skládá z četných harmonických nebo neharmonických částí (jednotlivých sinusových vln) o různých frekvencích a amplitudách, které se v čase mění. Z uvedených metod patří podle
39
Roadse (1996) aditivní syntéza mezi nejstarší a nejvíce zkoumané techniky simulace zvuku vůbec.22 Aditivní syntéza umožňuje emulaci zvuků ovládáním frekvence a amplitudy každé individuální části. Každý harmonický generátor má měnitelnou intenzitu, čím vytváří specifický, dynamický zvuk měnící se v čase. Syntéza může produkovat i neharmonické zvuky (které mají aperiodickou křivku), pokud všechny jednotlivé harmonické tóny nemají frekvenci, jež je celočíselným násobkem frekvence základní. V pozadí této metody stojí tzv. Fourierův teorém.23 Podle něj jakákoli periodická vlnová křivka se dá modelovat jako souhrn částí o rozdílných amplitudách a v čase měnících se frekvencích. Systém aditivní syntézy využívala např. řada syntetizérů Kawai K5000, které prosluly zejména v 90. letech. Z modernějších lze pak vyjmenovat Camel Audio Alchemy, nebo Image-Line Morphine. Zajímavostí je, že stejné aditivní postupy tvorby barvy zvuku vyžívaly i dnes už klasické varhany Hammond s devíti ručními táhly pro kontrolu harmonických tónů. Aditivní syntéza se všeobecně považuje za jednu z nejvýznamnějších a nejflexibilnějších spektrálních metod, ale její použití je velmi náročné, poněvadž hudební barva je složena z desítek jednotlivých částí křivek, včetně harmonických a neharmonických komponent, a šumu. Z hlediska simulace klasických hudebních nástrojů není tato syntéza příliš významná, a spíše se od ní kvůli její výpočetní složitosti upouští.
5.1.2 SUBTRAKTIVNÍ SYNTÉZA Subtraktivní syntéza (subtractive synthesis) je svým způsobem opakem aditivní. Je to technika, jež totiž vytváří zvuk odebíráním harmonických frekvencí, což se dá charakterizovat jako aplikace určitého filtru na audio signál. Celý proces si tak lze představit např. tak, že vezmeme wave výstup z generátoru a necháme jej projít low-pass filtrem, čímž vznikne specifická a přirozenější barva zvuku více
22
V případě aditivní i subtraktivní syntézy se jedná spíše o historické přístupy a dnes se využívají
sporadicky. 23
Jean Baptiste Joseph Fourier (1768 – 1830) byl známý francouzský matematik a fyzik, jenž
proslul zejména objevením tzv. Fourierovy řady sloužící k vyjádření rozvoje funkce.
40
připomínající skutečný (strunný) nástroj. Komplexita zdrojového signálu, mezní frekvence (cut-off frequency) a rezonance filtru pak určují výsledný zvuk (Dodge a Jerse, 1997).
Obrázek 10 – Filtry. Ukázka aplikace (a) low-pass filtru a (b) high-pass filtru při subtraktivní syntéze. Mezní frekvence (cut-off frequency) označuje bod, kdy filtr začíná působit. Zdroj: na základě Roads (1996) upravil autor.
Subtraktivní syntéza je historicky spojována s analogovými syntezátory (jako např. Moog syntezátor) díky jednoduchému zapojení obvodů pro generování základních signálů – různých typů wave křivek (square wave, pulse wave, triangle wave). Moderní digitální a softwarové syntetizéry většinou pracují se složitějšími typy křivek, popř. využívají modulaci šířkou impulzů, jež zvuk dynamicky mění za účelem dosažení plnějšího, „živějšího“ tónu. Subtraktivní syntéza je velice oblíbená metoda simulace díky své jednoduchosti a nalézá odezvu i v současných produktech – ovšem spíše při tvorbě syntetických zvuků.
5.2 FM SYNTÉZA Podle Mirandy (2002) se FM syntéza řadí mezi tzv. loose modelling techniky, které poskytují parametry, jež aspoň v malé míře mají vztah ke světu akustiky. Tyto metody jsou často založeny na konceptuálních matematických formulacích, přičemž není snadné předvídat jejich výstupy a vůbec prozkoumávat jejich potenciál. FM syntézu vynalezl (již v úvodu práce zmiňovaný) John Chowning v roce 1967, licenci později koupila společnost Yamaha (Chowning, 1972). FM syntéza (frequency modulation synthesis) je metoda simulace, při níž se barva jednoduché křivky mění modulací frekvence, přičemž modulovací frekvence je sama obsažena v rozsahu audio signálu. Frekvence oscilátoru se mění doslova „v souladu s amplitudou modulujícího signálu“ (Dodge a Jerse, 1997). Výsledkem je komplexnější a barevnější tón. Aby mohly vzniknout další 41
harmonické tóny, musí mít modulující signál harmonický vztah k signálu původnímu. Pokud sílu frekvenční modulace postupně zvyšujeme, změna je patrnější a zvuk se stává složitějším. V případě použití modulátorů, jejichž frekvence nejsou celými násobky frekvence základní, můžeme získat různé disonantní a perkusivní zvuky.
Obrázek 11 – FM syntéza. Zjednodušená forma FM syntézy. Modulující frekvence mění základní frekvenci, což se projeví na výstupu z oscilátoru. Zdroj: na základě Roads (1996) upravil autor.
Pomocí FM se dají obecně dobře tvořit harmonické i neharmonické tóny s poměrně ostrým attackem. Tuto metodu lze digitálně extrémně snadno implementovat, ale její nevýhodu je složitá úprava výsledného zvuku. Miranda tvrdí, že jen velmi málo lidí skutečně zvládlo účinně pracovat s FM. Faktem však zůstává, že dnes již legendární syntetizér Yamaha DX7 v 80. letech minulého století využíval právě FM syntézu a takřka vytvořil úplně novou kategorii barvy zvuku.24 Co se týče věrného napodobení zvuku hudebních nástrojů, je FM syntéza ze všech prvotních přístupů rozhodně nejblíže, i když zdaleka ještě nedosahuje takových kvalit, o nichž by bylo možno uvažovat jako o příkladu dokonalé simulace. Spíše se využívá k oživení hudební tvorby novými barvami zvuku ve smyslu elektronických nástrojů.
24
Zajímavostí je, že onen specifický zvuk DX „sedmiček“ je dnes předmětem simulace vývojářů
stejně jako klasické hudební nástroje.
42
5.3 FYZICKÉ MODELOVÁNÍ Fyzické modelování zvuku představuje zatím nejnovější a stále více oblíbenější trend v syntéze zvuku vůbec. Řada vývojářů a vizionářů do něj vkládá velké naděje, poněvadž se jedná o techniku, jejíž výsledkem je zvuk, jež se doposud nejvíce přibližuje zvuku skutečných hudebních nástrojů. Fyzické modelování označuje spíše celý přístup tvorby zvuku než přesné simulační návody a zahrnuje pokročilé programování. Jednotlivé metody byly vyvíjeny různými vědci po více než tři desítky let. Kvůli výhradně matematickému jádru a poměrně velké výpočetní náročnosti, trvalo dlouho, než fyzické modely vystoupily z laboratorního prostředí, aby konečně vkročily do nahrávacích studií (Roads, 1996).25 Fyzické modelování (physical modelling) je metoda syntézy, při níž je wave křivka přímo vypočítána na základě matematického modelu, který se skládá ze série rovnic a algoritmů. V modelu musí být definovány určité principy (např. včetně zákonů fyziky), které ovládají produkci zvuku a mají několik parametrů, z nichž některé budou konstanty definující fyzické vlastnosti nástroje, jiné budou časově závislé funkce popisující hráčovu interakci s nástrojem (Trautmann a Rabenstein, 2003). Až metoda fyzického modelování dává pravý význam počítačové simulaci hudebních nástrojů. Všechny jejich určující charakteristiky totiž musí být naprogramovány a rekonstruovány pomocí algoritmů. Modely, které se pro simulaci používají, jsou dostatečně komplexní, aby poskytovaly druh citlivého a expresivního ovládání barvy zvuku a tónu, přesně, jak bychom očekávali od skutečného nástroje. A zdá se, že prostor pro modelování všech typů nástrojů je značný, a sám o sobě představuje široké pole pro další vývoj. Výhoda fyzických modelů tkví především v síle používaných algoritmů. Ty jsou značně efektivní při vytváření různých artikulací (různých technik hry na hudební nástroj) ve spektru od attacku, dlouhého dozvuku až po pulzující tón či nelinearitu nástroje obecně. Fyzické modelování také exceluje v simulaci přechodu mezi notami a barvami zvuku tím, že dynamicky mění určité části virtuálního nástroje (např. prodloužení rezonující trubice, apod.). Výsledkem jsou pak velmi uvěřitelné sonické barvy. Nicméně tento typ syntézy se nesnaží zhmotnit skutečné
25
První produkty využívající fyzické modelování se objevily až v polovině 90. let 20. století.
43
hudební nástroje. Nebere v úvahu všechny možné stavy daného nástroje, ale soustředí se spíše na fyziku nástroje ve vysoce omezené situaci při samotném hraní.26
Obrázek 12 – Obálka zvuku. Možný tvar obálky zvuku (sound envelope) v čase. Zdroj: na základě Roads (1996) upravil autor.
U fyzického modelování je důležitá i práce s již zmiňovanou, tzv. obálkou zvuku (sound envelope), což je definování fyzického tvaru zvuku od jeho vzniku až po zánik. Tato charakteristika je naprosto klíčová a do značné míry určuje vnímání barvy zvuku.27 Zatímco u prvních technik syntézy byla obálka zvuku poměrně omezena, zde se jedná o prakticky nezávislou vlastnost, a jejím programováním můžeme získat leckdy opravdu reálné tóny. Fyzické modelování může vyžadovat velké množství dat ke specifikování určité barvy zvuku. Pro srovnání, Yamaha VL1, virtuální „akustický“ syntetizér využívá 387 MB pro uložení 128 programů, což je kolem 3 MB na jeden program, zatímco DX7 FM program vyžaduje pouze 155 kB, a pouze 128 bytů v komprimované podobě. Je jasné, že při současných kapacitách osobních počítačů se nebude jednat o nepřekonatelný problém a navíc, vezmeme-li v úvahu kapacitní náročnosti techniky samplingu (viz další kapitola), je „nějakých pár set mega“ stále nepatrným požadavkem. V současné době se na trhu objevuje stále více virtuálních nástrojů využívajících právě principů fyzického modelování zvuku. Třeba z oblasti
26
Což ostatně odpovídá všem nárokům a požadavkům, jež jsme si obšírně stanovili v předchozí
kapitole. 27
Jsme například schopni slyšet rozdíly mezi ostrým a postupným attackem, což mimo jiné přispívá
k rozpoznání zdroje zvuku, apod.
44
klávesových nástrojů jsou ve středu zájmu uživatelů určitě produkty Modartt Pianoteq 3 a Truepianos od 4Front Technologies. Výjimečností těchto nástrojů je fakt, že celou řadu různých charakteristik zvuku si můžeme definovat prostřednictvím velmi povedeného rozhraní sami (jen namátkou ostrost attacku, barvu zvuku, reverb, míru vlivu dynamiky, umístění mikrofonů při snímání, atd.). Výsledkem je zvuk, jehož barevnost a kompaktnost se velmi přibližuje zvuku klasického piana, byť k dokonalosti ještě chybí malý krůček.28 Ovšem ve chvíli, kdy se simulace blíží skutečnosti, už hrají svou roli i posluchačovy preference a subjektivní vkus, tudíž musíme být velmi opatrní při vynášení jakýchkoli soudů. Velkou výhodou těchto fyzických modelů je pak zejména jejich univerzálnost, neboť v jednom produktovém balíku pak můžeme mít různé typy zvuků, např. podle skutečných modelů, či hudebních stylů, apod. Technologie fyzického modelování se ukázala jako velice efektivní přístup k tvorbě počítačového zvuku. Bude zajímavé sledovat, zda se jádro emulace časem přesune od samplingu k fyzickým modelům. Ty ještě potřebují další vývoj v oblasti celkové programovatelnosti a polyfonie. Nicméně už teď představují stále se zvětšující segment trhu. Domnívám se, že budoucnost simulace zvuku leží právě v metodách fyzického modelování, a je jen otázkou času, kdy se simulace dokonale přiblíží ke skutečnému záznamu. Už teď se technicky nejedná o nic neuskutečnitelného, je pouze třeba ještě chvíli vyčkat, než vývojáři přijdou s ještě propracovanějšími přístupy a uživatelsky jednoduššími nástroji.
28
Přestože lze zejména v případě Truepianos stále odhalit, že se jedná o počítačovou simulaci, je
produkovaný tón natolik příjemný, že bych neváhal jej doporučit pro běžnou popovou nahrávku. Pianoteq se v základní verzi dá pořídit za cca 6250 Kč, Truepianos vyjde v přepočtu na 3760 Kč.
45
6 SIMULACE POMOCÍ ZVUKOVÝCH ZÁZNAMŮ Metody využívající zvukové záznamy, tzn. samotné wave křivky, jsou druhým základním způsobem simulace zvuku. Svým způsobem se jedná o přehrávání už existujícího zvuku (sample playback), což je ovšem poněkud zkreslená definice. Jak zvuk původně vznikl, není v tomto případě důležité. Mohl být buď počítačově generován a poté digitálně zaznamenán, popřípadě přímo nahrán skutečným nástrojem. Můžeme říci, že se tak jedná o jakousi druhotnou tvorbu zvuku, jež má nicméně stejný význam jako simulace prostřednictvím algoritmů, protože, jak již bylo řečeno, více nás zajímá proces simulace barvy zvuku za účelem nasazení v praxi, než pouhý vznik zvuku. Jednotlivé metody se můžou lišit tím, zda s wave souborem pracují ve smyslu jeho další úpravy (spojování tónů dohromady, využívání stejných attacků pro všechny tóny, apod.), nebo jestli čistě přehrávají daný sample. Podle toho se rozlišují
základní
techniky.
Protože
bytová
velikost
wave
souborů
(i
komprimovaných, neboť komprese musí být bezztrátová) je značná, je jasné, že simulace bude hardwarově velmi náročná, a to i při současných kapacitách. Je jasné, že i v případě syntéz využívající přímo zvukové záznamy, může být využito určitých algoritmů. To se na první pohled dostává do kontradikce s názvy obou uvedených přístupů, ovšem zde je třeba zdůraznit, že elementární rozdíl je v původu vlastního zvuku. Použití wave souborů je naprosto revolučním prvkem v syntéze zvuku, a tudíž označení vystihuje právě tuto filozofii přístupu.
6.1 WAVETABLE SYNTÉZA Wavetable syntéza (wavetable synthesis) je elementární metoda založená na zvukových záznamech. Jedná se o jednu z prvních syntéz tohoto typu vůbec. Wavetable je tabulka, nebo matice obsahující sadu wave křivek o jedné periodě. Wave soubory mohou být generované počítačem nebo zaznamenané, a každá jejich perioda je uložena v buňce vyhledávací tabulky. Ta pak obsahuje drobné části všech wave dat jednoho tónu. Při změně parametrů se části přehrávají v určitém pořadí a vytvářejí tak nové zvuky (Millward, 2002). Rozdíl mezi ostatními syntézami využívající jedno-cyklické je dvojí: za prvé wavetable pracuje s vícečetnými křivkami a za druhé jeden nebo několik 46
modulátorů ovládá změny mezi těmito křivkami nebo jejich smícháním. Míra wave modulace je obyčejně znatelně nižší než sampling rate (vzorkovací frekvence). Výsledkem je zvuk, jenž je velmi unikátní, protože vznikají pouze dokonalé harmonické frekvence. Unikátní, ovšem ne ve smyslu dobrého přiblížení se skutečným zvukům, ale spíše syntetický. Mechanismus syntézy může mít podobu několika forem. Asi nejjednodušší formou je lineární prolínání z jedné wavetable do druhé sekvenčně. V tomto případě vždy pouze dvě wave křivky jsou sloučeny v jednom časovém okamžiku. Někteří autoři předkládají sofistikovanější metody, jako je míchání sady určených základních wave křivek, každá s funkcí své korespondující obálky. U obou metod je ale množství skladovaných dat mnohem menší než při využití prostých PCM samplů. To je proto, že wavetable syntéza využívá periodické vlastnosti křivek za účelem odstranění redundancí a redukce dat (Bristow-Johnson, 1996).
Obrázek 13 – Wavetable syntéza. Do cyklu jsou vybrány jednotlivé wave křivky, což se kontinuálně opakuje. Výstup se pak skládá ze čtyř navzájem zřetězených wave cyklů. Zdroj: na základě Russ (1996) upravil autor.
Struktura wavetable, která je dána počtem a délkou záznamů, závisí na konkrétní implementaci. Jednotlivé wave křivky a jejich umístění v tabulce musí sledovat jak hudební záměr, tak modulační možnosti jádra syntézy. Tvorba nových wave tabulek je proto dosti složitý proces, pokud není podporována speciálními editačními nástroji a přehráváním wave souborů v reálném čase. Takové editory často vyžadují další hardware, nebo už jsou zabudovány v drahých modelech, např. od firmy Waldorf. V 90. letech se v souvislosti s příchodem zvukových karet řady Sound Blaster od Creative Labs začal termín waveteble používat jako 47
marketingové označení jakýchkoli karet využívajících PCM samplů jako základ tvorby zvuku. Nicméně tyto karty nepracovaly ani tak s wavetable syntézou, jako spíše se samplery a systémem subtraktivní syntézy. Nutno přiznat, že wavetable syntéza se stále využívá, ovšem zdaleka ne ve své původní podobě. Jedná se o prolínání wavetable se samplingem, což tvoří základ pro fungování některých moderních samplerů. Využití nacházejí při tvorbě zejména barevně bohatých elektronických zvuků (synth pad, synth lead). Pro oblast simulace skutečných nástrojů je podstata wavetable syntézy de facto mrtvá, zatímco „klasické“ samplování stále dominuje.
6.2 SAMPLOVÁNÍ Samplování (sampling) je simulační metoda, při níž se beze zbytku využívá záznam skutečného nástroje. Termín samplování obvykle může mít dvojí význam. Širší pojetí samplingu znamená, jak již víme (z kapitoly 3 Digitální zvuk), proces převodu analogového záznamu do digitální podoby. Sampling v užším pojetí je vymezen jako digitální zaznamenávání (vzorkování) jednotlivých tónů hudebního nástroje, což lze chápat jako jakousi podskupinu širšího pojmu. Dále termín sample může být vykládán více způsoby. Sample v obecném pojetí je krátký audio záznam vystřižený z nějaké původní nahrávky. Může se jednat např. o celý takt určitého rytmu s jedním i více nástroji. Naopak sample v našem pojetí je jeden zaznamenaný tón, zahraný skutečným nástrojem. Tuto podmínku jsme si ostatně vymezili již dříve, proto ji není třeba znovu analyzovat. Technika samplováním představuje způsob simulace, kdy rekonstruujeme hudební dílo pomocí samplovaného nástroje, tedy prostřednictvím jeho jednotlivých nahraných tónů. Do jaké míry se digitalizovaný záznam dále upravuje, je věcí konkrétního softwaru, ovšem při samplingu se vždy předpokládá, že výsledný zvuk bude prakticky totožný se zvukem původně nahraným. Jinak řečeno jakékoli další úpravy zvuku jsou minimální, často pouze v intencích použití jednotného attacku (z důvodu úspory paměti), apod., a téměř nikdy nezasahují do barvy zvuku. Již během procesu vzorkování se proto věnuje veškerá péče podmínkám, za kterých se zvuk pořizuje. Samotný Sampling lze provádět buď automaticky pomocí softwarových nebo hardwarových samplerů (někdy i speciálních robotických zařízení 48
zkonstruovaných pouze pro tyto účely), nebo, a to je častější, ručně v nahrávacím studiu jako jakoukoli jinou nahrávku.29 To je samozřejmě velmi pracná metoda, ovšem v případě celé řady nástrojů (bicí nástroje, kytara, smyčcové a dechové nástroje) ani jiná možnost neexistuje. Většina profesionálních samplovaných nástrojů vzniká v nejlepších studiích na světě za asistence zkušených zvukařů a hudebníků s použitím prvotřídních nástrojů. Samplované tóny pak mohou být souhrnně nabízeny jako zvuková knihovna (sound bank) určitého nástroje, nebo ve formátu VST jako virtuální instrument. Metoda samplingu má v zásadě dva hlavní problémy. Prvním problémem je značná pracnost pořízení samplů. Pokud totiž chceme dosáhnout opravdu věrné simulace, musíme zaznamenat (tón po tónu)30 různé hlasitosti, techniky hraní, artikulace, apod. V řadě případů to představuje desítky a desítky hodin strávených ve studiu. Druhý, a s tím související problém je ten, že takové množství samplů vyžaduje obrovské kapacity paměti. Některé z těchto vzorků trvají třeba i více než 20 vteřin, než tón úplně dozní. Výsledkem je fakt, že zvukové banky (kvalitně) samplovaných nástrojů obsahují tisíce samplů a představují desítky, výjimečně i stovky gigabytů dat31, což je i při dnešních možnostech výpočetní techniky nezanedbatelný požadavek. Útěchou však budiž konstatování, že výstupem je super reálný zvuk, jenž potvrzuje, že simulace pomocí samplů doposud patří mezi nejlepší dostupné metody. Domnívám se, že fyzické modelování se v rámci několika málo let dostane do popředí, ovšem nyní stále dominuje sampling. Aby si čtenář mohl učinit odpovídající představu o tom, jak náročné může samplování živého nástroje být, budu zde citovat z dokumentace virtuálního nástroje baskytary Scarbee J-Slap'n Fingered od již zmiňovaného dánského skladatele a producenta Thomase Hansena Skarbye:
29
Je nutné rozlišit, zda se jedná o primární pořízení samplů z daného nástroje, nebo jejich pouhé
načtení do souboru zvuků. Samotné pořízení samplů se děje nejčastěji ručně z důvodu charakteru nástrojů. 30
Některé levnější nástroje mají samplován např. každý druhý tón. Ovšem opravdu profesionální
produkty disponují každým tónem o různé dynamice, délce, technice hry, atd. 31
Např. Piano Sampletekk Steinway D při jedné mikrofonní perspektivě zabírá 6,2 GB dat. Při všech
třech nabízených perspektivách pak požaduje více než 18 GB prostoru!
49
„As I sampled notes from one string at a time, and therefore wanted to avoid noise and resonance from the remaining strings, I used a piece of cloth, which I folded around these three strings. To make sure that the bass maintained a consistent sound for the five weeks it took to complete any 1 of the 3 sounds (8-10 hours a day - 7 days a week...), I taped the volume, bass and treble buttons in place. I also had to turn off the computer screen every time I was in record mode - I even turned my back to the speakers and other gear to avoid any unwanted frequencies. For every sample that ended up in the final version, I have recorded at least five that didn't make it!I was a hard judge when evaluating the quality and evenness of the samples. Sometimes I spent an hour or more on just one single sample.“32 Výsledkem je banka obsahující 6117 jednotlivých samplů. Tento popis nahrávacího procesu ilustruje obtížnost získání kvalitních samplů a zároveň podtrhuje důležitost skutečného hudebního nástroje v současné hudbě. Je velmi překvapující, že v době tak moderních technologií, syntéza počítačového zvuku spoléhá na vcelku primitivní metodu simulace. Využití záznamu se totiž vrací k původní podstatě hudebních nástrojů a svým způsobem říká, že simulace na počítači je sice možná, ovšem za celé řady podmínek a jakoby druhotně, tj. stále je nástrojů potřeba. Tato skutečnost je pro nás nesmírně zajímavá, neboť v plné míře ukazuje na nedostatky a omezení počítačové simulace zvuku na té nejobecnější úrovni. Odpověď na otázku, kam se bude simulace dále ubírat, nejlépe poskytuje metoda fyzického modelování. Ovšem sampling jako takový hudební průmysl nesmírně ovlivnil, a stále se do jisté míry vyvíjí. Zde je třeba říci, že za prvé metoda samplování (v širším pojetí) v hudbě přinesla nové možnosti užití již nahraného materiálu. Tato manipulace se zvukem
32 Překlad:
„Protože jsem nahrával tóny postupně vždy z jedné struny, a nechtěl jsem žádný šum ani
rezonanci od zbývajících strun, zakryl jsem je kusem látky. Abych se ujistil, že basa bude mít stále stejný zvuk po pět týdnů, které celý proces zabral (8 -10 hodin denně, 7 dní v týdnu), přilepil jsem páskou všechny ovladače. Musel jsem vypínat obrazovku pokaždé, když jsem právě nahrával, a dokonce jsem se obracel zády k reproduktorům, abych se vyvaroval jakýchkoli nechtěných frekvencích. Na každý finální sample jsem nahrál aspoň pět, které byly nepoužitelné! Byl jsem velmi přísný při hodnocení kvality a vyváženosti zvuku a někdy jsem strávil i více než jednu hodinu na jednom tónu.“
50
má blízko ke způsobu, jakým dýdžejové rytmicky používají vinylové desky (tzv. scratching).33 To mimo jiné vedlo zvláště v popové hudbě k daleko většímu důrazu na rytmickou charakteristiku díla. Za druhé sampling spočívá v identifikaci jednotlivých samplů na straně posluchače. Identifikace každého samplu je však relevantní pouze v relaci na celé hudební dílo. Z toho samozřejmě vycházejí i podmínky poslechového testu. Sampling tedy představuje historicky poměrně starou metodu, kterou se za pomoci současné nejmodernější techniky podařilo dovést do stavu, kdy trhu jednoznačně dominuje a zřejmě nyní zažívá svůj zenit. Pravdou zůstává, že samplované virtuální nástroje jsou zatím nejlepší dostupnou simulací klasických nástrojů a gigabyty samplů stále vítězí nad sofistikovanějšími metodami.
33
Scratching představili první hip hopoví umělci už na konci 70. let 20. století.
51
7 TEST SOUČASNÝCH METOD SIMULACE Tato kapitola se věnuje poslednímu ze stanovených cílů práce, jímž je poslechový test, který poskytuje odpovědi na otázku, zda je možné na počítači plnohodnotně simulovat hudební nástroje. Celá řadu aspektů této problematiky, ze kterých jsme při testu vycházeli, byla analyzována v předchozích částech (zejména v kapitole 4). V průzkumu nebyly využity všechny uváděné metody tvorby zvuku, neboť se soustředíme na simulaci klasických hudebních nástrojů, tzn., že jsme použili pouze metody, jež takové simulace mohou dosáhnout. Nejčastěji se jedná o sampling a fyzické modelování, jakožto o dva současné představitele vhodných simulačních přístupů v hudebním průmyslu. Je zajímavé sledovat, zda se na základě diskutovaných témat některé teze potvrdily, popř. do jaké míry, apod. Je samozřejmě nutné zdůraznit, že poslechový test nelze pokládat za stoprocentně přesný a to z několika důvodů. Za prvé vnímání zvuku je vždy do určité míry subjektivní záležitostí, na níž nelze nic měnit. Z toho důvodu se testu zúčastnili pouze experti, u nichž se dá předpokládat vysoce vyvinuté hudební vědomí. Za druhé z kapacitních a dalších důvodů není možné test provádět na velkém souboru expertů, jsme tedy nuceni použít výběrový soubor. Dále při jakémkoli průzkumu se nelze vyhnout statistické odchylce. Nicméně i tak věřím, že získané materiály slouží jako dobrý podklad k zodpovězení alespoň základních otázek. Poslechový test byl bohužel časově poměrně omezený z důvodu účasti lidí z hudebního oboru. Všechny relevantní informace týkající se poslechového testu (seznam expertů, přehled jednotlivých ukázek, dotazník) jsou uvedeny v příloze práce. Veškeré ukázky jsou k dispozici na přiloženém CD. Jsou chráněny autorským právem a byly použity pouze pro edukační účely.
7.1 METODIKA POROVNÁNÍ 7.1.1 POPIS TESTU Použitá metoda poslechového testu by se dala nazvat jako heuristická. Bylo při ní využito odborníků z dané oblasti, kteří dostali za úkol určit, zda jsou jednotlivé ukázky skutečné, nebo se jedná o simulaci. Odpovídali 52
prostřednictvím dotazníkového šetření. Testu se zúčastnilo 24 expertů z řad muzikantů, hudebních pedagogů, a zvukařů; tedy lidé, jejichž zaměstnáním (a často i zálibou) je hudba, a denně jsou zvyklí poslouchat hudební nástroje. Tito lidé navíc znají jejich specifika, takže „oklamat“ jejich sluch počítačovou simulací není tak snadné jako u běžných posluchačů. Poslechový test byl tzv. slepý – účastníci tak samozřejmě nevěděli, o jakou ukázku se jednalo. Vždy byla puštěna jedna dvojice záznamu a simulace daného nástroje v libovolném pořadí. V praxi to pak znamená, že u některých dvojic byl jako první přehrán skutečný záznam, pak simulace, u jiných zase první simulace, potom záznam. Vždy po přehrání jedné dvojice se každý expert pokusil určit původ nahrávky. Důležité je, že se na dotazníkovém formuláři objevila volba nevím, jež se ukazuje jako klíčová, poněvadž rovněž hovoří ve prospěch simulace.34 Podmínkou je, že veškeré simulace musely být původně vygenerovány z MIDI zápisu. S tím souvisí i naše původní podmínka, že v případě samplovaných nástrojů musel být MIDI zápis vytvořen tón po tónu: jakékoli sekvence více tónů nebyly povoleny. Dále jsem považoval z hlediska posuzování za vhodné, aby v každé ukázce byl přítomen pouze jeden nástroj. V celém mixu (tj. se všemi ostatními stopami) by byl poslechový test neprůkazný. Navíc tím zajistíme, že v jakémkoli dalším hudebním kontextu bude nástroj (co do autentičnosti, ne nutně co do barevného prolnutí) stejně dobře funkční. Z hlediska celkové objektivity bylo rovněž vhodné, aby skladby byly ve dvojici ukázek stejné. Protože při poslechovém testu nehodnotíme přesnou zvukovou kopii daného nástroje, ale jeho celkovou simulaci, považuji za důležité zachovat princip ceteris paribus. Tuto podmínku se však bohužel nepodařilo zachovat u všech ukázek. Vždy se jednalo o stejný typ nástroje, výjimečně např. i o stejný model. Jelikož byly všechny ukázky sólové, nemá příliš smysl hovořit o konkrétních
34
Tzn. že počítačová simulace je natolik kvalitní, že ani expert nebyl na základě svého dojmu
schopen určit původ nahrávky.
53
hudebních žánrech. V některých případech byla použita klasická díla, v ostatních pak části různých kompozic a individuálních (studiových) představení. Pro simulaci byly použity dvě nejlepší dostupné metody a sice v první řadě sampling, a dále fyzické modelování. Obě metody navíc představují dva základní filozofické přístupy k tvorbě počítačového zvuku vůbec, tzn. generování zvuku a samplování. Ostatní analyzované metody, jako jsou FM syntéza nebo Wavetable syntéza, nebylo třeba brát při testu v úvahu vzhledem ke kvalitě výsledné simulace. Bylo nutné, aby test probíhal najednou, a to zejména kvůli poslechovým podmínkám, které musely být stejné pro všechny zúčastněné pro zajištění maximální objektivity.
7.1.2 CÍL TESTU Cílem poslechového testu bylo prostřednictvím dotazníkového šetření zjistit, zda lze na osobním počítači plnohodnotně simulovat klasické hudební nástroje (jak bylo diskutováno v předchozích kapitolách). Slovem plnohodnotně rozumíme skutečnost, že expert z dané oblasti nebude schopen postřehnout rozdíl mezi skutečným nástrojem a simulovaným. Dále bylo mou snahou potvrdit, nebo vyvrátit následující hypotézy, jež jsem formuloval v průběhu celé práce na základě analýzy simulace: 1) různé hudební nástroje mají různou obtížnost své počítačové simulace. 2) Čím více se člověk podílí na vzniku zvuku hudebního nástroje, tím je obtížnější tento nástroj počítačově simulovat. Tyto hypotézy vyvstaly z teoretického rozboru simulace ve čtvrté kapitole a úzce souvisí s primární otázkou, jež byla položena v úvodu práce. Do testu tak vstoupily tyto tři prvky s cílem je potvrdit nebo vyvrátit.
7.1.3 PRAVIDLA TESTU 1) Poslechový test probíhal z důvodu konstantních podmínek najednou. Byly pouštěny vždy dvojice ukázek o maximální délce cca do 2 minut v libovolném pořadí. Jednotlivých dvojic bylo celkem 10, tzn. v souhrnu 20 ukázek. Každá dvojice se skládala ze záznamu skutečného nástroje a jeho počítačové simulace generované z MIDI.
54
2) V každé ukázce byl vždy reprezentován právě jeden hudební nástroj. Ukázka byla melodicky, harmonicky, a rytmicky dostatečně rozmanitá, aby bylo možno posoudit autentičnost. Každá ukázka byla ve stereo formátu pro zajištění maximální kvality poslechu. Přípustné formáty byly wav (min. 16 bitů při 44,1 kHz) a mp3 (min. 320 kbps), kdy je kvalita totožná s audio standardem pro zvuková CD. 3) Každý expert dostal dotazník, na němž po každé dvojici ukázek označil podle svého úsudku, která z dvojice je záznam skutečného nástroje, a která počítačová simulace. Při tom jsme využili ordinální posuzovací stupnici bodovací. Jestliže expert ukázky správně určil, získal záznam 1 bod a simulace 0 bodů. Jestliže toto expert určil nesprávně (opačně), popř. nebyl schopen jakkoli určit, získala simulace 1 bod a záznam 0 bodů. 4) Výsledky byly analyzovány podle počtu získaných bodů přepočítaných na procenta, a to jednak celkově a jednak podle jednotlivých nástrojů. Bylo možné vyčíst, které hudební nástroje lze snadno simulovat, které hůře, popř. které nelze simulovat. Rovněž bylo do jisté míry možné porovnat obě použité simulační metody.
7.1.4 POUŽITÉ VYBAVENÍ Test byl proveden v poslechové místnosti s běžným zatlumením. Jako zdroj zvuku sloužil notebook s externí zvukovou kartou. Při testu byly použity dvoupásmové studiové monitory Tapco S8 typu mid-field (pro střední vzdálenost poslechu) o výkonu 60 W se sofistikovanou aktivní technologií, které byly již velmi dobře rozehrané. Propojeny byly pomocí standardního RCA (cinch) kabelu. Jako zvuková karta byla použita Echo Audio Indigo IO s kvalitními převodníky (24bit/96kHz). Jako softwarový přehrávač byl použit Windows Media Player ve verzi 11. Při testu nebyl aplikován žádný zesilovač, ekvalizér, či jakékoli další zkreslení signálu. Pro simulaci většiny nástrojů byl použit sampling, výjimečně pak i fyzické modelování, pokud to charakter nástroje umožňoval. V určitých případech byl při simulaci použit reverb efekt pro lepší napodobení originálního záznamu. Na některé nástroje (např. bicí nástroje) byl rovněž aplikován processing. Audio podmínky zůstaly konstantní po celou dobu testu, hlasitost zvuku byla nastavena
55
na stejné úrovni pro všechny ukázky.
7.2 VYHODNOCENÍ VÝSLEDKŮ Výsledky poslechového testu dopadly velice zajímavě, jak je vidět ze záznamů na obrázku 14. V tabulce vidíme jednotlivé dvojice ukázek, z nichž každá obdržela určitý počet bodů podle toho, jak účastníci testu označili odpovědi v dotazníku. Z počtu získaných bodů je zřejmé, že celkově mají skutečné záznamy nepatrně vyšší skóre, ovšem daleko přínosnější jsou pro nás výsledky jednotlivých nástrojů. Protože se testu zúčastnilo 24 expertů, pro každou dvojici ukázek bylo možno maximálně získat 24 bodů, což představuje 100 %. Tato hodnota by znamenala, že 100 % expertů považuje simulaci nástroje za zdařilou, neboli simulace je naprosto nerozeznatelná od skutečného nástroje. Podobně lze pak uvažovat u všech bodových hodnot, které jsou pro lepší orientaci přepočítány na procenta. Ukázky podle
Počet bodů
Počet bodů
hudebních nástrojů
záznamu
simulace
1
Piano
3
12,5 %
21
87,5 %
2
Piano
9
37,5 %
15
62,5 %
3
El. piano
5
20,8 %
19
79,2 %
4
Baskytara
13
54,1 %
11
45,9 %
5
Akustická kytara
14
58,3 %
10
41,7 %
6
Elektrická kytara
18
75,0 %
6
25,0 %
7
Bicí nástroje
10
41,6 %
14
58,4 %
8
Housle
15
62,5 %
9
37,5 %
9
Trumpeta
21
87,5 %
3
12,5 %
10
Saxofon
19
79,1 %
5
20,9 %
126
52,5 %
114
47,5 %
Celkem
Obrázek 14 – Výsledky poslechového testu. Zdroj: autor.
Vidíme, že např. simulace samplovaného piana získala 87,5 % bodů, zatímco záznam pouze 12,5 %, To znamená, že plných 87,5 % expertů by simulaci nerozeznalo od skutečného nástroje. Vidíme, že je to zdaleka nejvyšší hodnota, jaké jsme v průzkumu dosáhli. Je tedy zřejmé, že simulace je velmi kvalitní, a téměř nepoznatelná od skutečného záznamu. Potvrdilo se, že simulace 56
klávesových nástrojů je poměrně snadná, v porovnání s ostatními nástroji. Simulace
modelovaného
piana
získala
62,5
%
bodů.
Je
naprosto
neoddiskutovatelný fakt (který se i v testu jednoznačně projevil), že fyzické modelování pro většinu hudebních nástrojů zatím nedosahuje kvalit samplování, které bylo proto použito pro většinu testovaných simulací. Ostatní nástroje si v simulaci bodově už tak dobře nevedly. Například bicí nástroje získaly 41,7 % bodů, což úplně neodpovídá původní představě o jejich snadné simulaci. Zajímavé je, že simulace akustické kytary získala 41,7 %, což je relativně hodně v porovnání s kytarou elektrickou, jež získala pouhých 25,0 %. Tento výsledek můžeme zřejmě přičíst charakteru nástroje. Osobně se domnívám, že zvuk elektrické kytary nepůjde snadno simulovat nikdy, poněvadž tento nástroj může při hře disponovat tolika různými barvami a typy tónů, že vytvořit skutečně univerzální virtuální nástroj je velmi obtížné. Housle v simulaci získaly poměrně nízkou hodnotu 37,5 % bodů. Simulace dechových nástrojů nepřekvapivě získaly nízký počet bodů (12,5 % a 20,9 %), čímž se de facto potvrdily vyslovené teze o různé obtížnosti simulace u různých nástrojů. Je jasné, že pro větší objektivitu by bylo nutné provést celou řadu dalších testů. Nicméně zcela prokazatelně a zodpovědně můžeme prohlásit následující závěry, které z průzkumu vyplynuly.
7.3 FORMULACE ZÁVĚRŮ Především je možné odpovědět na původní otázku, položenou v úvodu práce, tj. zda je obecně možné na počítači plnohodnotně simulovat hudební nástroje. Odpověď zní: ano, možné to je. Ovšem velmi záleží na podmínkách konkrétní situace. Například velmi záleží na simulovaném nástroji, na použité metodě, atd. Tím se zároveň dostáváme k dvěma hypotézám vysloveným na počátku této kapitoly. Za prvé lze potvrdit hypotézu, že 1) různé hudební nástroje se vyznačují různou obtížností počítačové simulace. Za druhé můžeme potvrdit i hypotézu, že 2) čím více se člověk podílí na zvuku hudebního nástroje, tím obtížnější je dosáhnout kvalitní počítačové simulace. Vidíme, že tyto závěry spolu úzce korespondují. Pokud totiž vyslovíme názor, že hudební nástroje lze počítačově simulovat, ihned jsme nuceni 57
vyslovit obě zbývající teze. Neboli, říkáme ano, ovšem současně musíme přidat doplňující vysvětlení a podmínky. Je to zcela logické. Problematika počítačové simulace je tak náročná a komplexní, že není jednoduché pronášet vágní soudy a závěry dvěma slovy. Vždy záleží na celé řadě podmínek, jež je nutné v zájmu správného pochopení vyvozených závěrů uvést.
7.4 ZHODNOCENÍ TESTU Test lze hodnotit jako úspěšný. Podařilo se nám najít odpovědi na základní otázku, a uvést na pravou míru i další teze. I přes jistou míru subjektivity, kterou s sebou vnímání hudby a zvuku obecně pochopitelně nese, byl poslechový test co možná nejobjektivnější. Testování všech simulací proběhlo takříkajíc v „extrémních“ podmínkách, na základě poměrně přísných pravidel, jež jsme si stanovili. Zejména složitost vybraných skladeb byla podstatným limitujícím faktorem.35 Univerzálnost virtuálního nástroje je totiž jedním ze základních problémů. Zvláště u samplovaných nástrojů, které se obtížně simulují (strunné, dechové), je takřka nemožné postihnout a zachytit všechny přípustné barvy a typy tónů, techniky hraní, apod. Dost často se proto stává, že virtuální nástroj dobře funguje pouze v určitém hudebním stylu, nebo lépe řečeno, pouze pro určitý styl hraní (bez ohledu na hudební žánr). Zde by však bylo příliš obtížné (pokud vůbec možné), pokusit se najít nějaký přímý vztah. Komplexita hry na hudební nástroj je natolik široká, a hlavně těžko matematicky uchopitelná (na rozdíl např. od hudební kompozice), že hledání nějakých pevných vzorců nedává příliš smysl. Výsledky poslechového testu také zcela určitě ovlivnila podmínka, podle níž byl v každé ukázce prezentován pouze jeden nástroj. Tato podmínka je jistě na místě a v zájmu objektivity je nutné ji při podobných testech aplikovat. Nicméně v praxi se při počítačové simulaci často spoléhá na fakt, že v celém mixu je zkoumaný nástroj poměrně hůře slyšitelný, a tudíž není snadné simulaci odhalit (zvláště pokud máme stopy překryty vokálem, popř. nějakým sólovým nástrojem, apod.). Ve výsledném zvuku se detailní analýza jedné stopy provádí velmi špatně.
35
Simulace hudebních nástrojů se nejčastěji používají v popu, který obvykle nevyniká přehnanou
komplexností.
58
Z této skutečnosti bezesporu těží spousta skladatelů a producentů. Počítačová simulace v praxi proto bude zřejmě jednodušší, než se může ze závěrů poslechového testu zdát. Běžní posluchači navíc jednotlivé nástroje zdaleka nevnímají tak citlivě, jako lidé, jež se hudbou každodenně zabývají. Bylo by jistě zajímavé a přínosné, pokud bychom mohli provést celou sérii testů, pro každý nástroj jednu. Pak by bylo možné mít např. pro jeden nástroj 10 ukázek simulací od různých výrobců, o různé složitosti a v kontrastních stylech. Bylo by rovněž možné uplatnit např. hodnotící škálu, apod. Výsledky takového testu by byly zajisté více vypovídající, ovšem toto nebylo zejména z časových důvodů uskutečnitelné. Zůstává to však jako jeden z dalších směrů, kterým se při využití této práce vydat. Těžko soudit, zda lze potvrzené závěry hodnotit jako převratné, anebo nikoli. Osobně bych se přiklonil spíše k druhé variantě. Domnívám se však, že v rámci této problematiky jde o poznání, které je cenné a dává jasný signál všem zainteresovaným stranám. Jelikož žijeme v turbulentním prostředí, jehož hybatelem je vědecký a technologický pokrok, je zřejmé, že další vývoj v oblasti simulace zvuku na sebe nenechá dlouho čekat. Nemyslím si, že by počítačový software a hardware jednoho dne nahradil hudební nástroje. Spíše (jako dnes) bude nabízet další možnosti tvorby hudebních děl a jednodušší metody pro následnou úpravu. Sampling dosáhl svého vrcholu a budoucnost propracovanější simulace zvuku spočívá v metodách fyzického modelování. Buďme rádi za nové možnosti tvorby zvuku hudebních nástrojů. Jejich počítačová simulace nebyla nikdy jednodušší.
7.5 OSOBNÍ ZKUŠENOST Za více než 10 let, po které se počítačové simulaci hudebních nástrojů věnuji, mohu konstatovat, že výsledky poslechového testu odpovídají do značné míry praxi, a téměř vždy jsem jednal v souladu s vyvozenými závěry. Simulace je, dle mého názoru, možná, ovšem hlavními limitujícími faktory jsou typ vybraného nástroje a složitost hudebního díla, či partu. Pokud tyto dva faktory vhodně zkombinujeme, můžeme (po získaných zkušenostech) očekávat skutečně velmi dobré výsledky. Tradičně jsem velmi často používal simulaci klávesových nástrojů, bicích nástrojů, smyčcových nástrojů, ovšem ostatní typy nástrojů jsem využil 59
spíše jen sporadicky, anebo nikdy. Správné smíchání nástroje se zbytkem tracků navíc může simulaci poměrně usnadnit. Je ovšem pravda, že někdy jsem byl nucen MIDI zápis poněkud pozměnit, aby simulace zůstala kvalitní. Důvodem byla právě zmiňovaná neuniverzálnost virtuálního nástroje, který je možno použít pouze pro určité hudební situace, a ne pro všechny. Je jasné, že dosáhnout věrné simulace není právě jednoduchou záležitostí, k níž jsou potřeba zejména nabyté zkušenosti a znalosti. Nicméně mohu prohlásit, že z ekonomického pohledu se simulace jeví velmi pozitivně, a v určitých případech může ušetřit čas, a zejména peníze. V případech, kdy je simulace již obtížná, však toto snažení pomalu postrádá smysl a je jasné, že od určitého bodu se ekonomicky již nevyplatí. Bohužel není snadné takový vývoj dopředu odhadnout.
60
8 ZÁVĚR Tato práce ukazuje, jak nové přístupy ke vzniku a použití počítačového zvuku postupně mění možnosti tvorby současné hudby. V úvodu jsem si položil otázku, na kterou jsem hledal odpovědi v průběhu celého textu. V prvních kapitolách jsem se věnoval základním vlastnostem zvuku a jeho vnímání, rovněž tak aspektům digitálního zvuku. Tyto kapitoly zde mají své místo, neboť vybudovaly pevný základ, na kterém stojí hlavní část práce. Ta je bezesporu obsažena ve čtvrté kapitole, kde jsem se pokusil obsáhnout poměrně širokou problematiku počítačové simulace zvuku a nastínit její elementární předpoklady. Snažil jsem se postihnout vnímání autentičnosti záznamů, provést analýzu samotné simulace s ohledem na formální logiku výpočetní techniky, zdůraznit význam standardních technologií, a v neposlední řadě poukázat na ekonomické hledisko věci. Dále jsem se zabýval jednotlivými softwarovými přístupy k syntéze zvuku tak, že jsem stanovil dvě základní skupiny metod, jež jsou naprosto odlišné svou filozofií: techniky využívající algoritmy a techniky využívající záznamy. Z nich jsem pak nejvíce prostoru věnoval metodám fyzického modelování zvuku a následně metodám samplování, jakožto nejdůležitějším představitelům obou základních přístupů. Závěrečné části práce pak popisují průzkum, který se uskutečnil prostřednictvím poslechového testu, jehož se zúčastnili experti z hudební oblasti. V testu jsem pak zmíněné metody podrobil poměrně přísné zkoušce a pokusil jsem se tak získat podklady pro formulování odpovědi na zadanou otázku.
8.1 ZHODNOCENÍ DOSAŽENÝCH CÍLŮ Co se týče zhodnocení dosažených cílů, všechny považuji za splněné. I když připouštím, že složitost aspektů digitálního zvuku a detailů softwarových přístupů by si zasloužila poněkud větší pozornost. Z kapacitních důvodů a zvláště pak z důvodu ucelenosti práce jsem se rozhodl tyto části zpracovat pouze na základní úrovni. Čtvrtou kapitolu, jejíž obsahem je analýza simulace, považuji za klíčovou, neboť je zde poměrně podrobně rozpracována problematika věrného napodobení reálných zvuků.
61
Výstupem z této části je i několik podpůrných tezí, které se, stejně jako základní otázka této práce, staly předmětem zkoumání poslechového testu. Ten hodnotím rovněž jako úspěšný. Výsledkem mého snažení byla řada zajímavých závěrů, které pomohly objasnit základní problém. Podařilo se odpovědět na zadanou otázku, a s pomocí potvrzených hypotéz jsme tak dali smysl celému textu. Hlavní přínos práce proto spatřuji v zodpovězení otázky, která byla položena na samém počátku: lze na počítači plnohodnotně simulovat hudební nástroje? Odpověď zní: ano, je to možné, ovšem za celé řady podmínek, které se pro naši odpověď ukazují jako naprosto esenciální. Dalo by se říci, že se odpověď na zadanou otázku může pohybovat na škále od ano po ne. Každá podmínka pak může odpověď mírně vychýlit oběma směry. Jak již víme, velmi záleží na typu simulovaného nástroje, použité metodě, složitosti hudebního díla, a na celé řadě dalších podmínek (zda se jedná např. o sólový part, ale záleží i na zkušenostech posluchače, atd.). Pokud tedy vyřkneme jakýkoli závěr, je nutné uvést vysvětlující podmínky a doplňující informace. Tato práce mapuje základní prvky problematiky reálné simulace zvukových zdrojů a může tak sloužit jako podkladový materiál pro další výzkum této oblasti. Zejména teoretické rozpracování analýzy počítačové simulace představuje koncept základních vztahů, které je nutné si uvědomit při využívání i návrhu simulačních nástrojů.
8.2 SLOVO ZÁVĚREM Propojení počítačů s hudebním průmyslem se stalo pravidlem. Ovšem simulace klasických hudebních nástrojů dává této oblasti nový rozměr. Propojení MIDI se softwarovými nástroji umožňuje uživatelům rychleji skládat s možností nekonečné editace, simulovat hudební nástroje, zaznamenávat výstupy, a v neposlední řadě i lépe chápat fungování hudebních prvků. Dle mého názoru se ještě nepodařilo plně využít potenciál nových přístupů. Nicméně to se zřejmě v budoucnu změní s tím, jak se bude hudební software na jedné straně postupně zdokonalovat a na straně druhé více přibližovat běžnému zákazníkovi. Komercializace softwarových nástrojů nemusí být nutně na škodu, ba právě naopak. Zdravá konkurence na tomto trhu může celý proces urychlit více, než cokoli jiného.
62
Není třeba se obávat, že by virtuální nástroje nahradily ty skutečné. Ostatně jakékoli metody využívající zvukových vzorků stále spoléhají na záznam živého nástroje. Ale ani v případě fyzického modelování nemůže nikdy počítačově generovaný zvuk poskytnout takové výsledky, že by plně nahradil klasické nástroje. Počítačová simulace hudebních nástrojů představuje pro hudební průmysl obrovskou výzvu. Po provedení důkladné analýzy jsem nabyl dojmu, že technicky jde zvuk simulovat téměř vždy. Překážkou jsou spíše problémy spojené s transformací všech jednotlivých částí simulace do rozumných a dostupných softwarových nástrojů, které by byly uživatelsky přívětivé, a jejichž funkcionalitu by bylo možno plně využít. Domnívám se, že vývoj takových nástrojů je otázkou jen několika málo let a už teď je jisté, že vazba mezi hudbou a výpočetní technikou se tak ještě více prohloubí.
63
9 POUŽITÉ ZDROJE 9.1 KNIHY A ČLÁNKY BERANEK, Leo L. Snižování hluku. Praha: SNTL, 1965. 744 s. BERRY, Wallace. Structural functions in music. Toronto: Dover Publications, 1987. 447 s. BILBAO, Stefan. Numerical Sound Synthesis. West Sussex: Wiley Publishers, 2009. 456 s. BRISTOW-JOHNSON, Robert Wavetable Synthesis 101, A Fundamental Perspective. In 101st AES Convention. Los Angeles: Audio Engineering Society, 1996. s. 25. COOK, Perry R. Real sound synthesis for interactive applications. [s.l.]: AK Peters, 2002. 263 s. DEAN, Roger. The Oxford Handbook of Computer Music. Oxford: Oxford University Press, 2009. 611 s. DODGE, Charles; JERSE, Thomas A. Computer Music: Synthesis, Composition and Performance. New York: Schirmer Books, 1997. 480 s. HOLUB, Josef; LYER, Stanislav. Stručný etymologický slovník jazyka českého. 2. vydání. Praha: SPN, 1978. 485 s. CHOWNING, John. The Synthesis of Complex Audio Spectra by Means of Frequency Modulation. Journal of the Audio Engineering Society. 1973, 7, s. 21-28. KIRK, Ross; HUNT, Andy. Digital sound processing for music and multimedia. Oxford: Focal Press, 1999. 334 s. LACKO, Julie A.; SEARS, Andrew. The human-computer interaction handbook: fundamentals, evolving technologies and emerging applications. Mahwah (New Jersey): Lawrence Erlbaum Associates, 2003. 1277 s. LEMAN, Marc, et al. Music, Gestalt, and Computing: Studies in Cognitive and Systematic Musicology. Berlin: Springer-Verlag, 1997. 524 s. LICATA, Thomas. Electroacoustic music: analytical perspectives. Westport (Conn.): Greenwood Press, 2002. 242 s. LIŠKA, Jakub. Mobilní hardwarové řešení pro práci se zvukem. Praha, 2009. 54 s. Bakalářská práce. VŠE. LYSLOFF, René T. A., et al. Music and technoculture. Middletown (Conn.): Wesleyan University Press, 2003. 395 s. MANNING, Peter. Electronic and computer music. Oxford: Oxford University Press, 2004. 474 s. 64
MATTHEWS, Max V., et al. The Technology of Computer Music. [s.l.]: MIT Press, 1969. 196 s. MILLWARD, Simon. Sound Synthesis with VST Instrument. [s.l.]: PC Publishing, 2002. 277 s. MIRANDA, Eduardo Reck. Computer sound design: synthesis techniques and programming. Second Edition. Woburn (Mass.): Focal Press, 2002. 263 s. MOORE, F. Richard. Elements of Computer Music. [s.l.]: Prentice Hall, 1990. 560 s. OREL, Miroslav, et al. Člověk, jeho mozek a svět. Praha: Grada Publishing, 2009. 256 s. REILLY, Edwin D. Concise encyclopedia of computer science. West Sussex: Wiley Publishers, 2004. 875 s. ROADS, Curtis. Microsound. Cambridge (Mass.): MIT Press, 2004. 409 s. ROADS, Curtis. The Computer Music Tutorial. Cambridge (Mass.): MIT Press, 1996. 1234 s. ROADS, Curtis. The Music Machine: Selected Readings from Computer Music Journal. Cambridge (Mass.): MIT Press, 1992. 740 s. ROBERTSON, William C.; DISKIN, Brian. Sound. [s.l.]: NSTA Press, 2003. 107 s. RUSS, Martin. Sound synthesis and sampling. Oxford: Focal Press, 1996. 400 s. SCHAFFER, John W.; MCGEE, Deron. Knowledge-based programming for music research. Madison (Wis.): A-R Editions, 1997. 402 s. SHANNON, Claude E. Communication in the presence of noise. Institute of Radio Engineers. 1949, 37, 1, s. 10-21. SMITH, Julius O. Viewpoints on the History of Digital Synthesis. In Proc. Int. Computer Music Conf.. Stanford: Stanford University, 1999. s. 1-12. THE ESSENTIAL GUIDE TO…Subtractive Synthesis. Computer Music. 2005, 9, s. 2728. TRAUTMANN, Lutz; RABENSTEIN, Rudolf. Digital sound synthesis by physical modeling using the functional. New York: Springer, 2003. 226 s. WARNER, Timothy. Pop music: technology and creativity : Trevor Horn and the digital revolution. Burlington (Vermont): Ashgate Publishing, 2003. 172 s. WATKINSON, John. An introduction to digital audio. Second Edition. Great Britain: Focal Press, 2002. 419 s. WIIL, Uffe Kock. Computer music modeling and retrieval: International Symposium, CMMR 2003. Berlin: Springer-Verlag, 2004. 246 s.
65
9.2 INTERNETOVÉ ZDROJE Applied Acoustics Systems [online]. 2010 [cit. 2010-04-17]. Lounge Lizard EP-3. Dostupné z WWW:
Camel Audio [online]. 2010 [cit. 2010-04-10]. Alchemy - Additive Synth, VA, Granular, Sampler. Dostupné z WWW: . CSDL Computer Magazine [online]. 2010 [cit. 2010-04-15]. Computer Highlights 2009. Dostupné z WWW: . GRAVES, C. S. Angel Fire [online]. 2000 [cit. 2010-04-11]. A Beginner's Guide to FM Synthesis. Dostupné z WWW: . KVR: WIKI [online]. 2006 [cit. 2010-03-11]. Wavetable synthesis. Dostupné z WWW: . MIDI Manufactures Association [online]. 2010 [cit. 2010-03-08]. Learn About MIDI. Dostupné z WWW: . Native Instruments [online]. 2010 [cit. 2010-02-24]. Dostupné z WWW: . Pianoteq [online]. 2010 [cit. 2010-04-15]. Dostupné z WWW: . REID, Gordon. Sound On Sound [online]. 1999 [cit. 2010-03-10]. Synth Secrets. Dostupné z WWW: . Scarbee Professional Audio Tools [online]. 2009 [cit. 2010-01-09]. Dostupné z WWW: . Steinberg Media Technologies [online]. 2010 [cit. 2010-04-09]. Dostupné z WWW: . Trupianos [online]. 2010 [cit. 2010-04-15]. Dostupné z WWW: . Waldorf Music [online]. 2009 [cit. 2010-04-16]. Dostupné z WWW: .
66
SEZNAMY SEZNAM OBRÁZKŮ OBRÁZEK 1 – SIGNÁLY................................................................................................................................. 13 OBRÁZEK 2 – ZVUKOVÁ VLNA. .................................................................................................................... 14 OBRÁZEK 3 – FUNKCE BAZILÁRNÍ MEMBRÁNY. ........................................................................................... 14 OBRÁZEK 4 – DIGITALIZACE. ....................................................................................................................... 17 OBRÁZEK 5 - PROCES PŘEHRÁVÁNÍ DIGITÁLNÍHO ZVUKU. ........................................................................... 18 OBRÁZEK 6 – KEY EDITOR. .......................................................................................................................... 29 OBRÁZEK 7 – SCORE EDITOR........................................................................................................................ 30 OBRÁZEK 8 – VST INSTRUMENT. ................................................................................................................. 32 OBRÁZEK 9 – METODY SIMULACE................................................................................................................ 37 OBRÁZEK 10 – FILTRY. ................................................................................................................................ 41 OBRÁZEK 11 – FM SYNTÉZA.. ...................................................................................................................... 42 OBRÁZEK 12 – OBÁLKA ZVUKU. .................................................................................................................. 44 OBRÁZEK 13 – WAVETABLE SYNTÉZA. ........................................................................................................ 47 OBRÁZEK 14 – VÝSLEDKY POSLECHOVÉHO TESTU....................................................................................... 56
SLOVNÍK ZKRATEK A POJMŮ AD převodník
Zařízení převádějící analogový signál do digitálního.
Aditivní syntéza
Metoda simulace zvuku skládáním z jednotlivých částí vlnových křivek.
Aftertouch
MIDI parametr snímající intenzitu stisku klávesy.
Alikvóty
Celé násobky frekvence základního tónu.
Attack
Náběh zvuku v čase.
Bitová hloubka
Počet bitů, které určují počet informací, které se při digitalizaci zvuku uloží pro každý vzorek.
Bitové rozlišení
Viz bitová hloubka.
67
Bpm
Rychlost udávaného tempa (počet úderů za minutu).
Cut-off frequency
Mezní, hraniční frekvence zvuku.
DA převodník
Zařízení převádějící digitální signál do analogového.
DAW
Digital Audio Workstation – komplexní software pro tvorbu hudby, který umí pracovat jak s audio záznamy, tak s MIDI.
Decay
Pokles zvuku v čase.
Dopplerův efekt
Jev, podle kterého slyšíme jinou frekvenci zvuku od pohybujícího se zdroje, než jakou skutečně vydává.
Drum editor
Speciální editor na úpravu a zobrazení MIDI zápisu partu bicích nástrojů.
Event message
MIDI zpráva o nastalé události týkající se tónu.
FM syntéza
Metoda
simulace
zvuku
modulováním
(změnou)
základní
frekvence. Glissando
Technika skluzu z jednoho tónu do druhého.
GM
General MIDI je standardizovaná specifikace pro MIDI protokol umožňující nezávislost formátů na typu virtuálního nástroje.
High-pass filter
Filtr pro rekonstrukci digitální křivky propouštějící horní frekvence.
List editor
Seznam jednotlivých událostí MIDI zápisu.
Loop
Audio záznam, který může být bez přerušení přehráván znovu a znovu.
Low-pass filter
Filtr pro rekonstrukci digitální křivky propouštějící dolní frekvence.
Key editor
Editor pro úpravu a zobrazení MIDI zápisu.
Komprese
Použití zařízení, které určuje hlasitost záznamu.
68
Mastering
Finální úprava zvukové podoby záznamu.
Mid-field
Střední vzdálenost poslechu od reproduktoru.
MIDI
Standardizovaný protokol pro výměnu dat a způsob přehrávání zvuku při tvorbě počítačové hudby.
Modulation
MIDI parametr umožňující simulaci techniky vibrato.
Obálka zvuku
Popsaný tvar zvuku v čase.
Pan
MIDI parametr ovládající panoramatičnost zvuku.
PCM
Digitální vyjádření analogového signálu.
Pitch Bend
MIDI parametr umožňující změnu výšky tónu.
Processing
Úprava audio záznamu (použití efektů).
Release
Dozvuk při uvolnění drženého tónu.
Reverb
Prostorový efekt, běžně nazýván též hall.
Sample
Krátký zvukový záznam živého nástroje.
Sample rate
Viz sampling rate.
Sampler
Software či hardware na vytváření a přehrávání zvukových bank.
Sampling
Proces digitalizace zvuku. Nazývá se též vzorkování.
Sampling rate
Vzorkovací frekvence, neboli počet měření hodnot signálu při digitalizaci zvuku.
Score editor
Editor pro zobrazení MIDI pomocí klasických not.
Sound bank
Soubor zvuků (obvykle hudebního nástroje) pro vytváření hudby na počítači.
Sound envelope
Viz Obálka zvuku.
69
Staccato
Technika hry krátkých not.
Subtraktivní syntéza
Metoda simulace zvuku odebíráním harmonických frekvencí prostřednictvím filtrů.
Sustain
Periodický zvuk při držení tónu.
Syntetizér
Hardware či software umožňující generovat zvuk.
Track
Zvuková stopa záznamu.
Velocity
MIDI parametr ovládající hlasitost jednotlivých tónů.
Virtuální nástroj
Označení pro software nebo hardware, který plně do všech detailů simuluje skutečný hudební nástroj.
VST
Virtual Studio Technology je rozhraní pro integraci zvukových syntetizérů s audio editory a nahrávacími systémy.
Wave
Křivka zvuku, někdy též záznam zvuku.
White noise
Šum, který obsahuje všechny frekvence.
70
PŘÍLOHY I. SEZNAM ZÚČASTNĚNÝCH EXPERTŮ Zde je uveden seznam odborníků, kteří se zúčastnili poslechového testu. Dis. Jakub Antl
profesionální hudebník (Nightwork)
Karel Bohuslav
hudební pedagog
Dis. Jan Čep
absolvent Konzervatoře Jaroslava Ježka
Petr Dyml
zvukař
Mgr. Luboš Hána
hudební pedagog (PF UJEP)
Pavel Houfek
profesionální hudebník
Mgr. Miroslav Chytil
zvukař (Svengali)
Roman Kadlec
člen orchestru Severočeského divadla
Ing. Tomáš Klimpera
profesionální hudebník
PhDr. Mgr. Pavel Kraus, PhD.
hudební pedagog
Mgr. Michal Kříž
zvukař
Mgr. Jiří Nešpor
hudební pedagog
Slavomír Peterka
profesionální hudebník
Jan Polák
zvukař
Mgr. Jan Pospíšil
student Konzervatoře Jaroslava Ježka
Stanislav Radim
zvukař
Jan Seibt
zvukař (MACAC)
Mgr. Drahoslav Straněk
hudební pedagog
Ladislav Svoboda
hudební dramaturg v ČRo Sever
Ing. Peter Šinági
zvukař
Petr Šťastný
profesionální hudebník (Olga Lounová)
Marie Tesárková
studentka sbormistrovství PF na UK v Praze
Dis. Robert Vašát
absolvent Pražské konzervatoře
Zach Zegan
profesionální hudebník (Dizmas)
71
II. PŘEHLED POSLECHOVÉHO MATERIÁLU Zde jsou uvedeny všechny ukázky, které byly použity při poslechovém testu. Je uveden vždy název nástroje, resp. název virtuálního nástroje, autor záznamu, resp. autor simulace, a dále použitá simulační metoda. Záznam 1 - piano
Simulace 1 - piano
Bösendorfer 290
Sampletekk PMI Bösendorfer 290
Jan Vayne
Jan Vayne Sampling
Záznam 2 – piano
Simulace 2 – piano
Yamaha Premium S4
Pianoteq V.3
Michael Joshua
Modartt Fyzické modelování
Záznam 3 – el. piano
Simulace 3 – el. piano
Rhodes Mark I
ASS Lounge Lizard EP-3
Daan Herweg
Ondřej Hlavsa Fyzické modelování
Záznam 4 – baskytara
Simulace 4 – baskytara
Fender Marcus Miller Jazz bass
Scarbee J-Slap'n Fingered
John Steinward
Ondřej Havsa Sampling
Záznam 5 – akustická kytara
Simulace 5 – akustická kytara
Yamaha LJ16
Chris Hein Guitars
Andy McKee
Chris Hein Sampling
Záznam 6 – elektrická kytara
Simulace 6 – elektrická kytara
Neuvedeno
Chris Hein Guitars
Joe Satriani
Chris Hein Sampling
Záznam 7 – bicí nástroje
Simulace 7 – bicí nástroje
Sonor Designer
Natural Drum Kit 72
Thomas Lang
Ondřej Hlavsa Sampling
Záznam 8 – housle
Simulace 8 – housle
Neuvedeno
Hollywood strings
Angelia Cho
Eastwest/Quantum Leap Sampling
Záznam 9 – trumpeta
Simulace 9 – trumpeta
Neuvedeno
Chris Hein Horns Vol. 1
Chris Botti
Chris Hein Sampling
Záznam 10 – saxofon
Simulace 10 – saxofon
Neuvedeno
Mr. Sax T. v 1.02
Andrew Keehan
Sample Modeling Sampling
73
III. DOTAZNÍK Jméno:
POSLECHOVÝ TEST A
Označte správnou variantu podle vašeho dojmu. Pokud si nejste jisti, označte prosím v zájmu objektivity Nevím. V tomto testu nemá smysl „hádat“. 1.
2.
3.
4.
5.
(a) Záznam, simulace
6.
(a) Záznam, simulace
(b) Simulace, záznam
(b) Simulace, záznam
(c) Nevím
(c) Nevím
(a) Záznam, simulace
7.
(a) Záznam, simulace
(b) Simulace, záznam
(b) Simulace, záznam
(c) Nevím
(c) Nevím
(a) Záznam, simulace
8.
(a) Záznam, simulace
(b) Simulace, záznam
(b) Simulace, záznam
(c) Nevím
(c) Nevím
(a) Záznam, simulace
9.
(a) Záznam, simulace
(b) Simulace, záznam
(b) Simulace, záznam
(c) Nevím
(c) Nevím
(a) Záznam, simulace
10.
(a) Záznam, simulace
(b) Simulace, záznam
(b) Simulace, záznam
(c) Nevím
(c) Nevím
74