Vzkumné centrum JAMU
Vizualizace barvy zvuku MgA. Ondřej Jirásek, Ph.D., Výzkumné centrum JAMU
Vizualizace zvuku v hudební výuce Hudebník by měl na prvním místě trénovat své hlavní čidlo - sluch. Vizualizace mu ale poslouží k rychlé zpětné kontrole. Ke kvantitativnímu i kvalitativnímu zobrazení toho, zda správně rozeznává/analyzuje, co se ve zvukovém vzorku děje ohledně výšky, délky, síly i barvy. Vizualizace může probíhat jak v reálném čase, tak i zpětně ze záznamu. Učiteli k ní postačí dokonce jen počítač nebo notebook se zabudovaným mikrofonem a patřičný program. Ještě lepší variantou je samozřejmě kvalitní mikrofon napojený na kvalitní ADDA převodník, dále dobrá sluchátka i zvukové monitory (repro bedny). Barva zvuku a její analýza je poměrně složitá záležitost. Přesto lze barvy rozdělit do několika základních kategorií, které by měly být srozumitelné i užitečné běžnému muzikantovi.
Tvar kmitů Už pouhý tvar kmitů/vln prozradí znalému akustikovi a potažmo výkonnému hudebníkovi velmi mnoho. Podle toho, jak vlna kmitá, lze signál rozdělit do následujících kategorií.
Sinus Sinus je dokonalý harmonický pohyb, je plně tónový (neobsahuje žádnou hlukovou složku) a jeho signál obsahuje 1 harmonický.
Obr. 1: Sinus
Barevně se blíží např. písknutí, témbru okaríny, zobcové fétny, pp horny, fažoletu u strunných, pizzicatu, spodním rejstříkům příčné fétny či klarinetu. Valér je lehce zamaskovatelný jinými zvuky. Pokud se ve stejné výškové poloze nalézá ostřejší/sytější nástroj, hebčí valér lehce zamaskuje. Pro barvu potom mohou platit následující adjektiva: měkký, zastřený, hebký, neprůrazný, průhledný, mělký, jemný, prázdný, průzračný, tupý, kulatý.
Trojúhelník, obdélník (čtverec) Trojúhelník i obdélník jsou geometrické (předvídatelné) tvary, jsou harmonické, neobsahují žádnou hlukovou složku. Vykazují nespojitý, lomený zrcadlový (symetrický) pohyb: trojúhelník má jen jeden lom, blíží se více sinusu, obdélník má již lomy 2, vzdaluje se více od sinusu.
Obr. 2: Trojúhelník
Obr. 3: Čtverec Trojúhelník a obdélník obsahují jen liché harmonické. Poměr trvání mezi nejhlasitější a nejtišší polohou se nazývá střída a ovlivňuje, kolik lichých harmonických v signálu bude a jak budou hlasité. Valér je středně sytý, jakoby dutý. Zvukově sem patří především klarinet, který trojúhelník či čtverec generuje díky jednoplátku a také válcovitému korpusu (vlastně polokryté píšťale). Pro barvu potom mohou platit následující adjektiva: dutý, nosový, huhňavý, huhlavý, plovoucí (s vnitřními barevnými procesy), oblý, rozladěný.
Pila Pila je geometrický (předvídatelný) tvar, je harmonická, neobsahuje žádnou hlukovou složku. Má nespojitý, lomený a nesymetrický pohyb. Určujeme u ni fázi náběhu a doběhu, čím budou fáze náběhu a poklesu strmější (střída rozdílnější), tím bude tón ostřejší s větším množstvím harmonických.
Obr. 4: Pila Signál pily obsahuje jak liché tak sudé harmonické, střída ovlivňuje hlasitost harmonických - čím bude střída rozdílnější, tím bude křivka harmonických pomaleji klesat – shorků bude více a budou hlasitější. Témbr bude mít podobnou barvu jako např. f či f tón smyčcových nástrojů, žesťů jako trubky či trombón. Velice ostrá a průrazná barva je nesnadno zamaskovatelná jinými zvuky, ale sama silně maskuje. Pro barvu potom mohou platit následující adjektiva: ostrý, průrazný, jasný, plný, sytý, agresivní, pronikavý, tvrdý, bryskní, špičatý, jiskrný, zvonící.
Obdélník (puls) Střída u obdélníku je 1:10, tedy úzká, tvarem začíná signál splývat dokonce s úzkou pilou. Lichých i sudých vyšších harmonických se bude vyskytovat hojně, harmonické zde nepoklesávají exponenciálně nýbrž vlnovitě.
Obr. 5: Puls Barvou se signál bude blížit dvojplátkovým nástrojům jako hoboji či fagotu. Pulsový signál vzniká díky dvojplátkům, hbitě se spojujícím a rozpojujícím, ale také kuželovitému (či kuželovitě vrtanému) korpusu. Co do barvy, nástroje bude vynikat v okolí jiných třeba i sytějších valérů. Pro barvu potom mohou platit následující adjektiva: průrazný, agresivní, mečící, vrčící, vrnící, roztřepený.
Šum/hluk Šum je negeometrický (nepředvídatelný) tvar, je neharmonický, obsahuje jen hlukové složky (nebo minimum harmonických). Má nespojitý a nesymetrický pohyb a víceméně pokrývá celé spektrum od basů po výšky.
Obr. 6: Šum U absolutního šumu nemůžeme určit výšku tónu. Šum či hluk pokrývá výsek spektra, nemůžeme však stanovit jeho přesnou výškovou hranici (začátek a konec). Zvuk nám připomíná dech, z hudebních nástrojů sem patří např. činely, gongy anebo přeforsírované tóny (skřípání, chraptění), nemelodické bicí, tvrdě zkreslená kytara, techno/acid/scratch elektronické rejstříky. Většina hudebních zvuků obsahuje i šumové či hlukové ingredience. Šum a hluk pokrývají rovnoměrně buď úsek či výsek spektra a tam důsledně maskují ostatní zvuky. Pro barvu potom mohou platit následující adjektiva: šumící, syčící, hlučící, chrastící, chraptící, drnčící.
Půjdou vždy tvary vlny rozdělit do těchto kategorií? V praxi existují samozřejmě mnohem složitější tvary, hlavně ty, které vycházejí z různě hlasitých harmonických a tím i pestřeji kmitajícího signálu. I tak můžeme obvykle vypozorovat tendenci, do které kategorie svým tvarem signál směřuje. Je potřeba sledovat tvar signálu z různého odstupu, vzdálenosti (funkce Zoom). Navíc přírodní zvuky obsahují jak tónové tak šumové ingredience a to v různých poměrem. Dále i množství tzv. tranzientů – přechodných jevů, kdy se relativně ustálený tvar kmitů/vln, tj. v tomto případě barevně rovnoměrný úsek protíná do úseku druhého později znovu ustáleného. Podobně jako když se ve flmu prolínají dva záběry. Transientní fáze je proto komplikovaná a víceznačná, nemusíme v ní vůbec rozpoznat, o které dva propojující se konstantní a jinak lehce identifkovatelné témbry se jedná.
Tvar vlny v reálném čase a ze záznamu Ve výuce se pravděpodobně nejvíce užije tzv. osciloskop, zařízení zobrazující výsek kmitů v reálném čase. Vodorovná ose zleva doprava zobrazuje časový výsek v milisekundách, vertikální osa zleva doprava označuje amplitudu kmitů, tedy sílu nebo dynamiku zvuku. Je značena v decibelech nebo převedena do jednotky elektrického napětí (V).
Obr. 7: Osciloskop Díky okamžitému zobrazení kmitů může hudebník vizuálně posoudit, jaký tvar signálu vyluzuje. Při znalosti základních kategorií tvaru signálu ihned zařadit, kam témbr nejvíce směřuje. Např. u uvedeného příkladu, přestože jde o mužský zpěv, se střídají dva druhy kmitů – jeden blížící se čtverci, druhý blížící se trojúhelníku. Barva bude proto inklinovat k valéru s převládající složkou lichých shorků (dutější, prázdnější tón). Můžeme však hudební výkon zaznamenat, přehrávat a ve stejně zapojeném okně s oscilátorem zpětně pozorovat, co jsme to vlastně zahráli.
Programy pro sledování kmitů/vln v reálném čase Editační, ale i nahrávací program WaveLab obsahuje ve své bohaté výbavě i okno Osciloskop. Pokud nastavíme vstupy tak, aby se signál připravený na nahrávání zobrazoval v tomto okně, stačí hrát ale nezapínat červený/nahrávací knofík a kmity se v osciloskopu živě zobrazí.
Obr. 8: Osciloskop v programu WaveLab Stejné okno pak obsahuje program Audio Explorer. Stačí u něj přejít do režimu Real Time, který je nastaven na okamžité měření přicházejícího zvuku. Na ukázce níže zobrazuje tvar písknutí. Všimněme si, že odpovídá tvaru sinusu, tedy barvě s jediným vyšším harmonickým.
Obr. 9: Osciloskop v programu Audio Explorer
Programy pro sledování vlny/kmitu ze záznamu Oba výše uvedené programy umí samozřejmě i signál zaznamenat, anebo vlastní zaznamenaný nebo v jiném programu nahraný a exportovaný soubor přehrát. Výhodou takové analýzy je, že se ke vzorku můžete vracet, analyzovat jeho jednotlivé fáze. Mimochodem i interpret se na vzorek může „podívat„ z odstupu, tedy očima i ušima hudebního režiséra, dirigenta či pedagoga nástroje. V programu WaveLab stačí otevřít dvě okna: Wave (vlna či analyzovaný výchozí soubor) a osciloskop (analyzující okno). Kurzor nás informuje, kterou fázi vzorku právě přehrává a osciloskop zobrazuje odpovídající tvar kmitů.
Obr. 10: Přehrávání záznamu v programu WaveLab V programu Audio Explorer jde stejně zobrazit zdrojové (na obrázku horní) okno, do něj načíst zvukový soubor, přehrávat jej a sledovat v osciloskopu.
Obr. 11: Přehrávání záznamu v programu Audio Explorer Existuje řada dalších programů (ProoTools, Logic, Cubase, Adobe Audition, Sound Forge ad.), které sice nemusí mít ve výbavě osciloskopu, ale přesto v nich můžeme tvar zaznamenaného signálu rovněž pozorovat. Stačí použít zmíněnou funkci Zoom, kterou podobně jako dalekohledem či lupou vlnu přibližujeme nebo vzdalujeme. Výhodou vzdálenějšího pohledu, při kterém už nespatříme detailní tvar kmitu/vlny, ale celý zobrazený úsek je, že nás informuje o dynamickém obrysu úseku. Na ukázce níže tak můžeme v mžiku srovnat, jak například u klasické kytary a nylonových strun při drnknutí bříškem rychle doznívá (psaný) tón e, c´ a e´´. Ověříme si tak prakticky známé pravidlo, že vyšší tóny utichají dynamicky mnohem rychleji než tóny hlubší.
Obr. 12: Přehrávání záznamu v programu Sound Forge
Při zavádění jakékoliv novinky hraje důležitou roli nezvyk a učení se, tj. práce navíc. Jestliže si však jak učitel, tak žák tyto dovednosti během času osvojí, budou odměněni: přesnější zpětnou vazbou, než mohou dát jejich leckdy subjektivně pojaté smysly. A výsledek by měl při správném zužitkování informací, které analýza poskytla, přinést jak zvýšení hráčské techniky, tak i zlepšení sluchových dovedností ad.
Spektrogram Jak název napovídá, jedná se o nástroj umožňující analýzu spektra. Připomeňme, že tóny mají pravidelný průběh, který je složen zřídka z jedné (sinus) většinou však z více (čtverec, pila atd.) frekvencí, které se nacházejí v lidském slyšitelném spektru (20Hz – 20.000 Hz). Tón lze při analýze jeho spektra rozložit právě do těchto dílčích harmonických frekvencí. Nejnižší frekvence tónu (f 0 = 32,7 Hz = C) je považována za základní, udává výšku tónu a bývá označována jako fundament. Ostatní, vyšší frekvence (f1 = 65,4 Hz = c, f2 = 130,8 Hz = g, f3 = 262,5 Hz = c´ atd.), celé násobky frekvence základní se označují jako shorky nebo vyšší harmonické a ovlivňují výsledný sluchový dojem, nazývaný barvou tónu (témbr, timbre). Podle toho jak jsou shorky početné a jako mají hlasitost se mění valér – témbr tónu.
Obr. 13: Řada vyšších harmonických Můžeme tak například u drknutí na nylonovou kytarovou strunu nehtem docela přesně změřit, kolik shorků bylo v daném okamžiku vygenerováno a jak jsou které hlasité. Na obrázku níže jich objevíme zřetelnějších 8 a všimneme si, že od 5.-8. znějí cca o jedno dynamické patro níže. V barvě se to projeví základní hlasitou kulatější barvou středů, která je doplněna ostřejšími výškami, avšak o hladinu tiššími.
Obr. 14: Shorky u kytarového drnknutí Cílem, proč by měl výkonný hudebník zkusit vizuálně sledovat spektrum tónu, který produkuje, je racionální poznání, jaké tónové i netónové složky se v něm nacházejí. Na tuto znalost by měla navázat dovednost, cvik umět podle požadavku spoluhráčů či dirigenta vyloudit zvuk ostřejší nebo naopak měkčí (pozor nemusí vždy souviset s dynamikou tónu), a to v různých odstínech! Muzikant si zároveň uvědomí, které složky jeho barvy jsou v různých intervalových poměrech a harmoniích hraných jinými nástroji náchylnější k překrytí a zamaskování. Jak co nejefektivněji vytvářet požadované mixtury (harmonii) nebo opačně samostatnější a čitelnější hlasy (kontrapunkt, polyfonii).
2D zobrazení 2D zobrazení je vlastně okamžitým mini výsekem spektra, např. zprůměrňovaného časového stavu probíhajícího během 3-4 milisekund. Slouží jako zmražený statický a okamžitý snímek. Podobně jako v případě opozice fotografe versus flm, podobně jako „časově mrtvé“ foto umožňuje lidským smyslům detailní pohled na mžik zastaveného času.
Obr. 15: 2D Spektrogram (v programu Audio Explorer) Půjde-li o jednotlivé tóny - monodii (tedy ne polyfonii či harmonie, které programy analyzovat nedovedou), v grafu spektra rozeznáme lehce fundament a jeho násobky. Určíme, kolik násobků/shorku jsme vygenerovali, jak jsou asi hlasité i jaký mají odstup od spodní šumové hladiny. Můžeme rovněž určit, zda tón neobsahuje případné hlasitější šumové složky nebo například tzv. spojitá spektra (bývá v případě kovových či skleněných kmitajících těles/oscilátorů – zvonu, kamenů bicích melodických nástrojů ad.).
3D zobrazení 3D zobrazení poskládá vlastně jednotlivé snímky do časové posloupnosti a my uvidíme, jak se složky zvuku mění dynamicky v čase. Jako bychom statické fotografe poskládali do běžícího flmu. Zjistíme například, jak hlasitost jednotlivých alikvótů narůstá například v počátku tj. zrodu tónu (fáze attack a decay), jak se ustálí ve střední fázi (sustain) a jako měrou který vyšší harmonický odeznívá při utichání, odcházení tónu (fáze release).
Obr. 16: Tři roviny v 3D spektogramu Nevýhodou tohoto zobrazení je, že při velkém množství shorků i dalších složek vznikne natolik složitý terén, že hřebeny jednotlivých komponentů (například hlasitějších harmonických) mohou při různém úhlu pohledu zakrývat hřebeny shorků dalších. Musíme potom zvolit více úhlů pozorování, abychom mohli objevit všechny podstatné jevy celého časového vzorku. Tím se analýza stává náročnější a pro některé uživatele méně atraktivní.
Obr. 17: Možná nepřehlednost v 3D spektogramu
Spektrální analýza v reálném čase a ze záznamu 2D analýza nám umožňuje sledování spektra v reálném čase. Vidíme tak přímo „naživo“, jak se mění ladění (pohybuje fundament) zleva doprava na horizontální ose, která zobrazuje frekvenci tedy výšku zvuku. Můžeme rovněž pozorovat, na kterých frekvencích/tónech vznikají jednotlivé shorky. Vertikální osa odspodu nahoru měřená v decibelech nás informuje o tom, jak narůstá síla jednotlivých složek..Uvidíme jak dynamicky narůstají a klesají shorky ad. Ze záznamu můžeme sledovat jak 2D či i 3D formou. 3D pozorování funguje stejně jako u živého měření, vzorek hraje pouze z nahrávky. V případě 3D analýzy vybereme ze záznamu požadovaný úsek a zvolíme žádoucí parametry, např. šíři frekvenčního spektra, jemnost dynamické decibelové stupnice, můžeme i úhel 3D pohledu anebo způsob grafckého zobrazení.
Programy pro spektrální analýzu v reálném čase Program WaveLab stačí nastavit podobně jako u živého osciloskopu (viz článek 1), jen otevřít okno spektrogram. Co právě hrajeme, je analyzováno. V rozeznáme zřetelné špičky shorků, jejich počet a odstup od dynamicky nižší šumové hladiny či spojitých spekter.
Obr. 18: 2D spektrogram v programu WaveLab vyhodnocuje v reálném čase Stejné okno a stejné nastavení nabízí i program Audio Explorer – viz obr. 12.
Programy pro spektrální analýzu ze záznamu Spektrální analýza ze záznamu funguje znovu na stejných základech jako oscilátorová analýza ze záznamu. Do zdrojového okna načteme požadovaný audio - vzorek a otevřeme spektrogram. Zde můžeme dokonce žádat mimo 2D analýzy, tj. okamžitého časového výseku, i 3D analýzu, tedy zobrazení určitého delšího zvukového úseku – např. čtvrtinu sekundy, polovinu sekundy, ale i 5 sekund atd. Takový úsek je třeba samozřejmě označit kurzorem – jeho začátek a konec. V menu příkazů, podmenu nástrojů potom nastavit povel analyzovat spektrum. Program WaveLab zobrazí výsek houslového tónu e2 v takovém případě následujícím grafem.
Obr. 19: WaveLab – 3D spektrogram, pohled zepředu Všimněme si, jak se jednotlivé shorky postupně rodí a nabývají na hlasitosti. Ke konci měřeného úseku se již hřebeny překrývají a terén se stává nepřehledným. V takové případě použijeme okno Poin of View (bod pohledu), změníme svou pozorovatelskou pozici a získáme náhled odzadu dopředu. Kombinace obou oken nám poskytne objektivnější informace.
Obr. 20: WaveLab – 3D spektrogram, pohled zezadu Stejný typ 3D analýzy či pozorování nabízí program Sound Forge. Na rozdíl od WaveLab však disponuje pouze pohledem zepředu a zezadu, ne z bočních pozic. Na druhé straně však umožňuje postupovat v již vytvořeném 3D grafu krok za krokem po jednotlivých okénkách, tj. jít „do střev“ terénu a zobrazovat jej napříč, například po milisekundách.
Obr. 21: Sound Forge – 3D spektrogram, pohled zepředu i zezadu Analýza spektra, tedy barva tónu není skutečně produkčně střelhbitá a jednoduchá. Můžeme jít do různě komplikovaných a jemných úrovní. Již ale při prvním rychlém pohledu zjistíme například, v kolika oktávách se barva rozprostírá a co ji bude v okolním terénu jak moc ohrožovat či maskovat. Při podrobnějších rozborech dojdeme až k tomu, z jakých shorků v jaké hlasitosti se valér skládá, co udělat proto, aby byl sytější či hebčí. Případně kde nejlépe jaké složky mixovat s dalšímu nástroji nebo barvami, abychom získali žádoucí mixturu. Poznatky by nám měly sloužit k plnokrevnější a zajímavější hudbě, nejen k suchému racionálnímu poznání.