Bankovní institut vysoká škola Praha Katedra informačních technologií
Vstupní a výstupní zvuková zařízení u osobních počítačů Bakalářská práce
Autor:
Martin Havel Informační technologie
Vedoucí práce:
Praha
Ing. Vít Fábera, Ph.D.
Březen 2009
Prohlášení: Prohlašuji, že jsem tuto bakalářskou práci zpracoval samostatně a s použitím uvedené literatury.
V Praze dne 20. března 2009
Martin Havel
Poděkování: Děkuji vedoucímu bakalářské práce Ing. Vítovi Fáberovi Ph.D. za jeho čas, úsilí a konzultace poskytnuté k vypracování bakalářské práce.
Anotace Předložená práce je zaměřena na vývoj zvukových možností osobních počítačů a shrnuje směry, kterými se doposud vyvíjely. Zároveň se snaží nastínit budoucí vývoj a seznámit čtenáře s moderními trendy reprodukce zvuku u počítačů. Práce je rozdělena do čtyř částí. První část práce se zabývá zvukovými kartami a jejich vývojem. Představuje jednotlivé zvukové karty, které přinesly nové technologie ovlivňující následující vývoj zvukové reprodukce. Druhá část práce se věnuje zvukovému signálu a jeho zpracování v PC. Seznámí s principy digitálního signálu. Třetí část práce ukáže na dnešní možnosti reprodukce zvuku. Seznámí se strukturou reproduktorů a mikrofonů. Čtvrtá část práce přináší závěry a zamyšlení nad vizí budoucího směřování vývoje zvukových zařízení u PC.
Annotation The following thesis is focused on the development of sound possibilities of personal computers and summarizes ways that have evolved so far. At the same time it endeavours to outline the future development and acquaints the readers with modern trends in computer sound reproduction. The thesis is divided into four parts. The first part of the thesis deals with sound cards and their development. It represents a single sound card, which brought a new technologies affecting the following evolution of sound reproduction. The second part of the thesis attends to a sound signal and its processing in the PC. Familiars with the principles of digital signal. The third part of the thesis is dedicated to a today's possibilities of the sound reproduction. Familiars with the structure of speaker and microphone. The fourth part of the thesis brings the conclusions and the muse about the vision of the future direction of the development of PC audio equipment.
Obsah 1
ÚVOD
6
2
HISTORIE VZNIKU ZVUKOVÝCH ZAŘÍZENÍ U PC
7
2.1
Pohled do historie
7
2.2
První zvukové karty
9
2.3
Integrované zvukové čipy
3
PRINCIPY A MOŽNOSTI ZPRACOVÁNÍ ZVUKOVÉHO SIGNÁLU
16 18
3.1
Zvuk
18
3.2
Zvuková karta
19
3.3
Digitální část
22
3.4
Zvukové zdroje
29
3.5
Rozhraní MIDI
30
4
PRINCIPY A METODY REPRODUKCE ZVUKU
33
4.1
Reproduktory
33
4.2
Sluchátka
35
4.3
Mikrofony
36
4.4
Komprese zvuku
40
4.5
Zvukové formáty
45
5
ZÁVĚR
47
5.1
Použité zdroje
49
5.2
Použité obrázky
51
5.3
Použité tabulky
52
1 Úvod Snad každý z nás ve chvilce odpočinku či při práci, a to bez ohledu na své hudební vyznání, si s oblibou rád poslechne svou oblíbenou hudbu. Dnes již není poslech kvalitní hudby jen otázkou živého orchestru v dokonale akusticky přizpůsobeném sále. Není také pouze výsadou kvalitních a drahých hifi soustav, nýbrž je i součástí většiny osobních počítačů dneška. Díky dynamicky se rozvíjejícím IT technologiím se setkáváme s celou řadou nových zvukových
formátů,
standardů
a
možností
reprodukce
zvuku.
Jak
dlouhá
a trnitá byla cesta vývoje zvuku u osobních počítačů? Rád bych za pomoci mé bakalářské práce ukázal, proč vlastně PC nezůstaly jen němými počítacími stroji a v čem vlastně spočívá princip jejich hlasu. Důvod mého rozhodnutí napsat tuto práci, byl nejprve zájem o koupi zvukové karty. Rozhodl jsem se pro studii materiálů dostupných zvukových karet. Studium mě velice zaujalo, byl jsem překvapen rozsahem zvukové problematiky. Toužil jsem o porozumění principů zpracovávání zvukového signálu a možnostech jeho reprodukce. Zároveň jsem chtěl poznat historii zvukových karet. Vytvořit si lepší představu, směru a tempa budoucího vývoje.
Cíl práce Tato práce se zabývá vývojem zvukových karet a jejich využitím u osobních počítačů. Popsáním principů a metod zpracování zvukového signálu a jeho reprodukce. Pohledem na současné zvukové karty a jejich budoucí vývoj.
6
2 Historie vzniku zvukových zařízení u PC Od vzniku prvních zvukových karet uplynulo již téměř třicet let. Za tuto dobu prošel jejich vývoj neuvěřitelnými změnami. Za ně vděčí převážně dynamicky se zvyšujícím technickým možnostem výpočetní techniky a neméně tak i konkurenčnímu boji vývojových firem.
2.1 Pohled do historie Dnešní moderní společnost si již těžko představí své osobní počítače, které by neuměly reprodukovat zvuk. Rád bych zde vzpomenul na několik významných událostí, které udávaly tempo a směr vývoje zvuku u osobních počítačů. První PC od firmy IBM roku 1981 byly vybavovány pouze malým reproduktorkem nazývaným PC Speaker. Jeho úkolem bylo přehrávání lehčích tónů převážně výstražných signálů. Dovedl reprodukovat pouze jeden tón v jeden okamžik a jeho pípání se stalo velmi brzy nedostatečné. Až později v roce 1988 firma Access Software vyvinula metodu, při které se tóny akordu nehrají současně, ale rychle za sebou, jako například na harfě. Metoda byla nazvána Arpeggio a způsobovala rychlé vypínání a zapínání PC Speakeru. Při troše fantazie si zde posluchač mohl představit i hudbu. Avšak k reprodukci skutečné hudby měl tento pokus ještě velmi daleko.
Obrázek č. 1: PC Speaker1
V roce 1982 vyvinula firma Commodore počítač s typovým označením 64. Pro své na tu dobu nadprůměrné schopnosti a cenové dostupnosti si velmi brzy získal patřičnou přízeň uživatelů. Obsahoval integrovaný zvukový čip SID 6581 Sound Interface Device. Tento čip 1
Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html
7
2.11.2008
jako první umožňoval vytvářet kvalitnější hudební doprovod pro počítačové hry a ostatní aplikace. Čip využíval tří syntetických hlasů, které mohly spojením vytvářet složitější zvuky, mohly být použity i nezávisle na sobě. Jeho předností byla možnost nastavení frekvence, barvy a hlasitosti hraných tónů. Roku 1983 firma IBM představila osobní počítač PCjr nazývaný Junior. Jednalo se o relativně levný domácí počítač, který byl vylepšením předchozího modelu IBM PC. Obsahoval již nový zvukový čip Texas SN76496, pracující také se třemi hlasy a schopností nastavit hlasitost v šestnácti úrovních a to pro každý hlas. Z důvodu vysoké ceny a kvalitní konkurence se mu nepodařilo na trhu prosadit a brzy se přestal vyrábět. Vzhledem k tomu, že další PC od IBM s názvem Tandy 1000 nabízelo stejné zvukové možnosti, dopadlo stejným způsobem. Tehdejší neúspěch IBM nahrával konkurenčním firmám.
Obrázek č.2: Commodore 642
V roce 1985 přišel na trh nástupce úspěšného C64 a názvem Comodore Amiga. Jako první se mohl
pochlubit
8-bitovým
4-kanálovým
digitálním
stereo
zvukem.
Amiga
v úspěšnosti následovala svého předchůdce. Díky ní vznikl později první originální typ modulového souboru, jednalo se o hudební formát nazývaný MOD (Tracker Music Module). Byl to první originální typ modulového souboru, umožňující uskladnění hudby. V roce 1986 se objevila záchrana pro IBM PC. Firma Covox vyvinula externí zařízení, které využívalo možnosti připojení přes paralelní port jímž byly tehdejší PC vybaveny. Jednalo se o zařízení, která
pomocí
jednoduchého
obvodu
dokázala
reprodukovat
8-bitový
monofonií
digitalizovaný zvuk. Až později se objevila verze schopna reprodukci stereofonního zvuku.3
2 3
Zdroj: http://commodore-64.navajo.cz/ Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html
8
11.11.2008 11.11.2008
2.2 První zvukové karty Do roku 1986 tedy ještě neznalo PC interní zvukovou kartu jakou známe dnes. Byla to firma Adlib, která ji jako první uvedla na trh. Tato karta nastartovala skutečnou revoluci vývoje zvuku a stala se tak i hardwarovým standardem.
AdLib V roce 1987 se objevila karta AdLib. Tato karta byla prvním zástupcem interních zvukových karet využívající 8-bitového rozhraní ISA slotů. Byla vybavena jediným monofoním výstupem s otočným regulátorem hlasitosti a možností reprodukce hudby pomocí frekvenční modulace (FM syntézy). Použit zde byl čip od výrobce Yamaha (YM3812) s označením OPL-2. Jednalo se o monofoní čip s možností dvou režimů, které bylo možné mezi sebou libovolně přepínat. V prvním režimu byl schopen pracovat s devíti melodickými hlasy syntézy. V dalším speciálním režimu šumu měl k dispozici šest melodických hlasů a pět kanálů šumu. Ty byly využívány k napodobení bicích nástrojů.
Obrázek č.3: AdLib Music Synthesizer Card MOD-9008084
Music Feature Card Ve stejném roce vydala firma IBM, Music Feature Card. Byla vybavena také čipem od společnosti Yamaha (OLP-2). Zvuk její FM syntézy byl však kvalitnější než u karty AdLib a disponovala již čtyřmi možnými režimy. K dispozici měla pouze osm melodických hlasů, zato disponovala rozsáhlou knihovnou tří stovek kvalitních elektronických nástrojů. Její předností byla možnost použití dvou těchto karet zapojených do ISA slotů, tím bylo dosaženo
4
Zdroj: http://www.svethardware.cz/art_doc-BC77A7A4115424A5C125725D005327DE.html
9
11.11.2008
dvojnásobného počtu hlasů. S příchodem těchto karet začínal vývoj nabírat ještě větších obrátek. Výrobci si začali uvědomovat nepříliš věrohodnou reprodukci FM syntézy.
Obrázek č. 4: Music Feature Card5
Game Blaster V roce 1988 spatřila světlo světa první zvuková karta od firmy Creative Music Systems s názvem Game Blaster. Později firma změnila název na Creative Labs. Karta obsahovala dvanáct FM kanálů se šestnácti stupni hlasitosti. Byla vybavena stereofonním výstupem a třemi kanály šumu pro reprodukci bicích nástrojů. Kvalita zvuku nebyla příliš kvalitní, tak se firma Creative Labs pustila do vývoje dnes známé „legendy“ mezi zvukovými kartami, nazvanou Sound Blaster.
Obrázek č. 5: Game Blaster 6
Sound Blaster V listopadu roku 1989 představila firma Creative Labs novinku, kartu Sound Blaster za cenu 299$. Velkou výhodou karty Sound Blaster byl nový čip OPL-2, což mu zaručovalo kompatibilitu s doposud velmi rozšířenou kartou Adlib. Byla schopna poskytnout 8-bitový monofonní zvuk ve 22 kHz kvalitě pro přehrávání. Záznam zvuku byl možný s kvalitou až 15 kHz. Hlavní novinku, kterou přinášela tato karta, byl D/A (digitálně analogový) a A/D
5 6
Zdroj: http://www.svethardware.cz/art_doc-BC77A7A4115424A5C125725D005327DE.html Zdroj: http://www.svethardware.cz/art_doc-BC77A7A4115424A5C125725D005327DE.html
10
23.11.2008 24.11:2008
(analogově digitální) převodník, který již umožňoval reprodukovat a zaznamenávat digitalizované zvuky. Vybavena byla také vestavěným rozhraním MIDI (Musical Instrument Digital Interface) pro zpracování digitálního signálu od připojených externích zařízení. MIDI se stalo později standardem a definovalo sadu 128 hudebních nástrojů a 47 bicích. Svým vybavením a pozdějším snížením ceny až o jednu třetinu byl Sound Blaster nejprodávanější zvukovou kartou na trhu. Svou kvalitou si získal oblibu i většiny softwarových společností, které vyvíjely své aplikace právě s podporou karty Sound Blaster. Stal se tak i standardem pro většinu konkurenčních firem, které se pokoušely držet s firmou Crative Labs krok, ne však s velkým úspěchem.
Obrázek č. 6: Sound Blaster 7
Roland LAPC-1 Ve stejném roce se představila karta Roland LAPC-1. Karta se vyznačovala v porovnání s kartou Sound Blaster kvalitnějším přednesem zvuku, za který vděčila především novince nazvané Wavetable syntéza (digitální prezentace skutečných hudebních nástrojů uložených v operační paměti). Využívala ji v kombinaci s FM syntézou. Samozřejmostí již bylo rozhraní MIDI se sadou 128 hudebních nástrojů, 30 bicích a navíc obsahovalo 33 zvukových efektů. Její slabinou byla nekompatibilita s populární kartou Sound Blaster a proto se nestala příliš oblíbenou mezi běžnými uživateli a byla spíše využívána k profesionálnímu užití.
Sound blaster Pro a 16 V roce 1991 přišla na trh novinka firmy Creative Labs nazvaná Sound Blaster Pro. Obsahovala již dva čipy syntézy FM (OPL 2), což umožňovalo reprodukci zvuku ve 7
Zdroj: http://www.svethardware.cz/art_doc-3043BC46CBB32C89C125725D00541183.html
11
3.12.2008
stereofonním formátu. Vylepšena byla i schopnost záznamu zvuku se vzorkovací frekvencí 22,05kHz , její reprodukce se zvýšila na 45kHz. O rok později se objevila verze Sound Blaster 16. Jednalo se o vylepšení předchozího modelu. Novinkou zde byl čip Yamaha OLP-3, jako první z řady obsahovala 16-bitové zpracování digitálního zvuku. Karta byla vybavena slotem, který umožňoval připojení přídavné karty s názvem Wave Blaster, zajišťující Wavetable syntézu.
Obrázek č. 7: Sound Blaster 16 8
Gravis Ultrasound Plug'n'Play Rok 1995 přinesl novinku od firmy Gravis Ultrasound. Karta obsahovala nový čip od firmy Advanced Micro Devices (AMD) s označením InterWave AM 78C201. Vybaven byl 32 hlasy Wavetable syntézy a pracoval s pamětí 16MB. V paměti ROM bylo uloženo 195 nástrojů a reprodukce pracovala na 48kHz. Umožňovala také emulaci FM syntézy.
Sound Blaster AWE32 a AWE64 Roku 1997 se představila přepracovaná zvuková karta Sound Blaster s názvem AWE32. Jednalo se o první kartu firmy Creative Labs vybavenou Wavetable syntézou s 32 hlasy.
Obrázek č. 8: Sound Blaster AWE64 9 8 9
Zdroj: http://www.svethardware.cz/art_doc-3043BC46CBB32C89C125725D00541183.html Zdroj: http://www.svethardware.cz/art_doc-3043BC46CBB32C89C125725D00541183.html
12
3.12.2008 3.12.2008
Následně přišla verze AWE64, kde na první pohled patrnou změnou byla velikost karty.Ta byla o poznání menší a svým vzhledem se již podobala dnešním kartám. Nejvýraznější změnou byl přechod na 64 hlasovou Wavetable syntézu, o kterou se staral čip EMU8000. Byla vybavena 1 MB paměti ROM a 512 KB paměti RAM, která se dala rozšířit speciálním paměťovým čipem o maximální kapacitě 8 MB. Přehrávání i záznam zvuku zvládala karta stereo s frekvencí 44,1 MHz. Navíc byla karta plně duplexní a umožňovala tak současně zvuk reprodukovat i nahrávat.
A3d Jedná se o první systém tvorby prostorového zvuku s použitím nového zvukového čipu Vortex. Technologie A3D vyvinutá firmou Aureal Semiconductor využívala principu nepatrného zpožďování zvuků jednotlivých reproduktorů. Systém umožnil použití až čtyř reproduktorů z nichž dva byly umístěné v předu a dva v zadu za posluchačem. Již druhá verze s názvem A3D 2.0, byla schopna vytvářet efekty v podobě ozvěn, dozvuků a pracovala i s možností rozdílného typu okolního prostředí. Nabízela také digitální zvuk 5.1. dnes i 7.1. Později firma Creative Labs vyvinula obdobu toho systému s názvem EAX
Obrázek č. 9: Čip Vortex 2 10
Firma Aurel ukončila svou činnost roku 1999 z důvodů soudních sporů s Creative Labs, která následně firmu odkoupila a tím prosadila svou technologii EAX. Dnes nabízí verzi s označením EAX 5.1.
Diamond Sonic Impact S70 Rok 1998 byl ve znamení nové technologie 3D akcelerátorů . Jedním z prvních zástupců zvukových karet se systémem 3D byla Sonic Impact S70 uvedená firmou Diamond.
10
Zdroj: http://www.svethardware.cz/art_doc-C85FA7328B2413A6C125726C00434CF8.html
13
3.12.2008
Využívala čip Vortex s označením AU8820, který se mohl pochlubit výkonem 300Mhz. Karta byla vybavena sběrnicí PCI a zajišťovala kompatibilitu s operačním systémem Microsoft PC 98. Dále nabízela 32 hlasnou polyfonii Wavetable syntézy. Jako druhý zástupce firmy Diamond byla později představena zvuková karta Monster Sound MX 300. Vyznačovala se stejnými vlastnostmi jako její předchůdce, prodělal však několik vylepšení. Za ně vděčila nové verzi čipu Vortex 2. Ten přinášel vylepšení 3D zvuku s množstvím hudebních nástrojů pro simulaci zvuku v různých typech prostředí.
Sound Blaster Live! Rokem 1998 začala nová éra úspěšných zvukových karet s názvem Sound Blaster Live! Příchodem této karty si Creative Labs upevnil svou pozici jedničky na trhu. Jednalo se opět o revoluční kartu, která posunula budoucí vývoj zvukových karet až k možnostem používaným dnes. Karta již začala využívat technologie 3D v podobě zvukového syntetizátoru A3D. Nový čip vyvinutý firmou Creative Labs s názvem EMU10K1, který obsahoval 2,44 miliónů tranzistorů a umožňoval provést 1000 miliónů instrukcí za sekundu.
Obrázek č. 10: Sound Blaster Live! Platinum s Live! Drive11
Nabízel podporu Wavetable MIDI a vylepšení syntetizátoru A3D firemní technologií EAX 1.0 a 2.0, DirectSound3D obsahoval 64 hlasů pro syntetizátor. Wavetable syntéza umožňovala 64 hlasů a 1024 notovou polyfonii. Další jeho předností byla zpětná kompatibilita s již méně využívaným operačním systémem DOS. Karta byla osazena čtveřicí reproduktorových výstupů a zvládala již 16-bitovou stero reprodukci o 48kHz frekvence. Karta dále využívala druhý 32bitový čip FX8010 pro zpracování digitálních efektů, s jehož pomocí bylo možné nastavit různá audio prostředí dle vlastní potřeby. 11
Zdroj: http://www.svethardware.cz/art_doc-44EDD7C607B45F4EC125726C00436863.html
14
3.12.2008
Těchto schopností bylo využito k vytvoření nové technologie EAX – Environmental Audio eXtension. Obsahovala knihovnu 26 předvoleb různých prostředí, které si mohl uživatel libovolně upravovat. Karta používala nové rozhraní PCI, které umožnilo rychlejší digitální přenosy audio signálu a kvalita zvuku se tím ještě zlepšila. Později byla karta vylepšena o dekodér Dolby Digital 5.1 určený pro přehrání DVD disků.
Sound Blaster Audigy a Audigy 2 2001 - Sound Blaster Audigy byla dalším zástupcem Craetive Labs. Obsahovala nový procesor EMU10K2. Wavetable syntéza umožňovala až 64 hlasů a 1024-notovou polyfonii, možnost reprodukce zvuku až v 24bitové kvalitě o frekvenci až 96 kHz. První verze dokázaly pro svůj 5.1 výstup simultánně počítat čtyři vylepšené EAX 3.0 efekty najednou. Pozdější verze Audigy 2, byla nabízena možnost 24bitů / 192 kHz při reprodukci 24bitů/96 kHz při záznamu. Výstupy se rozšířily na 6.1 pro Dolby Digital, také zde byla možnost dokoupit externí box, který obsahoval porty MIDI, S/PDIF, FireWire a další analogové a optické konektory.
Obrázek č. 11: Sound Blaster Audigy 2 12
Sound Blaster X-FI Roku 2005 Creative Labs představila novou řadu zvukových karet a jejím prvním zástupcem byla karta Sound Blaster X-FI. Přinášela zbrusu nový čip Creative X-FI Xtreme Fidelity, pracující na frekvenci 400MHz o kvalitě zvuku 24bitů a vzorkovací frekvencí 96kHz. Byl vyroben z více než 51 milionů tranzistorů a je schopen vykonávat 10000 MIPS. Záznam zvuku umožňoval od 44,1kHz do 96 kHz. Výsadou této karty bylo EAX verze 4.0 se 128 hlasy, prostorový zvuk X-Fi CMSS-3D a nové Dolby Digital 6.1EX. Další roky přinesly několik vylepšení a dnes se můžeme setkat s verzí Sound Baster X-fi Elite Pro 64MB 12
Zdroj: http://www.tvfreak.cz/art_doc-015F60E2BC54BEC1C125727C00598A16.html
15
3.12.2008
X-RAM. Můžeme ji dnes pořídit za necelých 7000Kč. A jaké novinky přináší? Je postavena na nové sběrnicí PCI-Express s jejíž pomocí se ještě více urychlí přenos dat. Umožňuje maximální vzorkovací frekvenci až 192kHz. Dalším vylepšením je optický vstupní a výstupní port SPDIF. Přibylo také dekódování formátů DTS, prostorový zvuk pro sluchátka X-Fi CMSS-3D, Dolby Digital 7.1, EAX 5.0 a certifikát zvukového standardu THX . Samozřejmostí je dnes plná podpora OS Windows XP a Vista.13 Přes veškeré úsilí kvalitních konkurenčních firem se po velmi dlouhou dobu nepodařilo vyvinout zvukovou kartu, která by překonala populární kartu Sound Blaster. Pokud se taková karta objevila, Creative Labs vytáhl do boje s ještě kvalitnější kartou. Tak konkurenčním firmám stále nezbývá nic jiného, než držet kompatibilitu a krok se Sound Blastery, jelikož stále zůstávají v oblibě nejen u uživatelů, ale stejně tak i u většiny serverových firem. Zvukové karty Sound Blaster si stále drží první příčky v prodejnosti na světovém trhu.
2.3 Integrované zvukové čipy Další možné řešení zpracování zvuku na PC je použití integrovaných zvukových kodeků. Jako první přišla s integrovaným řešením zvuku firma Intel v roce 1997. Začala své základní desky osazovat zvukovými čipy a stanovila tím standart AC´97 (Audio Codec ´97). Kodek je integrován přímo na základní desce počítače a je závislý na výkonu procesoru PC, který pro svou funkci využívá.
Obrázek č. 12:Základní schéma AC'9714
13 14
Zdroj: http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html
16.12.2008
Zdroj: http:// http://www.svethardware.cz/art_doc-F2CF5608D8C3645BC12572740060E2C4.html
22.12.2008
16
Obsahuje převodníky ADC a DAC pro převod analogového signálu na digitální a naopak. Verze AC´97 2.2 nabízela 16-bitový stereo zvuk, 20-bitové převodníky, vzorkování 48kHz. Využívala analogové stereo vstupy pro audio a mikrofon. Výstupy pro sluchátka nebo reproduktory umožňující čtyřkanálový zvuk. Standard AC´97 se velmi rychle prosadil i mezi ostatní výrobce a stal se tak velmi populárním. Integrované řešení zvukové kary nedosahovalo zdaleka kvality slotových karet. Ne však každý uživatel PC je zarytý hudební fanoušek, nebo hráč počítačových her a právě pro běžného uživatele se stal zvukový kodek dostatečným řešením. Dnes jsou zvukové kodeky na velmi dobré úrovni. Staly se tak základním vybavením většiny základních desek. Ty nejlepší se mohou pochlubit 192kHz vzorkovací frekvencí, reprodukcí ve kvalitě až 32bitů a dekódováním Dolby Digital až 7.1. Avšak kvality zvuku kvalitních slotových karet zatím ještě nedosahují.15
15
Zdroj: http://www.svethardware.cz/art_docBC77A7A4115424A5C125725D005327DE.html
17
22.12.2008
3 Principy a možnosti zpracování zvukového signálu V této kapitole se zaměřím na vlastnosti zvukových signálů a pokusím se popsat principy jejich přeměny zvukovými kartami.
3.1 Zvuk Zvuk je mechanické vlnění v látkovém prostředí, které je schopno v lidském uchu vyvolat zvukový vjem.16 Vzniká rozechvěním molekul vzduchu na určitou frekvenci nějakým zdrojem. Zdrojem zvuku může být látka jakéhokoli skupenství, ve které vznikne mechanické kmitání. Přenos zvuku je realizován pomocí vodiče, tím bývá nejčastěji vzduch a přechází od zdroje (např. lidské hlasivky) k příjemci (lidské ucho). Při tomto ději se kmitáním v látkovém prostředí šíří energie. Příčinou vzniklého vlnění jsou vazby mezi molekulami a atomy daného prostředí, kde se kmitání jedné částice přenáší na částici druhou. Kmitání, které v tomto případě vzniká je harmonické a jeho zvukové vlny se v prostoru šíří formou postupného podélného vlnění. Ve vzduchu se zvuk šíří všemi směry rychlostí přibližně 340 m/s a jeho intenzita klesá kvadraticky se vzrůstající vzdáleností. Rychlost zvuku je závislá na typu látkového skupenství. Ve vodě dosahuje rychlosti 1500 m/s, v ledu 3250 m/s a nejvyšší rychlosti dosahuje v kovech až 6000 m/s.17
Obrázek č. 13: Zvukový signál 18
16
Zdroj: http://www.fi.muni.cz/usr/pelikan/ARCHIT/TEXTY/ZVUK.HTML Zdroj: http://www.tvfreak.cz 18 Zdroj: http://home.vsb.cz/petr.bernat 17
18
2.1.2009 2.1.2009 2.1.2009
3.2 Zvuková karta Zvuková karta je vstupní a výstupní zvukové zařízení, které mění analogový signál na signál digitální a naopak. Je vybavena vstupními a výstupními porty pro připojení příslušného zařízení. Dnešní karty nabízejí různé možnosti připojení, představíme si je na novince firmy Crative Labs, X-Fi Titanium 7.1: •
Analogový mikrofonní vstup
•
Analogový výstup pro přední reproduktory nebo sluchátka – stero signál
•
Analogový výstup pro střední reproduktory
•
Analogový výstup pro zadní reproduktory
•
Analogový výstup pro subwoofer
•
Digitální optický vstup pro MiniDisc, Game Console (herní konsolu)
•
Digitální optický výstup pro AV Receiver/Decoder
Obrázek č. 14: Crative Labs X-Fi Titanium 7.119
Karta se zasouvá do příslušného slotu sběrnice na základní desce počítače. Dříve byly používány sběrnice typu ISA, dnes jsou používány převážně sběrnice PCI a PCI-Express x1. Zvukové karty můžeme rozdělit podle technických parametrů:
19
Zdroj: http://www.czechcomputer.cz/user_prod_images.jsp?unid=E7B02C88F50F71EDC12574C70063BBF4&artno=59698
19
2.1.2009
•
Typ sběrnice - ISA, PCI, PCI Expres x1
•
Počet bitů A/D a D/A převodníků – 8, 16, 24 bit
•
Maximální vzorkovací frekvence: 11 - 192 KHz
•
Odstup signál/šum: 100 – 120 dB
Základní princip zvukové karty Hlavním úkolem zvukové karty je zpracovávat analogový signál a převést jej do digitální formy (na posloupnost čísel popisujících úroveň signálu). Principem převodu spojitého analogového signálu na digitální je rozdělení na sérii diskrétních impulzů. Digitalizace signálu je provázena časovou diskretizaci (vzorkováním), amplitudovou diskretizaci (kvantováním) a převodem kvantovaného signálu na číslicový signál (kódování).
Obrázek č. 15: Blokové schéma zpracování signálu20
Vzorkování Je základní operací, jejíž pomocí se provádí přeměna spojitého analogového signálu na signál digitální nespojitý. Vzorkováním je získávána řada impulsů (vzorků), jejichž výška je rovna okamžité hodnotě původního analogového signálu. Pro měření rychlosti vzorkování používáme hodnoty udávané v Hz. Lidské ucho je schopno zaznamenat rozsah zvukového spektra 20 Hz do 20 kHz. Dnes běžně používané kvalitní kmitočty vzorkování jsou 44.1 kHz a 48kHz, což je dvakrát více, než je lidské sluchové ústrojí schopno zaznamenat. Vzorkovací frekvence je definovaná Shannonůvým teorémem, který říká, že přesná rekonstrukce ze vzorků spojitého frekvenčně omezeného signálu je možná, pokud byl vzorkován alespoň dvakrát vyšší frekvencí než je frekvence původního signálu.V praxi to znamená, že pro věrnost rekonstrukce signálu je zapotřebí minimálně dvojnásobně vyšší frekvence.
20
Zdroj: Vlastní
7.1.2009
20
V opačném případě dochází ke ztrátě věrohodnosti původního signálu a signál se tak stává zkresleným. Například použijeme-li vzorkovacího kmitočtu 44,1 kHz (44.100 vzorků za sekundu) můžeme vzorkovat pouze signály, v jejichž spektru je nejvyšší kmitočet 22,05 kHz (při vzorkování vyšších kmitočtů by došlo ke slyšitelnému zkreslení ve výškách). Při vzorkování hrozí nebezpečí ztráty informace v důsledku možného překrytí dvou sousedních period. Vzorkováním kmitočtově omezeného akustického signálu vzniká v kmitočtové oblasti soubor překrývajících se spekter (aliasing). Proto je nutné analogový signál na vstupu kmitočtově omezit dolní propustí se zlomovým kmitočtem rovným polovině vzorkovacího kmitočtu (antialiasingový filtr). V tomto případě jsou odstraněny všechny frekvence vyšší než 22,05 kHz. Část spektra původního signálu se vlivem překrytí posunutých spekter ocitne ve slyšitelné oblasti kmitočtů a tím může způsobit vznik nových složek signálu spolu se změnou jeho barvy.
Obrázek č. 16: Vzorkování 21
Kvantování Vzorky jsou v čase nespojité, ale v amplitudě mohou dosahovat některých hodnot z původního signálu. Kvantováním dochází k přeměně signálu spojitého na signál diskrétní (nespojitý). Při kvantování vzorků jsou stanoveny horní a dolní rozdělovací úrovně.Ty určují zda hodnota vzorku je nad nebo pod touto úrovní (hodnota vzorku se nesmí rozdělovací úrovni rovnat). Vytvoří se omezený počet kvantizačních stupňů, počet bitů, jimiž se bude kódovat a každému vzorku je přiřazen jemu nejbližší kvantizační stupeň. Každá funkční hodnota signálu se nachází právě v kvantizačním intervalu a je reprezentovaná jeho jistou úrovní. Při kvantování dochází k většímu nebo menšímu kvantizačnímu zkreslení a tím vzniká u kvantovaného signálu kvantizační chyba (dochází ke ztrátě informace). Její velikost 21
Zdroj: http://cs.wikipedia.org/wiki/Soubor:Vzorkovani2.svg
7.1.2009
21
závisí na typu zobrazení pohyblivé nebo pevné řádové čárky, na typu použité aproximace (zaokrouhlení) a způsobu zobrazení záporných čísel. Signál sestavený z těchto chyb nazýváme kvantizační šum.
Obrázek č. 17: Kvantování 22
Kódování Jedná se o převod kvantovaného signálu na číslicový signál. Kódováním se přiřadí každému
kvantizačnímu stupni číselná kódová kombinace a kvantovaný vzorek se do ní zakóduje.23
Základní části zvukové karty Zvukovou kartu můžeme rozdělit na tři základní části – digitální, zvukové zdroje a MIDI rozhraní
3.3 Digitální část Její hlavní částí jsou A/D a D/A převodníky. Pro převod analogového a digitálního signálu.
A/D převodníky Analogově digitální převodníky zajišťují převod analogové veličiny například naměřených hodnot proudu nebo napětí do číslicové podoby. Výstupem je datové slovo se stanoveným počtem bytů. Základem převodu signálu je snímání napěťových hodnot analogového signálu
22 23
Zdroj: http://cs.wikipedia.org/wiki/Soubor:Kvantovani.svg Zdroj: http://maturita-ztd4.kvalitne.cz/SdT/16.doc
8.1.2009 8.1.2009
22
v krátkých časových okamžicích (vzorkování). V dalším kroku jsou amplitudy jednotlivých signálů převáděny na číslicový tvar (kvantování). Analogově digitálních převodníků existuje mnoho typů a každý z nich má své specifické vlastnosti, kterými se více či méně hodí pro dané účely. Z pravidla je můžeme rozdělit na tři skupiny dle způsobu převodu na kompenzační, komparační, integrační.
Obrázek č. 18: A/D převodník umístěný na zvukové kartě 24
Rozdělení A/D převodníků Podle zpětné vazby: •
bez zpětné vazby - porovnávají vstupní analogové napětí a napětí referenční, výsledkem je vstupní slovo.
•
se zpětnou vazbou - porovnávají vstupní analogové napětí s analogovým napětím odvozeným z postupně generovaného výstupního slova. Převod je ukončen v okamžiku rovnosti obou napětí.
Podle způsobu synchronizace: •
synchronní
–
k
převodu
vstupního
napětí
dochází
v
pravidelných
synchronizovaných okamžicích (krocích). •
asynchronní – načasování převodu vstupního napětí je závislé pouze na zpoždění jednotlivých obvodu (může probíhat ve více krocích).
Podle způsobu převodu: •
přímé – převádějí přímo vstupní napětí na výstupní datové slovo.
•
nepřímé – převádějí vstupní napětí na jinou analogovou veličinu, kterou následně převede na výstupní datové slovo.
24
Zdroj: http://cs.wikipedia.org/wiki/A/D_p%C5%99evodn%C3%ADk
23
8.1.2009
Komparační A/D převodníky Převod využívá principu porovnávání měřeného napětí s kvantovaným referenčním napětím (postupně nebo najednou). Kvantované referenční napětí je vytvářeno sítí shodných odporů. Počet kvant referenčního napětí udává hodnotu číslicového signálu. K převodu zde dochází paralelně, a její rychlost je určena reakční dobou komparátorů. Komparační převod patří mezi nejrychlejších principy převodu A/D převodníků, mezi nejznámější patří paralelní A/D převodník.
Kompenzační převodníky Převod je založen na kompenzaci měřeného vstupního napětí s napětím vytvořeným D/A převodníkem řízeným logickým obvodem. Převod je ukončen v okamžiku, kdy rozdíl mezi oběma napětími je menší než nejmenší hodnota referenčního napětí. To odpovídá bitu číslicového signálu s nejmenší vahou. Podle způsobu změn kompenzačního napětí dělíme převodníky s konstantním a odstupňovaným přírůstkem. •
Převodníky s kompenzačním přírůstkem – generují kompenzační napětí v podobě skoků s přírůstky shodné velikosti, určující kvantem referenčního napětí o nejmenší velikosti. Ukončení převodu nastane, překročí-li kompenzační napětí hodnotu vstupního napětí.
•
Převodníky s odstupňovaným přírůstkem – umožňují zkrátit dobu převodu generací kompenzačního proudu s přírůstky odstupňovanými podle vah jednotlivých bitů. Nejprve se generují přírůstky o největší hodnotě a následně o nejmenší hodnotě. (postupná aproximace).
A/D převodníky s postupnou aproximací Využívají principu postupného půlení intervalu a následného ověření ve které polovině intervalu se měřené napětí nachází. Následuje další rozdělení získané poloviny intervalu a opět se provede zjištění jeho umístění. Skončením každého dělení se určí hodnota dalšího bitu. Postup se opakuje do té doby, než není zjištěno napětí, které nejvíce odpovídá měřenému. Součástí je číslicově analogový převodník zpětně převádějící výstupní slovo na analogové srovnávací napětí, které se mění v průběhu každého kroku. Následně je
24
porovnáváno se vstupním napětím v napěťovém komparátoru. A/D převodníky s postupnou aproximací se vyznačují vysokou rychlostí převodu a velmi dobrou rozlišovací schopností.
Obrázek č. 19: Schéma A/D převodníku s postupnou aproximací25
Paralelní A/D převodník (flash convertor) Je principielně nejjednodušším a současně také nejrychlejším typem A/D převodníku. Analogové vstupní napětí je převáděno na vstupy napěťových komparátorů, kde se porovná s referenčním napětím daného komparátoru (rozdílným pro každý komparátor, určený odporovým děličem). Pokud hodnota vstupního analogového slova překročí referenční napětí konkrétního komparátoru, dojde k jeho překlopení z logické úrovně 0 na hodnotu 1. Všechny výstupy jednotlivých komparátorů jsou převedeny do kódovacího obvodu převádějícího jejich úrovně, nejčastěji do dvojkového kódu.
Obrázek č. 20: Tříbitový paralelní A/D převodník26
25 26
Zdroje: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf
25
10.1.2009 10.1.2009
Integrační A/D převodníky Integrační převod je založen na integraci měřeného vstupního napětí a převodu doby integrace na šířku impulsu, nebo na kmitočet. Následně jsou získané číslicové veličiny převáděny na číslicový údaj. Integrace je volena jako násobek periody rušivého signálu. Nejběžnějším typem integračního převodníku je Integrační A/D převodník s dvojí integrací pracující ve dvou fázích. V první fázi probíhá integrace vstupního napětí po dobu naplnění čítače. Ve druhé fázi dojde k naplnění čítače a tím k přepnutí klopného obvodu. Uzavře se vstup a čítač ukončí čítat impulsy z generátoru signálu Další varianty integračních převodníků jsou, se sledováním referenčního signálu a s mezipřevodem na frekvenci.
Obrázek č. 21: Integrační A/D převodník s dvojí integrací27
D/A Převodníky Slouží k převodu vstupního datového slova (digitálního čísla) do výstupní analogové veličiny (napětí určité hodnoty). Převodník se skládá ze zdroje referenčního napětí, sady spínačů ovládaných digitálními vstupy převodníku a odpory. Můžeme je rozdělit na přímé a nepřímé.
Obrázek č. 22: D/A převodník umístěný na zvukové kartě 28
27
Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf
26
10.1.2009
Přímé převodníky převádějí vstupní datové slovo přímo na výstupní napětí. Nejčastěji jsou řešeny příčkovou nebo váhovou strukturou odporové sítě. Základní princip nepřímých D/A převodníků spočívá v rozdělení převodu na dvě části. První část využívá mezipřevodu, kdy je vstupní číslicová kombinace převedena na jiný diskrétní signál určující šířku impulsu, nebo počet impulsů za jednotku času. Ve druhé části převodníku je převeden na výstupní analogový signál.
D/A převodník s váhovou strukturou odporové sítě D/A převodník s váhovou strukturou odporové sítě je zástupcem převodníku s přímím převodem. Používá datového slova jako řídící veličiny předávaného prostřednictvím datové sběrnice. Vstupní hodnoty mají váhu ovládání jednotlivých elektrických přepínačů 20, 21, 22, … , 2n bitů. Hodnota jejich sériových odporů je vždy dvojnásobkem hodnoty
předcházející. Na obrázku 24 je 3-bitový D/A převodník s odpory R, 2R, 4R, kde se mění celkový přenos výstupního zesilovače spínáním jednotlivých přepínačů. Zde platí:
Obrázek č. 23:Vztah pro přenos zesilovače29
B I zde nabývá hodnot 0 nebo 1 podle stavu příslušného spínače, n určuje počet bitů datového slova. Tento typ převodníků ve vyznačuje vysokou rychlostí převodu. Jeho slabinou je nízká přesnost způsobená velmi rozdílnými hodnotami odporů a jejich přesnosti v jednotlivých bytech datového slova.
Obrázek č. 24: Tříbitový D/A převodník s váhovou strukturou odporové sítě30
28
Zdroj: http://cs.wikipedia.org/wiki/D/A_převodník Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf 30 Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf
29
27
12.1.2009 18.1.2009 18.1.2009
D/A převodník s příčkovou strukturou odporové sítě Zde je struktura odporové sítě tvořena třemi odpory R, R, a 2R se stejnou popřípadě srovnatelnou hodnotou. Vstupní proud se dělí v každém uzlu a odpovídá dvojkové váze, proto odpory mají srovnatelnou hodnotu. Odporová síť je uspořádána tak, aby příspěvek každého následujícího bitu (nalevo) odpovídal odporu R. Pak příspěvek následujícího bytu k výstupnímu analogovému napětí se vždy zmenší o násobek 0,5.
Obrázek č. 25:Tříbitový D/A převodník s příčkovou strukturou odporové sítě31
Převodníky s pulzně šířkovou modulací D/A převodníky s PWM (Pulse Width Modulation) jsou zástupci nepřímých D/A převodníků. Jako předvolba pro zpětný datový čítač taktovaný generátorem hodinových impulzů slouží vstupní datové slovo. Pokud prochází datovým čítačem nula, obvod RS se překlopí do nulového stavu a dojde k zastavení odečítání zpětného čítače. Po ukončení převodu se klopný obvod RS překlopí do jednotkového stavu a převod se opakuje. Následně se impulzy za pomoci filtru převádějí na výstupní analogový signál (stejnosměrné napětí odpovídající střední hodnotě impulsu).
Obrázek č. 26: Princip převodníku DAC s mezipřevodem na šířku impulsu32
31 32
Zdroj: http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf Zdroj: Dostupné z: http://home.tiscali.cz:8080/ftpspace/mikroprocesory.pdf
28
18.1.2009 18.1.2009
3.4 Zvukové zdroje Zvuková karta je také schopna sama vytvářet tóny a zvuky pomocí syntetizátoru. Jedná se o syntézu tónu ve zvolených parametrech (výšce, hloubce, délce, nástroji). Zvuky jednotlivých hudebních nástrojů jsou tvořeny cykly skládající se ze čtyř částí: •
Nástup
•
Pokles
•
Trvání
•
Doznívání
Každý hudební nástroj je specifikován rozdílnou charakteristikou hodnot v průběhu jednotlivých fází cyklu. Pro kvalitní reprodukci musí zvuková karta tyto hodnoty dodržovat co nepřesněji.
FM syntéza (frekvenční modulace) Zvuková karta je vybavena nejméně dvojicí oscilátorů (operátorů) z nich jeden pracuje jako generátor nosného signálu (nosič) a druhý jako generátor modulačního signálu (modulátor), určující okamžitý kmitočet modulovaného signálu. Zapojení operátorů může být paralelní (jeden operátor řídí hlasitost modulátoru druhého operátoru), nebo sériové (jeden operátor řídí kmitočet modulátoru druhého operátoru). Principem je závislost okamžitého kmitočtu nosné vlny na změnách amplitudy modulačního signálu. Tato metoda se u zvukových karet již téměř nevyužívá, nedosahovala potřebné přesnosti reálných nástrojů.
Obrázek č.27: Ukázka časového průběhu frekvenčně modulovaného signálu.33
33
Zdroj:
Dostupné z: http://panwiki.panska.cz/images/9/94/Fmcz.png
29
18.1.2009
Wavetable syntéza Metoda využívá již připravené navzorkované signály skutečných hudebních nástrojů. Vzorky jsou umístěné v paměti ROM zvukové karty, nebo přímo v paměti počítače RAM. Touto metodou je docíleno téměř přesné reprodukce zvuku. Není možné, aby v paměti byly uloženy všechny výšky tónů všech nástrojů a proto je v paměti uložen vždy jeden tón od každého nástroje. Různé výšky tónu se pak dosahuje různou rychlostí přehrávání daného vzorku.
Syntéza fyzickým modelováním Jede o dosud nejdokonalejší metodu synteze, zatím však velice málo rozšířená. Hlavním důvodem jsou vysoké nároky na výkon procesoru. Metoda za pomoci softwarové analogie využívá principu analýzy zvukového ruchu a na jeho základě eliminuje zvuk vibrujícího systému.
3.5 Rozhraní MIDI Jedná se o vstupní standardizované rozhraní MIDI (Musical Instrument Digital Interface), kterým je možné připojit externí zdroj signálu např. elektronické varhany, (bylo také využíváno pro připojení joystic - game port). Při záznamu se pracuje s digitálním signálem, nedochází zde již ke vzorkování, ale přímo k záznamu jednotlivých bitů poskytovaných MIDI zařízením. Jednotlivé záznamy obsahují informace pro potřebnou identifikaci hudebního nástroje a jeho dynamice. Specifikace MIDI je rozdělena na dvě základní části. První část se zabývá způsobem připojení jednotlivých zařízení jak na linkové, tak i fyzické vrstvě a přenosem dat na nejnižší úrovni (asynchronním přenosem jednotlivých bitů). Druhá část popisuje specifikaci přenosového protokolu (přenos bajtů a MIDI zpráv). Přenos dat probíhá přes proudovou smyčkou a asynchronní sériový port. Pro přenos logické nuly protéká smyčkou od pinu na vysílacím zařízení s napětím 5V, proud o velikosti 5 mA. Jednotlivé informace jsou rozděleny na bajty (osm bitů) a každému z nich je přidělená dvojice bitů nazývaných start a stop bit. Start byt je reprezentován logickou 0 a stop byt logickou 1. Přenosem bajtů o různé délce rovné počtu jednotlivých bajtů (jeden, dva, tři), jsou tvořeny MIDI zprávy. První bajt zprávy (stavový bajt) je specifický svým prvním bitem, jehož logická hodnota je 1. Následující zprávy mají tento byt o logické hodnotě 0. Při ztrátě 30
synchronizace přenášených dat, je MIDI zařízení schopno jednoznačně identifikovat začátek další zprávy.
Obrázek č.28: Přenos MIDI zprávy o délce tří bajtů34
Start byt je reprezentován logickou 0 a stop byt logickou 1. Přenosem bajtů o různé délce rovné počtu jednotlivých bajtů (jeden, dva, tři), jsou tvořeny MIDI zprávy. První bajt zprávy (stavový bajt) je specifický svým prvním bitem, jehož logická hodnota je 1. Následující zprávy mají tento byt o logické hodnotě 0. Při ztrátě synchronizace přenášených dat, je MIDI zařízení schopno jednoznačně identifikovat začátek další zprávy. Obsahem stavového
bajtu je číslo přenosového kanálu a kód příkazu. Následujícími bajty jsou přenášeny potřebné informace o frekvenci a rychlosti tónu o hodnotách 0 -128.
Tabulka č.1: Skupina nástrojů definovaných specifikací General MIDI35 34 35
Zdroj: http://www.root.cz/clanky/rozhrani-midi-na-osobnich-pocitacich/ Zdroj: http://www.root.cz/clanky/rozhrani-midi-na-osobnich-pocitacich/
31
3.2.2009 3.2.2009
General MIDI se stal v roce 1991 standardem. Specifikace určuje 128 zvukových nástrojů a 47 bicích. Definuje tak nástroje a zvukové parametry. Výsledná kvalita přehrávaných tónu je závislá na kvalitě příslušného MIDI zařízení.
HDMI High-Definition Multi-media Interface je standardizované vstupně výstupní rozhraní, určené pro přenos nekomprimovaného zvukového a obrazového signálu ve vysokém rozlišení. První verze HDMI 1.0 byla uvedena na trh roku 2002. Pro přenos dat byl použit jediný kabel obsahující devatenáct signálových vodičů, s maximální propustností 4.9 Gbit/s a frekvencí 165 MHz. Audio přenos byl přizpůsoben pro 8-kanálový digitální zvuk s frekvencí 192 kHz/24-bit. Rok 2006 přinesl verzi HDMI 1.3. Nová verze umožňuje přenosovou rychlost 10.2 Gbit/s a frekvence byla zvýšena na 340 MHz. Maximální datová frekvence vzrostla na 768 kHz/48-bit. Díky navýšení datové frekvence umožní přenos i všech známých komprimovaných formátů jako např. AC3 a DTS.36
Tabulka č.2: HDMI konektor – popis pinů37
36 37
Zdroj: http://www.tvfreak.cz/art_doc-20A51A0D33014930C125727C0058FAB9.html Zdroj: http://cs.wikipedia.org/wiki/HDMI
32
23.3.2009 23.3.2009
4 Principy a metody reprodukce zvuku Doby, kdy nám první zvukové karty umožňovaly pouze poslech monofonního zvuku pomocí jednoho reproduktoru, jsou už nenávratně pryč. Dnešní možnosti reprodukce zvuku jsou přinejmenším obdivuhodné. Nebudu se zde zabývat jejím vývojem, ale rád bych objasnil principy a metody zvukové reprodukce, které si dnes může dopřát každý uživatel PC.
4.1 Reproduktory Reproduktor je elektroakustický měnič, který mění elektrický signál na mechanický pohyb membrány. Je umístěn v ozvučnici (skříni), která zabraňuje akustickému zkratu a optimalizuje reprodukci především nízkých kmitočtů. Membrána svým chvěním rozkmitá okolní vzduch a vzniklou tlakovou vlnou se do okolního prostředí šíří zvuk. Vzniká akustický signál. Pokud bychom hledaly reproduktor schopný obsáhnout celý slyšitelný rozsah (20 Hz do 20 kHz), budeme ho hledat zbytečně. Velikost frekvenčního rozsahu je závislá na velikosti membrány reproduktoru, její výchylky a možnosti rychlosti jejího kmitání. Z tohoto důvodu můžeme rozdělit reproduktory podle frekvenčních charakteristik: •
výškové 2000-20000Hz
•
středové 80-1200Hz
•
basové 20-1500Hz
Pro obsáhnutí celého spektra slyšitelného frekvenčního rozsahu je nutná konstrukce dvou, tří a více reproduktorů o rozlišné charakteristice frekvence. Sestavením několika reproduktorů do jedné ozvučnice nám vzniká reproduktorová soustava. O rozdělení a vyrovnanost signálů mezi jednotlivé reproduktory uvnitř soustavy se starají vyhybky.
Základní části reproduktoru Závěs membrány slouží k pružnému uchycení ke koši reproduktoru. Nejčastěji je vyroben z gumy nebo polyuretanu. Musí se vyznačovat odpovídající pružností, tepelnou a časovou stálostí. Na materiál membrány se nejčastěji používá polypropylen, a můžeme se setkat i s grafitovým papírem. U výškových reproduktoru se používají hliníkové a titanové 33
membrány, které se vyznačují potřebnou tuhostí a lehkostí. Střed membrány je přichycen k válcovitému nosiči kmitací cívky. Středící membrána je vyráběna z lehkého prodyšného materiálu. Její úloha spočívá v přidržování nosiče kmitací cívky s membránou, v přesné ose okolo magnetu a tím zabraňuje možnému tření o jeho povrch. Jako materiál magnetu se používá ferit, který plní funkci permanentního magnetu. Magnetické pole musí být po celé jeho délce co nejvyrovnanější, v opačném případě by docházelo ke zvukovému zkreslení. Pro odvod tepla je magnet vybaven chladícím středovým otvorem. Další částí je zkratovací prstenec sloužící ke snižování magnetického pole vzniklého vlivem kmitací cívky.
A. B. C. D. E. F. G. H.
- závěs membrány - membrána - středící membrána - zkratovací prstenec - připojovací terminál - magnet - chladící otvor magnetu - kmitací cívka O brázek č. 29: Části reproduktoru38
Charakteristiky reproduktorů U reproduktorů rozeznáváme několik parametrů, které nám určují jejich vlastnosti a tím i možnosti jejich využití. Můžeme měřit následující hodnoty: •
Jmenovitá impedance - je výrobcem udávaná hodnota odporu cívky, kterou zatěžuje reproduktor zesilovač. Hodnoty jsou udávány v ohm 2,4,6,8,16.
•
Charakteristická citlivost - je průměrná velikost akustického tlaku vyvolaná reproduktorem a to při příkonu 1W ve vzdálenosti 1 m od reproduktoru. Hodnoty se udávají v dB/W/m.
•
Rezonanční kmitočet - je nejnižší kmitočet, při němž vykazuje impedance reproduktoru maximální hodnotu a je jím dán dolní mezní kmitočet reproduktoru. Hodnoty jsou udávány v Hz.
38
Zdroj: http://eshop.dexon.cz/hifi_domaci_kino.htm
20.2.2009
34
•
Zatížitelnost reproduktoru – je hodnota dlouhodobého příkonu reproduktoru udávaná výrobcem, označená jako RMS nebo AES. Hodnoty jsou udávány dle velikosti reproduktoru v palcích na počet Wattů.
•
Maximální akustický tlak – je nejvyšší akustický tlak, který je schopný vyprodukovat reproduktor při maximálním příkonu. Hodnota se udává v dB.
•
Ekvivalentní objem – je objem vzduchu, který je zapotřebí pro ozvučnici reproduktoru. Hodnota se udává v litrech.
•
Směrová charakteristika reproduktoru - je závislost akustického tlaku před reproduktorem na úhlu, svíraného osou reproduktoru a spojnicí reproduktoru a měřicího mikrofonu nebo posluchače.
•
Kmitočtová charakteristika - je závislost hladiny akustického tlaku v určitém bodě před reproduktorem na kmitočtu při konstantním napětí. Hodnoty se udávají Hz. 39
4.2 Sluchátka Další možností reprodukce zvuku u PC jsou sluchátka využívající stejný výstup zvukové karty jako reproduktory. Jde o malé reproduktory přizpůsobené k nasazení na uši posluchače. Můžeme se setkat s variantami do uší, za uši a náhlavní. Často využívanou variantou jsou zařízení kombinující sluchátka a mikrofon. Princip sluchátkových reproduktorů je shodný s běžnými reproduktory. Zvuk je založen na pohybu membrány vytvářející zvukové vlny, rozkmitané magnetickými poli vytvořenými cívkou a magnetem. Výhodou kvalitních náhlavních sluchátek oproti reprosoustavám je převáženě v eliminaci okolního hluku. Odpadá zde problém se správností prostorového umístění reproduktorů.
Charakteristické vlastnosti sluchátek I v tomto případě jde o stejné vlastnosti jako u běžných reproduktorů, je zde však kladen požadavek na specifické nároky, vzhledem k velikosti a vzdálenosti reproduktorů od posluchače.
39
Zdroj: http://eshop.dexon.cz/hifi_domaci_kino.htm
20.1.2009
35
•
Jmenovitá impedance - výrazně ovlivňuje charakteristiku sluchátek. Zde se doporučuje pro kvalitní poslech impedance od 60 ohmů.
•
Charakteristická citlivost - vyjadřuje poslechovou hlasitost reproduktorů a u sluchátek by měla být kolem 95-100 dB.
•
Rezonanční kmitočet - zde jsou nároky kladené na hodnoty slyšitelnosti lidského ucha, tedy 20Hz-20kHz. Kvalitní sluchátka by měla splňovat tento rozsah.
•
Harmonické zkreslení - samozřejmostí je, že jakékoli zkreslení zvuku je pro reprodukci zvuku nežádoucí, proto platí, čím je nižší hodnota zkreslení, tím budou sluchátka kvalitnější.
Obrázek č. 30: KOSS PRO/4AAT40
4.3 Mikrofony Mikrofony převádějí analogový akustický signál na elektrickou energii. Při pořizování záznamu mají mikrofony podstatný vliv na jeho kvalitu. Jedná se o první přeměnu signálu před jeho dalším zpracováním.
Princip a funkce mikrofonů Tlak vzniklý akustickým signálem mechanicky rozkmitá citlivou membránu jejíž pohyb je snímán elektromechanickým měničem. V případě kdy je rozkmitána pouze jedna strana membrány, jedná se o tlakový všesměrový mikrofon s kruhovou charakteristikou. Pohyb membrány je přímo závislý na velikosti akustického tlaku. 40
Zdroj: http://www.sluchatka-koss.cz/index.php?akc=rs&id=4
22.2.2009
36
V případě že akustický tlak působí i na zadní stranu membrány, je pohyb membrány závislý na rozdílu tlaku před a za membránou ,takové mikrofony se nazývají tlakové. Dělíme je na: •
Mikrofony prvního řádu – výchylka membrány a velikost vstupního napětí je přímo úměrná první derivaci akustického tlaku dle směru šíření.
•
Mikrofony druhého řádu – výchylka membrány a velikost vstupního napětí je přímo úměrná druhé derivaci akustického tlaku dle směru šíření.
Velikost výstupního signálu, je přímo závislá na velkosti amplitudy vstupního signálu a na jeho vzdálenosti. Pokud je zdroj signálu příliš vzdálený od měřícího mikrofonu, zakřivení amplitudy je téměř rovinné a výstupní signál je nulový. Nejčastější využití tlakových mikrofonů je v nahrávacích studiích.
Parametry mikrofonů Představíme si základní charakteristiky určující vlastnosti mikrofonů. •
Kmitočtová charakteristika – závislost výstupního napětí mikrofonu na kmitočtu signálu. Nejčastěji udávaná v rozmezí 16Hz až 16kHz.
•
Směrová charakteristika – schopnost citlivosti mikrofonu na svíraném úhlu akustické osy s osou zdroje mikrofonu.
•
Elektrická impedance - udává se pro kmitočet 1kHz a její hodnota je zapotřebí pro optimalizované nastavení impedance zesilovače.
•
Citlivost – je frekvenčně závislá a udává poměr vstupního akustického tlaku na výstupní napětí mikrofonu. Udává se v mV/Pa.
•
Šum – Jde o poměr výstupního napětí při akustickém tlaku 94 dB k napětí výstupního šumu.41
Rozdělení mikrofonů Mikrofony můžeme rozdělit na základě jejich charakteristických vlastností či druhu mechanického systému elektromagnetického měniče. Dále je můžeme rozdělit podle dopadu akustického signálu na membránu mikrofonu, na tlakové a gradientní.
41
Zdroj: http://hellweb.loose.cz/index.php?page=school&subpage=elm&id=21
37
24.2.2209
•
Tlakové mikrofony – jde o dopad akustické vlny na jednu stranu membrány. Zbývající část je uzavřena. Elektrický signál je zde úměrný intenzitě zvukové vlny a mikrofony mají směrovou charakteristiku. Využívány bývají nejčastěji ke studiovým účelům.
•
Gradientní mikrofony – zde je akustický signál přiveden na vnější i vnitřní stranu membrány. Výstupní signál je úměrný velikosti přírůstku intenzity a to v závislosti na vzdálenosti mikrofonu od zdroje zvuku. Využití bývá nejčastěji tam, kde potřebujeme eliminovat okolní hluk a předcházet zpětným vazbám.
Elektrodynamické mikrofony Vyznačují se masivní konstrukcí. Jejich vlastnosti nabízejí malé zkreslení, nízký šum široké rozpětí kmitočtového pásma. Využívají se dva typy konstrukcí s membránou a příčně zvlněnou hliníkovou fólií (páskový mikrofon). U membránových konstrukcí je kmitací cívka spojena s membránou, která se pohybuje s přímou závislostí na akustickém tlaku v magnetickém poli permanentního magnetu. U páskového typu mikrofonů je použita hliníková fólie ve tvaru pásku a přímo v něm se změnami akustického tlaku indikuje nízkofrekvenční elektrický signál.
Elektromagnetické mikrofony Pracují na velmi podobném principu jako elektrodynamické mikrofony. S tím rozdílem, že kmitací cívka spojená s membránou je zde nahrazena pevnou nepohyblivou cívkou. Zde indikuje nízkofrekvenční signál přímo membrána, která mění magnetický tok pevnou cívkou. Díky svým malým rozměrům a příznivé ceně se často využívají převážně k přenosu řeči.
Elektrostatické mikrofony Elektrostatické mikrofony se skládají ze dvou od sebe navzájem izolovaných elektrod (princip kondenzátoru). První z nich tvoří pevná elektroda do níž je přiváděno stejnosměrné napětí. Druhou část tvoří membrána tvořena z kovové fólie. Ta je umístěna ve velice malé vzdálenosti od pevné elektrody. Při změně akustického tlaku se rozechvívá membrána a tím i vzdálenost od pevné elektrody, zároveň dochází ke změně kapacity
38
kondenzátoru. Aby se náboj při změně kapacity kondenzátoru nemohl rychle vyrovnat, pak se při zmenšení kapacity musí zvětšit napětí kondenzátoru. Požadavek pomalého vyrovnání náboje při změně kapacity je zajištěn rezistorem, který zvýší vnitřní odpor zdroje polarizačního napětí. Tyto mikrofony se vyznačují malým zkreslením, vyrovnanou frekvenční charakteristikou a malým zkreslením. Jsou využívány pro studiové účely či jako měřící zařízení.
Elektretové mikrofony Membrána je zde vodivá a její pohyb, na rozdíl od předchozích typů, vzniká v elektrickém poli, ne v magnetickém. Pomocí izolantů si membrána udržuje stálou elektrickou pozici. Dále obsahují tranzistor, který zesiluje elektrický signál. Mikrofony jsou velmi malé a můžeme se s nimi setkat u PC, notebooků a v mobilních telefonech.
Obrázek č 31: Schéma elektronového mikrofonu42
Piezoelektrické mikrofon Principem je využití piezoelektrického jevu s využitím krystalických látek. Ty při deformaci, či ohybu ,vytvářejí elektrický náboj, který je dále snímán elektrodami. Mohou být bez membrány, kde je přenášen zvukový signál přímo na krystaly nebo s membránou, kdy je pohyb membrány přenášen na krystaly. Tento typ mikrofonů se již téměř nevyužívá pro jeho nevěrohodnost reprodukce.
42
Zdroj: http://www.haaf.cz/view.php?cisloclanku=2007060305
25.2.2009
39
Uhlíkové mikrofoy Jedná se o první použitelné mikrofony. Principem jsou dvě elektrody. První je pevná a druhá pohyblivá (součástí membrány), mezi nimi se nachází uhlíkový prach. Se změnou tlaku se mění odpor prášku. Tím způsobuje kolísání napájecího proudu a jeho střídavá složka vytváří modulační proud. Nejčastější využití našli v telefonii.43
4.4 Komprese zvuku Jde o metodu, pro transport a ukládání dat za pomoci jejich komprese. Ta je v určitém kompresním poměru původních dat ke komprimovaným datům. Kompresi dat provádíme proto, abychom zmenšily nároky datového toku a tím urychlili přenos dat. Díky kompresi se nám snižují nároky na množství kapacity při jejich archivaci. Komprese se skládá ze dvou základních částí. V první částí (encoder) převede audio data do komprimované formy (bitstream). V druhé části (decoder) umožní přehrání komprimovaných souborů. Metoda je využívána hlavě tam, kde jsou omezené možnosti datové propustnosti. Můžeme ji rozdělit do dvou kategorií: •
Komprese ztrátová – dochází zde ke ztrátě části dat a není možná jejich zpětná rekonstrukce. Je použita tehdy, pokud nejsou kladeny vysoké nároky na přesnost přenášených dat ( známé formáty jako Mp3 ).
• Komprese bezeztrátová – nedochází ke ztrátě dat a je zde možnost kompletní zpětné rekonstrukce původního souboru. Není však schopna dosáhnout stejné účinnosti jako ztrátová komprese. Je použita pro přenos souboru, kde není přípustná ztráta jediného datového souboru (textové soubory).44
PCM (Pulse Code Modulation) Pulsně kódová modulace PCM, využívá proces analogově digitální konverze (A/D). Nejprve převede vstupní spojitý signál na posloupnost hodnot (vzorkováním). Hodnota amplitudy je omezena určitým počtem bitů (8 nebo 16 bitů), proto je nutné v dalším kroku nahradit spojitě se měnící hodnoty redukovaným počtem diskrétních úrovní (kvantizací).
43 44
Zdroj: http://www.haaf.cz/view.php?cisloclanku=2007060305 Zdroj: Dostupné z :http://www.haaf.cz/view.php?cisloclanku=2007060305
40
26.2.2009 26.2.2009
Při kvantizaci vzniká chyba způsobující vysokofrekvenční šum zhoršující kvalitu reprodukovaného signálu. Nejčastější využití nachází PCM v telefonii pro přenos telefonických hovorů.
DPCM (Differential Pulse Code Modulation) DPCM je rozdílovou metodou PCM. V typickém průběhu řečového signálu dochází pouze k relativně malým změnám, které je možné efektivně reprezentovat pomocí rozdílů po sobě jdoucích hodnot PCM, místo hodnot samotných. Pro dosažení větší komprese se výpočet změn provádí až po provedení kvantizace. Pro eliminaci kvantizační chyby je použit rozptyl (dithering) nebo rámcování (framing). •
Rozptyl – kvantizační chyba se postupně přidává k hodnotě, která reprezentujte daný vzorek a následně se kvantuje.
•
Rámcování – kvantizační chyba se snižuje rozdělením na malý počet kroků, uvnitř jednoho rámce. Diference a vzorkované hodnoty se ukládají do jednotlivých rámců pevné délky. První vzorek rámce se zakóduje přímo a zbylé vzorky se zakódují pomocí diferencí.
ADPCM (Adaptive Differential Pulse Code Modulation) Je adaptabilní variantou metody DPCM, využívající nižší počet kvantizátorů (nejčastěji 4). Z nichž je zvolen kvantizátor, nejblíže odpovídající dynamickému rozsahu vzorků jednoho rámce, který se do něj zakóduje. V dalším kroku dochází k zakódování prvního vzorku v plném rozlišení a následně i indexů do kvantizační tabulky zvoleného kvantizátoru. Výsledně dochází ke zlepšení kompresního poměru.
MPEG (Motion Picture Experts Group) Jedná se o skupinu mezinárodně uznávaných standardů ISO/IEC (International Standards Organization / International Elektro-Technical Commission) pro kódování informací, nejčastěji používaných pro kompresi zvuk a obrazu. MPEG standardy se skládají z několika částí. Každá z částí se týká určitého aspektu celé specifikace. Normy stanovují profily (definují sadu nástrojů), úrovně (vymezují rozsah příslušné hodnoty vlastností). Využívají omezení frekvenčního rozsahu pásma na slyšitelnost lidského ucha 41
(20 Hz – 20 kHz) a rozdělení dynamického rozsahu s rozdílem hlasitosti 96 dB Standardy se dělí na čtyři skupiny. •
MPEG-1 je určený pro kompresi audia a videa s datovým tokem od 0.9Mbit/s do 1.5Mbit/s. Jeho neznámější využití je u formátů MP3, DCC (Digital Compact Casete), DBA (Digital Audio Broadcast).
•
MPEG-2 je používán pro kódování datových toků od 1,5 Mbit/s do 15 Mbit/s. Formát je kompatibilní s MPEG-1, obsahuje nové vzorkovací frekvence a umožní kódovaní surround 5.1. Bývá použit k distribuci TV audio a video signálů.
•
MPEG-3 standard původně určený pro HDTV, později sloučen s MPEG-2.
•
MPEG-4 standart určený pro komplexní popis multimediálních objektů. Zahrnuje standardy podporující interakci s internetem např. AAC,VQF.
MPEG-I Obsahuje tři vrstvy popisující schémata kódování. Každá skupina obsahuje části popisující kódování audia, videa, synchronizací dat a formátů. První vrstva Layer I obsahuje nejjednodušší schémata komprese a disponuje tak vysokou rychlostí. Definuje 384kbit/s pro CD kvalitu a umožní kompresy 1:4. Druhá vrstva Layer II nabízí kompromis, mezi kompresním poměrem a rychlostí. Disponuje 256-192kbit/s při kompresy 1:6 až 1:8. Třetí vrstva Layer III je určena pro nízké kmitočty a vyznačuje se nejlepším kódování 128112kbit/s a kompresí 1:12. Jedním z nejrozšířenějších formátů skupiny MPEG je MP3. Zahrnutý ve specifikaci MPEG-1, MPEG-2, využívajícího standardu Layer III.
MP3 Umožní kompresi datového toku s výslednou velikostí souboru v poměru 1:12 při zachování kvality srovnatelné s CD (44.1Mhz/16bit). Principem komprese je odstranění redundance a neslyšitelných frekvencí. MP3 využívá metody časového(Tempoval masking) a frekvenčního maskování. (Frequency masking) Dochází k odstranění překrývajících tónů o méně intenzivní frekvenci. Principem maskování je snížená schopnost lidského sluchu vnímat zvuk při přítomnosti zvuku dalšího. Frekvenční maskování využívá schopnost odlišit od sebe dva frekvenčně blízké tóny znějící současně. 42
V takovém případě může docházet k potlačení slyšitelnosti nižšího tónu. Schopnost maskování je ovlivněno šířkou pásma o nejnižším kmitočtu 100Hz a nejvyšším až 4 kHz. Časové maskování využívá dvou metod potlačení signálu. Premasking, jestliže po hlasitém tónu následuje stejný tón s nižší hlasitostí, nižší tón je potlačen. Postmasking, tišší tón je maskován ještě před zahráním hlasitějšího tónu.
Obrázek č 32: Frekvenční maskování45
Obrázek č: 33: Časové maskování46
Kódování zvuku MP3 Kódování zvukových dat nejprve prochází přes soustavu filtrů. Dochází k rozdělení zvukového signálu v kmitočtové oblasti do 32 stejně širokých subpásem. Zároveň dochází za pomoci psychoakustického modelu k přesnému určení typu bloku a výpočtu odstupu signálu od maskovacího prahu v každém subpásmu SMR (Signal to Mask Ratio). Signály nacházející se pod maskovacím prahem subpásma nejsou kvantovány a tím dochází k úspoře datového toku. Modul MDCT umožní v každém subpásmu zvolit optimální počet bitů na jeden vzorek a zlepšit tak frekvenční rozlišení (bezztrátový algoritmus). Alokace šumu vzniklého při kvantizaci je prováděna ve dvou iteračních cyklech. V prvním cyklu (Inner loop) se kvantují hodnoty z MDCT a následně se kódují. Pokud je výsledný počet bitů vyšší než zvolený bitrate (datový tok), je zvolen jiný kvantizační krok a proces se opakuje. Bitrate určuje průměrný datový tok, počet bitů potřebných na jednu sekundu zvukových dat. Pro audio signál CD kvality je určený bitrate 1,4 Mbps. Ve druhém cyklu (Outer loop) dochází ke kódování a kontrole pásma vypočítaného psychokustickým modelem. Kontrola zjistí, zda je jeho zkreslení menší, než je povolené. V případě většího zkreslení se pásmo zesílí a proces se opakuje. Tím je šum vzniklí při kvantování maskován a nedochází tak ke slyšitelnému snížení kvality zvuku (enkodér). Pro účinné kódování, bez 45 46
Zdroj: http://home.zcu.cz/~mtoman/mp3.htm Zdroj: http://home.zcu.cz/~mtoman/mp3.htm
24.1.2009 24.1.2009
43
ohledu na okamžitou intenzitu kódovaného signálu jsou spolu se signálem přenášeny měřítka. Ty jsou závislá na velikosti signálu v určeném subpásmu. Následně se provádí výpočet měřítek a jejich výsledek se zakóduje SCSI (Scale Factor Select Information), dojde k přidělení bitů. Jednotlivé vzorky se následně kvantují a kódují. Výstupem je datový tok formátu zvukového rámce MPEG, tvořený rámci(frames). Rámce obsahují informace pro sadu 1152 vzorků zvuku. Každý rámec je vybaven hlavičku a obsahuje dvojici informací (side a main). Side zahrnují data potřebná pro řízení dekodéru a v main jsou obsaženy zakódované frekvenční vzorky.47
Obrázek č 34: Blokové schéma kódování MP348
Dekódování zvuku MP3 Pro získání informací o souboru MP3, musíme identifikovat první rámec a přečíst jeho hlavičku. Hlavička se nachází v prvních čtyřech bitech z 32 bitů subpásma rámce. Jedenáct prvních bitů hlavičky jsou označeny jako synchronizace rámce (frame syncronization), kterým je vždy přidělena hodnota 1. První bit je reprezentován hodnotou 225 a díky němu je možné v souboru identifikovat výskyt jedenácti nastavitelných bitů. Po jejich určení, je možné přečíst ze souboru celou hlavičku a provést kontrolu její správnosti. Dalšími vlastnostmi rámce jsou jeho délka a velikost. Délka rámce je definována po jeho kompresi. Pro načtení souboru je nutné spočítat délku rámce pro identifikaci rámce následujícího. Velikost rámce určí počet vzorků původního signálu, které jsou součástí jednoho rámce. Výpočet provedeme z hlavičky rámce načtení datového toku (nitráte),vzorkovací frekvence a doplněním (padding).49
Obrázek č 35:Výpočet pro velikost rámce50
47
Zdroj: http://home.zcu.cz/~mtoman/mp3.htm Zdroj: http://home.zcu.cz/~mtoman/mp3.htm 49 Zdroj: https://dip.felk.cvut.cz/browse/pdfcache/hrubyj1_2006bach.pdf 50 Zdroj: https://dip.felk.cvut.cz/browse/pdfcache/hrubyj1_2006bach.pdf 48
44
2.2.2009 2.2.2009 2.2.2009 2.2.2009
4.5 Zvukové formáty Pro stále se zvyšující nároky na kvalitu a věrnost reprodukce zvuku vznikají nové zvukové formáty a standardy. Ty nám převážně díky kinematografii stále otevírají nové, neuvěřitelné způsoby skrývající se ve zvukových možnostech. •
Mono - jako první možností reprodukce u PC byl zvuk vycházející z jednoho středového reproduktoru.
•
Stereo – jde o dvoukanálový zvuk, reprodukce zvuku se rozšířila na dva přední reproduktory.
•
Dolby stereo - výrobce formátu byly firmy Dolby Laboratoriem. Využívaly dynamické komprese zvukového signálu před záznamem a následné expanze při jeho reprodukci. Jednalo se o první čtyřkanálovou reprodukci využívající dvě zvukové stopy. Použit byl pravý, levý a středový kanál plus subwoofer. Výhodou toho formátu byla zpětná kompatibilita se staršími systémy mono a stereo.
•
Dolby Suround - jednalo se o zjednodušenou verzi Dolby stereo pro využití v menších prostorách. Byl přidán jeden zadní středový monofonní kanál s možností zapojení dvou reproduktorů.
•
Dolby pro Logic Roku 1987 jednalo se vylepšenou verzi která dokázala dekódovat navíc přední centrální kanál.
•
Dolby Surround Pro-Logic II – umožňuje z dvoustopého záznamu vytvořit 5.1 Dolby Surround zvuk.
Obrázek č. 36: Dolby Digital 5.151
51
Zdroj: http://www.elektronovy.cz/audio3.htm
25.2.2009
45
Dolby Digital Principem digitálního prostorového ozvučení je šest reproduktorových soustav, využívajících levý a pravý přední a zadní kanál, centrální kanál a subwoofer. Jeho označení je 5.1 Dolby Digital. Pro všech šest kanálů je využit datový tok o hodnotě 384kbit/s, jediný subwooferový kanál využívá plný kmitočtový rozsah 20Hz - 20kHz.
Obrázek č. 37: DTS ES 7.152
DTS (Digital Theater Systems) DTS je nejkvalitnějším digitálním zvukovým formátem s podporou systému 5.1. Využívá kvalitnější reprodukce zvuku než je tomu u systému Dolby Digital. Vděčí tomu především čtyřnásobně vyššímu datovému toku 1440kbit. Dnes se setkáváme s další verzí tohoto formátu DTS ES.
DTS ES a Dolby Digital EX Poslední verze systémů DTS a Dolby Digital byly rozšířeny o šestý zadní efektový kanál. Tento formát se označuje jako 7.1. Přibyly zde zadní centrální efektové reproduktory umístěné mezi stávající zadní reproduktory. Ty se posunuly mírně dopředu,zhruba na úroveň hlavy posluchače. Tím se docílilo ještě lepší představy okolní scény, která nyní již zcela obklopuje posluchače. Pokud jde o reprodukci formátů DTS ES A Dolby Digital EX není na trhu ještě příliš mnoho filmových titulů, počítačových her a neméně tak i zvukových zařízení které by podporovaly tyto formáty.53
52 53
Zdroj: http://www.elektronovy.cz/audio3.htm Zdroj: Zdroj: http://www.elektronovy.cz/audio3.htm
25.2.2009 20.2.2009
46
5 Závěr Vývoj zvuku u počítačů prošel bouřlivým vývojem. I přes relativně krátkou dobu vývoje, se dnes první pokusy o jejich ozvučení zdají jako pohled do minulého století. Dnes si běžný uživatel počítače s radostí vychutnává prostorové ozvučení dolby digital 7:1 a jen málo kdo si představí úsilí a strasti spojené s vývojem zvukových karet. Hnacím motorem vývoje zvuku u PC byly převážně hardwarové firmy a jejich snaha dostat se do povědomí softwarových společností, které vyvíjely potřebné aplikace. S jejich podporou byla téměř zaručena obliba u koncových uživatelů. Vlivem neustálého konkurenčního boje se poměrně rychle zvyšovala kvalita výsledných produktů a zvukové karty si začaly budovat své pevné místo v hardwarových konfiguracích počítačů. Zlom nastal v 1997, kdy firma Intel představila integrované řešení ve formě zvukového kodeku, kterým vybavovala své základní desky. Zdálo se, že nastává nový milník vývoje zvukových zařízení. Otázkou bylo, zda integrované řešení nahradí již tak populární slotové karty. Dnes již víme, že téměř většina základních desek je vybavena integrovaným řešením. Můžeme také z jistotou říci, že integrované kodeky doposud neohrozily kvalitní zvukové karty. Vývoj integrovaného řešení je pro výrobce hardwaru (základních desek) poměrně nákladný a to je jedním z hlavních důvodu, proč se jeho další vývoj téměř zastavil. I když pro běžného uživatele PC, bez nároku na kvalitu poslechu hudby, je integrovaný kodek jistě dostatečným zvukovým řešením. Zvukové karty si své pevné místo najdou tam, kde je vyžadován zvuk nejvyšší kvality. A tak můžeme dále s oblibou sledovat měnící se možnosti a kvality slotových karet, které se mohou pyšnit svým dvaadvaceti letým působením na trhu. Díky stále se zvyšujícímu tempu vývoje IT technologií se dnes můžeme setkat s celou řadu nových trendů zpracování a reprodukce zvuku. Jedním z nich je možnost připojení externí zvukové karty přes rozhraní USB. Další novinku je vstupně výstupní rozhraní HDMI, pro přenos nekomprimovaného signálu. Zvukové karty dále nabízejí moderní optické vstupy a výstupy. Vybavovány jsou D/A a A/D převodníky se vzorkovací frekvencí až 192 kHz/24bit. A samozřejmostí je podpora standartu Dolby Digital 7:1. Kam bude směřovat budoucí vývoj zvukových zařízení u počítačů? Na tuto otázku se jen těžko hledá odpověď. Vezmeme-li v úvahu, jakým zlepšením prošla doposud kvalita zvuku PC, jen velmi těžce si představíme její podobu za dalších dvacet let. Dá se předpokládat, že se můžeme těšit na přesnější a rychlejší převodníky. Čekají nás také nové kvalitnější 47
kompresní zvukové standarty. Bude se také usilovat o snížení nároků a nákladů na prostor, při prostorovém ozvučení. Snaha bude také o to, aby hudba a prostorové efekty ještě více útočily i na ostatní naše smysly, pro ještě přesvědčivější vjem reálné scény. S jistotou však můžeme říci.“ Ještě se máme na co těšit.“ Mým cílem bylo pokusit se seznámit čtenáře s celkovým pohledem na vývoj zvuku a jeho principů u PC. V předložené práci jsem ukázal možné technologie, principy, standardy, reprodukce a zpracování zvuku u počítačů. Doufám, že práce pomůže při získání lepší představy o principech a možnostech zvukových zařízení počítačů. Vzhledem k rozsahu mé bakalářské práce jsem se nebyl schopen podrobněji věnovat jednotlivým tématům. Problematika je velice rozsáhlá. Zahrnuje širokou škálu technických oborů a specifických témat.
48
5.1 Použité zdroje AD/ a D/A převodníky [online]. [cit. 2009-10-1]. Dostupný z WWW: < http://maturita.andweb.cz/from%20koulis/29prevodniky.pdf Akustické řešení mikrofonů [online]. [cit. 2009-26-2]. Dostupný z WWW: < http://www.haaf.cz/view.php?cisloclanku=2007060305 Analogově-číslicové převodníky, číslicové multimetry [online]. [cit. 2009-11-1]. Dostupný z WWW: < http://measure.feld.cvut.cz/groups/edu/x38ema/pdfs/EMA-Predn_8tisk.pdf BÁBÍČEK, Lukáš. Historie a vývoj zvukových karet [online]. c2002 [cit. 2008-2-11]. Fakulta Informatiky Masarykovy Univerzity: PV109 Historie a vývojové trendy ve výpočetní technice. Dostupný z WWW: < http://www.fi.muni.cz/usr/jkucera/pv109/2002/xbabice1.html BERNÁT, Petr. Varhany [online]. c2002 [cit. 2008-28-12]. Vysoká škola báňská : Akustika, vznik a šíření zvuku, frekvenční analýza a syntéza, sluchový vjem zvukového signálu. Dostupný z WWW: < http://home.vsb.cz/petr.bernat Creative Labs X-Fi Titanium [online]. [cit. 2009-12-1]. Dostupný z WWW: http://www.czechcomputer.cz/ Denon [online]. [cit. 2009-20-2]. Dostupný z WWW: < http://eshop.dexon.cz/hifi_domaci_kino.htm Elektrické měření [online]. [cit. 2009-12-1]. Dostupný z WWW: < http://hellweb.loose.cz/index.php?page=school&subpage=elm&id=21 HRUBÝ, Josef Knihovna pro zacházení se zvukovými daty pro Home Entertainment systemes [online]. c2006 [cit. 200-2-2].ČVUT FEL katedra počítačů, bakalářská práce Dostupný z WWW: < https://dip.felk.cvut.cz/browse/pdfcache/hrubyj1_2006bach.pdf JELÍNEK, Libor. A/D Převodníky [online]. c2008 [cit. 2009-2-1]. Katedra kybernetikystudijní materiály. Dostupný z WWW: < http://control.zcu.cz/~jelinekl/PRX-P17.pdf LÍŠKA, Dušan. Digitální terestriální televize DVB-T: Technické minimum – MPEG 2 [online]. c2002 [cit. 2009-22-2]. Článek měsíčníku Telekomunikace Dostupný z WWW: < http://www.digitalnitelevize.cz/magazin/dvb-t/dvb-ttechnologie/technicke_minimum_mpeg2.html LYSENKO, Vladimír. Analogově číslicové převodníky [online]. c2003 [cit. 2009-4-1]. Katedra fyziky, informace studentům – Ostravská univerzita v Ostravě. Dostupný z WWW: < http://artemis.osu.cz/uvmet/10.pdf 49
MINÁŘ, Jakub. Reprodukce zvuku aneb základy teorie [online]. c2008 [cit. 2009-2-2]. Dostupný z WWW: < http://avmania.zive.cz/Hi-Fi/Reprodukce-zvuku-aneb-zaklady-teorie/sc-34-sr-1-a1425/default.aspx PELIKÁN, Jaroslav. Zvuková karta [online]. c1999 [cit. 2008-02-12]. Fakulta Informatiky Masarykovy Univerzity: Texty, Zvuková karta. Dostupný z WWW: < http://www.fi.muni.cz/usr/pelikan/ARCHIT/TEXTY/ZVUK.HTML PAUL,M. Regulační technika 2díl. [online]. Skriptum SPŠ-VOŠ Písek c2001. [cit. 200912-1]. Dostupný z WWW: < http://wifisite.ic.cz/skola/AUT/Skripta/AUT-3_2_aot.pdf Převodníky AD,DA [online]. [cit. 2009-12-1]. Dostupný z WWW: < http://intranet.ssintekarvina.cz/download/raszykova/%C4%8CT/MZ%20otazky/P%C5%99evodn%C3%ADky %20DA1.doc Převodníky, ČVTU FEL-Praha, katedra elektrických pohonů [online], [cit. 2009-9-1]. Dostupný z WWW: < http://motor.feld.cvut.cz/www/materialy/X14RVE/PREVODNIK.pd Sluchátka-KOSS [online]. [cit. 2009-12-1]. Dostupný z WWW: < http://www.sluchatka-koss.cz/index.php?akc=rs&id=4 Systémy pro digitální zpracování analogových signálů [online]. [cit. 2009-19-2]. Dostupný z WWW: < http://www.umel.feec.vutbr.cz/bdom/predn/BDOM07new.pdf TOMAN,Michal. O MP3 [online]. c2001 [cit. 2009-02-02]. Dostupný z WWW: < http://www.digitalnitelevize.cz/magazin/dvb-t/dvb-tVÍTEK, Jan. Zvukové karty a jejich vývoj [online]. c2007 [cit. 2008-13-12]. Dostupný z WWW: < http://www.svethardware.cz/art_doc-BC77A7A4115424A5C125725D005327DE.html VRBA, Radomír. LEGÁT, Pavel. KUCHTA, Radek. MIKEL, Břetislav. [online]. Digitální obvody mikroprocesory [online]. c2002 [cit. 2009-8-1]. Fakulta elektrotechniky a komunikačních technologií VUT v Brně: Dostupný z WWW: < http://home.tiscali.cz:8080/ftpspace/mikroprocesory.pdf Zvukové formáty domácího kina [online]. [cit. 2009-20-2]. Dostupný z WWW: < http://www.elektronovy.cz/audio3.htm Zvuková karta [online]. [cit. 2008-13-12]. Dostupný z WWW: < http://www.esphere.cz/kostka/Hardware/zvuk.htm
50
5.2 Použité obrázky [1] PC Speaker [2] Commodore 64 [3] AdLib Music Synthesizer Card MOD-900808 [4] Music Feature Card [5] Game Blaster [6] Sound Blaster [7] Sound Blaster 16 [8] Sound Blaster AWE64 [9] Čip Vortex 2 [10] Sound Blaster Live! Platinum s Live! Drive [11] Sound Blaster Audigy 2 [12] Základní schéma AC'97 [13] Zvukový signál [14] Crative Labs X-Fi Titanium 7.1 [15] Blokové schéma zpracování signálu [16] Vzorkování [17] Kvantování [18] A/D převodník umístěný na zvukové kartě [19] Schéma A/D převodníku s postupnou aproximací [20] Tříbitový paralelní A/D převodník [21] integrační A/D převodník s dvojí integrací [22] D/A převodník umístěný na zvukové kartě [23] Vztah pro přenos zesilovače [24] Tříbitový D/A převodník s váhovou strukturou odporové sítě [25] Tříbitový D/A převodník s příčkovou strukturou odporové sítě [26] Princip převodníku DAC s mezipřevodem na šířku impulsu [27] Ukázka časového průběhu frekvenčně modulovaného signálu. [28] Přenos MIDI zprávy o délce tří bajtů [29] Části reproduktoru [30] KOSS PRO/4AAT [31] Schéma elektronového mikrofonu [32] Frekvenční maskování 51
[33] Časové maskování [34] Blokové schéma kódování MP3 [35] Výpočet pro velikost rámce [36] Dolby Digital 5.1 [37] DTS ES 7.1
5.3 Použité tabulky [1] Skupina nástrojů definovaných specifikací General MIDI [2] HDMI konektor – popis pinů
52