16. Tétel 16. Ön részt vesz egy internetes zenei-album megvalósításában. A tervezett alkalmazás lehetővé teszi a zenei hanganyagok adatbázisában való keresést, zenei hanganyagok, narrációk feltöltését, lejátszását. Milyen eszközök szükségesek a hanganyagok előállításához? Milyen hang-formátumokat részesítene előnyben? – Hanganyagok előkészítése – A hang fogalma, jellemzői (sebesség, frekvencia, periódus idő, intenzitás). – A hang analóg rögzítése, lejátszása. – Hangok digitális rögzítése és lejátszása. – Mintavételezés, kvantálás. A digitalizált hangállomány minősége és mérete. – A digitalizálás szempontjai. – A digitális hangrögzítés és lejátszás hardver eszközei, elterjedt szabványok
– – –
Hangkártya szabványok. Hangállományok tömörítése, szabványok, kódolási módszerek Az MPEG Audio. Egyéb állományformátumok (PCM, WMA, OGG).
A hang fogalma A hang a hallás által érzékelt inger, fizikai jellegét tekintve valamilyen rugalmas közegben létrejövő mechanikus rezgés (vákumban nem terjed). Sebesség A hang sebessége változó, attól függően, hogy milyen közegben terjed (pl. folyadék, gázok, szilárd testek). Alapvetően a hangsebességen a levegőben való terjedést értjük, melyet legfőképp a hőmérséklet befolyásol. (tengerszinten 340 m/s) Frekvencia: • A hang frekvenciája határozza meg a hangmagasságot: minél nagyobb, annál magasabb hangot hallhatunk. • Az emberi fül számára hallható hangmagasságtartomány körülbelül a 20 Hz-20 kHz közötti intervallumba esik. • A frekvencia a hangrezgés időegység alatti periódusainak a gyakorisága. Az időegység egyezményesen 1 másodperc, tehát a frekvencia az 1 másodperc alatti teljes periódusok száma: 1 sec / T (T= periódusidő). Mértékegysége: Hertz (Hz).
1
16. Tétel
Periódus idő: Periódusidőn (T) azt az időtartamot értjük, amely egy teljes periódus lezajlása alatt eltelik. Pl. a normál zenei "A" hang periódusideje 0.00227 sec (= 2.27 ms), ami azt jelenti, hogy a hangrezgés 1/0.00227 = 440 teljes periódust végez 1 másodperc alatt, tehát frekvenciája 440Hz. Intenzitás: • Az intenzitás fogalmával a hangenergia nagyságát, a hangforrás teljesítményét jellemezzük. • Az intenzitás a hangterjedés irányára merőleges egységnyi felületen időegység alatt átáramlott energiamennyiség. Mértékegysége a W/m2. Amikor a hangok erősségét jellemezzük, akkor többnyire a decibelben kifejezett hangteljesítmény szintet, vagy nyomásszintet adjuk meg. • Különböző hangok hallásküszöbhöz való viszonya:
A hang analóg rögzítése, lejátszása A hangjelek rögzítésekor az a cél, hogy egy adott információhordozóról később az eredetihez hasonló minőségben vissza tudjuk adni a hanganyagot. Ez úgy történik, hogy a hangot (analóg) elektromos jellé alakítják át, melynek tulajdonságai (frekvencia, amplitúdó) megegyeznek az eredeti hangjelével, s végül analóg módon rögzítik (pl mágnesszalagra) A lejátszásnál ennek pont az ellenkezője zajlik, vagyis a rögzített analóg elektromos jelet érzékelni kell, majd azt fel kell erősíteni, és át kell alakítani hangnyomássá. Az erősítést az erősítő áramkörök, a hangnyomás átalakítását pedig a hangszórók valósítják meg. Hangok digitális rögzítése, lejátszása: A digitális hangrögzítés az analóg rögzítés folyamatához hasonlít. Ennél a módszernél az analóg elektromos jelből hozzák létre a digitális jelet, s ezt rögzítik. A folyamat a következő: bizonyos időközönként mintát vesznek az analóg jelsorozatból (mintavételezés), majd ezen minták amplitúdó értékeit bináris számokká alakítják át (kvantálás). Minél nagyobb a mintavételezés gyakorisága (mintavételezési frekvencia), és a kvantálás során megkülönböztethető értékek száma (kvantálási hossz), annál jobb minőségű lesz a rögzítés.
2
16. Tétel
Mintavételezés, kvantálás. A digitalizált hangállomány minősége és mérete: Digitalizálás menete (PCM): Két fontos paramétert kell tisztázni a digitalizálás során: • Mintavételezés sűrűsége (khz): milyen sűrűn vegyünk mintát az adott jelből • A vett minta pontossága (bit): egy darab mintát ha levettünk azt hány biten ábrázoljuk (kvantálás), azaz mennyire legyen pontos a mért érték (10 vagy 10,82345 nembiztos hogy mindegy) A digitalizált hangállomány minősége A hanganyagok digitalizálását különböző mintavételezési frekvenciával és kvantálási hosszal lehet elvégezni. A digitalizált hangállományból az eredeti hangállományt mindig csak bizonyos hibával lehet visszaállítani, e hiba mértéke jellemzi a digitalizálás minőségét. A mintavételezési frekvencia értéke határozza meg, hogy a digitalizált hangállomány milyen frekvenciájú hangelemet tartalmaz az eredeti analóg hanganyagból. Digitalizált hangállomány mérete Egy digitalizált hangállomány minden mintavételezési helyen a kvantálási hossz szerinti bitet tartalmaz. Ha 44,1 kHz mintavételezési frekvenciával és 16 bit kvantálási hosszal digitalizálnak egy mono hangállományt, akkor a digitális hangfájl: 44 100 minta másodpercenként × 16bit mintánként × 2 = 1 411 200 bit adatot tartalmaz másodpercenként, tehát kb. 1,3 megabit/sec. Több csatornás üzemmódban csatornánként történik a mintavételezés és a kvantálás. Sztereó üzemmódban a digitális hangállomány mérete a mono üzemmód szerinti hangállomány duplája. A digitális hangállomány mérete: Méret (bájt) = Mintavételezési frekvencia (Hz) * Kvantálási hossz (bit) * Játszási idő (másodperc) * Csatornaszám / 8. A hangfájlok méretei Minőség
Kvantálás (byte)
Mintavételi sebesség (kHz)
2 2 2 1 2 1
Csatornák száma 4 2 1 2 2 2
48,00 44,10 44,10 44,10 22,05 11,00
1 percnyi anyag fájlmérete 23 MB 10,5 MB 5,25 MB 5,25 MB 5,25 MB 1,3 MB
Stúdió CD Magas minőségű beszéd PC minőség MM szabvány Alacsony minőségű zene Alacsony minőségű beszéd
1
1
11,00
650 kB
3
16. Tétel A digitalizálás szempontjai • milyen eszközről digitalizálunk (lejátszóról, vagy mikrofonról, mikrofon esetében kell csendes szoba, lejátszó esetében nem mert ott kábelen jön át a hang azt nem befolyásolja a környezet) • milyen hanganyagot digitalizálunk: ha egy erős hangerejű rokkoncertet rögzítünk akkor más Gain értéket kell beállítani a felvételkor mintha valamilyen halk szöveget (http://en.wikipedia.org/wiki/Gain ) • Kell e zajszűrést végezni: ebben az esetben speciális szoftverek kellenek (pl iZotope RX ) • Milyen környezetben fogjuk lejátszani a rögzített hangot: ez már inkább a tömörítés kiválasztásánál szempont
Hangkártya szabványok A számítógépek alaplapán ma már alapvető követelmény hogy legyen integrált hangkártya, de ez professzionális munkához nem igazán alkalmas, ekkor egy külön PCI (belső) vagy USB-s (külső) hangkártya megvásárlása szükséges.
Az IBM keveset törődött a PC-k hangtechnikai lehetőségeivel, ezért a játékprogramokból élő cégek kezdték meg ezeknek a kiépítését. A hangkártya szabványok kialakulása hasonlít a grafikuskártya szabványok kialakulásához. A hangkártyák esetében is az történt, hogy a szoftvergyártók olyan hangkártyákat részesítettek előnyben, melyek már bizonyos mértékben elterjedtek voltak. Mivel az elterjedőben lévő hangkártyák szoftver kínálata gyorsan növekedett, az új vásárlók a sok szoftverrel támogatott hangkártyák beszerzése mellett döntöttek. Az elterjedt hangkártyákhoz kötődve létrejöttek a „de facto” (piacvezető) szabványok, eközben a nem „szabványos” hangkártyák kiszorultak a piacról.
4
16. Tétel
Az ismert szabványok: •
•
AdLib szabvány: ez volt az első önálló hangfeldolgozó kártya 1987-ben. A hangokat a szintetizátorokban alkalmazott frekvencia modulációs (FM) elv alapján állította elő: 5 ütős és 6 zenei hangszer hangját tudta szintetizálni. Egycsatornás, mono hangképzésre volt alkalmas, hangfelvételt nem lehetett készíteni vele. Az AdLib (kanadai) cég 1994-ben megszűnt. SoundBlaster szabvány: A Creative Labs cég nevezte (nevezi) így a hangkártya-sorozatát. Ez volt az első kártya, amely lehetővé tette a PC-kben a hangok digitális felvételét, tárolását és szerkesztését. Támogatta a többszólamú szintetizátor-zene megszólaltatását, továbbá a kétcsatornás sztereó hangrögzítést és lejátszást. A Windows 95 megjelenéséig piacvezető volt, de amióta a Microsoft szabványosította a programozó interfészt az alkalmazási rétekben (application level) azóta feleslegessé vált a Sound Blaster szabvány, mert nem volt szükség a régebbi eszközökkel való kompatibilitásra. A hangkártyák gyártása a Windows 95 megjelenése után abba az irányba vezetett hogy az alaplapra integrálják a hangkártyákat.
Hangállományok tömörítése, szabványok, kódolási módszerek Az MPEG Audio Az MPEG (The Moving Picture Experts Group) egy csapat, az ISO-nak dolgozik ( http://mpeg.chiariglione.org/ ) Az MPEG Audio-t arra tervezték hogy nagymértékben csökkentse azt az adatmennyiséget ami egy hangfelvételhez kell, és mindezt úgy, hogy az átlag felhasználó ne érezze a hangfelvétel minőségromlását. Úgy működik, hogy az ember által nem hallható hanghullámok pontosságát csökkenti vagy teljesen eldobja, (veszteséges tömörítés) ezzel nagymértékben csökkenti az adatmennyiséget. Az MPEG több tömörítési algoritmust definiált. Hang és kép tömörítést is. Az MPEG Audio 3 szintre van osztva (layer-ek) minden layer egy picit bonyolultabb az előzőnél. (és hatékonyabb, alacsonyabb bitrátánál)
MPEG-1 Audio § §
§
MPEG-1 Audio Layer I.: a layer II. leegyszerűsített változata, hamar kihalt. (.mp1, .m1a) MPEG-1 Audio Layer II. (MP2): 256 kbit/s 16bit 44.1 Khz-en szinte tökéletes hangzást ad, ezért a mai napig előfordul a használata (közönség hangok, női férfi hangok, stb… )(.mp2, .m2a) Ha az mp2 bitrátája elég magas, akkor jobb minősége lehet mint az mp3-nak. MPEG-1 Audio Layer III. (MP3): 128 kbit/s stereo-ra optimalizálzák. § Az MP3 tömörítés mindenképpen okoz minimális minőségromlást mindenféle bitrátán. § Közel azonos hangminőséget produkál 15%-al kevesebb bitrátán mint az mp2.
5
16. Tétel §
128 kbit/s : az “aranyközép út”, ennél nagyobb bitrátának már nem lesz annyival jobb minősége. (alacsonyabb bitrátán minőségileg is veri az MP2-t)
§
A Layer-ek visszafelé kompatibilisek (FULL mp3 lejátszó lejátszik mp1,mp2-t is)
MPEG-2 (audio) § §
Még néhány bitrate-et és sampling rate-et bevezetett (16,24 ,144 kbit/s stb.., 16, 24, kHz, stb..) Bevezette a Multichannelt (5.1), 5.1 még visszafelé kompatibilis (MPEG1)
Egyéb állományformátumok Windows Media Audio § § § §
A Windows Media Audio rövidítése a WMA, ez a Microsoft cég szoftvere a Windows Media Player saját zenei formátuma. A WMA bitsűrűsége egy azonos minőségű MP3-hoz hasonlítva jóval kisebb, azaz jobb a minősége mint az mp3-nak (azonos bitrátánál). Amennyiben például egy zenei CD-t rippelünk és azt WMA formátumban mentjük el, az sokkal kevesebb helyet foglal el, mint ha azonos minőségben MP3 formátumban mentettük volna el. Sok lejátszó képes megbirkózni a WMA kiterjesztéssel, MP3 lejátszók és DVD lejátszók is egyaránt, ezért érdemes lehet használni ha csak Windows-os környezetben gondolkodunk.
OGG § Xiph.org Alapítvány támogatásával jött létre ez a szabadfelhasználást támogató formátum, mely különböző jogdíjak fizetése nélkül kínál használható zenei formátumot. § Nem csak audio, hanem video is tömöríthető belé, ezért alternatívát jelenthet számos jogdíjas vagy zárt kódú formátummal szemben, mint például az MP3, QuickTime, RealAudio és RealVideo. § Több komponensből áll, elsődleges komponense az hangkódolásra használható Vorbis, további komponense még a video kódolásra használható Theora, a Speex ami emberi hangot kódol és a FLAC (veszteség mentes tömörítés), ami magas hanghűségű hangkódolást biztosít. PCM A PCM a Pulse Code Modulation szóból ered, vagyis impulzuskód modulációt jelent. Ez maga a digitalizálás folyamatának metódusát jelenti amit a digitalizáló eszközök használnak. http://en.wikipedia.org/wiki/Pulse-code_modulation A PCM adatfolyam, az analóg jel digitális leképezése. Két fontos paramétere van, a sampling rate, és a bit deph (mintavételezés, kvantálás…).
6