3.3. A hangtechnikai jellemzők
Az napjaink információtechnikája már elképzelhetetlen az információ digitális feldolgozásának lehetősége nélkül. Ez a tárolás és továbbítás vonatkozásában új dimenziókat nyit, a felhasználónak pedig az információ könnyű „átjárhatóságát”, az interaktivitást jelenti.
Az alábbiakban röviden áttekintjük a digitalizálás problémakörét, annak elsősorban hangtechnikai vonatkozásait, de az elv általános érvényű, tehát más jellegű információk átalakításának vonatkozásában is végiggondolható.
A jelfeldolgozás minőségét az átviteli csatornák paraméterei döntően meghatározzák. A fellépő zavarjelek hatását semmiképp sem lehet figyelmen kívül hagyni. Ezen átviteli tulajdonságokhoz tartozó fogalmak a következők:
Jel-zaj viszony: A hasznos és a zavaró jel viszonyát jel-zaj viszonynak nevezzük. Ezt a hasznos és a zavarójel arányaként adjuk meg és dB-ben fejezzük ki. A DIN szabvány a hifi minőségű átvitelre 46 dB jel-zaj viszonyt ír elő. Az átviteli csatornában fellépő leggyakoribb zavarójel a zaj, melyet a csatornában elhelyezkedő elektronikus alkatrészekben fellépő zajfeszültség hoz létre. A zajfeszültség a hallható frekvenciatartomány széles sávjában jelentkezik. Az emberi fül érzékelési tulajdonságait figyelembe véve a minimális zajfeszültség-távolság a hifi hangzásban 54 dB.
Dinamika: A vizsgált átviteli csatorna dinamikáját felülről a max. kivezérelhetőség, alulról pedig a zavarójel és a rendszerzaj határolja. Ezt a viszonyszámot is dB-ben fejezzük ki.
Sávszélesség: Az átviteli csatorna sávszélességének a frekvenciatartomány azon szakaszát értjük, ahol a kimenőjel amplitúdója a vonatkoztatási frekvencián mért értékhez képest legfeljebb +3 dB-lel tér el.
Linearitás: Az ideális átviteli csatornában a kimenőjel és a bemenőjel lineáris kapcsolatban van. Nemlineáris kapcsolat esetén torzításról beszélünk.
Harmonikus torzítás: Az átviteli csatorna kimenetén a bemenőjel bizonyos frekvenciakomponenseinek felharmonikusai megjelennek. A felharmonikusok effektív értékének és a felharmonikusokkal terhelt kimenőjel hányadosának %-ban kifejezett értéke a harmonikustorzítás.
A digitális jelfeldolgozás számos előnyét sorolhatjuk fel, de meg kell említeni a hátrányokat is.
Előnyök:
-
nagyobb jel-zaj viszony,
-
nagyobb dinamikatartomány
-
tetszőleges számú, minőségromlás nélküli másolat,
-
hőmérséklet- és tápfeszültség-ingadozásokkal szembeni érzéketlenség,
-
nincs jeltorzulás,
-
nem lép fel együttfutás és hangmagasság-ingadozás,
-
egyenfeszültségű jelkomponens visszaállítása,
-
lineáris frekvenciamenet.
Hátrányok:
-
a digitális adatjel érzékeny az adatvesztésre,
-
a digitális jelfeldolgozást végző áramkörök lényegesen bonyolultabbak, komplexebbek,
-
a digitális jelfeldolgozó áramkör túlvezérlése a teljes hangfrekvenciás jel összeomlásához vezet,
-
a digitális rendszerű kazettás magnetofonokkal nincs lehetőség mechanikus snittkészítésre.
A hangfrekvenciás jelek digitális feldolgozása PCM (Pulse Code Modulation, impulzuskód-moduláció) elv alapján történik. A PCM rendszerben az analóg jelet diszkrét impulzusok sorozatára bontják, ahol az egyes impulzusok amplitúdó értékeinek információtartalma bináris kódsorozatokkal kifejezett.

Az időben és értékben folytonos analóg jelek diszkrét minták sorozatává történő átalakítása, melynek információtartalma megegyezik az eredeti folytonos analóg jel információtartalmával, az ún. mintavételi tétellel (C. E. Shannon) bizonyított. Ennek alapján mintavétel után az eredeti jelet információveszteség nélkül akkor lehet visszaállítani, ha a mintavételi frekvencia értéke legalább kétszerese az eredeti analóg jelben előforduló legnagyobb frekvenciának. A mintavételi frekvenciának állandónak kell lenni.
Az eredeti analógjelben megengedett maximális frekvenciát (fmax) Nyquist frekvenciának nevezik. Ez alapján a mintavételi frekvencia határozza meg a digitális hangfeldolgozó rendszerben az átviteli csatorna sávszélességét. A hangfrekvenciás jel felső határának a 20 kHz értéket elfogadva, ha a hifi hangminőség elérésére törekszünk, úgy a mintavétel értéke minimálisan 40 kHz. A digitális hangfeldolgozásban jelenleg az alábbi mintavételi frekvenciákat alkalmazzák:
48 kHz DAT kazettás technikában,
44,1 kHz CD rendszerben,
32 kHz digitális rádióadások,
44,1 kHz (PAL), 44,05 (NTSC) képmagnókon PCM rögzítéshez.
A fenti okból a digitális hangrendszerek számára elméletileg az alábbi jel-zaj viszonyok adódnak:
-
12 bit = 73,6 dB
-
14 bit = 85,6 dB
-
16 bit = 97,6 dB
Fontos területe a problémakörnek az A/D átalakítók kialakításának módja, a kódolás folyamata, D/A átalakítás, a hibafelismerés és a hibajavítás.

A mintavételezés során az időfüggvényében történik a mintavételezés. Folyamatos mintavételezéskor a hang intenzitásával arányos diszkrét értékek (feszültségimpulzusok) halmaza keletkezik. A mintavétel során az impulzusok a beérkező amplitúdó értékek alapján végtelen sok értéket vehetnek fel, ugyanakkor csak meghatározott számú bináris adatszó áll rendelkezésre. Ez a kvantálás vagy tartományokra való felosztás. Pl. 3 bit szóhosszúság esetén 23 = 8 tartomány (különböző értékű jel) lehetséges.
A kvantálás során véges számú lépcsőre osztják a hangtartományt. A kvantálás finomsága a mintavételi frekvencia mellett a digitális jelfeldolgozás legfontosabb paramétere. (Minél több kvantálási szintre osztják a hangot, annál több bitre van szükség a kódoláshoz). A gyakorlatban a hangfrekvenciás jelek digitalizálásánál a kvantálás 14 bit vagy 16 bit szóhosszúsággal történik. A kvantálásnál beszélnünk kell kvantálási zajról is, mely a tartományok növelésével csökkenthető.
A kódolás során a hangszintek szerint kvantált pontok kódkombinációk sorozatává, digitális jelekké alakulnak át.
Az eddigiek során röviden éttekintettük a hangjel digitális feldolgozásának elvi alapjait.
A multimédiában az adatmennyiség és tárolókapacitás kompromisszumaként a következő minőségi jellemzők terjedtek el:
Mintavételezési frekvencia | Adekvát médium | Minőség | Tárolási igény |
44,1 kHz | CD | HI-FI | Nagyon nagy |
32 kHz | Rádió (FM) | Kevés zaj | Átlagos |
22,05 kHz | Rádió (AM) | Enyhén sistergő | Közepes |
11,025 kHz | Telefon | Sistergő üres hangzású | Alacsony |
12. táblázat: Mintavétel és minőség összefüggése
Mintavételi frekvencia | Felbontás | Memóriaigény | Minőség |
11.025 | 8 bit | 1,3 MB | Telefonhang |
22.05 | 8 bit | 2,6 MB | Rádió minőség |
22.05 | 16 | 5,25 MB | Rádió minőség |
44.100 | 8 bit | 5,25 MB | Sztereó, rádió minőség |
44.100 | 16 | 10, 5 MB | HI-FI |
13. táblázat: Egyperces sztereó hanganyag hangfelvételek memóriaigénye
Hallgassuk meg különböző mintavételezési frekvenciával a multimédia definícióját:
1: 11,025 kHz
2: 22,05 kHz
3: 44,1 kHz