Odporúčanie G.723.1 špecifikuje kóder na kompresiu reči alebo iného zvukového signálu ako časť multimediálnych aplikácií pre veľmi nízke prenosové rýchlosti. Kóder je navrhovaný ako časť skupiny štandardov H.324.
Kóder pracuje pri dvoch rýchlostiach: 5,3 a 6,3 kbit/s. Vyššia prenosová rýchlosť má vyššiu kvalitu. Obidve zariadenia, kóder aj dekóder, musia byť schopné pracovať s obidvoma prenosovými rýchlosťami. Medzi jednotlivými rýchlosťami je možné prepínať aj počas kódovania na hranici rámcov dĺžky 30 ms. Existuje aj voľba pre prenos variabilnou rýchlosťou pri nespojitom prenose dát a zároveň aj výplň šumom v intervaloch, kde sa neprenáša zvuková informácia.
Kodek bol optimalizovaný predovšetkým pre reprezentáciu reči s obmedzenou komplexnosťou. Hudba a iné zvukové signály, ktoré vyžadujú širšie frekvenčné spektrum ako základné telefónne pásmo, nie sú reprezentované s takou vysokou kvalitou.
Celkové oneskorenie algoritmu je 37,5 ms, ktoré je spôsobené tým, že kóder spracováva zvukový signál v rámcoch dĺžky 30ms a k tomu sa pripočítava predpoveď signálu na interval 7,5ms.
V praxi však celkové oneskorenie zvuku medzi komunikujúcimi uzlami je oveľa väčšia a skladá sa z nasledovných častí:Kóder je navrhnutý na spracovávanie digitálneho signálu, ktorý je získaný z analógového orezaním filtrom na základné telefónne pásmo a následným vzorkovaním rýchlosťou 8kHz a konverziou vzoriek na 16 bitovú lineárnu PCM. Výstup dekódera by mal byť spätne upravený do analógovej formy obdobným spôsobom. V prípade použitia iného vstupného, prípadne výstupného signálu je potrebné tento signál prekonvertovať do požadovaného formátu (napríklad PCM podľa odporúčania G.711 obr.1).
Kóder je založený na princípe kódovania so syntézou a následnou analýzou signálu s lineárnou predikciou, pričom sa snaží minimalizovať hodnotu váhovaného rozdielového signálu medzi pôvodným signálom a signálom rekonštruovaným zo zakódovaného signálu. Pracuje s blokmi (rámcami) o veľkosti 240 vzoriek, čo predstavuje dĺžku 30 ms pri vzorkovacej frekvencii 8kHz. Každý blok je upravený HP filtrom aby sa odstránila jednosmerná zložka a následne je rozdelený do 4 podrámcov po 60 vzoriek. Pre každý podrámec sa na základe nespracovaného vstupného signálu počítajú koeficienty LPC (Linear Prediction Coder) filtra, ktorý je desiateho stupňa.
Koeficienty LPC filtra pre posledný podrámec v rámci sú kvantované prediktívnym rozdeľujúcim vektorovým kvantizérom (PSVQ – Predictive Split Vector Quantizer). Nekvantované koeficienty LPC filtra sa používajú na vytvorenie váhovacieho filtra s krátkou impulzovou odpoveďou [2.8]. Tento filter sa požíva na úpravu celého rámca, po ktorej získame váhovaný hovorový signál.
Pre každé dva podrámce (120 vzoriek) sa prostredníctvom váhovaného hovorového signálu určí perióda špičky otvorenej slučky. Perióda špičky je určovaná v rozsahu 18 až 142 vzoriek. Od tohto bodu je hovorový signál spracovávaný po jednotlivých podrámcoch (60 vzoriek).
S použitím odhadnutej periódy špičky sa vytvorí tvarovací filter harmonického šumu (Harmonic Noise Shaping Filter). Kombinácia syntetizačného LPC filtra, váhovacieho filtra (Formant Perceptual Weighting Filter) a tvarovacieho filtra harmonického šumu sa použije na získanie impulzovej odpovede, ktorá sa aplikuje pri ďalších výpočtoch.
S použitím odhadu periódy špičky otvorenej slučky a impulzovej odpovede sa vypočíta prediktor špičky uzatvorenej slučky (Pitch Predictor 2.14) piateho rádu. Perióda špičky sa počíta ako malá rozdielová hodnota v okolí odhadu špičky otvorenej slučky. Príspevok prediktora špičky sa odpočíta od počiatočného cieľového vektora. Perióda špičky aj rozdielová hodnota sú následne vyslané do dekódera.
Nakoniec sa aproximuje neperiodická časť budiaceho signálu. Pre vysoké bitové rýchlosti sa ako aproximácia používa MP-MLQ budenie (Multi Pulse - Maximum Likelihood Quantization) a pre nízke prenosové rýchlosti sa používa excitovanie algebraickým kódom (ACELP - Algebraic Code Excited Linear Prediction).
Dekódovanie sa realizuje podobne ako kódovanie rámec po rámci. Najskôr sa dekódujú LPC indexy a potom dekóder vytvorí syntetizačný LPC filter. Pre každý podrámec sa dekóduje excitačný signál z adaptívneho aj pevného katalógu a obidva sa privedú na vstup syntetizačného filtra. Adaptívny postfilter sa skladá z formátovacieho (formant) a dopredno-spätného postfiltra špičky (Forward-Backward Pitch Postfilter). Excitačný signál slúži ako vstup do postfiltra špičky, ktorého výstup je vstupom syntetizačného filtra s výstupom nakoniec vstupujúcim do formátovacieho postfiltra. Jednotka nastaviteľného zosilnenia udržiava úroveň energie signálu na úrovni vstupného signálu formátovacieho postfiltra.
![]() |
G.723.1 E |