ASR(Automaticky recovy rozpoznavac)
Matematicky model kanaloveho zdroja sa casto formuluje problemy rozpoznavania reci.Recnikova sekvencia
slov je prenasana do textoveho generatora.Zdroj prechadza cez ruseny komunikacny kanal, ktory pozostava
z recnikovho hlasoveho aparatu, ktory produkuje recove krivky a recove signaly ,tieto su zlozky recoveho
rozpoznavaca. Recovy dekoder nakoniec vyhladava ciele na dekodovanie a najdene sekvencie dekoduje
do konecnej formy ,ktora je najblizsie originalu.
Typicky system rozpoznavanie reci pozostava z bloku spracovania signalu, dekodera ,adaptacie, akustickych
a jazykovych modelov a sad aplikacii.Rozhranie aplikacii s dekoderom posuvaju vysledky rozpoznavania ,ktore
su pouzite v inych castiach systemu.Hovorovy signal je spracovany v module spracovania signalu, tento vybera
charakteristicke crty pre dekoder.Dekoder a oba jazykovy a akusticky model generujU
postupnost slov, ktore maju najvacsiu posteriornu pravdepodobnost pre vstupny udaj vektorov.Aby zvysil
vykon ,moze poskytnut informacie potrebne pre komponenty adaptacie a pre akusticky a recovy modul.
Akusticke modely obsahuju zastupenie vedomosti o akustickej fonetike
,premenlivosti prostredia,gramaticky rod a rozdiely v dialekte medzi recnikmi.Jazykove modely doplnuju
vedomosti ci sa slovo pravdepodobnostne vyskytuje a v akej sekvencii sa vyskytuje.
V tychto oblastiach je mnoho neistot spojenych s charakteristikov recnika, hovoroveho stylu a rychlosti,
rozponavania zakladnych recovych segmentov, vhodnych slov, pravdepodobnych slov, neznamych slov, gramatickych
variacii, rusiveho sumenia, nevrodeneho prizvuku a utajenie vyhodnotennych vysledkov.Uspesny rozpoznavac
reci si musi vediet poradit s tymito problemami, ale to je len zaciatok.Akusticke neistoty z roznych
akcentov a rozne rozpravacie styly od individialnych recnikov su zalozene na slovnej a gramatickej
zlozitosti a variantov hovoreneho jazyka, ktory je reprezentovany v jazykovom modele.


Literatúra:
[1] Xuedong Huang, Alex Acero, Hsiao-Weun Hon : Prentice Hall - Spoken Language Processing a quide to Theory, Algorithm, and System Development, Carnegie Mellon University, Redmond 2001[2] L.R. Rabiner, R.W. Schafer: Digital Processing of Speech Signals, ISBN 0-13-213603-1, Prentice-Hall, Inc.,Englewood Cliffs, New Jersey 07632