ASRAutomatickyrecovyrozpoznavac

ASR(Automaticky recovy rozpoznavac)

Matematicky model kanaloveho zdroja sa casto formuluje problemy rozpoznavania reci.Recnikova sekvencia slov je prenasana do textoveho generatora.Zdroj prechadza cez ruseny komunikacny kanal, ktory pozostava z recnikovho hlasoveho aparatu, ktory produkuje recove krivky a recove signaly ,tieto su zlozky recoveho rozpoznavaca. Recovy dekoder nakoniec vyhladava ciele na dekodovanie a najdene sekvencie dekoduje do konecnej formy ,ktora je najblizsie originalu.
Typicky system rozpoznavanie reci pozostava z bloku spracovania signalu, dekodera ,adaptacie, akustickych a jazykovych modelov a sad aplikacii.Rozhranie aplikacii s dekoderom posuvaju vysledky rozpoznavania ,ktore su pouzite v inych castiach systemu.Hovorovy signal je spracovany v module spracovania signalu, tento vybera charakteristicke crty pre dekoder.Dekoder a oba jazykovy a akusticky model generujU postupnost slov, ktore maju najvacsiu posteriornu pravdepodobnost pre vstupny udaj vektorov.Aby zvysil vykon ,moze poskytnut informacie potrebne pre komponenty adaptacie a pre akusticky a recovy modul. Akusticke modely obsahuju zastupenie vedomosti o akustickej fonetike ,premenlivosti prostredia,gramaticky rod a rozdiely v dialekte medzi recnikmi.Jazykove modely doplnuju vedomosti ci sa slovo pravdepodobnostne vyskytuje a v akej sekvencii sa vyskytuje. V tychto oblastiach je mnoho neistot spojenych s charakteristikov recnika, hovoroveho stylu a rychlosti, rozponavania zakladnych recovych segmentov, vhodnych slov, pravdepodobnych slov, neznamych slov, gramatickych variacii, rusiveho sumenia, nevrodeneho prizvuku a utajenie vyhodnotennych vysledkov.Uspesny rozpoznavac reci si musi vediet poradit s tymito problemami, ale to je len zaciatok.Akusticke neistoty z roznych akcentov a rozne rozpravacie styly od individialnych recnikov su zalozene na slovnej a gramatickej zlozitosti a variantov hovoreneho jazyka, ktory je reprezentovany v jazykovom modele.

Literatúra:

[1] Xuedong Huang, Alex Acero, Hsiao-Weun Hon : Prentice Hall - Spoken Language Processing a quide to Theory, Algorithm, and System Development, Carnegie Mellon University, Redmond 2001

[2] L.R. Rabiner, R.W. Schafer: Digital Processing of Speech Signals, ISBN 0-13-213603-1, Prentice-Hall, Inc.,Englewood Cliffs, New Jersey 07632

Katedra telekomunikácií

ASR(Automaticky recovy rozpoznavac)

Literatúra: