Reconeixement automàtic de la parla
José Adrián Rodríguez Fonollosa
En reconeixement de la parla, s’està treballant en diverses línies d’investigació entre les que podem destacar les següents:
- Sistemes de gran vocabulari
- Generació de mitjans de confiança
- Sistemes de reconeixement multidialectals i multilingües
- Sistemes robustos davant de sorolls i variacions en l’entorn
- Integració en entorns multimèdia
- Reconeixement en sales i de senyals procedents d’agrupacions de micròfons
- Modelatge de llenguatge.
- Integració en sistemes de traducció oral
Un dels objectius conjunts d’aquesta tasca investigadora és augmentar les prestacions dels sistemes de reconeixement automàtic de la parla de gran vocabulari per a obtenir un sistema multilingüe de traducció de veu a veu de gran qualitat. Una aplicació concreta seria la traducció dels discursos parlamentaris.
Un altre objectiu és obtenir unes bones prestacions en el reconeixement automàtic dels senyals de veu recollides en una sala proveïda amb diversos micròfons. Aquesta tasca d’investigació inclou, a més a més, la capacitat de detectar altres tipus de sons (sorolls, música, aplaudiments, etc). Per a obtenir bones prestacions, especialment quan hi ha superposició de sons i diverses senyals de veu, és necessari realitzar una separació cega de fonts, un procés d’agrupacions de micròfons i seleccionar una parametrització robusta del senyal.