Albayzin

 

El corpus espanyol Albayzin consisteix en 3 sub-corpus de senyals de 16 KHz 16 bits, gravats per 304 parlants castellans.

Els 3 sub-corpus són:

  • un corpus fonètic amb 6,800 elocucions de frases equilibrades fonèticament, incloent-ne 1000 amb segmentació fonètica.
  • un corpus geogràfic amb 6,800 elocucionss de frases extretes d'una base de dades geogràfica espanyola
  • un corpus "Lombard" amb 2,000 elocucions de varis corpus

Va ser produït el 1998 després de ser dissenyat entre 1991 i 1993 per un consorci de 6 grups de recerca  espanyols dirigits pel Grup de Processament del Senyal de la UPC, que actualment pertany al Centre TALP. El corpus és distribuït per ELRA.

 

Per obtenir més informació sobre Albayzin, clica aquí