El proyecto MASTERMIND de expediente ZL- 2023/00172 ha sido aprobado en la convocatoria HAZITEK 2023 del Grupo SPRI.
Mondragon Lingua-Alecop lidera este proyecto junto con ADDITU, y el apoyo de los agentes de la Red Vasca de Ciencia y Tecnología ISEA y VICOMTECH.
El objetivo general del proyecto MASTERMIND es la automatización de pruebas orales para la evaluación del dominio lingüístico de estudiantes de lengua extranjera. Un sistema tal puede utilizarse para automatizar las pruebas de nivel o para monitorizar el progreso de los/las estudiantes, por ejemplo. Se trata de una solución de Inteligencia Artificial. Específicamente, requiere tecnología avanzada de Reconocimiento Automático del Habla (ASR, del inglés “Automatic Speech Recognition”) y de Procesamiento del Lenguaje Natural (NLP, “Natural Language Processing”) y consta, como mínimo, de los siguientes componentes tecnológicos elementales:
- Un reconocedor automático del habla que genera hipótesis de transcripciones de la producción hablada de los/las estudiantes.
- Herramientas de extracción de características a partir del audio y del texto, características que sirven como descriptores objetivos y cuantificables de distintas dimensiones de la competencia lingüística, como son la fluidez, la corrección en la pronunciación, el dominio léxico y gramatical o la coherencia discursiva.
- Un sistema de puntuación que interprete las características extraídas y asigne las puntuaciones en esas dimensiones, puntuaciones si cabe más justas y explicables que las que produciría un humano.
El desarrollo de un sistema de estas características requiere, a su vez, de la disponibilidad o, en su defecto, creación de una serie de recursos y herramientas, de las que cabe destacar el corpus de referencia. Un corpus de referencia para el objetivo que se pretende perseguir aquí constaría de un histórico de evaluaciones, es decir, de una colección de grabaciones de estudiantes y las puntuaciones correspondientes asignadas por una persona experta.