News from the world of user experience, UX. Discover students’ projects and current events in the sector. Follow us!

16 November 2010 | Posted by Equipo Editorial de UX

iLearn English, para practicar

iLearn English es un proyecto de investigación sobre el aprendizaje de idiomas iniciado por NHN Corp, una compañía líder en el rubro de Información y tecnología en Corea. Cabe destacar que NHN Corp es exitosa por inter-conectar al mundo y de crear espacios para intercambiar información a través de redes. .

El objetivo del proyecto iLearn English es desarrollar una aplicación independiente para el iPhone, para la capacitación y entrenamiento en inglés de los coreanos usando PocketShinx, que es un sistema de reconocimiento de voz de fuente abierta desarrollado como proyecto de la CML (Carnegie Mellon University).

Suena como un gran reto puesto que involucra el proceso de reconocimiento automático del habla. Esta es la forma en la que los humanos dotan a las máquinas la capacidad de recibir mensajes orales. Tomando como entrada la señal acústica recogida por un micrófono, para después descifrar esa secuencia de patrones, y así descodificar el mensaje contenido en la onda acústica para realizar las acciones pertinentes. Para lograr este fin, un sistema de reconocimiento necesitara conjugar una gran cantidad de conocimientos acerca del sistema auditivo humano, sobre la estructura del lenguaje, la representación del significado de los mensajes y sobre todo el autoaprendizaje de la experiencia diaria, lo que sin duda es más que una tarea compleja.

Como ya se ha mencionado, la principal tecnología ha emplearse es el Pocket Sphinx, pero también intervienen el iPhone y el OS X (el sistema operativo para el iPhone, iPad y iPod Touch de Apple Inc).

Explicando mejor el Pocket Sphinx, esta es una versión del Sphinx que puede ser usada en sistemas integrados, como por ejemplo basado en un procesador ARM. El pocket Sphinx está bajo desarrollo activo e incorpora características tales como aritmética de punto fijo y algoritmos eficientes para el cálculo de GMM (generalized method of moments).

En cuanto al Sphinx o CMU Sphink es el término para describir al grupo de sistemas de reconocimiento de voz desarrollados en la Carnegie Mellon University.

Estos incluyen una serie de reconocedores de voz Sphinx 2 -4 y un modelo de entrenamiento acústico Sphinx Train. Los decodificadores de voz vienen con modelos acústicos y aplicaciones de ejemplo. Los recursos disponibles incluyen además el software para el entrenamiento del modelo acústico, la compilación del Lenguaje de modelo y una pronunciación de dominio público diccionario, cmudict.

El equipo de iLearn tiene un proyecto muy ambicioso, que además piensan hacer el mejor uso de las diversas interfaces del  iPhone para proveer a los usuarios  experiencias más inmersivas e intuitivas para el aprendizaje. Esperemos que podamos ver los resultados con éxito.

Redacción: Montserrat Presno

Revisión: Oscar García

Share

Add new comment

CAPTCHA
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
11 + 7 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.