IA

Lenguas en extinción pueden ser salvadas con IA

Para reconocer y producir el habla de más de 1.000 lenguas, Meta desarrolló modelos de inteligencia artificial (IA). Se trata de un paso importante hacia la preservación de lenguas que corren el riesgo de desaparecer.

Para ello pone sus modelos a disposición del público a través del servicio de alojamiento de código GitHub.

Afirma que hacerlos de código abierto ayudará a los desarrolladores que trabajan en distintos idiomas a crear nuevas aplicaciones de lenguaje.

Por ejemplo servicios de mensajería que entiendan a todo el mundo o sistemas de realidad virtual que puedan utilizarse en cualquier idioma.

En el mundo hay unas 7.000 lenguas, pero los modelos de reconocimiento del habla existentes solo cubren de forma exhaustiva unas 100.

Esto se debe a que este tipo de modelos suelen requerir grandes cantidades de datos de entrenamiento etiquetados, que solo están disponibles para un pequeño número de idiomas, entre ellos el inglés, el español y el chino.

Biblia del Nuevo Testamento

Los investigadores de Meta sortearon este problema reentrenando un modelo de IA existente desarrollado por la empresa en 2020. Es capaz de aprender patrones de lenguaje a partir de audio sin necesidad de grandes cantidades de datos etiquetados como pueden ser las transcripciones.

Lo entrenaron con dos nuevos conjuntos de datos: uno que contiene grabaciones de audio de la Biblia del Nuevo Testamento y su correspondiente texto extraídos de internet en 1.107 idiomas.

Otro que contiene grabaciones de audio del Nuevo Testamento.

El equipo procesó el audio hablado y los datos de texto para mejorar su calidad antes de ejecutar un algoritmo diseñado para alinear las grabaciones de audio con el texto que las acompaña.

A continuación, repitieron este proceso con un segundo algoritmo entrenado con los datos recién alineados.

Con este método, los investigadores pudieron enseñar al algoritmo a aprender un nuevo idioma más fácilmente, incluso sin el texto que lo acompañaba.

Los investigadores afirman que sus modelos pueden conversar en más de 1.000 idiomas, pero reconocen más de 4.000.

Fuente: technologyreview.es

Silvia Chavela

Entradas recientes

Modernización de transporte urbano deberá integrar datos y tecnología: Alfredo Del Mazo Maza

Alfredo Del Mazo Maza, especialista en políticas públicas, afirmó que México avanza en la modernización…

5 horas hace

Tecnología para vigilar mares en Baja California Sur

La seguridad marítima en México ya no depende únicamente de barcos patrulleros o radares tradicionales.…

9 horas hace

Mercado Play conquista Smart TVs en Latinoamérica

El entretenimiento digital en América Latina sigue marcando récords con propuestas que conectan directamente con…

10 horas hace

Elektra impulsa la movilidad inteligente y transforma los traslados urbanos

En las grandes ciudades, el tráfico es un reto diario que impacta la productividad y…

23 horas hace

Yo vivo Samsung: tecnología que acompaña cada momento

La campaña más reciente de Samsung Argentina propone una mirada distinta sobre la relación entre…

1 día hace

Microscopio de alta tecnología fortalece la investigación veterinaria

La innovación científica avanza en La Pampa con un anuncio que marca un antes y…

1 día hace