IA

Meta crea modelos de ia para reconocer lenguas

Meta desarrolló modelos de inteligencia artificial que pueden reconocer y producir el habla de más de 1.000 lenguas, un avance que multiplica por diez la oferta actual. Se trata de un paso importante hacia la preservación de lenguas que corren el riesgo de desaparecer.

Para ello pone sus modelos a disposición del público a través del servicio de alojamiento de código GitHub. Afirma que hacerlos de código abierto ayudará a los desarrolladores que trabajan en distintos idiomas a crear nuevas aplicaciones de lenguaje, como servicios de mensajería que entiendan a todo el mundo o sistemas de realidad virtual que puedan utilizarse en cualquier idioma.

7.000 lenguas

En el mundo hay unas 7.000 lenguas, pero los modelos de reconocimiento del habla existentes solo cubren de forma exhaustiva unas 100. Esto se debe a que este tipo de modelos suelen requerir grandes cantidades de datos de entrenamiento etiquetados, que solo están disponibles para un pequeño número de idiomas, entre ellos el inglés, el español y el chino.

Los investigadores de Meta sortearon este problema reentrenando un modelo de IA existente desarrollado por la empresa en 2020 que es capaz de aprender patrones de lenguaje a partir de audio sin necesidad de grandes cantidades de datos etiquetados como pueden ser las transcripciones.

Lo entrenaron con dos nuevos conjuntos de datos: uno que contiene grabaciones de audio de la Biblia del Nuevo Testamento y su correspondiente texto extraídos de internet en 1.107 idiomas, y otro que contiene grabaciones de audio del Nuevo Testamento.

Nuevo idioma

El equipo procesó el audio hablado y los datos de texto para mejorar su calidad antes de ejecutar un algoritmo diseñado para alinear las grabaciones de audio con el texto que las acompaña. A continuación, repitieron este proceso con un segundo algoritmo entrenado con los datos recién alineados.

Con este método, los investigadores pudieron enseñar al algoritmo a aprender un nuevo idioma más fácilmente, incluso sin el texto que lo acompañaba.

Los investigadores afirman que sus modelos pueden conversar en más de 1.000 idiomas, pero reconocen más de 4.000.

Fuente: technologyreview.es

REDACCIÓN

Entradas recientes

¿Cuál es el mejor procesador para la alimentación complementaria? La tecnología que conserva más nutrientes para tu bebé

Cuando llega el momento de iniciar la alimentación complementaria, muchos padres descubren que no todos…

7 horas hace

México sigue ganándole a la IA… en algo que las máquinas aún no pueden copiar

La inteligencia artificial ya escribe textos, genera imágenes, compone canciones y hasta puede crear videos…

7 horas hace

Pagos por SPEI crecen en México, destaca Norman Hagemeister

Durante 2025, el Sistema de Pagos Electrónicos Interbancarios (SPEI) ganó terreno frente al efectivo y…

9 horas hace

la increíble tecnología natural que mantiene con vida a un bebé antes de nacer

Mucho antes de que existieran incubadoras, monitores médicos o tratamientos avanzados para recién nacidos, la…

1 día hace

Las papas que ya no necesitan aceite

Durante décadas, preparar papas fritas significó una cosa: aceite caliente. Sin embargo, la industria alimentaria…

1 día hace

Seguritech: ¿Proveedor de seguridad o integrador de misión crítica?

La convergencia entre inteligencia de datos, telecomunicaciones y monitoreo avanzado está redefiniendo la manera en…

1 día hace