Noticias

Patenta Apple nueva tecnología que lee los labios

Apple patentó un sistema para detectar los movimientos de la boca y leer los labios del usuario. Todo ello durante los comandos de voz en entornos con interferencias. Eso se aplicaría a dispositivos que soporten el asistente digital de la compañía.

La compañía dispone de un asistente inteligente, Siri, que registra peticiones como la de escribir y enviar un mensaje. También fijar recordatorios o llevar a cabo acciones. Es decir, llamar a un contacto o compartir la llegada a un lugar con otro usuario.

Sin embargo, tal y como recuerda Apple Insider, este encuentra ciertas dificultades para entender las peticiones de los usuarios en diferentes escenarios. Por ejemplo, cuando hay ruido en el lugar desde el que se está utilizando. Las distorsiones son también otro de los problemas a los que se enfrenta Siri.

La compañía tecnológica ha ideado un sistema de reconocimiento de voz que detecta diferentes datos de movimiento. Eso, generado por las vibraciones durante el habla que recoge en una patente firmada por los desarrolladores Eddy Zexing Liang y Madhu Chinthakunta.

“Cuando un usuario habla, la boca, la cara, la cabeza y el cuello se mueven y vibran. Los sensores de movimiento, como acelerómetros o giroscopios, pueden detectar estos movimientos y consumen relativamente poca energía. Todo, en comparación con los sensores de audio, como los micrófonos”, se puede leer en este documento.

Comandos

Este sistema de reconocimiento sería capaz de comparar con movimientos de la boca anteriormente aprendidos y contrastar si lo que solicita el usuario coincide con palabras o frases de comandos de voz previos para encontrar coincidencias. Es decir, leería los labios del usurios para entender su petición.

Gracias a este sistema, los dispositivos en los que estuviese implementado este sistema de reconocimiento de voz serían capaces de reconocer comandos como ‘Oye, Siri’. Así como otras órdenes simples o habituales, como ‘siguiente canción’. Estas acciones se reflejarían en el iPhone después de vincularlo a los equipos electrónicos.

Para cumplir con sus objetivos, Apple debería analizar un gran conjunto de datos sobre los movimientos que los usuarios realizan para pronunciar cada palabra y crear perfiles de voz.

Fuente: aristeguinoticias.com

REDACCIÓN

Entradas recientes

¿Cuál es el mejor procesador para la alimentación complementaria? La tecnología que conserva más nutrientes para tu bebé

Cuando llega el momento de iniciar la alimentación complementaria, muchos padres descubren que no todos…

1 hora hace

México sigue ganándole a la IA… en algo que las máquinas aún no pueden copiar

La inteligencia artificial ya escribe textos, genera imágenes, compone canciones y hasta puede crear videos…

2 horas hace

Pagos por SPEI crecen en México, destaca Norman Hagemeister

Durante 2025, el Sistema de Pagos Electrónicos Interbancarios (SPEI) ganó terreno frente al efectivo y…

3 horas hace

la increíble tecnología natural que mantiene con vida a un bebé antes de nacer

Mucho antes de que existieran incubadoras, monitores médicos o tratamientos avanzados para recién nacidos, la…

19 horas hace

Las papas que ya no necesitan aceite

Durante décadas, preparar papas fritas significó una cosa: aceite caliente. Sin embargo, la industria alimentaria…

19 horas hace

Seguritech: ¿Proveedor de seguridad o integrador de misión crítica?

La convergencia entre inteligencia de datos, telecomunicaciones y monitoreo avanzado está redefiniendo la manera en…

1 día hace