Noticias

Patenta Apple nueva tecnología que lee los labios

Apple patentó un sistema para detectar los movimientos de la boca y leer los labios del usuario. Todo ello durante los comandos de voz en entornos con interferencias. Eso se aplicaría a dispositivos que soporten el asistente digital de la compañía.

La compañía dispone de un asistente inteligente, Siri, que registra peticiones como la de escribir y enviar un mensaje. También fijar recordatorios o llevar a cabo acciones. Es decir, llamar a un contacto o compartir la llegada a un lugar con otro usuario.

Sin embargo, tal y como recuerda Apple Insider, este encuentra ciertas dificultades para entender las peticiones de los usuarios en diferentes escenarios. Por ejemplo, cuando hay ruido en el lugar desde el que se está utilizando. Las distorsiones son también otro de los problemas a los que se enfrenta Siri.

La compañía tecnológica ha ideado un sistema de reconocimiento de voz que detecta diferentes datos de movimiento. Eso, generado por las vibraciones durante el habla que recoge en una patente firmada por los desarrolladores Eddy Zexing Liang y Madhu Chinthakunta.

“Cuando un usuario habla, la boca, la cara, la cabeza y el cuello se mueven y vibran. Los sensores de movimiento, como acelerómetros o giroscopios, pueden detectar estos movimientos y consumen relativamente poca energía. Todo, en comparación con los sensores de audio, como los micrófonos”, se puede leer en este documento.

Comandos

Este sistema de reconocimiento sería capaz de comparar con movimientos de la boca anteriormente aprendidos y contrastar si lo que solicita el usuario coincide con palabras o frases de comandos de voz previos para encontrar coincidencias. Es decir, leería los labios del usurios para entender su petición.

Gracias a este sistema, los dispositivos en los que estuviese implementado este sistema de reconocimiento de voz serían capaces de reconocer comandos como ‘Oye, Siri’. Así como otras órdenes simples o habituales, como ‘siguiente canción’. Estas acciones se reflejarían en el iPhone después de vincularlo a los equipos electrónicos.

Para cumplir con sus objetivos, Apple debería analizar un gran conjunto de datos sobre los movimientos que los usuarios realizan para pronunciar cada palabra y crear perfiles de voz.

Fuente: aristeguinoticias.com

REDACCIÓN

Entradas recientes

¿Therian qué es y por qué esta identidad animal viral crece en México?

La conversación digital en México y otros países de habla hispana no para de crecer…

20 horas hace

Lanzamientos Ivrea para lectores

Editorial Ivrea mantiene el pulso del mercado del manga en España con un nuevo listado…

20 horas hace

Mercados de predicción toman fuerza con el financiamiento de Novig

En Estados Unidos la forma en que los fanáticos interactúan con los eventos deportivos se…

2 días hace

Corte Suprema de EE UU invalida aranceles que afectaban videojuegos

Una decisión contundente sacudió el mercado tecnológico en Estados Unidos y cambió el rumbo de…

2 días hace

Medicina veterinaria rechaza atención a personas con identidad therian

En Costa Rica se encendió un debate luego de que el Colegio de Médicos Veterinarios…

3 días hace

Mujeres en ciencia transforman la salud en Colombia

La energía que hoy rodea la innovación médica en Colombia nace de historias que desafían…

3 días hace