Apple patentó un sistema para detectar los movimientos de la boca y leer los labios del usuario. Todo ello durante los comandos de voz en entornos con interferencias. Eso se aplicaría a dispositivos que soporten el asistente digital de la compañía.
La compañía dispone de un asistente inteligente, Siri, que registra peticiones como la de escribir y enviar un mensaje. También fijar recordatorios o llevar a cabo acciones. Es decir, llamar a un contacto o compartir la llegada a un lugar con otro usuario.
Sin embargo, tal y como recuerda Apple Insider, este encuentra ciertas dificultades para entender las peticiones de los usuarios en diferentes escenarios. Por ejemplo, cuando hay ruido en el lugar desde el que se está utilizando. Las distorsiones son también otro de los problemas a los que se enfrenta Siri.
La compañía tecnológica ha ideado un sistema de reconocimiento de voz que detecta diferentes datos de movimiento. Eso, generado por las vibraciones durante el habla que recoge en una patente firmada por los desarrolladores Eddy Zexing Liang y Madhu Chinthakunta.
“Cuando un usuario habla, la boca, la cara, la cabeza y el cuello se mueven y vibran. Los sensores de movimiento, como acelerómetros o giroscopios, pueden detectar estos movimientos y consumen relativamente poca energía. Todo, en comparación con los sensores de audio, como los micrófonos”, se puede leer en este documento.
Este sistema de reconocimiento sería capaz de comparar con movimientos de la boca anteriormente aprendidos y contrastar si lo que solicita el usuario coincide con palabras o frases de comandos de voz previos para encontrar coincidencias. Es decir, leería los labios del usurios para entender su petición.
Gracias a este sistema, los dispositivos en los que estuviese implementado este sistema de reconocimiento de voz serían capaces de reconocer comandos como ‘Oye, Siri’. Así como otras órdenes simples o habituales, como ‘siguiente canción’. Estas acciones se reflejarían en el iPhone después de vincularlo a los equipos electrónicos.
Para cumplir con sus objetivos, Apple debería analizar un gran conjunto de datos sobre los movimientos que los usuarios realizan para pronunciar cada palabra y crear perfiles de voz.
Fuente: aristeguinoticias.com
La conversación digital en México y otros países de habla hispana no para de crecer…
Editorial Ivrea mantiene el pulso del mercado del manga en España con un nuevo listado…
En Estados Unidos la forma en que los fanáticos interactúan con los eventos deportivos se…
Una decisión contundente sacudió el mercado tecnológico en Estados Unidos y cambió el rumbo de…
En Costa Rica se encendió un debate luego de que el Colegio de Médicos Veterinarios…
La energía que hoy rodea la innovación médica en Colombia nace de historias que desafían…