IA

Diffbot, la IA que lee toda la www pública

La startup Diffbot ha desarrollado una IA dedicada a la tarea de aprender (o, como mínimo, extraer aquellos datos que sea capaz de reconocer) mediante el revolucionario método de leer.

De leerse, de hecho, toda la WWW pública, en múltiples idiomas: su forma de entender el lenguaje humano pasa por intentar encajar todo lo que lee en un molde de sujeto + verbo + predicado, lo que le permite establecer relaciones entre conceptos, como por ejemplo:

«Bill Gates + es + el fundador de Microsoft. // Microsoft + es + una empresa».

Tomando estos datos simples, el papel de la IA de Diffbot es crear lo que se llama un gráfico de conocimiento: una red de relaciones dotado de un sistema de ‘razonamiento’ que le permite llegar a nuevas conclusiones a partir de los datos extraídos. Diffbot escanea la WWW y actualiza su gráfico de conocimiento cada 4-5 días, añadiendo hasta 150 millones de entradas en cada ocasión.

Y además, aplica a sus conocimientos algoritmos más antiguos de machine learning, que le permiten identificar información obsoleta y sustituirla por otra más novedosa.

Es tan exhaustivo que no se conforma con leer el texto del HTML, sino que aplica algoritmos de visión por computadora para extraer información también de imágenes y vídeos. Y además, navega como nosotros: revisando las webs de arriba a abajo, cambiando entre pestañas y clicando en ventanas emergentes.

Y en un futuro cercano, sus creadores planean dotarlo de un modelo de lenguaje (similar a GPT-3) para que, ahora que la IA ha sido capaz de entender lo que lee, pueda generar textos a partir de ello y crear un «sistema universal de respuesta a preguntas sobre hechos».

REDACCIÓN

Entradas recientes

¿Cuál es el mejor procesador para la alimentación complementaria? La tecnología que conserva más nutrientes para tu bebé

Cuando llega el momento de iniciar la alimentación complementaria, muchos padres descubren que no todos…

2 horas hace

México sigue ganándole a la IA… en algo que las máquinas aún no pueden copiar

La inteligencia artificial ya escribe textos, genera imágenes, compone canciones y hasta puede crear videos…

2 horas hace

Pagos por SPEI crecen en México, destaca Norman Hagemeister

Durante 2025, el Sistema de Pagos Electrónicos Interbancarios (SPEI) ganó terreno frente al efectivo y…

4 horas hace

la increíble tecnología natural que mantiene con vida a un bebé antes de nacer

Mucho antes de que existieran incubadoras, monitores médicos o tratamientos avanzados para recién nacidos, la…

20 horas hace

Las papas que ya no necesitan aceite

Durante décadas, preparar papas fritas significó una cosa: aceite caliente. Sin embargo, la industria alimentaria…

20 horas hace

Seguritech: ¿Proveedor de seguridad o integrador de misión crítica?

La convergencia entre inteligencia de datos, telecomunicaciones y monitoreo avanzado está redefiniendo la manera en…

1 día hace