Google le enseña a la Inteligencia Artificial a "ver" y "oír" al mismo tiempo

Un paso más hacia la percepción a nivel humano…

Google le enseña a la Inteligencia Artificial


Un equipo de científicos de Google Research, el instituto de Alan Turing y la Universidad de Cambridge presentó recientemente un nuevo transformador multimodal de última generación (SOTA) para IA.

En otras palabras, le están enseñando a la IA como “oír” y “ver” al mismo tiempo.

Al frente

Probablemente hayas oído hablar de los sistemas de IA de transformadores como GPT-3. En esencia, procesan y categorizan datos de un tipo especifico de flujo de medios.

Bajo el paradigma actual de SOTA, si quisieras analizar los datos de un video, necesitarías varios modelos de IA ejecutándose al mismo tiempo.

Necesitarías un modelo que haya sido entrenado en videos y otro modelo que haya sido entrenado en clips de audio.

Esto se debe a que, al igual que sus oídos y ojos humanos son sistemas completamente diferentes (pero conectados), los algoritmos necesarios para procesar diferentes tipos de audio suelen ser diferentes a los que se utilizan para procesar video.

Antecedentes

Lo increíble aquí es que el equipo no solo pudo construir un sistema multimodal capaz de manejar sus tareas relacionadas simultáneamente, sino que al hacerlo lograron superar a los modelos SOTA actuales que se enfocan en una sola tarea.

Los investigadores llaman a su sistema “PolyVit”. Y, según ellos, actualmente no tienen competencia.

Toma rápida

Esto podría ser un gran problema para el mundo empresarial.

Uno de los mayores problemas que enfrentan las empresas que esperan implementar pilas de IA es la compatibilidad. Hay literalmente cientos de soluciones de aprendizaje automático y no hay garantías de que funcionen juntas.

Esto da como resultado implementaciones monopolísticas en las que los lideres de TI se quedan como un solo proveedor por motivos de compatibilidad o un enfoque de combinación que conlleva más dolores de cabeza de los que normalmente vale.

Un paradigma en el que los sistemas multimodales se conviertan en la norma sería una bendición para los administradores cansados.

Por supuesto, esta es una investigación preliminar de un documento preimpreso, por lo que no hay razón para creer que veremos esto implementando ampliamente en el corto plazo.

Pero es un gran paso hacia un sistema de clasificación único para todos, y eso es algo bastante emocionante.

Fuente: este post proviene de Cristian Monroy, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Recomendamos

Relacionado

Tecnología IA

La inteligencia artificial (IA) ha logrado avances notables en los últimos años. Las aplicaciones de software basadas en IA cada vez más sofisticadas están revolucionando varios sectores al proporcionar soluciones innovadoras.  Desde chatbots de servicio al cliente fluidos hasta impresionantes generadores visuales, la IA está mejorando nuestras experiencias diarias.  ¿Qué es el hardware de Inteli ...

Actualidad Tecnología Composición musical ...

Gonzalo Sanchez del Pozo Si hasta ahora la Inteligencia Artificial solo se utilizaba para la resolución de problemas técnicos y científicos, ahora, y en el proyecto Iamus, se está buscando aplicar la IA a la creación musical y la generación de partituras tal como lo haría un compositor humano Hasta ahora teníamos asociado la inteligencia artificial como una nueva forma de solucionar problemas que ...

_Services DigitalTransformation New Business and ICT

Si hay algo que no puede tratarse de manera ligera, es la Inteligencia Artificial (IA). Y es tal la ligereza con que se trata por estar de moda, que al final termina banalizándose. Además termina "en boca" de todólogos y "sabios de post de Facebook", vendiéndose a muchas empresas algoritmos en excell y no soluciones reales de Inteligencia Artificial. La Inteligencia Artificial ...

Apps Tecnología

La inteligencia artificial es una palabra de moda continua en el espacio digital, y no es de extrañar por qué. Su aporte a internet permite disfrutar de una experiencia en línea avanzada, facilitando la realización de tareas en línea. Google ofrece una amplia gama de herramientas que te permiten completar varias tareas todos los días, pero ¿sabías que algunas de ellas ya usan inteligencia artifici ...