Google le enseña a la Inteligencia Artificial a "ver" y "oír" al mismo tiempo

Un paso más hacia la percepción a nivel humano…

Google le enseña a la Inteligencia Artificial


Un equipo de científicos de Google Research, el instituto de Alan Turing y la Universidad de Cambridge presentó recientemente un nuevo transformador multimodal de última generación (SOTA) para IA.

En otras palabras, le están enseñando a la IA como “oír” y “ver” al mismo tiempo.

Al frente

Probablemente hayas oído hablar de los sistemas de IA de transformadores como GPT-3. En esencia, procesan y categorizan datos de un tipo especifico de flujo de medios.

Bajo el paradigma actual de SOTA, si quisieras analizar los datos de un video, necesitarías varios modelos de IA ejecutándose al mismo tiempo.

Necesitarías un modelo que haya sido entrenado en videos y otro modelo que haya sido entrenado en clips de audio.

Esto se debe a que, al igual que sus oídos y ojos humanos son sistemas completamente diferentes (pero conectados), los algoritmos necesarios para procesar diferentes tipos de audio suelen ser diferentes a los que se utilizan para procesar video.

Antecedentes

Lo increíble aquí es que el equipo no solo pudo construir un sistema multimodal capaz de manejar sus tareas relacionadas simultáneamente, sino que al hacerlo lograron superar a los modelos SOTA actuales que se enfocan en una sola tarea.

Los investigadores llaman a su sistema “PolyVit”. Y, según ellos, actualmente no tienen competencia.

Toma rápida

Esto podría ser un gran problema para el mundo empresarial.

Uno de los mayores problemas que enfrentan las empresas que esperan implementar pilas de IA es la compatibilidad. Hay literalmente cientos de soluciones de aprendizaje automático y no hay garantías de que funcionen juntas.

Esto da como resultado implementaciones monopolísticas en las que los lideres de TI se quedan como un solo proveedor por motivos de compatibilidad o un enfoque de combinación que conlleva más dolores de cabeza de los que normalmente vale.

Un paradigma en el que los sistemas multimodales se conviertan en la norma sería una bendición para los administradores cansados.

Por supuesto, esta es una investigación preliminar de un documento preimpreso, por lo que no hay razón para creer que veremos esto implementando ampliamente en el corto plazo.

Pero es un gran paso hacia un sistema de clasificación único para todos, y eso es algo bastante emocionante.

Fuente: este post proviene de Cristian Monroy, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Recomendamos

Relacionado

blog - artículos de interés

Mmm … difícil pregunta, no ?? Pero desde mi punto de vista tiene una respuesta fácil y poco ambiciosa: presente efímero con mucho futuro Para saber de donde viene la Inteligencia Artificial basta con hacer un par de consultas a través de Internet y obtendremos una ingente cantidad de información. Os comparto un enlace a una presentación del conocido Chema Alonso, una de las voces más reputa ...

Tecnología IA

La inteligencia artificial (IA) ha logrado avances notables en los últimos años. Las aplicaciones de software basadas en IA cada vez más sofisticadas están revolucionando varios sectores al proporcionar soluciones innovadoras.  Desde chatbots de servicio al cliente fluidos hasta impresionantes generadores visuales, la IA está mejorando nuestras experiencias diarias.  ¿Qué es el hardware de Inteli ...

Automatizaciones Chat GPT Cursos ...

La Ética en la Inteligencia Artificial: Un Debate Esencial La irrupción de la Inteligencia Artificial (IA) en nuestra vida diaria ha llevado a la sociedad a plantearse serias cuestiones relacionadas con la Ética AI. Este debate sobre la Inteligencia Artificial está marcado por cuestiones como la transparencia, la justicia, la responsabilidad y la privacidad. Impacto Social de la IA La IA tiene el ...

Inteligencia Artificial

La inteligencia artificial ha sido un tema de fascinación durante décadas, pero ahora más que nunca, nos encontramos entrando en la era de la inteligencia artificial. Las posibilidades parecen infinitas, desde mejorar la asistencia sanitaria hasta revolucionar el transporte. Sin embargo, estas posibilidades van acompañadas de retos y preocupaciones. Mientras miramos hacia el futuro, es esencial ex ...

Tecnología IA

Desde una profunda personalización hasta planes de entrenamiento genéticamente personalizados, así es como el entrenamiento virtual y la IA podrían transformar el ejercicio para siempre. Si tienes la edad suficiente, es posible que recuerdes cuando hacer ejercicio significaba cargar con un voluminoso Sony Walkman y sudar al ritmo de la canción de la película de Rocky Balboa. Durante las últimas dé ...

Tecnología IA

La AI parece estar haciendo grandes avances todos los días. Como programador, ¿deberías estar preocupado de que las máquinas vengan por tu trabajo? Varias tecnologías nuevas han creado un revuelo en torno a la inteligencia artificial (IA) y lo que significa para nuestro futuro como sociedad. Cada tecnología proviene de diferentes ramas de la IA y plantea un conjunto único de ventajas y preocupacio ...

Entendiendo la IAEn términos generales, los sistemas artificialmente inteligentes pueden realizar tareas comúnmente asociadas con funciones cognitivas humanas, como interpretar el habla, jugar e identificar patrones. Por lo general, aprenden cómo hacerlo procesando cantidades masivas de datos y buscando patrones para modelar en su propia toma de decisiones. En muchos casos, los humanos supervisará ...

Tecnología Google IA

Las discusiones sobre la sensibilidad de la IA no son nada nuevo, pero las noticias sobre AI LaMDA de Google han avivado las llamas. Después de que un ingeniero afirmara que el bot estaba consciente, incluso teniendo un alma, surgieron nuevamente algunas preguntas familiares. ¿Puede la IA como LaMDA ser consciente o consciente de sí misma y, de ser así, cómo podría saberlo? ¿Acaso importa? ¿Qué e ...

Actualidad Tecnología Composición musical ...

Gonzalo Sanchez del Pozo Si hasta ahora la Inteligencia Artificial solo se utilizaba para la resolución de problemas técnicos y científicos, ahora, y en el proyecto Iamus, se está buscando aplicar la IA a la creación musical y la generación de partituras tal como lo haría un compositor humano Hasta ahora teníamos asociado la inteligencia artificial como una nueva forma de solucionar problemas que ...

Tecnología Google IA

Si una computadora te da todas las respuestas correctas, ¿significa que está entendiendo el mundo como tú? Muchos científicos creen que los modelos de aprendizaje profundo son solo grandes máquinas estadísticas que asignan entradas a salidas de formas complejas y notables. Las redes neuronales profundas pueden producir grandes extensiones de texto coherente, pero no comprenden conceptos abstractos ...