Por qué los generadores de imágenes de Inteligencia Artificial tienen problemas con las manos

La Inteligencia Artificial puede engañarnos para que confundamos el arte generado con fotos reales. Entonces, ¿por qué las manos son un desafío tan grande?

Los generadores de IA evolucionan ante nuestros ojos a un ritmo veloz, pero aún tienen fallas. Detectar detalles extraños en imágenes de IA es bastante divertido. Es por eso que las manos generadas en Midjourney se convirtieron en un tema candente, un problema común en muchos motores.

Analicemos por qué las manos desafían tanto a los generadores de imágenes de IA. Sus programadores ya están solucionando este problema digno de un meme, pero es interesante pensar en cómo aprende la inteligencia artificial, sin mencionar lo que se interpone en su camino.

Por qué los generadores de imágenes de Inteligencia Artificial tienen problemas con las manos


Por qué las manos generadas por IA causaron revuelo

Cualquiera que use motores de inteligencia artificial para crear imágenes puede haber notado que las manos rara vez salen bien, pero el problema llamó la atención cuando aparecieron un montón de “fotos” en Twitter.

En una inspección más cercana, las extrañas manos de las personas los delataron como imágenes generadas por IA. El hecho de que se conociera justo en el auge de Midjourney hizo que la situación fuera más interesante.

Uno de los mejores motores de inteligencia artificial que existen no pudo abordar la complejidad de las manos humanas, por lo que se pusieron a prueba las capacidades de Midjourney y sus competidores. Es cierto que incluso DALL-E es propenso a tener dedos y uñas poco realistas.

La exageración fue desproporcionada, teniendo en cuenta que las manos generadas por IA siempre han sido un problema, pero la atención adicional provocó el lanzamiento de Midjourney v5 para mejorar la v4 .

¿Por qué los generadores de imágenes de IA tienen problemas con las manos?

Los motores de IA utilizan redes antagónicas generativas (GAN) o difusión estable para producir imágenes. Ambas tecnologías requieren una gran cantidad de materiales de origen, capacitación y poder de procesamiento para crear incluso las obras de arte más básicas.

Dado que las imágenes preexistentes son fundamentales para el entrenamiento de una IA, los programadores tienen que alimentar su software con miles, sino millones, de imágenes junto con indicaciones, repitiendo el proceso una y otra vez hasta que el motor comprenda a qué se refiere una palabra en particular y cómo representarla ese objeto

Pero las imágenes de origen de las que aprende una IA son principalmente 2D, donde las manos se representan en una variedad de posiciones. Ya sea recto o rizado, mostrando cinco o tres dedos.

Al final del día, una máquina en realidad no comprende el concepto de manos, y las imágenes de las que aprende no siempre muestran manos de manera clara o consistente. Es por eso que las manos de Midjourney pueden ser tan feas, confusión de IA.

Otras razones por las que los generadores de imágenes de IA tardan en mejorar

En cuanto a los modelos de Midjourney, v5 ofrece una coherencia avanzada entre las indicaciones de texto y las imágenes producidas, así como una resolución más alta y herramientas adicionales. Pero tales logros no son baratos.

Entrenar a una IA para hacerlo mejor con las manos requiere alimentarla con mejores imágenes, especialmente en 3D. Eso significa que se dedica mucho tiempo y mano de obra a los procesos, desde la adquisición de materiales de origen hasta la mejora de la codificación y la repetición de la capacitación hasta que la IA lo hace bien.

Los generadores de imágenes de IA no lucharán para siempre

Las manos son un concepto complicado para que la inteligencia artificial entienda su cabeza binaria, pero las soluciones al problema ya están funcionando. Midjourney, DALL-E 2 y otras plataformas eventualmente podrán mantener los dedos peculiares al mínimo, si no erradicarlos por completo.

Los avances en otros campos de la IA garantizan que la tecnología evolucione constantemente y que sus desarrolladores siempre aprendan nuevas formas de aplicarla y mejorarla.

Fuente: este post proviene de Cristian Monroy, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Etiquetas: TecnologíaIA

Recomendamos

Relacionado

Tecnología Arte IA

Las obras de arte generadas por Inteligencia Artificial ya han dejado su huella en el mundo del arte. Pero, ¿cómo influirá en el futuro del arte? El arte es subjetivo. Abarca muchos puntos de vista y puede soportar tantas o más definiciones. Como término, está en constante evolución, y los límites de lo que se puede considerar arte continúan siendo empujados. 1. Te hace cuestionar lo que consider ...

Inteligencia Artificial

La inteligencia artificial ha sido un tema de fascinación durante décadas, pero ahora más que nunca, nos encontramos entrando en la era de la inteligencia artificial. Las posibilidades parecen infinitas, desde mejorar la asistencia sanitaria hasta revolucionar el transporte. Sin embargo, estas posibilidades van acompañadas de retos y preocupaciones. Mientras miramos hacia el futuro, es esencial ex ...

Tecnología IA

A medida que los modelos de lenguaje como GPT continúan mejorando, se vuelve cada vez más difícil diferenciar entre el texto generado por IA y el escrito por humanos. Pero, en algunos casos, como los académicos, es necesario asegurarse de que el texto no esté escrito por IA. 1. GPTZero GPTZero se creó para ayudar a los profesores a determinar si el trabajo enviado por sus alumnos se generó utiliz ...

Existen un buen puñado de páginas para generar imágenes con IA. Tanto gratuitas como de pago, están demostrando ser un divertido entretenimiento, pero también una herramienta para ilustrar historias tanto en el ámbito de la literatura como en las redes sociales. Ya te apetezca chafardear de lo que son capaces, o quieres introducir las imágenes generadas por IA en tus proyectos, te dejamos las más ...

Tecnología IA Web3

La versión actual de Internet, Web 2.0, utiliza modelos de inteligencia artificial y aprendizaje automático de diferentes maneras. Estos modelos impulsan anuncios dirigidos, motores de recomendación, chatbots, generadores de imágenes y asistentes de voz. Pero la Web 2.0 tiene sus limitaciones. Problemas como el control corporativo, las preocupaciones sobre la privacidad y la difusión de informació ...

Tecnología

¿Cansado de escuchar la misma música? ¿Por qué no le das una oportunidad a la música generada por IA?  Gracias a la evolución de la inteligencia artificial, hay más música generada por IA por descubrir que nunca. Si te agradan los desarrollos recientes en la música generada por IA seguramente ya sabes que hay muchos sitios web, servicios y más para que descubras tu próxima canción favorita. 1. AI ...

Tecnología IA

La Inteligencia Artificial está aportando mejoras transformadoras a la atención médica, pero los profesionales y los pacientes también deben considerar los riesgos de esta tecnología. Los avances en inteligencia artificial están revolucionando la industria de la salud. Los chatbots ayudan a los pacientes a estudiar enfermedades, los sistemas de almacenamiento agilizan la organización de datos y lo ...

Tecnología IA

La inteligencia artificial (IA) ha logrado avances notables en los últimos años. Las aplicaciones de software basadas en IA cada vez más sofisticadas están revolucionando varios sectores al proporcionar soluciones innovadoras.  Desde chatbots de servicio al cliente fluidos hasta impresionantes generadores visuales, la IA está mejorando nuestras experiencias diarias.  ¿Qué es el hardware de Inteli ...

SEO

La inteligencia artificial generativa (IAG) está revolucionando el mundo del marketing digital, con un impacto significativo en Search Engine Optimization (SEO). Por ello, vamos a analizar cómo la IAG está redefiniendo las estrategias de búsqueda, impulsando innovaciones y ofreciendo soluciones personalizadas para enfrentar desafíos únicos en SEO. ¿Qué es la inteligencia artificial generativa? La ...

Tecnología IA

La IA ha influido significativamente en numerosas profesiones y los desarrolladores no son una excepción. Pero, ¿cuáles son los pensamientos de los desarrolladores sobre esta tecnología? La creciente popularidad de la IA es innegable, pero plantea la cuestión de cuán significativa y relevante es la IA para el flujo de trabajo de un desarrollador. Para arrojar luz sobre este tema, Stack Overflow en ...