OpenAI entrenó con éxito un bot de Minecraft utilizando 70.000 horas de gameplay

OpenAI entrenó con éxito un bot de Minecraft utilizando 70.000 horas de gameplay

Tech

Es posible que no pienses en Minecraft como una herramienta de investigación de IA. ¿Por qué es tan importante instruir a una máquina sobre cómo jugar a un juego sandbox obsoleto? Una investigación reciente realizada por OpenAI sugiere que un bot de Minecraft bien entrenado puede contribuir al avance de la inteligencia artificial.



El objetivo principal de OpenAI ha sido el desarrollo de tecnologías de IA y ML que sean útiles para la humanidad. Se enseñó a un ordenador utilizando más de 71.000 horas de vídeo de personas jugando al juego Minecraft. No es sólo un programa informático que intenta ganar un juego. Fomenta el proceso de aprendizaje automático mediante el uso de la observación y la imitación.

El bot de OpenAI muestra el aprendizaje por imitación en acción (o “aprendizaje supervisado”). A diferencia del aprendizaje por refuerzo, el aprendizaje por imitación consiste en entrenar redes neuronales viendo a personas que realizan diversas tareas. OpenAI utilizó imágenes e instrucciones de juegos para enseñar a su máquina complejas secuencias de juego que necesitarían 24.000 acciones de un humano para realizarlas por sí mismo.

openai minecraft
El uso de entradas de vídeo etiquetadas para dar contexto a las acciones y sus resultados es necesario para el aprendizaje por imitación. Esta estrategia, que requiere mucho trabajo manual, restringe los conjuntos de datos disponibles. El aprendizaje por observación del agente se ve obstaculizado por la ausencia de conjuntos de datos.

El equipo de investigación de OpenAI utilizó el preentrenamiento en vídeo (VPT) para aumentar significativamente la cantidad de vídeos etiquetados. Para entrenar a un agente, los investigadores recopilaron 2.000 horas de juego de Minecraft anotadas. El modelo resultante se aplicó para clasificar automáticamente 70.000 horas de material online de Minecraft, esto proporcionó al bot un conjunto de datos más amplio para estudiar y replicar.

El experimento demuestra que YouTube es un recurso valioso para la formación de la IA. El entrenamiento de la IA para realizar actividades específicas, como la navegación por la web y la asistencia física, podría llevarse a cabo mediante el uso de películas que hayan sido debidamente clasificadas por los científicos.

Te puede interesar...


Las mejores ofertas del Blackfriday en Amazon, AliExpress, PCComponentes, GeekBuying... - corre antes de que se acaben

Consigue las mejores ofertas del Black Friday en AliExpress en 2022: la guía definitiva

Las mejores ofertas de GeekBuying para el Black Friday

Las mejores ofertas y cupones de AliExpress (actualizado)

Las mejores ofertas de El Corte Inglés (actualizado)

Listado de las Ofertas y Descuentos de GeekBuying (Actualizado)

Ofertas y cupones actualizadas de MyProtein

El abogado de Elon Musk habla sobre los despidos de Twitter
Fuente: este post proviene de WikiVersus, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

¿Qué es el proceso trimming de una unidad SSD? El trim o trimming de una unidad SSD es un proceso que ayuda a mantener el rendimiento de una unidad de estado sólido a lo largo del tiempo. El trim o r ...

Etiquetas:

Recomendamos