DeepMind también supera a los humanos en los videojuegos colaborativos

DeepMind también supera a los humanos en los videojuegos multijugador

Publicado: 30/05/2019 20:00

En marzo de 2016, el mundo asistió atónito a la partida del programa AlphaGo contra Lee Sedol, el campeón de Go al que la máquina vapuleó con claridad. Solo unos meses después, la compañía DeepMind de Google anunció que había desarrollado una nueva versión del programa, AlphaGo Zero, capaz de ganar a la anterior por 100 partidas a 0. Ahora, en un trabajo publicado en la revista Science, un equipo de investigadores ha demostrado que la máquina es capaz de jugar también a videojuegos 3D multijugador, un tipo de juego que requiere destrezas típicamente humanas, como la colaboración, y que hasta ahora resultaba inabarcable para la inteligencia artificial (IA).

Los autores de la investigación han desarrollado una IA basada en el aprendizaje reforzado - un sistema que se había mostrado sutil para entrenar a jugadores artificiales capaces de navegar en entornos complejos. Pero a diferencia de intentos anteriores, el equipo de Max Jaderberg no ha provisto a la máquina con conocimientos previos sobre las reglas del juego ni la forma de moverse en el escenario, sino que se aseguró de que aprendiera a partir de lo que veía en pantalla (píxels) y la puntuación que conseguía en cada actuación.

El juego con el que han probado el programa es un clásico de los juegos en primera persona llamado Quake III Arena Capture the Flag, que consiste en competir con otros jugadores para capturar banderas. Los diferentes agentes de la IA aprendieron a competir contra sí mismos en miles de partidas en entornos generados aleatoriamente.

Según los investigadores, con el tiempo los agentes desarrollaron estrategias de un nivel sorprendentemente alto, no muy diferentes de las que desarrollan los jugadores humanos con mayores habilidades en el juego. Y lo que es más, en partidas con jugadores humanos, la máquina superó a sus oponentes, incluso a pesar de que su velocidad de reacción fue ralentizada para ajustarse al nivel de una persona. Además, los resultados fueron igualmente buenos en partidas colaborativas e incluso participando como parte de equipos humanos.

Referencia: Human-level performance in 3D multiplayer games with population-based reinforcement learning (Science)

Ya no se pueden votar ni publicar comentarios en este artículo.