Rares sont les jeux de Gameboy avec les monstres de poche qui ont suscité autant de nostalgie dans la culture populaire. Mais que se passe-t-il lorsque vous utilisez l’intelligence artificielle sur les Pokémon ?
En outre, la technologie (porteuse d’espoir)pourde nombreux domaines de la vie, des voitures à conduite autonome, des robots dans les usines ou tout simplement pour les smartphones et les ordinateurs domestiques.
Mais l’IA peut-elle aussi briller dans une partie de Pokémon Rouge, le jeu classique de la GameBoy?
Un (YouTuber)ayant des connaissances en programmation et un penchant pour les petits monstres s’est penché sur cette question – avec des résultats étonnants.
Comment fonctionne l’expérience Pokémon du YouTuber?
L’IA à l’origine de l’expérience a joué plus de (50.000 heures)Pokémon Rouge, guidée par le développeur de logiciels et YouTuber Peter Whidden.
Comment entraîner une IA pour Pokémon Rouge?Pour (Peter Whidden)l’un des défis consistait à entraîner l’IA à se comporter comme un joueur humain. Selon le YouTuber, le comportement de l’IA est proche de celui d’un joueur humain
Après chaque action, l’IA devrait ainsi contrôler ce qui se passe à l’écran avant de décider de l’action suivante – un peu comme une personne jouant à Pokémon Rouge avec une manette Gameboy devant les yeux. Pour entraîner l’IA le plus rapidement possible, Whidden a fait tourner 40 sessions de test en parallèle.
L’astuce du système de récompense:Comment apprendre à une IA à jouer à une partie de Pokémon Rouge ? La solution choisie par le YouTuber : pour que l’algorithme poursuive l’objectif de gagner une partie, il a défini un système de récompenses. Chaque fois que l’IA découvre quelque chose de nouveau dans le jeu, elle est récompensée par un point de récompense.
Ce qui est considéré comme « nouveau » était mesuré par le nombre de pixels différents sur l’écran. Mais cette méthode présentait aussi l’inconvénient que le personnage contrôlé par l’IA regardait une animation aquatique au lieu de poursuivre le jeu dans le sens d’une réussite.
Whidden a d’ailleurs présenté son expérience dans une vidéo de 33 minutes sur YouTube.
A quels obstacles l’expérience Pokémon a-t-elle dû faire face?
Lors de la visite du Centre Pokémon, l’IA a stocké certains Pokémon. Cela a entraîné une baisse du niveau général de l’équipe. Suite à cette mauvaise expérience, l’IA a décidé d’éviter le Centre Pokémon. L’inconvénient est que l’équipe n’a plus été soignée à partir de ce moment-là.
Dans sa vidéo YouTube sur l’expérience,
Whidden déclare à ce sujet :
« Elle [l’IA] n’a certes pas d’émotions comme un être humain, mais un seul événement avec une valeur de récompense extrêmement élevée peut influencer son comportement de manière durable. […] Dans ce cas, il suffit qu’elle perde son Pokémon une seule fois. Cela développe une association négative avec l’ensemble du Centre Pokémon, raison pour laquelle l’IA l’évitera complètement dans tous les jeux à venir. «
Ainsi, Whidden a dû ajuster davantage son système de récompenses.
A propos :Les Pokémon ont récemment fait leur entrée sur le grand écran, comme en témoigne la bande-annonce du film ci-dessous.
L’IA en mode kamikaze:Non moins remarquable : le comportement initial de l’IA en combat. En effet, au début, elle se précipitait dans tous les combats, indépendamment de ses chances de victoire. C’est pourquoi le YouTuber a introduit une pénalité pour les combats perdus
Mais le comportement de l’IA après un combat perdu était vraiment curieux – mais en quelque sorte logique : elle restait alors sur l’écran de combat, ne le lisait tout simplement plus. Et ce, afin de ne pas perdre de points
En face, Whidden s’est réjoui du grand succès de sa vidéo YouTube, qui a atteint plus de 4,3 millions de spectateurs à ce jour (10.11.2023). Il déclare:
« Voir le nombre de personnes qui s’intéressent [à la vidéo] me procure beaucoup de plaisir. «
Ce que l’IA a bien fait
Mais l’IA n’a pas fait que des bêtises – elle a même été parfois très intelligente. Puis, à un certain endroit, elle utilisait toujours le même chemin de course. Ce qui, à première vue, n’avait pas de sens, s’est avéré astucieux. Car l’IA s’est servie d’un glitch. Le premier Pokémon qu’elle rencontre est immédiatement capturé en un seul jet.
Pouvez-vous améliorer l’expérience Pokémon du YouTubeur ? De plus, Whidden propose dans sa vidéo quelques conseils sur la manière de réussir une telle expérience par vous-même.
Il a par exemple utilisé la méthode PPO (Proximal Policy Optimization). Selon le site (OpenAI)cet algorithme d’apprentissage offre des performances « comparables ou supérieures aux approches actuelles ». En outre, PPO devrait être facile à mettre en œuvre et à régler.
Que pensez-vous de l’expérience du YouTuber ? Et aussi : avez-vous trouvé la vidéo correspondante amusante ? Avez-vous ressenti de la nostalgie en regardant Pokémon Rouge, ou ne jurez-vous que par Digimon, en fronçant le nez à la simple évocation de Pikachu & Co. N’hésitez pas à nous donner votre avis dans les commentaires