A (YouTuber) Hoe pakte het experiment van deze YouTuber met Pokémon uit?
De kunstmatige intelligentie achter het
experiment, geleid door softwareontwikkelaar en YouTuber Peter Whedon, speelde in totaal meer dan ( 50.000 uur ) Pokémon Red.
Voor (Peter Whedon)Een van de uitdagingen was hoe de AI te trainen om zich te gedragen als een menselijke speler. Volgens YouTuber gedraagt de AI zich heel vergelijkbaar met menselijke spelers
Na elke actie kijkt de AI naar wat er op het scherm gebeurt voordat hij zijn volgende zet beslist – vergelijkbaar met een mens die Pokémon Red voor je ogen speelt met een draagbare spelconsole. Om de AI zo snel mogelijk te trainen, voerde Whedon 40 tests tegelijkertijd uit.
(Joaquin Corbalan/Adobe Stock; Peter Whidden))” src=”https://www.global-esports.news/wp-content/uploads/2023/11/For-his-experiment.jpg” width=”1920″ height=”1080″ /☻
Beloningssysteem truc: Hoe leer je een AI Pokémon Red spelen?” De YouTuber koos voor een oplossing: hij creëerde een beloningssysteem waarmee het algoritme kan streven naar de overwinning in het spel. Elke keer dat de AI iets nieuws vindt in het spel, krijgt hij een
Hidden heeft zijn experimenten samengevat in een 33 minuten durende YouTube-video.
Kunstmatige intelligentie heeft een aantal Pokémon gered tijdens een bezoek aan het Pokémon Center. Dit leidde tot een daling van het algemene niveau van het team. Vanwege deze slechte ervaring vermijdt de AI sindsdien Pokémon Centers. Het gevolg is dat het team vanaf dit moment geen meer geneest.
De verborgen
vertelt over dit experiment in zijn YouTube-video:
“Het [AI] heeft geen emoties zoals mensen, maar gebeurtenissen met een zeer hoge beloningswaarde kunnen een blijvend effect hebben op haar gedrag [……]. In dit geval hoefde ze haar Pokémon maar één keer te verliezen. Dit zorgde ervoor dat de AI negatieve associaties vormde met het hele Pokémon Center, waardoor ze het in toekomstige spellen volledig ging vermijden.”