50 000 HODIN POZDĚJI: Umělá inteligence měla vyřešit lidské problémy, ale kvůli Pokémon Red selhala

0
159

Jen málo věcí v popkultuře je tak nostalgických jako konzole Pokémon. Co by se ale stalo, kdyby byla do Pokémonů implantována umělá inteligence?

Kromě toho se tato technologie (očekává)využije vmnoha oblastech života, od samořídících aut a továrních robotů až po chytré telefony a domácí počítače.

Může však umělá inteligence vyniknout také při hraní klasické hry Pokémon Red pro GameBoy?

A (YouTuber)s talentem pro programování a slabostí pro malé příšerky se této otázky ujal – s překvapivým

s překvapivými výsledky.

Jak dopadl experiment tohoto youtubera s pokémony?
Umělá inteligence, která stojí za

experimentem, vedeným softwarovým vývojářem a YouTuberem Peterem Whedonem, hrála celkem více než ( 50 000 hodin )Pokémon Red.
Pro (Petera Whedona)Jednou z výzev bylo, jak vycvičit umělou inteligenci, aby se chovala jako lidský hráč. Podle YouTubera se AI chová velmi podobně jako lidští hráči

Po každé akci se AI podívá na to, co se děje na obrazovce, a teprve poté se rozhodne pro další tah – podobně jako když člověk hraje Pokémona Red před očima s kapesní herní konzolí. Aby mohl Whedon umělou inteligenci co nejrychleji vycvičit, provedl 40 testů současně.

(Joaquin Corbalan/Adobe Stock; Peter Whidden))“ src=“https://www.global-esports.news/wp-content/uploads/2023/11/For-his-experiment.jpg“ width=“1920″ height=“1080″ /☻

Trik se systémem odměn: Jak naučit umělou inteligenci hrát hru Pokémon Red?“ YouTuber zvolil řešení: vytvořil systém odměn, který algoritmu umožňuje usilovat o vítězství ve hře. Pokaždé, když umělá inteligence najde ve hře něco nového, dostane za odměnu bod

.

Zmíněná „novost“ se měří počtem různých pixelů na obrazovce. Tento přístup má však i své nevýhody, a sice že postava řízená umělou inteligencí sleduje animaci vody, a nikoli pokračuje ve hře ve smyslu jejího úspěšného dokončení.

Kromě toho byly vytvořeny další bonusové body za takové věci, jako je chytání pokémonů, vítězství v aréně nebo vítězství v bitvě s trenérem.

Hidden své experimenty shrnul do 33minutového videa na YouTube.

Umělá inteligence uložila některé pokémony při návštěvě Pokémoního centra. To vedlo k poklesu celkové úrovně týmu. Kvůli této špatné zkušenosti se umělá inteligence od té doby pokémoním centrům vyhýbá. Výslednou nevýhodou je, že tým od tohoto okamžiku již neléčí

Skrytý

vypráví o tomto experimentu ve svém videu na YouTube:

„Nemá [umělá inteligence] emoce jako lidé, ale události s velmi vysokou hodnotou odměny mohou mít trvalý vliv na její chování [……]. V tomto případě jí stačilo ztratit pokémona pouze jednou. To způsobilo, že si umělá inteligence vytvořila negativní asociace s celým Pokémoním centrem, což způsobilo, že se mu v budoucích hrách zcela vyhnula.“

Whedon tedy musel svůj systém odměn dále upravit.

Mimochodem: Pokémoni se nedávno dostali i na velké plátno, jak dokazuje níže uvedený filmový trailer.

Umělá inteligence v režimu kamikadze: Počáteční bojový výkon umělé inteligence je stejně přesvědčivý. Zpočátku se vrhá do každé bitvy bez ohledu na šance na vítězství. Proto Youtuber zavedl postihy za prohrané bitvy.
Wieden je algoritmus, který se postupně učí požadovanému chování ve hře. Protože v tomto případě neexistuje velký soubor dat jako v případě textové nebo řečové umělé inteligence, musel se algoritmy chování pro dosažení cílů hry učit po malých částech.

( TechCrunch )Whedon je potěšen obrovským úspěchem svého videa na YouTube, které má zatím (10. listopadu 2023) více než 4,3 milionu zhlédnutí. Řekl:

„Je skvělé vidět tolik lidí, kteří se do (videa) zapojili.“

Cože?“

Co dělá AI dobře

Umělá inteligence však nevytváří jen problémy, někdy je dokonce velmi chytrá. A pak v určitém okamžiku používá stále stejné cesty. To, co se zpočátku zdá nesmyslné, se stane velmi chytrým. Umělá inteligence využívá chybu. To znamená, že prvního pokémona, na kterého narazila, chytila, jakmile ho hodila.

Můžete vylepšit YouTuberův experiment s pokémony? Whedon navíc ve svém videu nabízí několik tipů, jak se pokusit takový experiment provést sami.

Používá například takzvanou proximální optimalizaci politiky (PPO). V (OpenAI)tomto algoritmu učení se říká, že poskytuje „srovnatelný nebo lepší výkon než současné metody“. PPO se prý také snadno implementuje a ladí.

Co si myslíte o experimentu tohoto YouTubera? A také: přišlo vám přiložené video vtipné? Přepadá vás nostalgie při pohledu na Pokémon Red, nebo nadáváte na Digimony a při zmínce o Pikachuovi se ptáte, jestli máte nos? Dejte nám vědět, co si o tom myslíte, v komentářích níže