Minecraft: onderzoekers leren een AI om met YouTube-video’s te spelen

0
554

Door een nieuwe technologie leert een AI zelfs diamanten houweel te maken in Minecraft. Maar de weg er naar toe is nogal ingewikkeld.

Speel je graag Minecraft, maar heb je niet echt de tijd om duizenden blokken steen en hout te delven voor je volgende monumentale bouwwerk? Dan heb je geluk, want in de toekomst kan een goed getrainde AI dat voor je doen. OpenAI, een onderzoeksbedrijf dat kunstmatige intelligentie bestudeert, is hiervoor verantwoordelijk. OpenAI staat bekend om de ontwikkeling van (DALL E 2), een AI die afbeeldingen maakt op basis van tekstinvoer.

A (vrije variant van DALL E)Je kunt het trouwens zelf uitproberen, de resultaten kunnen grappig zijn, maar ook behoorlijk verontrustend.Maar terug naar het onderwerp:Het doel van de onderzoekers was om de AI acties te leren, niet via spraakinput, maar via videobeelden. Ontdek hoe ze dit voor elkaar kregen en waartoe de kunstmatige intelligentie in staat is.

Fed with 70,000 hours of gameplay

Om de AI Minecraft te leren,ondernamen de onderzoekers verschillende stappen – het volledige verslag vind je in hun (blog post). Eerst moesten ze ervoor zorgen dat de AI überhaupt kon leren van videomateriaal van YouTube. Dit komt omdat de daar verrichte handelingen niet specifiek worden beschreven: De AI kan niet weten welke knoppen, muisklikken en bewegingen spelers gebruiken om te bewegen, hun inventaris te openen en blokken te ontmantelen.

Daarom hebben we eerst onze eigen gameplay opgenomen met de respectievelijke muis en toetsenbord inputs. Met deze gegevens werd een omgekeerd dynamiekmodel getraind om de volgende actie in de video te voorspellen. Het had toegang tot zowel vroegere als toekomstige beelden van de video. Het model werd vervolgens gebruikt om 70.000 uur aan ongescripte videobeelden te matchen met de juiste muis- en toetsenbordinvoer.

KI bouwt zelfs diamanten pikhouwelen

Nu kun je de AI de bewerkte videobeelden geven en het gedrag laten nabootsen dat in de gameplay wordt getoond.

De kunstmatige intelligentie leerde nog meerhumanvaardigheden, zoals zwemmen, jagen en dieren eten en zelfs zogenaamd pijlerspringen. Maar dit was nog lang niet het einde voor de onderzoekers.

De AI had nu enkele basisvaardigheden, maar moest leren ze specifieker te gebruiken door middel van fijnafstemming. Zo werd het gepresenteerd met gameplay van nieuw gelanceerde Minecraft werelden om vaardigheden uit het vroege spel te versterken. Als gevolg daarvan leerde de AI zelfs om houten en stenen werktuigen te maken, (echt heel) rudimentaire schuilplaatsen te bouwen en kisten te plunderen in NPC dorpen.

Met behulp van een andere methode van fine-tuning, reinforcement learning, was het zelfs mogelijk voor de AI om aan het eind een diamanten houweel te vervaardigen! En dat, terwijl hij achteloos recht naar beneden groef! Ter vergelijking: terwijl een werkbank ongeveer 1.000 handelingen vereiste, heeft de mens ongeveer een hele 24.000 handelingen nodig om een diamantgereedschap te vervaardigen, die allemaal door de kunstmatige intelligentie werden uitgevoerd.

Wat is het nut van dit alles?

Zoals je waarschijnlijk al kunt raden, gaat het onderzoek niet over praktische AI metgezellen voor gestresste Minecraft spelers. De kunstmatige intelligenties worden veeleer verondersteld handelingen te leren op basis van de talrijke video’s die op het internet beschikbaar zijn. De onderzoekers schrijven in hun blogbericht dat VPT (hun technologie) de opwindende mogelijkheid biedt om grootschalige gedragspatronen rechtstreeks te leren op andere gebieden dan taal.

Minecraft is bij uitstek geschikt voor deze experimenten omdat het een zeer generieke interface heeft met muis en toetsenbord, en een zeer open wereld biedt met vele mogelijkheden. De resultaten die daar worden bereikt, kunnen gemakkelijk worden overgebracht naar soortgelijke gebieden, zoals de algemene werking van computers.

Wat vind je van het Minecraft-experiment van de AI-onderzoekers? Vindt u kunstmatige intelligenties saai en verwacht u er niet veel van of gelooft u in hun toekomstig belang? Voel je vrij om je mening te geven in de commentaren!