Minecraft:研究人员教AI玩YouTube视频

0
613

利用一项新技术,一个人工智能甚至学会了在Minecraft中制作钻石镐。但去那里的方法相当复杂。

你喜欢玩Minecraft,但真的没有时间为你的下一个纪念性建筑开采成千上万的石块和木材吗?那么你可能很幸运,因为在未来,一个训练有素的人工智能可以为你做这件事。OpenAI是一家研究人工智能的研究公司,负责这项工作。OpenAI因开发(DALL E 2)而闻名,这是一种能根据文本输入创建图像的人工智能。

A(DALL E的免费变体)顺便说一下,你可以自己试试,结果可能很有趣,但也相当令人不安。但回到主题:研究人员的目标是不通过语音输入,而是通过视频片段来教人工智能行动。了解他们如何做到这一点,以及人工智能在这里的能力。

喂养了70,000小时的游戏

为了教人工智能Minecraft,研究人员采取了几个步骤–你可以在他们的(博客文章)中找到完整的报告。首先,他们必须确保人工智能完全可以从YouTube的视频材料中学习。这是因为那里执行的行动没有具体描述。人工智能无法知道玩家使用哪些按钮、鼠标点击和动作来移动、打开他们的库存和拆除积木。

这就是为什么我们首先用各自的鼠标和键盘输入来记录自己的游戏过程。有了这些数据,一个逆向动力学模型被训练来预测视频中的下一个动作。它能够访问视频的过去和未来帧。然后,该模型又被用来将7万小时的无脚本视频片段与适当的鼠标和键盘输入相匹配。

KI甚至建造了钻石镐


现在,你可以向人工智能提供经过处理的视频片段,并让它模仿游戏中展示的行为。例如,它设法砍伐树木,用它们制作木板,并最终制作一个工作台。这听起来可能并不令人印象深刻,但它需要玩家提供大约1000个输入,所有这些都必须由人工智能来模仿。

人工智能学会了更多人类技能,如游泳、狩猎和吃动物,甚至所谓的跳柱子。但这远远不是研究人员的终点。

人工智能现在有了一些基本的能力,但要通过微调的方式学习如何更具体地使用这些能力。因此,它以新推出的《Minecraft》世界的游戏玩法呈现,以加强早期游戏的技能。结果,人工智能甚至学会了制造木制和石制工具,建造(真正非常)简陋的住所,并在NPC村庄里抢夺箱子。

在另一种微调方法–强化学习的帮助下,人工智能甚至有可能在最后制作出一把钻石镐! 而这,虽然它不经意地直往下挖! 作为比较:一个工作台需要大约1000个动作,而人类制作一个钻石工具需要大约24000个动作,所有这些都是由人工智能完成的。

这一切有什么意义?

正如你可能猜到的那样,这项研究并不是关于强调Minecraft玩家的实用AI伴侣。相反,人工智能应该根据互联网上的大量视频来学习动作。研究人员在他们的博客条目中写道,VPT(他们的技术)提供了在语言以外的领域直接学习大规模行为模式的令人兴奋的可能性。

Minecraft非常适合这些实验,因为它有一个非常通用的鼠标和键盘界面,并提供了一个非常开放的世界,有许多可能性。在那里取得的成果可以很容易地转移到类似的领域,例如计算机的一般操作。

你怎么看人工智能研究人员的Minecraft实验?你是觉得人工智能很无聊,对其不抱太大期望,还是相信其未来的重要性?欢迎在评论中给我们写下你的意见!