。首先,他们必须确保人工智能完全可以从YouTube的视频材料中学习。这是因为那里执行的行动没有具体描述。人工智能无法知道玩家使用哪些按钮、鼠标点击和动作来移动、打开他们的库存和拆除积木。
这就是为什么我们首先用各自的鼠标和键盘输入来记录自己的游戏过程。有了这些数据,一个逆向动力学模型 被训练来预测视频中的下一个动作。它能够访问视频的过去和未来帧。然后,该模型又被用来将7万小时的无脚本视频片段与适当的鼠标和键盘输入相匹配。
KI甚至建造了钻石镐
。
现在,你可以向人工智能提供经过处理的视频片段,并让它模仿游戏中展示的行为。例如,它设法砍伐树木,用它们制作木板,并最终制作一个工作台。 这听起来可能并不令人印象深刻,但它需要玩家提供大约1000个输入,所有这些都必须由人工智能来模仿。
人工智能学会了更多人类 技能,如游泳、狩猎和吃动物,甚至所谓的跳柱子。但这远远不是研究人员的终点。
VIDEO
人工智能现在有了一些基本的能力,但要通过微调的方式学习如何更具体地使用这些能力。因此,它以新推出的《Minecraft》世界的游戏玩法呈现,以加强早期游戏的技能。结果,人工智能甚至学会了制造木制和石制工具,建造(真正非常)简陋的住所,并在NPC村庄里抢夺箱子。
在另一种微调方法–强化学习的帮助下,人工智能甚至有可能在最后制作出一把钻石镐! 而这,虽然它不经意地直往下挖! 作为比较:一个工作台需要大约1000个动作,而人类制作一个钻石工具需要大约24000个动作,所有这些都是由人工智能完成的。
这一切有什么意义?
正如你可能猜到的那样,这项研究并不是关于强调Minecraft玩家的实用AI伴侣。相反,人工智能应该根据互联网上的大量视频来学习动作。研究人员在他们的博客条目中写道,VPT(他们的技术)提供了在语言以外的领域直接学习大规模行为模式的令人兴奋的可能性。
Minecraft非常适合这些实验,因为它有一个非常通用的鼠标和键盘界面,并提供了一个非常开放的世界,有许多可能性。在那里取得的成果可以很容易地转移到类似的领域,例如计算机的一般操作。
你怎么看人工智能研究人员的Minecraft实验?你是觉得人工智能很无聊,对其不抱太大期望,还是相信其未来的重要性?欢迎在评论中给我们写下你的意见!