OpenAI训练电脑看影片玩《Minecraft》 做钻石镐的速度竟比人类还快

图/OpenAI
图/OpenAI

微软旗下 Mojang Studios 开发的工艺沙盒游戏《Minecraft》,以几乎没有边界限制的多生态域世界,让玩家随意与环境方块互动、创作各种事物,2011 年发售持续更新各种内容,至今仍受到大家喜爱,但如今就连 AI(人工智能)都学会在游戏中建设自己的家园了。

图/OpenAI
图/OpenAI

OpenAI 是一个非营利的人工智能研究组织,由SpaceX 暨特斯拉执行长伊隆·马斯克(Elon Musk)于 2015 年创立,近日他们在官方 推特 上透露,在给 AI 看了约 7 万小时(换算约 8 年)的 YouTube 视频后,AI 即能上手《Minecraft》。

图/OpenAI
图/OpenAI

另根据记录在官方博客的训练过程,OpenAI 采用了一种叫影像预训练(Video PreTraining: VPT)的技术,来教导 AI 游玩《Minecraft》,电脑要学习的不只是视频的内容,还包括对应的键盘及鼠标操作。

图/OpenAI
图/OpenAI

接着他们训练一个逆动力模块(inverse dynamics model)去预测视频中的每一个操作会造成什么结果,然后让 AI 根据资料建构一个基础模型,并微调及学习新的动作

图/OpenAI
图/OpenAI

最终,这个模型在看了上万小时的视频后,学会视频中的动作,如砍树、用木材制作工作台。 这当然不是全部,模型也能做到像游泳、打猎、进食等较困难的操作,甚至还能做到「跳叠」利用跳跃的瞬间把方块快速放置在脚下到达高处。

图/OpenAI
图/OpenAI

其中砍树、收集原木、将原木制作成木板,然后将木板制作成工作台的过程,AI 只花约 48 秒; 这个过程需要一个精通《Minecraft》的人类大约50秒或1,000个连续的游戏动作。

图/OpenAI
图/OpenAI

AI 的能力也会随着看视频的时间加长而增长,如制作能力的提升,从木头、石头发展到挖掘钻石制作工具,就连建房子、搜索村庄也可以。

图/OpenAI
图/OpenAI

研究人员为了激发 AI「强化学习」,会在成功完成困难的挑战时给予奖励,以促成超人类的游戏表现,比如做出钻石镐,这是首度有计算机在《Minecraft》做出如此创举,在 10 分钟的游玩过程中有 2.5% 机率会这么做,而人类必须花 20分钟、24,000 次才能做到。

玩游戏已经不是人类的特权了。 不仅是像《Minecraft》这样的沙盒游戏,也许未来我们还会看到更多AI游戏应用,比如2018年OpenAI被训练来对抗《Dota 2》并打爆职业玩家,抑或《Ready or Not》让AI学会上厕所、欣赏画作跟抽烟。

(0)
打赏 微信扫一扫 微信扫一扫

相关推荐

发表评论

登录后才能评论