GPT-4玩《我的世界》15倍速攀科技,不看画面全靠代码操作 / 头条资讯

9月前 阅读 / 44 来源 / 原创 文 / 越读党订阅

克雷西 发自 凹非寺量子位 | 公众号 QbitAI把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3.3倍,探索范围是2...

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

把GPT-4放进一个虚拟世界会怎么样?比如《我的世界》。

英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的15.3倍,同时获得的独特物品是此前的3.3倍,探索范围是2.3倍。



更关键的是,Voyager目前完全借助游戏画面推理,一切操作与反馈通过文本和游戏的Javascript API进行。

被其他AI玩家视为噩梦的挖钻石也不在话下。



结合人类反馈,盖个房子也不是问题。



更不用说撸树、游泳、摸鱼……这些基础操作。

(视频请到微信公众号文章中查看)

这项成果来自英伟达科学家Jim Fan(范麟熙)团队。

Voyager的出现甚至引发了一些网友的恐惧。

当GPT-4不再只是一款大语言模型,而拥有了与其他工具交互进行复杂动作的能力,学会推理和创造,真正的“人工智能”即将降临……



深度广度双双提升

团队将Voyager的表现与ReAct、Reflexion和AutoGPT进行了对比。

在地图探索距离上,Voyager达到了其他AI玩家的2.3倍。



而在科技树方面,只有Voyager成功解锁了钻石工具。

对于其他工具,Voyager解锁的效率也最高。

下表中,括号前的数字表示提示迭代的次数,越少说明效率越高;括号中的数字则表示在3次试验中AI玩家的成功率。



除了能点亮训练过的科技树,Voyager在零点测试中表现同样出色。

研究人员让这些AI玩家制造没有训练过的钻石镐、金剑、岩浆桶和指南针。

结果只有Voyager取得了100%的成功率,效率也比其他玩家更高。



如果有人工的帮助,给予评价或指导,Voyager还能构造建筑。

之所以需要人工,是因为在研发Voyager时GPT-4还不具备视觉能力。



如何实现

Voyager主要由三部分组成,即自动任务生成系统、技能库和迭代提示机制。



顾名思义,自动任务生成器负责根据宏观目标生成具体任务及操作游戏的代码并进行优化。Voyager使用的是一个流行的Javascript Minecraft 操作库 (Mineflayer)。

GPT-4根据Voyager发送的提示生成代码调用这个操作库,并根据JS运行情况和游戏反馈对代码中的错误进行修正。

Voyager发送给GPT的提示中主要包含四部分内容:

一是鼓励GPT尝试多种方式,同时又加以限制的总方针。二是目前的状态,包括生命和饥饿值、持有物、位置和周围环境等。三是之前成功和失败的操作,反映目前的工作进展。四是额外信息,让GPT-3.5根据前述状态提问并调用知识库自答,将过程传给GPT-4。



说完了任务生成器,再看看Voyager的技能库。

通过让GPT-3.5(成本考虑)对生成的代码进行注释,并纳入技能库同时建立索引。

操作时则先用GPT-3.5生成操作说明,调用数据库中最匹配的五个。

然后,GPT-4将决定是调用数据库中的已有技能还是重新生成代码。



这一过程给GPT的提示则由五部分组成:

一是代码生成的指导,如“你生成的代码将被反复使用”。二是控制API及相关技能。三是上一步中生成的代码,以及对应的运行状况和反馈。四是当前的状态,具体内容和代码生成器部分相同。五是利用思维链方式,让GPT生成代码前进行推理。

最后再来看看Voyager的迭代提示机制,这一机制用于Voyager的自我提升。

这一机制会收集环境反馈、运行错误等信息。



同时结合对任务成功与否的自我检测,对自身进行优化。

下图就展示了自我检测的几个实例。



消融测试结果显示,缺少这一环节会导致Voyager运行质量的显著下降。



论文地址:
https://arxiv.org/abs/2305.16291
项目主页:
https://voyager.minedojo.org
GitHub页面:
https://github.com/MineDojo/Voyager
参考链接:
[1]https://twitter.com/DrJimFan/status/1662115266933972993
[2]https://m.weibo.cn/status/4905873598054632


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关阅读
#杂志封面

《高教学刊》杂志_高教学刊2023年13期杂志封面

《高教学刊》杂志_高教学刊2023年13期杂志封面

#杂志目录

《家庭医药·快乐养生》杂志2020年07期最新目录订阅

目录养生观点丨少看朋友圈,你会更快乐随着移动互联网时代的来临,使用微博、微信等社交媒体成为很多人日常生活的一部分。但社交媒体的作用相当复杂,在看似愉快地刷微博、朋友圈的行为背后,也会不易察觉地导致了一些负面效果...

#头条资讯

日本电产称2030年电动汽车价格下降80%

日本电产欲抢占汽车电驱市场。当地时间11月11日,据日经网报道,日本电产董事长兼CEO永守重信在一场论坛上表示,随着纯电动汽车的普及,预计2030年纯电动汽车的价格将降至目前的五分之一左右。公开资料显示,日本电产主要生产...

#杂志目录

《科学导报·学术》杂志2020年59期最新目录订阅

目录科学教育前沿丨Research on the creative process of packaging design Abstract:all along,packaging design is a very important fi...

#杂志目录

《科学与财富》杂志2020年33期最新目录订阅

目录科技发展丨CAD在机械设计中的应用及机械制造技术的发展摘 要:随着我国工业化进程以及城市化进程的推进,机械制造技术迎来了新的发展机遇,机械设备呈现出复杂化、精密化的发展趋势,依靠传统的设计技术不仅仅会导致设备...

#杂志目录

《中小学管理》杂志2020年07期最新目录订阅

目录卷首丨做一个“赋能型”教育局长我们已然进入一个变幻莫测、颠覆性丛生的“乌卡时代”(VUCA,即Volatility〈易变性〉、Uncertainty〈不确定性〉、Complexity〈复杂性〉、Ambiguity〈模糊性〉)。这是管理学...