让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

Nintendo Switch • 2023年10月3日 07:07 • 投稿

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

微软和谷歌正在搜索引擎领域拿刀互砍，Meta冷不防抛出一篇新论文，顿时吸引所有人目光：瞄准ChatGPT的「弱点」，让大语言模型自行学会了使用工具！

简单来说，基于Meta的这个思考方式，ChatGPT这些大语言模型可以缺什么补什么：

不会算数，就自己掏出计算机来计算; 需要最新资讯，就自己连接搜索引擎搜索资料……

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

这感觉就像是AI自己操作自己的那个感觉？

论文一出，不少AI研究者就将其视作「过去几周里最重要的论文」。

▲ 这篇论文给人们打开了思路，让大语言模型未来可以成为所有事情的起点。

▲ 还有网友表示：我老婆原本不太关心AI，听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

自学工具用法的大语言模型

这一回，Meta为这个会使用工具的语言模型起名Toolformer。 Toolformer的核心逻辑，总结下来很简单，就是：

专业的任务交给专业的工具来做。

在产生文字的过程中，遇到特定的任务，Toolformer会直接呼叫所需工具的API。

例如说，在执行这个任务：1400名参与者，有400人通过了测试，占多大比例？（为了让ChatGPT掌握数学运算，OpenAI可没少下功夫）

Toolformer丝毫不慌，直接「拿出」计算机，现场计算得出结果：29%。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

又或者说，想要备注事情，只知道是周五，但确实是哪天还不知道？没关系，翻出日历查一下就好了。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

甚至翻译任务也可以直接丢给它，各国语言都能够识别并翻译，直接省去了在软件切换语言的工夫。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

除了这些工具之外，Toolformer还能够呼叫Q&A以及搜索引擎等工具。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

这时，就已经有网友开始想：现在，ChatGPT版Bing能帮你比较酒店价格，那未来有了Toolformer，预定性价比高的酒店岂不是也可以丢给AI去做了。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

不过话说回来，Toolformer面对不同的任务都能行云流水般地呼叫对应的工具，它是怎么做到的呢？一言以蔽之，Toolformer经过训练，能够在产生的文字中插入API呼叫，直接将任务外包出去。

在这其中，训练的过程是以自监督的方式完成的。这意味着无需大量人类标注好的资料，Toolformer只需要少量示范就能学会呼叫API。具体来说，先给Toolformer提供少量已经手动标注好的例子，然后让语言模型在实践中产生一个更大的包含示例的数据集。

这个过程主要分成三步：

首先是取样，通俗点讲就是看输入的文字提示中，哪个地方需要使用哪种工具，然后直接将「呼叫的API」插入到对应的地方;

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

其次是执行，执行上一步的「呼叫API」任务，将产生的文字直接插入进去;

最后是过滤，上一步中工具产生的文字如果对输入文字来说用处不大的话，就可以直接pass掉，保留对文字有用的地方。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

这样一来，基于这些有用的数据集，Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多，Toolformer的真实效果到底如何，有没有一个横向的资料对比？

论文将Toolformer和多个其他大语言模型，包括GPT-J，OPT（66B）以及GPT-3（175B）进行了对比，比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示，在学习使用工具后，GPT-J的零样本学习性能的到了显著的提高。

▲ Toolformer：是在GPT- J上微调，并加强了CCNet子集中的API呼叫/ Toolformer （disabled）：同上，但解码期间禁用API呼叫

并且在大多数任务上性能都有明显提高，在一些下游任务中Toolformer甚至已经超过了GPT-3。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

「未来大语言模型发展的重要分支」

说到这里，不知道你怎么看这件事。有不少网友是已经按捺不住，想着去拔AI电源了。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

而引发更多讨论的，是这样一种观点：Toolformer可能是未来LLM（大语言模型）发展的一个重要分支。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

大语言模型进化出使用工具的能力，知道应该在何时、使用何种工具来实现需求，也就意味着许多在今天还需要人类和AI协作完成的工作，未来AI都能自己搞定了。

比如现在还多少有些「人工智障」的语音助手，如果背后有ChatGPT+Toolformer的技术能力支撑，那么从挑选符合需求的餐厅，到直接订座，这一系列动作都可以被顺畅地串联起来。

又比如微软的Bing搜索接入ChatGPT。如果这些大语言模型能充分呼叫各种API、使用UI，那它不仅能帮人们完成搜寻，还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至，ChatGPT这样的模型，借助各种API重写自己的代码，也将成为可能。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

事实上，让AI掌握工具的使用方法这个研究方向，也并不只有Meta在做。

例如谷歌即将嵌入到搜索中的Bard，背后模型LaMDA就内置了一套工具箱，包括计算机、翻译器和链接搜索引擎获取外部信息的接口。

还有开源项目LangChain，也致力于将大语言模型与外部的运算、知识来源相结合，以开发真正可用的应用程序。

而现在，Meta又使大模型对工具的使用「熟练度」、「自主性」，更上一层楼。

不过，也有网友指出，Toolformer所展现出的「自学」能力，还是一个初级、「狭义」的版本。

这些模型本身仍然是纯粹的函数：给定相同的输入（包括采样时的随机值），它将总是产生相同的输出。

有点像是在说，一个大语言模型能学会将特定领域的语言作为其自然语言的一部分，以此纳入来自外部工具的知识。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

One More Thing

Meta新论文炸场，还挑动了人类的反思神经。

不过，新鲜梗图已经出炉：

人类在沉迷，而机器在学习。

让ChatGPT长出「手」来！ Meta新论文爆红，让语言模型学会自主使用工具

赞 (0)

打赏

微信扫一扫

Nintendo Switch认证作者

0 0

《东方咒术泡泡》新增角色包第一波！「角色包泄矢诹访子」今日上市！

发行商亚克系统（ARC SYSTEM WORKS）亚洲分店宣布，TAITO 公司的节奏益智游戏《东方咒术泡泡》Nintendo Switch 中文版包含了新角色与乐曲的 DLC「角…

Expreview超能网
2023年8月25日 • 投稿
投稿

迪士尼已经为自家流媒体服务预订《波西杰克森》影集

该影集自 2020 年 5 月即开始筹备。

Playstation爱好者
2023年8月25日
投稿

iPadOS 17 预测：5 大重点与支持机型带你一次看

距离 WWDC 2023 大概只剩下一个月的时间，有关 iPadOS 17 的传闻依然不多，这或许表明苹果可能将 iPadOS 17 的重点…

cnBeta
2024年6月3日
快手点赞兼职一单一结(点赞就能赚佣金，是馅饼还是陷阱)

其实快手抖音根本没有纯粹的点赞兼职，有评论兼职，不过佣金也非常低，5分钱一个，你没有看错，去打开视频评论，还需要浏览20秒后才评论，才5分钱一个，也就是说你无缝连接一分钟做两个，才…

GamesIndustry
2023年9月30日 • 投稿
dnf100级什么职业适合平民长期玩(2022dnf什么职业吃香)

DNF全职业耐玩度排行榜，声明：不包括异界套，ss套等的加成玩法，有些职业有主观成分，9年期待，更近所爱！ top44、缔造者可玩度：☆ 点评：非常无聊的职业，现在已经绝种了。技…

IGN
2023年10月1日 • 投稿
论新手跟老手的鸿沟要如何减轻？ ─《Granblue Fantasy Versus： Rising》正式评测心得

Cygames 旗下的手机游戏《碧蓝幻想》从 2014 年营运至今，至今也可以说是当红手机游戏的代表之一了，从动画、小说、CD 等等，也朝多媒体行之有年。其中最让人意外的，应该就…

Expreview超能网
2023年12月15日 • 投稿

发表评论

登录后才能评论