Llama38B玩出新花样小模型也能当大爷

今天给大家带来一个劲爆消息!

有一帮疯狂的科学家声称,他们把Llama3-8B这个小屁孩喂了点"思维增强剂",居然能干翻Llama3-70B这个大块头了!这是什么神仙操作?咱们一起来看看这个名为"Buffer of Thoughts"(BoT)的黑科技到底有多牛逼。

首先,这帮科学疯子发明了一个叫"buffer-manager"的玩意儿,就像给AI装了个超级大脑。这玩意儿能动态更新所谓的"meta-buffer",就跟人类学习一样,越解题越长脑子。结果呢?在"24点游戏"上提升了11%,"几何形状"上涨了20%,"将军"更是暴涨51%!这简直就是给AI喂了兴奋剂啊!

Llama38B玩出新花样小模型也能当大爷-2

更牛的是,这个BoT系统比那些花里胡哨的多重询问方法(比如思维树、思维图之类的)只用了12%的成本。这简直就是用自行车的价格买了辆法拉利啊!

那么,这个神奇的"思维缓冲区"到底是个啥玩意儿呢?简单来说,就是给AI装了个超级记忆库,里面存满了各种高级思维模板。这些模板分为文本理解、创意语言生成、常识推理、数学推理、代码编程和应用调度六大类。每次遇到新问题,AI就从这个"智慧宝库"里找个合适的模板,然后像填空题一样,把具体问题套进去。

Llama38B玩出新花样小模型也能当大爷-3

更绝的是,这个系统还会不断学习。每解决一个新问题,它就会总结经验,提炼出新的思维模板,然后决定要不要把这个新模板加入"智慧宝库"。这简直就是给AI装了个自动升级系统啊!

实验结果简直惊呆了所有人。在10个需要深度推理的任务中,BoT完全碾压了之前的最强选手。而且,它的推理效率高得吓人,速度跟单次询问差不多,但比那些复杂的多重询问方法快多了。

Llama38B玩出新花样小模型也能当大爷-4

Llama38B玩出新花样小模型也能当大爷-5

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/132.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>