微软又整活AI数据生娃术让你下岗没商量
微软和WizardLM_AI 这两个不安分的主儿又搞出了个叫" Auto Evol-Instruc t"的玩意儿!
这玩意儿简直就是AI界的" 无中生有 "大法,能自动进化出高质量、多样性和复杂度爆表的合成数据,而且不需要人类专家插手!

这玩意儿是怎么搞的呢?它基于Evol-Instruct,但把人类专家换成了 两个AI:一个叫"Evol LLM"的,负责创造新指令;另一个叫"Optimizer LLM"的,负责吐槽和优化 。这就像是把两个AI放在一个房间里,一个负责胡说八道,另一个负责挑刺儿,最后居然还真能整出点名堂来!
实现步骤如下,坐稳了:
数据收集 :先搜刮一堆种子提示,就像在垃圾堆里找宝贝。
进化指令 :用Evol LLM开始胡编乱造,跟编故事似的。
进化轨迹分析 :Optimizer LLM开始挑刺儿,就像你妈看你女朋友一样挑剔。
进化方法优化 :Optimizer LLM根据吐槽结果优化方法,跟改错题似的。
过滤进化方法 :把那些没进步的方法筛掉,就像把烂苹果从篮子里挑出来。
迭代 :重复1-4步,直到达到预期目标或者AI累得趴下。
生成数据 :用最终的进化方法和Evol LLM生成新提示,就像用面包机做面包一样简单。

这么折腾下来,居然还真有点东西。用这方法生成的10K条ShareGPT数据, 在MTBench上得了8.09分,在AlpacaEval上用Mixtral-8x7B模型跑出了91.4的高分 。这简直就是让AI自己给自己补课,还补得贼溜!

更绝的是,如果 用GPT-4当Evol LLM,效果比GPT-3.5还要好 。这就像是用宝马替换了大众,跑起来当然更带劲儿!

不过,这帮人还没放出数据集和代码。估计是怕一放出来,全世界的程序猿都得失业。
总之,这 Auto Evol-Instruct就像是给AI装上了自动繁殖系统,让它们可以自己生娃还不带重样的。
我的工作恐怕是要保不住了!

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/125.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论