微软又整活AI数据生娃术让你下岗没商量

clash • 2026年1月18日 am7:40 • shadowrocket, Shadowrocket下载, Shadowrocket官网, Shadowrocket节点, 小火箭

微软和WizardLM_AI 这两个不安分的主儿又搞出了个叫" Auto Evol-Instruc t"的玩意儿！

这玩意儿简直就是AI界的" 无中生有 "大法，能自动进化出高质量、多样性和复杂度爆表的合成数据，而且不需要人类专家插手！

这玩意儿是怎么搞的呢？它基于Evol-Instruct，但把人类专家换成了两个AI：一个叫"Evol LLM"的，负责创造新指令；另一个叫"Optimizer LLM"的，负责吐槽和优化。这就像是把两个AI放在一个房间里，一个负责胡说八道，另一个负责挑刺儿，最后居然还真能整出点名堂来！

实现步骤如下，坐稳了：

数据收集：先搜刮一堆种子提示，就像在垃圾堆里找宝贝。

进化指令：用Evol LLM开始胡编乱造，跟编故事似的。

进化轨迹分析：Optimizer LLM开始挑刺儿，就像你妈看你女朋友一样挑剔。

进化方法优化：Optimizer LLM根据吐槽结果优化方法，跟改错题似的。

过滤进化方法：把那些没进步的方法筛掉，就像把烂苹果从篮子里挑出来。

迭代：重复1-4步，直到达到预期目标或者AI累得趴下。

生成数据：用最终的进化方法和Evol LLM生成新提示，就像用面包机做面包一样简单。

这么折腾下来，居然还真有点东西。用这方法生成的10K条ShareGPT数据，在MTBench上得了8.09分，在AlpacaEval上用Mixtral-8x7B模型跑出了91.4的高分。这简直就是让AI自己给自己补课，还补得贼溜！

更绝的是，如果用GPT-4当Evol LLM，效果比GPT-3.5还要好。这就像是用宝马替换了大众，跑起来当然更带劲儿！

不过，这帮人还没放出数据集和代码。估计是怕一放出来，全世界的程序猿都得失业。

总之，这 Auto Evol-Instruct就像是给AI装上了自动繁殖系统，让它们可以自己生娃还不带重样的。

我的工作恐怕是要保不住了！

版权声明：
作者：clash
链接：https://www.shadowrocket6.top/125.html
来源：Shadowrocket官网
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

下一篇>>

搜索内容