重磅Google发布实验版Gemini15Pro首次登顶排行榜

Google 首次摘下桂冠!

重磅Google发布实验版Gemini15Pro首次登顶排行榜-2

Google的 Gemini 1.5 Pro 模型刚刚在Chatbot Arena上 一鸣惊人 ,首次登顶排行榜,打破了GPT-4和Claude的长期垄断!

不得不说,Google是真的 憋了个 大招啊!

重磅Google发布实验版Gemini15Pro首次登顶排行榜-3

先看排行,Gemini 1.5 Pro以 1300分 的高分 独占鳌头 ,远超第二名GPT-4o和第三名Claude-3.5。

要知道,之前GPT-4和Claude可是AI界的 双子星 (其实,Gemini 的中文名就叫双子星!),长期霸占排行榜前两名。现在Google 终于出手,直接把他俩挤到了二三名,简直就是AI界的 "新皇登基" 啊!

不仅如此,Gemini 1.5 Pro还在 视觉任务 的排行榜上也拿下了第一名。这波操作,可以说是 全面开花 了。

重磅Google发布实验版Gemini15Pro首次登顶排行榜-4

看到这里,有细心的网友肯定会问: "这个Gemini 1.5 Pro是从哪冒出来的?"

其实这是Google最近刚放出来的一个 实验版本 (0801),目前正在Google AI Studio和Gemini API上进行早期测试和反馈收集。

也就是说,这个 "新皇" 其实还是个 "Beta版" 呢!这就更恐怖了,Beta版就能打趴下其他成熟模型,要是正式版出来,会不会更不得了?

先汇总快速过目Gemini 1.5 Pro(0801)在各个类别的排名:

总体 :第1名

数学 :第1-3名

指令跟随 :第1-2名

编程 :第3-5名

硬核提示(英语) :第2-5名

这成绩单可算是 全A+ 啊!不愧是Google DeepMind的心血之作。

有细心的网友发现,Gemini团队似乎很喜欢用"1.5"这个数字。有人调侃道:

"看来Google是想告诉我们,1.5比2.0更香?"

也有人猜测:

"会不会是想暗示自己只用了一半的实力就干掉了对手?"

来看看Gemini 1.5 Pro的具体表现。

首先是 多语言能力 ,这可以说是它的一大亮点。

重磅Google发布实验版Gemini15Pro首次登顶排行榜-5

可以看出,Gemini在中文、日语、德语、俄语等语言上都拿下了第一名。这说明什么?说明Google这次是真的下了大功夫, "全球化" 可不是说说而已。

国内玩家们也算是迎来了点好消息,如果你能体验到的话。

再来看看技术领域的表现:

重磅Google发布实验版Gemini15Pro首次登顶排行榜-6

在数学、指令遵循、编码等技术领域,Gemini 1.5 Pro也都表现不俗,基本上都能排进前三。尤其是在数学和指令遵循方面,更是 稳坐前二 。

不过,在 编码 和 困难提示 方面,Claude 3.5 Sonnet、GPT-4o和Llama 405B还是占据了优势。看来Google还是有些 "短板" 需要补齐。

最后,来看看整体的胜率对比:

重磅Google发布实验版Gemini15Pro首次登顶排行榜-7

Gemini 1.5 Pro (0801)对阵GPT-4o的胜率是 54% ,对阵Claude-3.5-Sonnet的胜率更是高达 59% 。这数据一出来,可以说是相当亮眼了。

有网友忍不住调侃道:

"Google这是要 搅动AI江湖 啊!OpenAI和Anthropic要小心了,新的 '天下第一' 要易主了!"

也有技术大佬分析说:

"Gemini的表现确实出色,尤其是在多语言方面。但在一些高难度技术任务上还有提升空间。不过考虑到这只是Beta版,潜力巨大。期待正式版的表现!"

重磅Google发布实验版Gemini15Pro首次登顶排行榜-8

Google AI Studio的产品负责人Logan Kilpatrick表示:

这个模型是一个实验性的预览版本, 仅供开发者反馈和测试 ,更多更新即将到来 🙂

啊这...所以说这是个 半成品 ?

实验版本就能有这样的表现,足以让竞争对手 坐立不安 了。OpenAI和Anthropic估计已经开始 加班加点 了吧?

有网友戏称:

"Sam Altman:今晚别睡了,我们得讨论讨论GPT-5了。"

"Dario Amodei:Claude,你怎么能输给一个1.5呢?"

如果你想亲自体验一下这个 "新皇" 的实力,可以去Google AI Studio上试试。不过要注意,目前只有最新版本的Gemini才支持这个实验版本哦!

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/92.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>