精选吃瓜网- 追踪心情故事,带你精彩内容 > 爆秀 > 乐瓜 > 正文

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

原创   全台 (作)   图已处理(译)   2025-07-11 11:16:41

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

多地官宣:音乐节可在现场领结婚证

多地官宣:音乐节可在现场领结婚证

每经编辑|何小桃音乐节可以在现场领证。据新疆广播电视台报道,7月12日至7月13日,2025新疆超级草莓音乐节将在乌鲁木齐市水磨沟区天山明月城火热开唱。此次音乐节不仅有超燃的音乐盛宴,更有一系列“花式

6872 个星友都在看 19小时前

逃离都市的秘境体验:安岚秘境音乐派对如何征服高端度假客群?

逃离都市的秘境体验:安岚秘境音乐派对如何征服高端度假客群?

来源标题:逃离都市的秘境体验:安岚秘境音乐派对如何征服高端度假客群?这个夏天,宁海安岚以一场沉浸式音乐活动,精准击中了高端客群对“小众”“深度”&ldq

22 个星友都在看 75小时前

第三届北京网络视听艺术大会开幕 80部网络视听精品力作发布

第三届北京网络视听艺术大会开幕 80部网络视听精品力作发布

来源标题:第三届北京网络视听艺术大会开幕 80部网络视听精品力作发布2日上午,以“视听潮涌 文艺生辉”为主题,为期两天的第三届北京网络视听艺术大会在北京开幕。微短剧等多类型精品

178 个星友都在看 45小时前

电视剧《锦绣芳华》展现东方美学魅力

电视剧《锦绣芳华》展现东方美学魅力

来源标题:电视剧《锦绣芳华》展现东方美学魅力电视剧《锦绣芳华》日前开播。该剧以牡丹文化为载体,讲述了芳园店主何惟芳与花鸟使蒋长扬共守家园的故事。电视剧《锦绣芳华》剧照。剧方供图记者了解到,在创作过程中

7 个星友都在看 13小时前

日本首相石破茂:赌上国运战斗,不能被美国看扁

日本首相石破茂:赌上国运战斗,不能被美国看扁

据环球网援引日本共同社报道,日本首相石破茂9日在为自民党参议院选举候选人拉票时,在街头演讲中谈到日美关税谈判。石破茂向日本民众表示,关税谈判“是场赌上国家利益的战斗,怎么能忍受被对方看扁。”石破茂9日

8 个星友都在看 54小时前

加载更多