新榜訊 3 月 26 日訊,谷歌推出“最智能的 AI 模型”Gemini 2.5 系列,其中實(shí)驗(yàn)版 Gemini 2.5 Pro 作為該系列首款推理模型已上線。據(jù)悉,此實(shí)驗(yàn)版 Gemini 2.5 Pro 乃是谷歌旗下最為先進(jìn)的復(fù)雜任務(wù)模型,展現(xiàn)出強(qiáng)大的推理與代碼能力,且涵蓋 Gemini 系列此前各模型的全部功能。當(dāng)下,實(shí)驗(yàn)版 Gemini 2.5 Pro 在 GPQA 和 AIME 2025 等多項(xiàng)基準(zhǔn)測(cè)試任務(wù)中表現(xiàn)出色,更以 39 分的顯著優(yōu)勢(shì),在測(cè)試人類偏好的大模型競(jìng)技場(chǎng) Chatbot Arena 中拔得頭籌,力壓 Grok-3 與 GPT-4.5。
掃描二維碼
手機(jī)瀏覽
谷歌繼續(xù)上新:推理模型2.5 Pro發(fā)布 多項(xiàng)測(cè)試擊敗OpenAI和Grok
分享文章鏈接
相似推薦

智譜將開(kāi)源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
新榜訊 智譜將于4 月 14 日開(kāi)源推理模型 GLM-Z1-Air 及基座模型 GLM-4-Air0414,且上述模型將于近期陸續(xù)上線 bigmodel.cn。
.png)
阿里通義千問(wèn)正式推出QVQ-Max視覺(jué)推理模型第一版
新榜訊 據(jù)悉,去年 12 月,阿里通義千問(wèn)推出探索模型 QVQ-72B-Preview,該模型存在一定不足。
.png)
阿里發(fā)布開(kāi)源推理模型QwQ-32B 支持消費(fèi)級(jí)顯卡本地部署
新榜訊 阿里巴巴日前發(fā)布并開(kāi)源全新推理模型通義千問(wèn) QwQ-32B,該模型在數(shù)學(xué)、代碼及通用能力方面整體性能與 DeepSeek-R1 不相上下,且成功降低部署使用成本,甚至在消費(fèi)級(jí)顯卡上亦可實(shí)現(xiàn)本地部署。