新榜訊 3 月 4 日,豆包大模型團(tuán)隊于近日開源SuperGPQA。這是一個在領(lǐng)域方面十分全面且具有高區(qū)分度的知識推理基準(zhǔn)測試。此數(shù)據(jù)集成功構(gòu)建起涵蓋 285 個研究生級學(xué)科,包含 26529 道專業(yè)問題的評估體系。不但囊括了主流學(xué)科,還將輕工業(yè)、農(nóng)業(yè)、服務(wù)科學(xué)等長尾學(xué)科收納其中。充分彰顯出全面學(xué)科的覆蓋廣度,成功填補(bǔ)了長尾知識評估領(lǐng)域的空白。
掃描二維碼
手機(jī)瀏覽
豆包大模型團(tuán)隊開源基準(zhǔn)測試集SuperGPQA
分享文章鏈接
相似推薦
跳動.jpeg)
字節(jié)跳動豆包大模型團(tuán)隊正式開源首個多語言類SWE數(shù)據(jù)集
新榜訊 4 月 10 日,字節(jié)跳動豆包大模型團(tuán)隊重磅開源首個多語言類 SWE 數(shù)據(jù)集——Multi-SWE-bench。
跳動.jpeg)
字節(jié)豆包大模型團(tuán)隊提出稀疏模型架構(gòu)UltraMem
新榜訊 2 月 12 日消息,據(jù)字節(jié)跳動豆包大模型團(tuán)隊透露,其 Foundation 團(tuán)隊于近期推出 UltraMem,這是一種能將計算和參數(shù)解耦的稀疏模型架構(gòu),在確保模型效果的基礎(chǔ)上成功化解了推理的訪存難題。

豆包:視頻生成模型“VideoWorld”可僅靠視覺認(rèn)知世界 現(xiàn)已開源
新榜訊 由豆包大模型團(tuán)隊攜手北京交通大學(xué)、中國科學(xué)技術(shù)大學(xué)聯(lián)合提出的視頻生成實驗?zāi)P汀癡ideoWorld”,有別于 Sora 、DALL-E 、Midjourney 等主流多模態(tài)模型,在業(yè)界率先達(dá)成無需依賴語言模型便能認(rèn)知世界的突破。