新榜訊 近日,月之暗面研究員 FloodSung 公開分享了 k1.5 模型背后的詳盡思考歷程,并透露,2024 年 9 月 12 日 OpenAIo1 發(fā)布所產(chǎn)生的震撼影響,致使其對 Long-CoT 的有效性展開反思。 早在一年多前,月之暗面 Kimi 聯(lián)合創(chuàng)始人 Tim 周昕宇就已驗證了 Long-CoT 的有效性,通過采用較小的模型,訓練其進行幾十位的加減乘除運算,將細粒度的運算過程整合為長的 CoT 數(shù)據(jù)進行 SFT,能取得極佳效果。 FloodSung 稱,公司認識到 LongContext 的重要性,率先著眼于將 Context 延長,然而對 Long-CoT 之事重視不足,主要歸因于成本考量?!癓ongContext 主要致力于長文本輸入,具備 Prefill 預(yù)填充及 Mooncake 支持,成本與速度可控,而 Long-CoT 屬于長文本輸出,成本高昂且速度緩慢,在此情形下,延長輸出未被列為優(yōu)先選項?!?FloodSung 反思道:“但還有何事比性能(Performance)更為關(guān)鍵呢?成本和速度有摩爾定律支撐,能夠持續(xù)降低,只要將性能提升,其余皆非首要問題?!币虼?,必須開展 Long-CoT 及 o1 相關(guān)工作?!翱傊覀兙褪且柧毮P湍軌蛉缛祟愐话阕杂伤伎??!盕loodSung 表示。 在月之暗面 Kimi 官網(wǎng),F(xiàn)loodSung 發(fā)表了一篇揭秘 o1 破解過程的萬字長文,標志著公司關(guān)注并開始對標 o1 且推進相關(guān)研究的實質(zhì)性舉措。(來源:IT 之家)