新榜訊 6月5日,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)通過微信公眾號(hào)發(fā)布消息。由字節(jié)跳動(dòng)ByteBrain團(tuán)隊(duì)牽頭,聯(lián)合美國(guó)加州大學(xué)默塞德分校(UC Merced)和加州大學(xué)伯克利分校(UC Berkeley)提出了VMR2L,并研發(fā)出一套基于深度強(qiáng)化學(xué)習(xí)的VMR系統(tǒng)。該系統(tǒng)在保持近似最優(yōu)性能的情況下,將推理時(shí)間大幅壓縮至1.1秒,成功達(dá)成了系統(tǒng)性能與工業(yè)可部署性的統(tǒng)一。此項(xiàng)研究成果已在系統(tǒng)領(lǐng)域頂級(jí)會(huì)議EuroSys25上發(fā)表。值得一提的是,論文的兩位共同一作均為字節(jié)跳動(dòng)ByteBrain團(tuán)隊(duì)的實(shí)習(xí)生,他們的研究聚焦于長(zhǎng)期以來被忽視卻極為關(guān)鍵的虛擬機(jī)重調(diào)度(VMR)問題。
掃描二維碼
手機(jī)瀏覽
字節(jié)跳動(dòng)ByteBrain團(tuán)隊(duì)提出秒級(jí)推理強(qiáng)化學(xué)習(xí)VMR系統(tǒng)
分享文章鏈接
相似推薦

小紅書Hi Lab團(tuán)隊(duì)提出可大幅降低平均思考長(zhǎng)度的強(qiáng)化學(xué)習(xí)訓(xùn)練方式
新榜訊 6月19日,小紅書技術(shù)團(tuán)隊(duì)發(fā)布消息,其深度思考模型借助Test - Time Scaling(測(cè)試時(shí)擴(kuò)展)顯著提升了模型推理能力,不過也產(chǎn)生了大量冗余和無效思考情況。
跳動(dòng).jpeg)
字節(jié)豆包大模型團(tuán)隊(duì)提出稀疏模型架構(gòu)UltraMem
新榜訊 2 月 12 日消息,據(jù)字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)透露,其 Foundation 團(tuán)隊(duì)于近期推出 UltraMem,這是一種能將計(jì)算和參數(shù)解耦的稀疏模型架構(gòu),在確保模型效果的基礎(chǔ)上成功化解了推理的訪存難題。

字節(jié)跳動(dòng)成立海外短劇業(yè)務(wù)團(tuán)隊(duì) 上線Melolo短劇APP
新榜訊 1 月 7 日最新消息,字節(jié)跳動(dòng)已組建海外短劇業(yè)務(wù)團(tuán)隊(duì),且正在廣招多個(gè)與短劇海外業(yè)務(wù)相關(guān)的職位,像海外短劇用戶產(chǎn)品經(jīng)理、歐美文案策劃等等,工作地點(diǎn)主要在北京、上海等地。