各位好,這里是“AI新榜”的月更欄目:AIGC月刊。
你將在下文看到:
「AI大事件」為你盤點(diǎn)每月最值得關(guān)注的至少10條AI資訊
「AI創(chuàng)作」為你推薦每月值得一看的AI內(nèi)容創(chuàng)作熱門案例
「AI Talk」為你精選每月值得一讀的AI領(lǐng)域訪談/演講/報(bào)告等
「AI預(yù)告」為你搜羅下個(gè)月值得跟進(jìn)的AI動(dòng)態(tài)及產(chǎn)品發(fā)布(也歡迎AI同行聯(lián)絡(luò)爆料,完善信息,共創(chuàng)AI月刊,可聯(lián)系微信zhangjie74510備注姓名公司)
希望能為你了解AIGC帶來參考,也歡迎你在評(píng)論區(qū)交流每月使用/研究AI的感受心得~
??附AI產(chǎn)品榜,助你了解更多AI產(chǎn)品排名:http://www.jinhaohk.com.cn/aiRank
??附AI玩家進(jìn)群方式:添加微信banggebangmei備注姓名公司,進(jìn)群交流AI
1月AI大事件
1. DeepSeek-R1“國(guó)運(yùn)”級(jí)創(chuàng)新持續(xù)霸榜
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)發(fā)布最新開源模型DeepSeek-R1,以較低成本實(shí)現(xiàn)了比肩OpenAI GPT-o1的性能,打破了全球AI產(chǎn)業(yè)長(zhǎng)期以來“堆算力”的路徑依賴,成功登頂100多個(gè)國(guó)家AppStore免費(fèi)應(yīng)用榜,熱度一直居高不下。
它還采用MIT許可協(xié)議,支持免費(fèi)商用及開發(fā),免費(fèi)將推理模型開放給用戶使用,OpenAI首席執(zhí)行官后續(xù)評(píng)論:“不開源我們錯(cuò)了”。此后不久,OpenAI、谷歌等廠商紛紛跟進(jìn),增加了類似深度推理的功能。
曾在2024年制作出《黑神話·悟空》的“游戲科學(xué)”CEO馮驥盛贊該成果堪稱“國(guó)運(yùn)級(jí)”創(chuàng)新,海外著名播客主理人Lex Fridman稱之為“DeepSeek時(shí)刻”,不少業(yè)內(nèi)人士發(fā)言表示DeepSeek將為整個(gè)AI領(lǐng)域帶來全新變革。
2. “Tik Tok難民”涌入后,小紅書連夜上線AI翻譯
小紅書在TikTok海外用戶因封禁風(fēng)波涌入之際,迅速上線評(píng)論區(qū)一鍵翻譯功能。該功能并非傳統(tǒng)機(jī)翻,而是接入大模型的AI翻譯,表現(xiàn)十分出色。
它不僅能輕松翻譯“cpdd”“yyds”這類網(wǎng)絡(luò)縮寫詞、中式英語,還能準(zhǔn)確解讀打亂順序的漢字、二進(jìn)制ASCII字符、盲文、摩斯密碼等特殊內(nèi)容,甚至連《冰與火之歌》中的“高等瓦雷利亞語”及顏表情都能精準(zhǔn)翻譯,被網(wǎng)友稱贊:與其說是翻譯,不如說是“破譯”。
相關(guān)閱讀:《別管了,先玩下小紅書AI翻譯》
3. OpenAI發(fā)布o(jì)3-mini模型
2月1日凌晨,面對(duì)DeepSeek的挑戰(zhàn),OpenAI終于做出回應(yīng),正式發(fā)布了其最新的推理模型o3-mini。
o3-mini是o3的精簡(jiǎn)版,在科學(xué)、數(shù)學(xué)及編程等領(lǐng)域表現(xiàn)出色且成本更低,還首次引入了搜索功能的早期原型,能夠找到最新答案并提供相關(guān)網(wǎng)絡(luò)來源連接,支持調(diào)用函數(shù)、結(jié)構(gòu)化輸出和開發(fā)者消息等。
4. OpenAI發(fā)布智能代理產(chǎn)品Operator
1月底,OpenAI發(fā)布了其首款A(yù)I Agent產(chǎn)品Operator。該產(chǎn)品依托全新模型Computer-Using-Agent(CUA),融合了GPT-4o的視覺感知和高級(jí)推理強(qiáng)化學(xué)習(xí)能力,能夠自主識(shí)別并操作網(wǎng)頁界面,實(shí)現(xiàn)鼠標(biāo)點(diǎn)擊、鍵盤輸入等一系列人機(jī)交互動(dòng)作。
與傳統(tǒng)依賴API調(diào)用或預(yù)設(shè)程序流程的Agent不同,Operator通過基于文本的思維鏈推理,實(shí)現(xiàn)了對(duì)各種網(wǎng)頁環(huán)境的靈活適應(yīng),并支持多任務(wù)并行處理。用戶只需下達(dá)任務(wù)指令,如提供購(gòu)物清單、預(yù)定餐廳、搜索信息等,Operator便能獨(dú)立完成從信息獲取到操作執(zhí)行的全過程,還能識(shí)別可疑信息并及時(shí)制止。
5. 豆包上線實(shí)時(shí)語音功能,發(fā)布Doubao-1.5-pro
1月20日,字節(jié)跳動(dòng)旗下豆包上線了全新端到端實(shí)時(shí)語音通話功能,基于Doubao-1.5-realtime-voice-pro打造,在擬人化、情緒理解、情感表達(dá)等多樣化場(chǎng)景中表現(xiàn)出色。
隨后,豆包還發(fā)布了基礎(chǔ)模型Doubao-1.5-pro,支持32k與256k上下文長(zhǎng)度,在知識(shí)、代碼、推理、中文等多個(gè)測(cè)評(píng)基準(zhǔn)上,綜合得分優(yōu)于GPT-4o、Claude 3.5 Sonnet等模型;新版視覺模型Doubao-1.5-vision-pro原生支持任意分辨率與長(zhǎng)寬比圖像,顯著提升了圖像理解和推理能力;實(shí)時(shí)語音模型Doubao-1.5-realtime-voice-pro實(shí)現(xiàn)了精準(zhǔn)語音對(duì)話和多樣化場(chǎng)景適應(yīng)。另有輕量級(jí)1.5-lite以更低延遲和成本滿足日常應(yīng)用需求。
6. 月之暗面發(fā)布Kimi k1.5視覺思考模型
1月20日,月之暗面發(fā)布了Kimi k系列最新模型k1.5,在數(shù)學(xué)、代碼、視覺和通用推理等任務(wù)上有了不小的提升。
技術(shù)上,Kimi k1.5采用了長(zhǎng)上下文擴(kuò)展策略,將RL的上下文窗口延伸至128k tokens,并利用部分展開技術(shù)提高訓(xùn)練效率;同時(shí),通過改進(jìn)的策略優(yōu)化方法——在線鏡像下降,有效實(shí)現(xiàn)了長(zhǎng)鏈條思維的規(guī)劃、反思與修正,構(gòu)建了一個(gè)簡(jiǎn)潔高效的RL框架,避免了傳統(tǒng)方法中依賴復(fù)雜搜索或價(jià)值函數(shù)的弊端。
7. 阿里通義除夕夜發(fā)布Qwen2.5-Max,開源視覺理解旗艦
1月29日,阿里云通義千問發(fā)布新旗艦?zāi)P蚎wen2.5-Max,在知識(shí)、編程、綜合能力、人類偏好對(duì)齊等測(cè)試上,其指令模型版本比肩Claude-3.5-Sonnet ,幾乎全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B。
此外,通義還開源了全新的視覺模型Qwen2.5-VL,共3B、7B和72B三個(gè)尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項(xiàng)權(quán)威評(píng)測(cè)中奪得視覺理解冠軍,超越了GPT-4o與Claude3.5。
8. 階躍星辰更新Step系全家桶,連發(fā)6款模型
臨近春節(jié),階躍星辰升級(jí)Step系基座模型全家桶,一口氣接連上新了6款模型,具體介紹如下:
1)Step-1o:多模態(tài)理解與生成模型,其視覺版本Step-1o Vision架構(gòu)升級(jí),能精準(zhǔn)識(shí)別圖像內(nèi)容、理解文化隱喻、進(jìn)行視覺推理。
2)Step-1o Audio:語音模型,能感知情緒,支持多語種和多方言對(duì)話,通話低延遲、聲音自然且具個(gè)性化風(fēng)格。
3)Step R-mini:首款推理模型,在數(shù)學(xué)基準(zhǔn)測(cè)試和代碼任務(wù)上表現(xiàn)出色,超過o1-preview,比肩OpenAI o1-mini,在文科內(nèi)容創(chuàng)作和視覺推理方面也有良好表現(xiàn)。
4)Step-Video V2:視頻生成模型,在復(fù)雜運(yùn)動(dòng)、人物刻畫、文字生成和鏡頭表現(xiàn)力上實(shí)現(xiàn)升級(jí)。
5)Step-2 mini:小參數(shù)語言模型,參數(shù)量?jī)H為Step-2的3%,但保有80%以上的模型性能,生成速度快,推理成本低,已開放API接口。
6)Step文學(xué)大師:專為創(chuàng)作而生的語言模型,能創(chuàng)作邏輯嚴(yán)密、風(fēng)格獨(dú)特的內(nèi)容。
9. GLM-PC電腦智能體大模型
1月23日,智譜GLM-PC v1.1正式上線,作為號(hào)稱全球首個(gè)面向公眾、回車即用的電腦智能體,其架構(gòu)基于多模態(tài)大模型CogAgent,能夠像人類一樣“觀察”和“操作”計(jì)算機(jī),協(xié)助用戶高效完成各類電腦任務(wù)。GLM-PC v1.1 版本進(jìn)一步強(qiáng)化了深度思考模式下的規(guī)劃、推理、反思能力,能穩(wěn)定高效地應(yīng)對(duì)復(fù)雜場(chǎng)景與任務(wù)。
10. 訊飛發(fā)布首個(gè)全國(guó)產(chǎn)算力深度推理模型X1
1月15日,科大訊飛發(fā)布了首個(gè)在全國(guó)產(chǎn)算力上訓(xùn)練的深度模型X1。該模型在多類數(shù)學(xué)測(cè)試中表現(xiàn)不錯(cuò),包括2024高考數(shù)學(xué)題、AIME數(shù)學(xué)競(jìng)賽題以及高中奧數(shù)題。目前,X1已迅速投入實(shí)際應(yīng)用:在教育領(lǐng)域,已落地多所中學(xué)數(shù)學(xué)教研組,贏得一線教師認(rèn)可;醫(yī)療場(chǎng)景中,基于知識(shí)反思和CoT,結(jié)合醫(yī)療循證推理技術(shù),其??戚o助診斷和復(fù)雜病例內(nèi)涵質(zhì)控準(zhǔn)確率達(dá)90%,后續(xù)還將推出升級(jí)版。
11. CES 2025海量AI產(chǎn)品亮相,AI寵物成為黑馬
1月7日至10日,有“全球科技第一展”之稱的全球消費(fèi)電子展(CES)在美國(guó)拉斯維加斯舉行,展示了一系列結(jié)合生成式AI技術(shù)的硬件產(chǎn)品。今年包括AI PC、AI眼鏡、AI寵物以及智能家庭領(lǐng)域的新品贏得了不少用戶關(guān)注。
其中AI機(jī)器寵物以其同時(shí)切中“AI情感陪伴”和“智能硬件”兩大熱點(diǎn),成為了CES 2025上當(dāng)之無愧的黑馬。業(yè)內(nèi)普遍認(rèn)為,AI寵物或?qū)⒊蔀榇竽P驮谟布寺涞氐膬?yōu)秀場(chǎng)景,多家上市公司也在加緊布局,推動(dòng)了行業(yè)的蓬勃發(fā)展。
相關(guān)閱讀:《不生孩子的年輕人,開始養(yǎng)AI寵物了》
1月AI創(chuàng)作
1. 用DeepSeek整活兒
DeepSeek的爆火,除了本身推理能力、免費(fèi)策略以外,各種圍繞它產(chǎn)生的整活兒作品也對(duì)傳播功不可沒。
例如,B站UP主“Ai藝術(shù)譚墨”使用DeepSeek語言能力模仿貼吧嘴臭老哥,僅用一段30秒的使用DeepSeek錄屏就獲得了140多萬的瀏覽量;UP主“山中冷月微”使用DeepSeek創(chuàng)作詩(shī)歌,成功“把文科生整破防”了;UP主“暗色調(diào)”通過AI重編了黃宏、侯耀文的經(jīng)典小品《打撲克》,用充滿幽默感的語言諷刺DeepSeek出現(xiàn)后OpenAI的各種反應(yīng),得到了網(wǎng)友的一致好評(píng)。
還有一大批關(guān)于如何高效使用DeepSeek、用DeepSeek賺錢的內(nèi)容,在短短幾天內(nèi)集中獲得了一大波流量。
相關(guān)閱讀:《DeepSeek帶動(dòng)AI搞錢熱潮?我們總結(jié)了用AI做副業(yè)的幾個(gè)方向》
2. 民俗文化融入具身智能,宇樹機(jī)器人登上春晚
今年春晚,活潑又喜感、會(huì)扭秧歌、會(huì)轉(zhuǎn)手絹的人形機(jī)器人成為了不少人關(guān)注的焦點(diǎn)。16個(gè)機(jī)器人穿著喜慶的服飾,動(dòng)作全程精準(zhǔn)同步,與16名舞蹈演員合作帶來了一場(chǎng)碳基生命與“硅基生命”合作的《秧BOT》,網(wǎng)友笑稱其為“最魔性節(jié)目”。
除此之外,今年春晚還通過30多臺(tái)相機(jī)捕捉與虛擬運(yùn)鏡,創(chuàng)造出了巴黎奧運(yùn)會(huì)同款的“子彈時(shí)間”效果;現(xiàn)場(chǎng)還有將畫面數(shù)秒內(nèi)轉(zhuǎn)化為油畫風(fēng)格、動(dòng)態(tài)背景生成等多項(xiàng)新應(yīng)用;首次無障礙轉(zhuǎn)播通過AR虛擬手語和AI語音字幕,確保視障和聽障觀眾也能享受樂趣。
3. 拜賽博財(cái)神,享AI祝福
除了春晚使用AI錦上添花,各大平臺(tái)也紛紛推出應(yīng)景的春節(jié)玩法,例如AI寫春聯(lián)、AI紅包、AI換裝等,還有應(yīng)用將AI語音與春節(jié)融合,制作出諸如“財(cái)神來電”玩法,賽博財(cái)神明確表示,將在新一年為我們的發(fā)財(cái)事業(yè)“暗中發(fā)力”。
還有一些利用換臉技術(shù),讓用戶自己就可以“成為財(cái)神”;各種爆金幣、送祝福的AI視頻特效成為不少人的春節(jié)新寵。例如這條使用即夢(mèng)AI生成的“財(cái)神進(jìn)門”作品就在抖音平臺(tái)獲得了超過56萬觀眾的喜愛,評(píng)論區(qū)至今仍有用戶“接”祝福。
相關(guān)閱讀:《春節(jié)新體驗(yàn):讓AI陪你拜年、送祝福、接財(cái)神》……
4. AI輔助作品披頭士《Now and Then》斬獲格萊美最佳搖滾表演獎(jiǎng)
在67屆格萊美音樂盛典上,著名搖滾樂隊(duì)披頭士憑借AI修復(fù)的歌曲《Now and Then》獲得了格萊美最佳搖滾表演獎(jiǎng)。
據(jù)了解,這首歌最初源于約翰·列儂(John Lennon)在20世紀(jì)70年代末錄制的一段小樣,后來在電影制作人彼得·杰克遜及其音效團(tuán)隊(duì)的助力下,團(tuán)隊(duì)開發(fā)的機(jī)器學(xué)習(xí)技術(shù),分離并修復(fù)列儂錄音中的不同元素,才使歌曲得以在2023年正式發(fā)行。
1月AI Talk
下月AI預(yù)告
1. 為應(yīng)對(duì)AI競(jìng)爭(zhēng),OpenAI CEO將再次開啟“全球巡回之旅”
彭博社2月1日消息,OpenAI首席執(zhí)行山姆·奧特曼(Sam Altman)將在接下來的幾周里,頻繁往返東京、新德里、迪拜和德國(guó),旨在與投資者、開發(fā)者和行業(yè)領(lǐng)袖交流。
這是奧特曼擔(dān)任OpenAI CEO后的第二次全球巡回之旅。據(jù)知情人士透露,他大部分的會(huì)談將集中在與投資者的交流上,表明OpenAI依然相信“擁有最多資源的公司最終會(huì)占據(jù)主導(dǎo)地位”。
2. 亞馬遜將于2月26日發(fā)布新一代Alexa生成式AI服務(wù),使用Claude模型
亞馬遜已發(fā)出人工智能主題活動(dòng)的邀請(qǐng),計(jì)劃在2月26日的活動(dòng)中推出其下一代Alexa生成式人工智能服務(wù)。據(jù)了解,亞馬遜沒有完全依賴其內(nèi)部人工智能技術(shù),而是采用了Anthropic公司的Claude人工智能模型。
自2014年推出以來,Alexa已成為應(yīng)用最廣泛的語音助手之一。然而,隨著ChatGPT、Claude和Gemini等生成式人工智能產(chǎn)品的大量涌現(xiàn),Alexa逐漸落后。對(duì)亞馬遜來說,Alexa能否通過變革取得成功至關(guān)重要。
3. 世界AI行動(dòng)峰會(huì)將在法國(guó)舉行
2月10日至11日,人工智能行動(dòng)峰會(huì)將在法國(guó)舉行。據(jù)法國(guó)24新聞電視臺(tái)報(bào)道稱,出席此次人工智能行動(dòng)峰會(huì)的業(yè)內(nèi)人士包括OpenAI CEO奧特曼、谷歌CEO皮查伊、諾獎(jiǎng)獲得者哈薩比斯等。法新社表示,該峰會(huì)旨在為正在應(yīng)對(duì)來自美國(guó)和中國(guó)人工智能挑戰(zhàn)的歐洲敲響“警鐘”。
4. 全球開發(fā)者先鋒大會(huì)即將在上海開幕
2月21日至23日,2025春季GDC(全球開發(fā)者先鋒大會(huì))將以“模塑全球 無限可能”為主題,在上海徐匯西岸召開,大會(huì)定位 “社區(qū)的社區(qū)”,聚焦AI技術(shù)前沿,活動(dòng)包括開幕式、企業(yè)講壇、開發(fā)者活動(dòng)等,旨在為開發(fā)者提供應(yīng)用場(chǎng)景、技術(shù)交流和產(chǎn)業(yè)合作平臺(tái)。
大會(huì)官網(wǎng):www.globalaidc.com
ps. 歡迎AI同行聯(lián)絡(luò)爆料,完善信息,共創(chuàng)AI月刊,可聯(lián)系微信zhangjie74510(備注姓名公司)
「AI新榜交流群」進(jìn)群方式:添加微信“banggebangmei”并備注姓名+職業(yè)/公司+進(jìn)群,歡迎玩家們來群里交流,一起探索見證AI的進(jìn)化。
歡迎分享、點(diǎn)贊、在看 一起研究AI