大模型明星企業(yè)DeepSeek深夜“上新”。據(jù)AIGC開放社區(qū),5月29日凌晨,DeepSeek開源了R1最新0528版本。DeepSeek目前沒有對(duì)該版本進(jìn)行任何說明,又只是“悄悄”地開放了模型。估計(jì)很快會(huì)放出模型卡介紹更多功能。但已經(jīng)有網(wǎng)友迫不及待的對(duì)新版R1進(jìn)行測(cè)試,在著名代碼測(cè)試平臺(tái)Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。也有網(wǎng)友對(duì)新版R1的風(fēng)格進(jìn)行了測(cè)試,幾乎和OpenAI的o3差不多。
此前,DeepSeek在官方交流群中發(fā)布通知:DeepSeek R1模型已完成小版本試升級(jí),歡迎前往官方網(wǎng)頁、App、小程序測(cè)試(打開深度思考),API接口和使用方式保持不變。DeepSeek曾在今年3月對(duì)V3模型進(jìn)行小版本升級(jí),同樣是通過官方交流群率先宣布,隨后公布了具體更新內(nèi)容。
3月25日晚,DeepSeek在官方賬號(hào)上正式宣布V3模型完成小版本升級(jí)的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細(xì)節(jié),包括推理、前端開發(fā)、中文寫作等幾個(gè)方面的能力優(yōu)化。
彼時(shí),據(jù)海外專業(yè)AI模型評(píng)測(cè)機(jī)構(gòu)最新排名,新版V3模型是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
關(guān)于此次最新升級(jí)的R1模型,據(jù)中國(guó)基金報(bào)報(bào)道,據(jù)用戶反饋,DeepSeek升級(jí)后的模型,思維鏈 (CoT) 的行為似乎發(fā)生了顯著變化。
也有用戶總結(jié)了更新后的幾個(gè)亮點(diǎn),其中包括:現(xiàn)在像Google模型一樣進(jìn)行深度推理;改進(jìn)寫作任務(wù)——更自然、格式更好;獨(dú)特的推理風(fēng)格——不僅快速,而且深思熟慮;長(zhǎng)時(shí)間思考——每個(gè)任務(wù)最多30~60分鐘。
DeepSeek于今年1月正式發(fā)布高性能開源推理大語言模型R1,該模型在數(shù)學(xué)推理、編程、邏輯分析等領(lǐng)域表現(xiàn)亮眼,以極低成本實(shí)現(xiàn)對(duì)OpenAI o1等閉源模型的性能對(duì)標(biāo),迅速成為全球AI領(lǐng)域焦點(diǎn),引發(fā)熱議。
相比于此次小版本升級(jí)的R1大模型,外界更期待DeepSeek推出R2模型。此前,有許多關(guān)于R2大模型的傳聞出現(xiàn),比如“參數(shù)規(guī)模被曝達(dá)到驚人的1.2萬億,相比前代R1的6710億參數(shù)幾乎翻倍等”。但截至目前,并未獲得官方證實(shí)。