再度延期！消息稱DeepSeekV4將下月發(fā)布長(zhǎng)期記憶上取得突破

快看科技資訊 2026-03-14 15:47:59

電競(jìng)體育3月14報(bào)道?據(jù)《白鯨實(shí)驗(yàn)室》爆料，DeepSeek V4 和姚順雨領(lǐng)銜操刀的混元新模型，均預(yù)計(jì)將于下個(gè)月（2026 年 4 月）發(fā)布。

值得一提的是，回顧今年以來的多次爆料，無論是春節(jié)還是3月首周，DeepSeek V4的發(fā)布日期傳聞均一一落空。

3 月 11 日，OpenRouter 新上線了兩個(gè)神秘模型——Healer Alpha 與 Hunter Alpha。OpenRouter 頁(yè)面顯示，Healer Alpha 被描述為具備視覺、聽覺、推理與行動(dòng)能力的前沿全模態(tài)模型；社區(qū)因此迅速將其與尚未發(fā)布的新一代國(guó)產(chǎn)模型聯(lián)系起來，據(jù)稱捕捉到了「系統(tǒng)提示詞中要求嚴(yán)格遵守中國(guó)法律法規(guī)」。

據(jù)悉，DeepSeek V4 將于 4 月正式上線。作為梁文鋒打磨已久的多模態(tài)大模型，DeepSeek V4 除了代碼能力躍升，還會(huì)在長(zhǎng)期記憶上取得突破。這一方向與 DeepSeek 團(tuán)隊(duì)近幾個(gè)月的公開研究脈絡(luò)基本一致。

2026 年 1 月，梁文鋒署名論文《Conditional Memory via Scalable Lookup》提出「條件記憶」機(jī)制；2025 年 12 月的《mHC: Manifold-Constrained Hyper-Connections》則繼續(xù)指向底層架構(gòu)優(yōu)化。

兩篇論文都在嘗試處理 Transformer 在記憶、訓(xùn)練穩(wěn)定性和長(zhǎng)上下文上的瓶頸。梁文鋒過去半年的主要工作，是補(bǔ)齊 DeepSeek 在視覺內(nèi)容處理和 AI 搜索上的短板。為強(qiáng)化 AI 搜索能力，DeepSeek 早在去年就已與百度展開合作。

梁文鋒這次為 DeepSeek V4 設(shè)定的關(guān)鍵迭代方向，正是長(zhǎng)期記憶能力。DeepSeek V4 還將深度適配國(guó)產(chǎn)芯片，并有望成為首個(gè)完全跑在國(guó)產(chǎn)算力生態(tài)上的大模型。

電競(jìng)免費(fèi)觀看_游戲免費(fèi)觀看_英雄聯(lián)盟免費(fèi)觀看_電競(jìng)高清在線_游戲高清在線_英雄聯(lián)盟高清在線

電競(jìng) 游戲英雄聯(lián)盟 LPL

上一篇： icon：DOTA簡(jiǎn)直就是moba之魂幾個(gè)人玩很影響生活一玩就是一天

下一篇：外網(wǎng)排先鋒賽戰(zhàn)隊(duì)實(shí)力榜：GEN排名榜首BLG與JDG分列二、三G2第五

相關(guān)信息