人物專訪監(jiān)管
制造芯片
6G運(yùn)營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

Evermind 助力 AI 模型記憶實(shí)現(xiàn)自演化
在聊EverMemOS為啥強(qiáng)之前,我們不妨先來思考一個(gè)問題:當(dāng)你使用大模型時(shí),是不是總覺得有什么地方不得勁?
前一秒還聊得好好的,下一秒就忘得一干二凈,要么就是拆東墻補(bǔ)西墻,這個(gè)記住了,另一個(gè)又忘了。
歸根結(jié)底,不是模型能力不夠強(qiáng),而是記憶功能不夠用。
這就要回到大模型的底層架構(gòu)上講,眾所周知,當(dāng)前大模型普遍用的是Transformer架構(gòu),其記憶核心在于自注意力機(jī)制,也就是上下文窗口的信息緩存。

它會(huì)通過計(jì)算當(dāng)前窗口的token間關(guān)系,理解上下文含義,但實(shí)際運(yùn)行中由于受限于物理內(nèi)存資源,窗口長度是有限的,一旦文本長度超過窗口限制,信息就會(huì)被截?cái)噙z忘。
另外,隨著對(duì)話變長,KV Cache占用的顯存也會(huì)逐漸膨脹。影響推理效率的同時(shí),為了節(jié)省資源,現(xiàn)有的技術(shù)往往會(huì)選擇壓縮舊記憶,從而導(dǎo)致記憶細(xì)節(jié)變得模糊。
這顯然影響了用戶的實(shí)際體驗(yàn),舉個(gè)例子be like:
當(dāng)你需要AI協(xié)助寫一篇論文時(shí), 從確定選題→檢索相關(guān)文獻(xiàn)→擬結(jié)構(gòu)→寫初稿→修改優(yōu)化到最后定稿,這當(dāng)中勢(shì)必需要多輪交互,但AI壓根記不住你之前寫的內(nèi)容,最后輸出的結(jié)果也只能是驢頭不對(duì)馬嘴。
那怎么辦呢?學(xué)術(shù)界為此提出了三種技術(shù)方案:
基于外部存儲(chǔ)的記憶(External Storage based Memory)
這就類似于為大模型配備了一個(gè)外部數(shù)據(jù)庫,里面系統(tǒng)存儲(chǔ)著用戶相關(guān)的歷史記錄。當(dāng)用戶提問時(shí),系統(tǒng)就會(huì)先去數(shù)據(jù)庫里搜索相關(guān)文檔,再將其和問題一起喂給AI。
但這并非真正的記憶,而是在考場上臨時(shí)翻閱教材。
• 基于模型參數(shù)的記憶(Model Parameter based Memory)
該方案本質(zhì)是將記憶通過訓(xùn)練內(nèi)化成模型的一部分,通過微調(diào)SFT或持續(xù)預(yù)訓(xùn)練,讓模型在看到某個(gè)問題時(shí),就能迅速通過參數(shù)內(nèi)部權(quán)重指向正確答案。
DeepSeek的最新成果便是用的這個(gè)思路,但再訓(xùn)練的成本極高且容易遺忘,不適合個(gè)性化和短期記憶。
• 基于隱狀態(tài)的記憶(Latent State based Memory)
通過保存模型的中間推理狀態(tài)(如KV Cache),達(dá)成類人的短期記憶或工作記憶。
它非常適用于理解復(fù)雜的對(duì)話語境,但換言之,它是一次性的,只能短暫存在,無法長久記憶。
其中業(yè)界用的比較多的方法,還是RAG(檢索增強(qiáng)生成),也就是基于外部存儲(chǔ)的記憶。
但RAG同樣缺點(diǎn)明顯。首先,其工作方式是將長文本切成一個(gè)個(gè)片段,會(huì)破壞信息的連貫性,讓模型難以理解復(fù)雜的因果關(guān)系。
其次RAG依賴向量相似度檢索,擅長找語義相近的內(nèi)容,但在時(shí)序匹配上不足;另外RAG知識(shí)是相對(duì)靜態(tài)的,如果要更新信息,則需要高昂的成本支持。

基于此,EverMemOS應(yīng)運(yùn)而生。
學(xué)習(xí)大腦記憶機(jī)制,成了
啟發(fā)于腦科學(xué)技術(shù)的研究成果,盛大一直以來非常重視長期記憶領(lǐng)域的研究。早在2024年10月,盛大團(tuán)隊(duì)就對(duì)外發(fā)布了長期記憶領(lǐng)域的綱領(lǐng)性文章《Long Term Memory-The Foundation of AI Self-Evolution》。
基于盛大多個(gè)團(tuán)隊(duì)在該領(lǐng)域的持續(xù)積累,EverMind在2025年8月正式啟動(dòng)EverMemOS項(xiàng)目,并于11月對(duì)外正式發(fā)布開源版本。
EverMemOS是EverMind打造的首款A(yù)I記憶基礎(chǔ)設(shè)施,對(duì)比同賽道團(tuán)隊(duì),似乎姍姍來遲。
Mem0、Zep等產(chǎn)品最早都能追溯到2024年,現(xiàn)在商業(yè)化最成功的開發(fā)者框架Letta(原MemGPT)也是2023年就開始起步。
EverMemOS卻交出了亮眼的答卷:最晚入場,但效果彎道超車。
從技術(shù)角度看,它同時(shí)繼承了基于外部存儲(chǔ)和基于隱狀態(tài)兩種路徑。不過業(yè)內(nèi)并非沒有嘗試過此類方案,但EverMind顯然在記憶提取的精準(zhǔn)度和邏輯一致性上實(shí)現(xiàn)了更優(yōu)的平衡。
原因在于EverMind抓住了精髓,用鄧亞峰的話說,就是:
通過EverMemOS,我們賦予智能體一個(gè)活的、不斷演化的歷史。
這里的關(guān)鍵詞其實(shí)是“活的”。那么如何能保存最鮮活的記憶呢?人類大腦。
這就引出了EverMind的獨(dú)特思路——生物啟發(fā)。

具體來講,EverMemOS通過模擬人類記憶的形成并轉(zhuǎn)化為計(jì)算框架,利用三階段層層遞進(jìn)以實(shí)現(xiàn)大模型長期記憶的存儲(chǔ)和提。
Step 1:情景軌跡構(gòu)建。
對(duì)應(yīng)人腦的海馬體和內(nèi)嗅皮層,可以將連續(xù)的對(duì)話內(nèi)容拆分成一個(gè)個(gè)獨(dú)立的記憶單元(MemCell),每個(gè)單元里不僅記錄有完整的聊天內(nèi)容,還包括一些關(guān)鍵事實(shí)、時(shí)效信息等。
Step 2:語義整合。
類比新皮層(前額葉皮層+顳葉皮層),系統(tǒng)會(huì)將內(nèi)容相關(guān)的記憶單元?dú)w類在一起,形成主題化的記憶場景(MemScene),同時(shí)還會(huì)更新用戶畫像,區(qū)分用戶的長期穩(wěn)定偏好和短期臨時(shí)狀態(tài)。
Step 3:重構(gòu)式回憶。
這一步對(duì)應(yīng)的是前額葉皮層和海馬體的協(xié)同機(jī)制,當(dāng)用戶提問時(shí),系統(tǒng)就會(huì)在記憶場景的引導(dǎo)下進(jìn)行智能檢索,只挑選出必要且足夠的記憶內(nèi)容,用于后續(xù)的推理任務(wù)。
由此,AI學(xué)會(huì)像人類一樣記憶——這不僅是知識(shí)的數(shù)據(jù)庫存儲(chǔ),更是認(rèn)知系統(tǒng)的深度整合。如此一來,即便是在多個(gè)Agent之間,也能實(shí)現(xiàn)信息的高效傳遞。

至于效果如何,咱們還是眼見為實(shí),看看基準(zhǔn)測(cè)試結(jié)果。
團(tuán)隊(duì)選取了4個(gè)主流記憶基準(zhǔn)測(cè)試,以及多種大模型記憶增強(qiáng)方法。所有方法都基于同一基礎(chǔ)大模型(GPT-4o-mini或GPT-4.1-mini)進(jìn)行測(cè)試。
結(jié)果也很明顯,EverMemOS大獲全勝,全面超越現(xiàn)有記憶系統(tǒng)和全上下文模型。

中在LoCoMo上,準(zhǔn)確率直接一躍來到93.05%,尤其是在多跳推理和時(shí)序任務(wù)上表現(xiàn)突出,分別提升19.7%和16.1%,同時(shí)token使用量和計(jì)算成本得到大幅度降低。
在多會(huì)話對(duì)話評(píng)估LongMemEval里,EverMemOS同樣以83%的準(zhǔn)確率位居榜首,說明在面對(duì)跨度極大、信息量極高的場景中,EverMemOS依舊能夠精準(zhǔn)檢索和關(guān)聯(lián)到過去的信息,并且通過持續(xù)交流還會(huì)不斷進(jìn)化完善自己。
HaluMem由MemTensor和中國電信研究院聯(lián)合發(fā)布,是業(yè)界首個(gè)面向AI記憶系統(tǒng)的操作級(jí)幻覺評(píng)估基準(zhǔn)。而EverMemOS在保證記憶完整性的同時(shí),也顯著改善了幻覺現(xiàn)象。
在PersonaMem v2里,EverMemOS在九個(gè)復(fù)雜場景中依舊全場最佳,保證了深度個(gè)性化和行為一致性。

足以見得,EverMemOS是相當(dāng)全能的一枚選手,記性好、搜得準(zhǔn),關(guān)鍵還運(yùn)行速度快、成本還夠低,最長可突破百兆上下文限制。
一邊幫大模型減負(fù),一邊幫大模型補(bǔ)記憶力,堪稱大模型版安神補(bǔ)腦液。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
盤點(diǎn)2025|光纖光纜:周期性放緩之下,確定性開始凸顯
在2025年,光纖光纜廠商們習(xí)慣于用“周期性”一詞來描述當(dāng)前的困難,相比于寬帶普及、4G升級(jí)換代帶來的流量需求猛增這一巨大業(yè)務(wù)增長?扇缃裨谒⒅桃曨l、看著帶貨的新日常生活常態(tài)下,盡..[詳細(xì)]
盤點(diǎn)2025|人工智能:破局前行、以智啟新,同赴人機(jī)共生新未來
2025年,人工智能行業(yè)迎來技術(shù)迭代與價(jià)值落地的雙重關(guān)口。這一年里既延續(xù)著近年來的高速增長態(tài)勢(shì),也迎來從野蠻生長向規(guī)范提質(zhì)的深刻轉(zhuǎn)型。 [詳細(xì)]
盤點(diǎn)2025|算力行業(yè):量質(zhì)齊升的進(jìn)階之路
在數(shù)字經(jīng)濟(jì)加速滲透全球經(jīng)濟(jì)社會(huì)各領(lǐng)域的今天,算力已成為繼電力、水資源之后的關(guān)鍵生產(chǎn)要素,是支撐數(shù)字中國建設(shè)、推動(dòng)高質(zhì)量發(fā)展的核心基礎(chǔ)設(shè)施。算力的規(guī)模與質(zhì)量直接決定了數(shù)字經(jīng)濟(jì)的發(fā)..[詳細(xì)]
盤點(diǎn)2025|芯片:AI依舊是挖潛點(diǎn),應(yīng)用進(jìn)一步多樣化
時(shí)至2025年年底,人們已經(jīng)開始漸漸習(xí)慣,有事聽聽AI給出的參考意見。其背后的算力支撐也在逐步加強(qiáng),像是更先進(jìn)的制程,以及向更多端側(cè)設(shè)備的拓展。另一方面,AI又一石激起千層浪,機(jī)遇與需..[詳細(xì)]
盤點(diǎn)2025 | 從5G到6G:深耕與突破并行,開啟智能連接新紀(jì)元
2025年,全球通信產(chǎn)業(yè)站在了一個(gè)關(guān)鍵的歷史交匯點(diǎn)。這一年既是“十四五”規(guī)劃的收官年,5G建設(shè)成果全面轉(zhuǎn)化的驗(yàn)收年,也是“十五五”規(guī)劃啟幕,6G布局從技術(shù)探索邁向工程落地的奠基之年,更..[詳細(xì)]
盤點(diǎn)2025|量子信息:三大領(lǐng)域技術(shù)持續(xù)演進(jìn),產(chǎn)業(yè)發(fā)展未來可期
以量子計(jì)算、量子通信和量子精密測(cè)量為代表的量子信息技術(shù)是挑戰(zhàn)人類調(diào)控微觀世界能力極限的世紀(jì)系統(tǒng)工程,是對(duì)傳統(tǒng)技術(shù)體系產(chǎn)生沖擊、進(jìn)行重構(gòu)的重大顛覆性創(chuàng)新,將引領(lǐng)新一輪科技革命和產(chǎn)..[詳細(xì)]
盤點(diǎn)2025|2025年智能終端趨勢(shì)洞察:AI重構(gòu)體驗(yàn),超級(jí)終端時(shí)代加速到來
2025年,全球智能終端行業(yè)站在了技術(shù)革新與生態(tài)重構(gòu)的十字路口。AI技術(shù)的規(guī);瘽B透、折疊屏形態(tài)的成熟落地、跨設(shè)備協(xié)同的深度演進(jìn),正在重塑終端產(chǎn)品的價(jià)值邏輯與市場格局。[詳細(xì)]
專題|2026世界移動(dòng)通信大會(huì)
2026年3月2日至5日,世界移動(dòng)通信大會(huì)(MWC)在西班牙巴塞羅那Fira Gran Via會(huì)展中心拉開帷幕。本屆展會(huì)以“The IQ Era”(眾智啟新)為主題,向世界展示AI與通信深度融合的無限可能。..[詳細(xì)]
MWC26啟幕:AI+通信深度融合,重構(gòu)行業(yè)價(jià)值邏輯
三月的巴塞羅那,科技盛宴如期而至。3月2日至5日,世界移動(dòng)通信大會(huì)(MWC26)將拉開帷幕,恰逢展會(huì)落戶當(dāng)?shù)?0周年,這場全球通信行業(yè)的開春盛事,正承載著定義下一個(gè)十年科技革命和產(chǎn)業(yè)變革..[詳細(xì)]
從“參與”到“主導(dǎo)”:華為開源之路越走越寬
如今國內(nèi)使用開源軟件、貢獻(xiàn)開源社區(qū)已經(jīng)蔚然成風(fēng),不過很少有企業(yè)像華為一樣迅速從使用開源、參與開源到成為諸多大型開源項(xiàng)目的主要貢獻(xiàn)者。華為計(jì)算開源業(yè)務(wù)總經(jīng)理李永樂在近日接受采訪時(shí)..[詳細(xì)]












