每日微信報(bào)
人物專訪監(jiān)管
制造芯片
6G 運(yùn)營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

Evermind 助力 AI 模型記憶實(shí)現(xiàn)自演化

2026年3月3日 15:50CCTIME飛象網(wǎng)

在聊EverMemOS為啥強(qiáng)之前，我們不妨先來思考一個(gè)問題：當(dāng)你使用大模型時(shí)，是不是總覺得有什么地方不得勁？

前一秒還聊得好好的，下一秒就忘得一干二凈，要么就是拆東墻補(bǔ)西墻，這個(gè)記住了，另一個(gè)又忘了。

歸根結(jié)底，不是模型能力不夠強(qiáng)，而是記憶功能不夠用。

這就要回到大模型的底層架構(gòu)上講，眾所周知，當(dāng)前大模型普遍用的是Transformer架構(gòu)，其記憶核心在于自注意力機(jī)制，也就是上下文窗口的信息緩存。

它會(huì)通過計(jì)算當(dāng)前窗口的token間關(guān)系，理解上下文含義，但實(shí)際運(yùn)行中由于受限于物理內(nèi)存資源，窗口長度是有限的，一旦文本長度超過窗口限制，信息就會(huì)被截?cái)噙z忘。

另外，隨著對(duì)話變長，KV Cache占用的顯存也會(huì)逐漸膨脹。影響推理效率的同時(shí)，為了節(jié)省資源，現(xiàn)有的技術(shù)往往會(huì)選擇壓縮舊記憶，從而導(dǎo)致記憶細(xì)節(jié)變得模糊。

這顯然影響了用戶的實(shí)際體驗(yàn)，舉個(gè)例子be like：

當(dāng)你需要AI協(xié)助寫一篇論文時(shí)，從確定選題→檢索相關(guān)文獻(xiàn)→擬結(jié)構(gòu)→寫初稿→修改優(yōu)化到最后定稿，這當(dāng)中勢(shì)必需要多輪交互，但AI壓根記不住你之前寫的內(nèi)容，最后輸出的結(jié)果也只能是驢頭不對(duì)馬嘴。

那怎么辦呢？學(xué)術(shù)界為此提出了三種技術(shù)方案：

基于外部存儲(chǔ)的記憶（External Storage based Memory）

這就類似于為大模型配備了一個(gè)外部數(shù)據(jù)庫，里面系統(tǒng)存儲(chǔ)著用戶相關(guān)的歷史記錄。當(dāng)用戶提問時(shí)，系統(tǒng)就會(huì)先去數(shù)據(jù)庫里搜索相關(guān)文檔，再將其和問題一起喂給AI。

但這并非真正的記憶，而是在考場上臨時(shí)翻閱教材。

• 基于模型參數(shù)的記憶（Model Parameter based Memory）

該方案本質(zhì)是將記憶通過訓(xùn)練內(nèi)化成模型的一部分，通過微調(diào)SFT或持續(xù)預(yù)訓(xùn)練，讓模型在看到某個(gè)問題時(shí)，就能迅速通過參數(shù)內(nèi)部權(quán)重指向正確答案。

DeepSeek的最新成果便是用的這個(gè)思路，但再訓(xùn)練的成本極高且容易遺忘，不適合個(gè)性化和短期記憶。

• 基于隱狀態(tài)的記憶（Latent State based Memory）

通過保存模型的中間推理狀態(tài)（如KV Cache），達(dá)成類人的短期記憶或工作記憶。

它非常適用于理解復(fù)雜的對(duì)話語境，但換言之，它是一次性的，只能短暫存在，無法長久記憶。

其中業(yè)界用的比較多的方法，還是RAG（檢索增強(qiáng)生成），也就是基于外部存儲(chǔ)的記憶。

但RAG同樣缺點(diǎn)明顯。首先，其工作方式是將長文本切成一個(gè)個(gè)片段，會(huì)破壞信息的連貫性，讓模型難以理解復(fù)雜的因果關(guān)系。

其次RAG依賴向量相似度檢索，擅長找語義相近的內(nèi)容，但在時(shí)序匹配上不足；另外RAG知識(shí)是相對(duì)靜態(tài)的，如果要更新信息，則需要高昂的成本支持。

基于此，EverMemOS應(yīng)運(yùn)而生。

學(xué)習(xí)大腦記憶機(jī)制，成了

啟發(fā)于腦科學(xué)技術(shù)的研究成果，盛大一直以來非常重視長期記憶領(lǐng)域的研究。早在2024年10月，盛大團(tuán)隊(duì)就對(duì)外發(fā)布了長期記憶領(lǐng)域的綱領(lǐng)性文章《Long Term Memory-The Foundation of AI Self-Evolution》。

基于盛大多個(gè)團(tuán)隊(duì)在該領(lǐng)域的持續(xù)積累，EverMind在2025年8月正式啟動(dòng)EverMemOS項(xiàng)目，并于11月對(duì)外正式發(fā)布開源版本。

EverMemOS是EverMind打造的首款A(yù)I記憶基礎(chǔ)設(shè)施，對(duì)比同賽道團(tuán)隊(duì)，似乎姍姍來遲。

Mem0、Zep等產(chǎn)品最早都能追溯到2024年，現(xiàn)在商業(yè)化最成功的開發(fā)者框架Letta（原MemGPT）也是2023年就開始起步。

EverMemOS卻交出了亮眼的答卷：最晚入場，但效果彎道超車。

從技術(shù)角度看，它同時(shí)繼承了基于外部存儲(chǔ)和基于隱狀態(tài)兩種路徑。不過業(yè)內(nèi)并非沒有嘗試過此類方案，但EverMind顯然在記憶提取的精準(zhǔn)度和邏輯一致性上實(shí)現(xiàn)了更優(yōu)的平衡。

原因在于EverMind抓住了精髓，用鄧亞峰的話說，就是：

通過EverMemOS，我們賦予智能體一個(gè)活的、不斷演化的歷史。

這里的關(guān)鍵詞其實(shí)是“活的”。那么如何能保存最鮮活的記憶呢？人類大腦。

這就引出了EverMind的獨(dú)特思路——生物啟發(fā)。

具體來講，EverMemOS通過模擬人類記憶的形成并轉(zhuǎn)化為計(jì)算框架，利用三階段層層遞進(jìn)以實(shí)現(xiàn)大模型長期記憶的存儲(chǔ)和提�。�

Step 1：情景軌跡構(gòu)建。

對(duì)應(yīng)人腦的海馬體和內(nèi)嗅皮層，可以將連續(xù)的對(duì)話內(nèi)容拆分成一個(gè)個(gè)獨(dú)立的記憶單元（MemCell），每個(gè)單元里不僅記錄有完整的聊天內(nèi)容，還包括一些關(guān)鍵事實(shí)、時(shí)效信息等。

Step 2：語義整合。

類比新皮層（前額葉皮層+顳葉皮層），系統(tǒng)會(huì)將內(nèi)容相關(guān)的記憶單元?dú)w類在一起，形成主題化的記憶場景（MemScene），同時(shí)還會(huì)更新用戶畫像，區(qū)分用戶的長期穩(wěn)定偏好和短期臨時(shí)狀態(tài)。

Step 3：重構(gòu)式回憶。

這一步對(duì)應(yīng)的是前額葉皮層和海馬體的協(xié)同機(jī)制，當(dāng)用戶提問時(shí)，系統(tǒng)就會(huì)在記憶場景的引導(dǎo)下進(jìn)行智能檢索，只挑選出必要且足夠的記憶內(nèi)容，用于后續(xù)的推理任務(wù)。

由此，AI學(xué)會(huì)像人類一樣記憶——這不僅是知識(shí)的數(shù)據(jù)庫存儲(chǔ)，更是認(rèn)知系統(tǒng)的深度整合。如此一來，即便是在多個(gè)Agent之間，也能實(shí)現(xiàn)信息的高效傳遞。

至于效果如何，咱們還是眼見為實(shí)，看看基準(zhǔn)測(cè)試結(jié)果。

團(tuán)隊(duì)選取了4個(gè)主流記憶基準(zhǔn)測(cè)試，以及多種大模型記憶增強(qiáng)方法。所有方法都基于同一基礎(chǔ)大模型（GPT-4o-mini或GPT-4.1-mini）進(jìn)行測(cè)試。

結(jié)果也很明顯，EverMemOS大獲全勝，全面超越現(xiàn)有記憶系統(tǒng)和全上下文模型。

中在LoCoMo上，準(zhǔn)確率直接一躍來到93.05%，尤其是在多跳推理和時(shí)序任務(wù)上表現(xiàn)突出，分別提升19.7%和16.1%，同時(shí)token使用量和計(jì)算成本得到大幅度降低。

在多會(huì)話對(duì)話評(píng)估LongMemEval里，EverMemOS同樣以83%的準(zhǔn)確率位居榜首，說明在面對(duì)跨度極大、信息量極高的場景中，EverMemOS依舊能夠精準(zhǔn)檢索和關(guān)聯(lián)到過去的信息，并且通過持續(xù)交流還會(huì)不斷進(jìn)化完善自己。

HaluMem由MemTensor和中國電信研究院聯(lián)合發(fā)布，是業(yè)界首個(gè)面向AI記憶系統(tǒng)的操作級(jí)幻覺評(píng)估基準(zhǔn)。而EverMemOS在保證記憶完整性的同時(shí)，也顯著改善了幻覺現(xiàn)象。

在PersonaMem v2里，EverMemOS在九個(gè)復(fù)雜場景中依舊全場最佳，保證了深度個(gè)性化和行為一致性。

足以見得，EverMemOS是相當(dāng)全能的一枚選手，記性好、搜得準(zhǔn)，關(guān)鍵還運(yùn)行速度快、成本還夠低，最長可突破百兆上下文限制。

一邊幫大模型減負(fù)，一邊幫大模型補(bǔ)記憶力，堪稱大模型版安神補(bǔ)腦液。

編輯：T01

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載，請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題，請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。