产品更新｜多视角记忆、检索精筛与 Skills 本地化上线

本次更新围绕"记忆系统工程化"和"Agent能力结构化"两大方向，重点推出多视角记忆系统，支持每个Agent拥有独立记忆世界。新增混合检索机制提升召回质量，并优化Token消耗控制。Skills能力升级为本地化存储，MindDock插件实现跨平台接入。记忆删除机制强化为双通道模式，调度系统完成模块化重构。文档记忆支持原文与摘要双轨检索，时间过滤精度提升至秒级

记忆张量MemTensor

151人浏览 · 2026-02-13 17:48:09

记忆张量MemTensor · 2026-02-13 17:48:09 发布

请添加图片描述

本次更新围绕"记忆系统工程化"和"Agent 能力结构化"两条主线，对云服务和开源项目做了系统升级。核心改进集中在多视角记忆、记忆版本管理、检索召回质量、Skills 本地化，以及若干生产环境的稳定性优化。

本次发布亮点

请添加图片描述

1. 多视角记忆：让每个 Agent 拥有“自己的记忆世界”

传统 Agent 架构里，记忆通常是全局共享的，所有 Agent 共享同一份"客观记忆池"。这在多角色系统、多 Agent 协作场景中容易导致行为冲突和角色混淆。

我们上线了多视角记忆（Multi-Perspective Memory），为每个 Agent 引入"主观视角"的记忆结构。同一事实可以在不同 Agent 那里形成不同视角的记忆表达和认知结构。每个 Agent 的记忆体拥有自己的"主观视角"，适合需要角色化、队伍化的 AI 游戏或多 Agent 协作场景，比如组队游戏、角色化陪伴类应用。

帮助系统在多 Agent 协作时避免"一刀切"的全局记忆，便于实现个性化行为和角色差异化决策。记忆不再是单一全局视图，而是 Agent 级别的认知世界模型。

请添加图片描述

2. 多视角 AI 小游戏 Demo：多 Agent 记忆协作的真实形态

基于多视角记忆的小游戏"冲顶鳌太线"已经上线，提供组队冲顶玩法的示例。Demo 以组队协作为核心场景，多 Agent 各自拥有独立视角记忆，同时参与协作任务目标，形成"个体认知 + 团队目标"的复合结构。

该 Demo 以组队协作为核心场景：

多 Agent 各自拥有独立视角记忆
同时参与协作任务目标
形成“个体认知 + 团队目标”的复合结构

3. 检索记忆（search/memory）能力增强：更准 + 更省 Token

3.1 关键词召回 + 语义相似度混合排序

在事实记忆检索链路中新增 关键词召回机制，并与原有语义相似度检索进行混合排序：

提升召回覆盖率；
提升召回准确率；
避免单一语义相似导致的语义漂移问题。

实测效果：

LongMemEval 提升 1.8%；
Locomo 提升 0.72%。

该能力默认开启，开发者无需额外配置。

3.2 消耗 Token 更少的记忆召回策略（相关性精筛）

新增 relativity（相关性阈值） 与 memory_limit_number/top_k 等参数，允许开发者按阈值只返回高相关性的记忆，从而显著降低注入 prompt 的 token 消耗，控制成本并提高上下文质量。

为解决记忆注入导致的 Token 消耗问题，search/memory 接口新增 相关性精筛机制：

relativity：相关性阈值（0~1）；
memory_limit_number / top_k：召回数量上限。

系统只返回：

相关性 ≥ 阈值；
且 数量 ≤ 上限 的记忆集合。

这使 MemOS 的记忆注入从“暴力拼接”升级为：

精准召回 + 强相关过滤 + Token 成本可控

📌 当前 relativity 仅对 事实记忆、偏好记忆 生效。

**示例（云服务）**：

data = {
  "user_id": "memos_user_123",
  "query": "为我规划5天的成都游。",
  "relativity": 0.8, # 只返回相关性 >= 0.8 的记忆
  "memory_limit_number": 9 # 最多返回 9 条
}

**示例（开源）**：

{
  "user_id": "memos_user_123",
  "readable_cube_ids": ["memos_user_123_cube"],
  "query": "为我规划5天的成都游。",
  "relativity": 0.8,
  "top_k": 9
}

注意：relativity 当前仅对事实记忆与偏好记忆生效。

4. Skills 能力工程化升级 + MindDock 插件接入

4.1 Skills 本地化存储机制

Skills 文件支持本地保存，系统会为本地 Skills 自动生成专属访问 URL，LLM 可通过接口远程加载并运行 Skills，支持私有化部署与企业级管理。

这使 Skills 从"运行态能力"升级为可管理、可分发、可治理的能力资产。

开源项目中，Skills 文件现已支持本地保存：

系统自动生成专属访问 URL
大模型可通过接口远程加载 Skills
支持私有化部署与企业级管理

4.2 Skills 生成质量优化

系统现在可以基于用户历史消息生成更完整、更结构化的 Skills 描述，使技能从"零散规则"升级为结构化能力模块。

配置本地储存（开源）（简要步骤）：

Step 1: 添加环境变量到项目根目录的.env 文件

SKILLS_REPO_BACKEND=LOCAL
SKILLS_LOCAL_DIR=/tmp/upload_skill_memory/ # 最终存储位置
SKILLS_LOCAL_TMP_DIR=/tmp/skill_memory/ # 生成时的临时位置
SKILLS_LLM=gpt-4o

Step 2: 启动本地服务

uvicorn memos.api.server_api:app --host 0.0.0.0 --port 8001 --workers 1

4.3 MindDock 插件能力接入

插件 MindDock 现已支持：

在 ChatGPT；
千问；
等多平台聊天环境中。

并支持实时注入 Skills，使 Skills 成为跨平台通用能力层，而非单一模型绑定能力。

请添加图片描述

5. MCP 删除记忆路径增强：删除不再是“弱操作”

为更好支持用户删除记忆的意图识别与落地，MCP 处理逻辑更新为：

在识别到删除意图后，调用 deleteMemory 接口直接删除对应记忆；
同时调用 addFeedback 接口以记录用户反馈并更新相关记忆项，确保删除操作更可靠且可审计。

从“模糊删除”升级为双通道强语义删除机制，确保用户对记忆控制权的完整性与可靠性。

请添加图片描述

6. 记忆调度模块化重构：工程级稳定性升级

记忆调度任务处理器实现模块化重构并集中统一管理。

重构内容包括：

将检索流程拆分为：search →enhance→rerank→ filter 四阶段；
新增 search_service 统一 API 与 Scheduler 的文本检索实现；
修复 Redis Streams 调度消息序列化问题，补齐 mem_read/pref_add processor 的 user_context 传递。

我们提升了调度的可靠性、可观测性与可扩展性，便于在高并发场景下稳定运行。

请添加图片描述

7. 文档记忆双轨检索：记忆 + 原文 + 上下文协同

新能力：

支持原文片段（RawFileMemory）与记忆（SummaryMemory）混合检索，并可按需同时召回原文上下文以增强长文本语义连贯性；
search_memory_type 支持三种模式：All（原文 + 记忆混合）、AllSummaryMemory（仅记忆）、RawFileMemory（仅原文片段）；
neighbor_discovery 配置用于是否召回原文分片的上下文。

现在，文档记忆同时具备：

语义抽象能力；
原文可追溯性；
上下文连贯性。

开源示例：

data{
  "user_id": "testfile", 
  "readable_cube_ids": ["testfile_cube"],
  "query": "minddock 适配什么浏览器",
  "search_memory_type": "AllSummaryMemory", # 三种检索模式 All | AllSummaryMemory | RawFileMemory
  "neighbor_discovery": "true", # 若想召回原文上下文则置为 True
}

检索到的结果中：memory_type 新增 RawFileMemory（记忆原文片段）。

8. 记忆过滤器（Filter）支持秒级时间精度

filter 字段现在支持秒级别时间范围过滤（例如 "create_time": "2026-02-12 10:00:00"），适用于检索/获取记忆与对话接口的精确时窗筛选，提高审计与时效性控制的能力。

示例：

"filter" : {
  "and": [
    {"create_time": {"gt": "2026-02-01 10:00:00"}},
    {"create_time": {"lt": "2026-02-12 10:00:00"}}
  ]
}

9. 对话接口（Chat）稳定性与能力增强

修复了 qwen3-32b 回答失败的问题，恢复模型可用性；
对话接口现支持 relativity 字段，允许开发者在对话阶段控制召回记忆的相关性阈值，从源头减少低价值上下文注入。

对话系统在稳定性与成本控制层面同步升级。

10. 开源社区（CHANGELOG 摘要）

新增 / 新功能

记忆检索优化（关键词检索 + 语义混合）；
文档记忆双轨检索：原文 + 记忆协同检索；
文档记忆上下文唤醒（分片上下文）；
relativity 精筛字段（0~1）；
MindDock 与云服务 Skill 支持；
MCP 删除意图触发 deleteMemory 与 addFeedback；
Chat 接口可传 relativity。

改进

检索 pipeline 重构（Search → Enhance → Rerank → Filter）；
调度任务处理器模块化与 Redis Streams 修复；
Skills 本地化存储与 URL 发布；
Skills 生成质量提升。

修复

Playground 使用体验问题修复；
偏好记忆阈值字段使用错误修复；
修复 get_memory 在复杂 filter 情形下的调用失败或卡顿问题；
修复 Chat 接口 qwen3-32b 回答失败，兼容 LLM 的 enable thinking 参数。

关于 MemOS

MemOS 为 AGI 构建统一的记忆管理平台，让智能系统如大脑般拥有灵活、可迁移、可共享的长期记忆和即时记忆。

作为记忆张量首次提出“记忆调度”架构的 AI 记忆操作系统，我们希望通过 MemOS 全面重构模型记忆资源的生命周期管理，为智能系统提供高效且灵活的记忆管理能力。
请添加图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

LMDeploy重磅更新：从支撑模型到被模型反哺，推理引擎迈入协同进化时代！

2048 AI社区

企业估值中的人工智能法律助手评估

本文旨在探讨人工智能技术在企业估值过程中法律风险评估方面的应用。我们将重点关注如何利用AI技术识别、分析和量化企业面临的法律风险，以及这些风险如何影响企业整体估值。AI法律助手的基本原理法律风险评估的技术实现风险因素对企业估值的影响模型实际应用案例分析本文首先介绍AI法律助手的基本概念和技术背景，然后深入探讨核心算法原理和数学模型。接着通过实际代码示例展示技术实现，最后讨论应用场景和未来发展趋势。

2048 AI社区

AI应用架构师：如何设计可扩展的智能家居系统？

智能家居的本质是**“感知-决策-执行”的闭环智能系统**，而可扩展性是其从“单设备控制”走向“全场景协同”的核心瓶颈。从“设备异构”到“协议统一”的设备层抽象；从“集中式处理”到“边缘-云端协同”的计算分层；从“ polling 轮询”到“事件驱动”的流量优化；从“单体应用”到“微服务拆分”的功能扩展。通过理论推导、架构设计、代码实现与案例分析，本文为架构师提供一套可落地的可扩展智能家居设计框架