从当下窥见未来,AI技术资讯合集
尽管取得了这些进展,基于 LLM 的智能体在复杂的多步规划任务中仍然表现不佳,经常出现违反约束、状态跟踪不一致以及解决方案在微小变化下就会失效的脆弱性问题。与人类的科学推理、经典的人工智能规划以及决策的认知模型不同,当前的 LLM 提示范式允许推理在一个隐式且不稳定的任务内部模型上进行。graphrag-workbench是基于微软GraphRAG框架的一个交互式Web应用,用来构建和可视化知识图
hello,更新一期最新的AI技术资讯,希望对大家有帮助~
想要相关研究报告,请联系我们的客服领取哦!
1、MiroThinker 1.5:30B参数跑出1T性能:https://mp.weixin.qq.com/s/AykcSFyEmRRV8EfFBRszVw
近日,MiroMind 团队发布开源搜索智能体模型 MiroThinker 1.5。该模型分 30B 和 235B 参数版本,上下文长度最高 256K,调用成本低、推理速度快。基准测试中,235B 版本刷新 BrowseComp 纪录跻身全球第一梯队,多项测试表现亮眼。实测中,其在赛事预测、游戏发售时间判断、股市选股等场景逻辑严谨、信息获取迅速。
2、中科大AgentRuse:缓存规划,延迟降低93%:http://xhslink.com/o/Apba0pKc8Lg (复制后打开)
现实场景数据分析表明,LLM驱动智能体接收的请求中约有30%内容相同或相似,因此,本文提出并实现了一种名为AgentReuse的LLM驱动智能体规划重用机制。该机制通过挖掘请求间的语义关联与差异,结合意图分类技术评估请求相似度,从而实现规划的高效复用。
3、Vertex AI Agent Builder:https://docs.cloud.google.com/agent-builder?hl=zh-cn
Vertex AI在Agent Builder中推出了Agent Designer功能。这是一个低代码可视化界面,允许用户在画布上编排智能体与子智能体的工作流程,并可直接将逻辑导出至智能体开发套件(ADK)进行代码级优化。
4、Awesome Adaptation of Agentic-AI:https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf
本篇论文指出几乎所有先进的AI智能体系统都可以被理解为仅使用四种基本适应方式,即通过更新智能体本身或更新其工具来实现适应。
该研究也是首个针对智能体AI适应机制的完整分类体系。
5、从组件到 OS 的跃迁,MemOS 深度拆解:构建企业级 Agent 的高性能记忆底座【上】:https://mp.weixin.qq.com/s/m2irBzhg3QnQ5if3S_SLlQ
MemOS 作为一个“记忆操作系统”,负责统一管理、组织、调度记忆,并通过标准接口开放给上层应用。本篇文章介绍了记忆操作系统 MemOS的设计理念、核心架构以及如何快速上手MemOS。

6、开源,本体驱动的GraphRAG新范式,零噪声:https://mp.weixin.qq.com/s/ZmOvDWM04waBcptHXuMysg
项目地址:https://github.com/trustgraph-ai/trustgraph
TrustGraph 是一款开源全栈解决方案,通过自动化上下文图谱构建、自定义本体工程与智能上下文检索,将原始数据转化为精准可信的上下文信息。
7、从 ReAct 到 Ralph Loop:AI Agent 的持续迭代范式:https://mp.weixin.qq.com/s/zMnIrokMvdNI6gW-33-6xQ
本文介绍了 AI 编程的 Ralph Loop 范式,旨在解决 AI 编程助手在任务没完成之前自动推出的问题。核心思想是:同一个提示反复输入,让 AI 在文件系统和 Git 历史中看到自己之前的工作成果。
8、梁文锋署名开源「记忆」模块,DeepSeek V4更细节了:https://mp.weixin.qq.com/s/IVafD4Blf1KPt7OSz2GdzA
近日,DeepSeek 与北大合作发布新论文,开源「记忆」模块 Engram,补全 DeepSeek V4 细节。该模块为 LLM 添 O (1) 查找式记忆,性能优于纯 MoE 模型,成下一代稀疏大模型核心原语。
9、Anthropic 万字长文:AI Agent 评估体系全解析:https://mp.weixin.qq.com/s/pwhg5Kmh3wMlxqIlbVqGMw
Anthropic 发布 AI Agent 评估指南,旨在解决 Agent 调试难、无系统评估的问题。这篇文章全面介绍了AI Agent的评估体系,指出建立评估体系的复利效应是非常明显的。
10、ChatGPT 为什么越来越“懂你”?一文解析它背后的记忆机制:https://mp.weixin.qq.com/s/7LknilarrcY-jlOgHHpPMQ
2025年4月,OpenAI 对 ChatGPT 的记忆系统进行了重磅升级:它可以参考用户的全部过往对话来提供更个性化的响应。本文拆解 ChatGPT 记忆系统是如何运作的、推测背后可能采用的技术实现方式以及探索记忆机制如何重塑用户体验。
11、Vertex AI Agent Builder:https://docs.cloud.google.com/agent-builder?hl=zh-cn
Vertex AI Agent Builder 是Google研发的一套产品,可帮助开发者在生产环境中构建、扩缩和治理 AI 智能体。最近,Vertex AI 在 Agent Builder 中又推出了 Agent Designer。它是一个低代码可视化界面,允许你在画布上编排智能体(agents)和子智能体(subagents),然后将逻辑直接导出到 Agent Development Kit (ADK) 中进行代码级别的优化。
12、开源项目推荐:面向上下文工程的代理技能:https://github.com/muratcankoylan/Agent-Skills-for-Context-Engineering
上下文工程的代理技能并非仅仅提供一个黑盒工具库,而是充当一个“元智能体”知识库。它提供了一套以 Markdown 和代码形式编写的标准技能,可以将其输入到智能体中,使其了解如何管理自身的认知资源。
13、智能体 AI 的卓越自适应:https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf
这篇论文创新性地指出几乎所有先进的 AI 智能体(Agent)系统都可以理解为仅使用四种基本的自适应方式,即通过更新智能体本身或更新其工具来实现。

14、多智能体 AI 辩论系统 Quorum:https://github.com/Detrol/quorum-cli
Quorum 项目是一个先进的多代理 AI 讨论系统,专注于在终端环境中实现结构化辩论。该系统支持主流 AI 模型的集成,如 GPT、Claude 和 Gemini,并通过 Ollama 实现本地模型的兼容。Quorum 提供七种独特的讨论方法,包括平衡共识、正式辩论、魔鬼代言人模式和苏格拉底模式等,适用于多种场景。
15、基于模型优先推理的大语言模型智能体:通过显式问题建模减少幻觉:https://arxiv.org/html/2512.14474v1
大型语言模型在链式思维(Chain-of-Thought, CoT)和 ReAct 等提示策略的引导下,已展现出令人印象深刻的推理和规划能力。尽管取得了这些进展,基于 LLM 的智能体在复杂的多步规划任务中仍然表现不佳,经常出现违反约束、状态跟踪不一致以及解决方案在微小变化下就会失效的脆弱性问题。该论文认为,这些失败中的许多并非源于推理本身的缺陷,而是由于缺乏显式的问题表示。与人类的科学推理、经典的人工智能规划以及决策的认知模型不同,当前的 LLM 提示范式允许推理在一个隐式且不稳定的任务内部模型上进行。
受这些传统的启发,该论文提出了模型优先推理(Model-First Reasoning, MFR),这是一种两阶段范式。
16、将文档转换为可交互3d知识图谱的工具:graphrag-workbench:https://d.aigclink.ai/3D-graphrag-workbench-AI-2c39857c0f47806cb404ec260a18761b
github:https://github.com/ChristopherLyon/graphrag-workbench
graphrag-workbench是基于微软GraphRAG框架的一个交互式Web应用,用来构建和可视化知识图谱,它适合需要可视化复杂关系或进行AI辅助分析的场景用,比如说,做研究、商业情报、小说剧本理人物关系等等。

17、上下文图谱:AI的万亿美元机遇:https://x.com/JayaGup10/status/2003525933534179480
延申阅读:https://m.aitntnews.com/newDetail.html?newId=21067
本文认为,下一个万亿美元平台不会通过在现有记录系统中添加AI来构建。这个时代,手机、电脑软件都是给人用的 —— 人负责一步步操作,系统负责把信息存好、算好。但现在,Agent 开始接过这些操作:你只需要说清楚目标,它就能自己去打开应用、填信息、做选择,最后把结果交给你确认。
现有的记录系统会消失吗?Agent 杀死了记录系统,还是说 Agent 只是提高了「好的记录系统」的标准?
18、多智能体系统中的隐式协作:https://arxiv.org/pdf/2511.20639
多智能体系统(MAS)将大型语言模型(LLMs)从独立的单模型推理扩展到协同的系统级智能。现有 LLM 智能体依赖基于文本的媒介进行推理与通信,而本篇论文更进一步,认为模型能够在连续的隐空间内直接协作。
360智汇云:AI时代企业数智化基础设施:https://zyun.360.cn
更多推荐



所有评论(0)