构建智能体人工智能的原生数据基础：挑战、技术与演进路径

weixin_30777913

728人浏览 · 2026-03-02 18:53:48

weixin_30777913 · 2026-03-02 18:53:48 发布

摘要

智能体人工智能（Agentic AI）正推动人工智能从被动分析向主动决策的根本转变。这一范式转移对数据基础设施提出了全新要求——传统面向静态、确定性工作负载的存储系统已无法支持智能体所需的动态上下文感知与自主规划能力。本文系统论述构建智能体人工智能原生数据基础面临的核心挑战，包括知识提取的规模化与完整性、多模态语义对齐的准确性、以及检索系统在高信噪比下的可靠性。在此基础上，本文深入分析应对这些挑战的关键技术路径：以知识图谱和语义层为核心的异构数据知识提取框架、基于多模态语义树和对齐训练的多模态融合方法、以及融合查询重写与重排序的增强检索机制。进一步，本文提出从传统数据存储向智能数据平台演进的架构范式，探讨以知识为中心的存储模型、活跃元数据驱动的上下文增强、以及基于Kubernetes的认知功能微服务化等基础设施要求。最后，本文综述相关评估指标与研究进展，为构建可信、高效、可扩展的智能体人工智能数据基础提供理论参考与实践指引。

关键词：智能体人工智能；数据基础设施；知识提取；多模态对齐；检索增强生成；知识图谱

1 引言

人工智能领域正经历从被动、任务特定的工具向具备真正自主性的工程系统的范式转移。智能体人工智能（Agentic AI）作为这一转移的前沿方向，其核心特征在于系统能够进行主动规划、维护上下文记忆、使用复杂工具，并根据环境反馈动态调整行为。这些系统不仅仅是问题的求解器，更是能够感知复杂环境、推理抽象目标、并编排行动序列的协作伙伴。

然而，智能体人工智能的自主决策能力高度依赖于其数据基础的支撑。与传统人工智能系统不同，智能体需要在持续运行的上下文中访问和理解数据，而非在孤立的事务中执行预设查询。这一转变暴露了当前数据管理架构的根本性局限：传统数据库和数据湖（Data Lakehouse）是为静态、定义良好的工作负载而设计的，而智能体系统展现出动态、上下文驱动、协作的行为特征。智能体持续分解任务、跨模态切换注意力、与对等体共享中间结果——这些非确定性、多模态的工作负载使传统的查询优化器和缓存机制难以应对。

本文旨在系统论述构建智能体人工智能原生数据基础所面临的核心挑战，分析应对这些挑战的关键技术，并探讨数据基础设施的演进路径。第2节分析智能体人工智能对数据基础设施的新要求；第3节深入论述三大核心挑战：知识提取、多模态对齐与检索可靠性；第4节介绍应对这些挑战的技术方案；第5节探讨基础设施的架构演进；第6节总结评估指标与研究进展；第7节提出未来研究方向。

2 智能体人工智能的数据基础设施要求

2.1 从被动分析到主动决策的范式转移

智能体人工智能的兴起标志着人工智能系统角色的根本转变。经典人工智能系统主要执行被动分析任务——接收输入、处理、产生输出，其行为边界由预设规则严格定义。而智能体人工智能系统具备真正的自主性：它们能够主动分解复杂目标、规划多步行动、调用外部工具、并从环境反馈中持续学习。

这一转变对数据基础设施提出了质的不同要求。如表1所示，智能体人工智能与传统系统在数据访问模式上存在根本差异。

表1：传统系统与智能体人工智能的数据访问模式对比

维度	传统系统	智能体人工智能	关键差异
工作负载特性	静态、定义良好、可预测	动态、上下文驱动、非确定性	访问模式的不可预测性
数据交互方式	预设查询、结构化请求	目标驱动探索、中间结果共享	交互的迭代性与协作性
上下文需求	有限、事务级	持久、跨会话	记忆的持续性与关联性
多模态处理	独立模态、分离处理	跨模态融合、语义对齐	模态间的语义映射

2.2 智能体-数据交互的独特模式

理解智能体与数据的交互模式是设计数据基础设施的前提。研究表明，智能体工作负载呈现三个关键特征：

第一，注意力引导的数据访问。智能体在执行任务时，其数据访问模式受当前推理焦点的引导。这意味着数据系统需要能够理解智能体的“注意力”状态，并据此优化数据检索策略。

第二，语义级的中间结果共享。在多智能体协作场景中，智能体之间共享的不仅是原始数据，更是经过推理的中间结果。这要求数据系统支持语义层面的缓存与重用，避免重复计算与冗余数据移动。

第三，上下文驱动的动态数据流。智能体的数据需求随任务进展而动态演化。数据基础设施必须能够预测智能体的后续需求，并主动预取相关数据，而非被动响应查询。

2.3 持久上下文与统一数据访问

智能体人工智能的核心能力之一是其上下文记忆——系统能够在长时间跨度的交互中维持对目标、历史和用户偏好的理解。这要求数据基础设施具备以下能力：

持久上下文存储。智能体需要访问跨会话、跨任务的累积知识，而非仅局限于当前事务。传统的无状态架构无法满足这一需求。

统一数据访问接口。智能体通常需要访问分布在多源、多模态的数据。数据基础设施必须提供统一的语义层，屏蔽底层异构性，使智能体能够以一致的方式发现、理解和使用数据。

2.4 基础设施即知识管理系统

从更深层次看，智能体人工智能的数据基础设施本质上是一个知识管理系统，而非单纯的数据存储系统。两者的区别在于：

数据存储关注原始比特的持久化与检索，以文件、记录、对象为基本单元。
知识管理关注语义丰富的表示——实体、关系、概念、规则，以及它们之间的关联。

因此，为智能体人工智能构建原生数据基础，需要将存储系统从“数据容器”升级为“知识伙伴”。这意味着存储系统不仅要管理原始数据，还要通过领域词汇表、语义层和检索索引来管理“业务含义”。实时或近实时地提供语义丰富的表示（如嵌入向量和衍生元数据）成为基础设施的核心功能。

3 核心挑战分析

3.1 知识提取：从异构数据到结构化知识

智能体人工智能面临的首要挑战是从日益增长的非结构化和半结构化数据中提取有意义的知识。这一过程必须将异构数据转换为统一的语义模式，以支持智能体的推理与决策。

规模与完整性的张力。在实际应用中，组织通常面临网络规模的数据源——文档、日志、邮件、多媒体文件等。从这些数据源中自动创建机器可读的知识库（如Google Knowledge Vault、YAGO等系统）需要可扩展的信息抽取技术。然而，抽取的完整性是一个严峻挑战：如何确保关键实体、关系、事件被完整捕获，而非仅抽取高频或显式出现的知识？

领域适配的复杂性。在高风险领域如医疗健康，知识提取的准确性直接影响智能体决策的安全性。临床文档包含领域特定的语言、缩略语和隐含知识，通用抽取模型往往难以捕捉其中的语义精微之处。例如，从电子健康记录中抽取患者病史、用药方案和过敏信息时，信息的不完整或错误可能导致智能体的错误决策。

动态知识的更新。知识并非静态不变。实体状态演化、新关系出现、旧知识过时——这些动态性要求知识提取系统具备持续学习能力，能够检测变化并增量更新知识库。

3.2 多模态对齐：语义一致性的挑战

智能体人工智能必须准确解读并处理多模态信息——文本、图像、音频、结构化数据等，以符合人类的预期。多模态对齐的挑战在于：

模态间的语义鸿沟。不同模态的数据在表示空间上存在根本差异。例如，一张工程图纸的图像与描述该图纸的技术文档之间，不存在直接的对应关系。智能体需要理解“这张图中的这个部件对应文档中的那段描述”——这种跨模态的语义映射需要复杂的对齐机制。

上下文依赖的模态权重。在多模态信息融合中，不同模态的重要性往往高度依赖于上下文。在医疗诊断场景中，患者的生命体征数据、医学影像、临床笔记之间的相对重要性随病情变化而动态调整。智能体需要具备根据上下文动态加权不同模态信息的能力。

对齐错误的风险。如果多模态对齐出现错误，可能导致智能体对情境的误解，进而在构建知识图谱时产生实体和关系的错误识别。例如，将患者A的影像与患者B的临床笔记对齐，将导致完全错误的医疗建议。

3.3 检索可靠性：效率与效果的平衡

检索系统是智能体获取外部知识的关键通道。当前的检索系统必须兼顾效率和效果，而这两者之间存在根本张力。

传统检索的效率取向。传统的检索工具（如基于BM25的搜索引擎）强调速度，能够在毫秒级响应大规模查询。然而，这种效率往往以牺牲质量为代价——关键词匹配难以捕捉语义相关性，重要但表达方式不同的“长尾”信息容易被埋没。

重排序的质量取向。为提升检索质量，现代系统采用两阶段架构：先快速召回候选文档，再用更复杂的模型（如基于Transformer的重排序器）对候选文档进行精细排序。然而，重排序的计算成本高，难以应用于大规模检索。

长尾信息的可见性。在许多应用场景中，最关键的信息恰恰是低频出现的“长尾”知识。例如，在设备维修文档中，罕见故障模式的处理方法可能仅出现在少数文档中。如果检索系统偏向于高频信息，这些关键但稀有的知识将被系统性地忽略。

3.4 挑战的相互关联性

值得注意的是，上述三大挑战并非孤立存在，而是相互交织、彼此强化的。知识提取的质量直接影响多模态对齐的准确性——如果提取的实体和关系本身存在错误，后续的对齐必然失真。而检索可靠性又依赖于知识库的质量和对齐的精度——从混乱的知识库中检索，即使算法再精妙也难以保证结果的可靠性。这一相互关联性意味着，构建智能体数据基础需要系统性的解决方案，而非孤立地优化单一环节。

4 技术解决方案

4.1 异构数据知识提取框架

应对知识提取挑战，研究界已发展出一系列技术方法，其核心目标是从网络规模的数据源中实现可扩展的信息提取，自动创建机器可读的知识库。

信息抽取流水线。现代知识提取系统通常采用多阶段流水线：实体识别、关系抽取、事件检测、指代消解、知识融合。每个阶段都可通过深度学习模型（特别是基于Transformer的预训练语言模型）实现高精度抽取。

分布式处理架构。为达到高性能目标——例如1GB/s的数据处理带宽、100ms以下生成可检索知识——知识提取系统需要采用分布式处理架构。Apache Spark、Flink等大数据处理框架被广泛用于构建可扩展的抽取流水线。

知识图谱构建。抽取的知识通常以知识图谱形式组织，其中节点表示实体，边表示实体间的关系。知识图谱不仅支持结构化查询，还为智能体提供语义丰富的推理基础。Google Knowledge Vault、YAGO等项目展示了从网络规模数据自动构建知识图谱的可行性。

增量更新机制。为应对知识的动态性，现代系统采用增量更新策略：检测新数据中的变化，仅对受影响的知识片段进行重新抽取和融合，而非周期性全量重建。

4.2 多模态语义对齐方法

多模态对齐的核心是构建跨模态的统一语义表示，使智能体能够在不同模态间自由导航和推理。

多模态语义树与知识图谱。一个前沿方向是通过细粒度的跨模态上下文感知策略，构建多模态语义树（Multimodal Semantic Tree, MMST）和多模态知识图谱（Multimodal Knowledge Graph, MMKG）。MMST捕捉文档的层次结构——章节、段落、表格、图片及其相互关系；MMKG则抽取跨模态的实体和关系，将图像中的视觉实体与文本中的概念实体链接起来。这种结构化混合索引为智能体提供了丰富的导航基础。

跨模态嵌入空间。另一种主流方法是将不同模态的数据映射到统一的向量空间。Vision-and-Language Pre-training (VLP)模型如CLIP、ViLT通过对比学习，使图像及其文本描述在嵌入空间中彼此靠近。智能体可以在这一统一空间中进行跨模态相似性检索——给定文本查询，找到最相关的图像，反之亦然。

语义对齐训练。为弥合领域特定的语义鸿沟（如工程文档中的专业术语与通用语言模型之间的差距），研究者提出了新的训练框架。例如，Retriever-Reranker-Responder (R3)框架结合监督学习和强化学习，利用排序反馈增强模型的语义对齐能力。在工程文档问答任务中，该方法显著提升了检索和生成的准确性。

多智能体协作对齐。更进一步，多智能体协作机制可用于优化多模态对齐。不同的智能体可以专注于不同的模态或索引结构——一个智能体负责MMST导航，另一个负责MMKG查询，第三个整合专家反馈——通过协作实现更精确的对齐。

4.3 增强检索与重排序技术

针对检索可靠性挑战，现代信息检索系统融合了一系列增强技术，旨在同时优化召回率和排序质量。

查询增强。初始用户查询往往简短、模糊，难以精确表达信息需求。查询重写器（Query Rewriters）利用大语言模型对原始查询进行扩展、分解或重构，弥合用户意图与索引信息之间的差距。例如，查询“变压器过热原因”可能被重写为“电力变压器温度异常的可能故障原因列表”。

两阶段检索架构。现代检索系统普遍采用“召回-重排序”两阶段架构：

第一阶段（召回）：使用高效算法（如BM25、稠密向量检索）从大规模语料库中快速获取候选文档集，目标是高召回率。
第二阶段（重排序）：使用更复杂的模型（如基于交叉编码器的Transformer）对候选文档进行精细排序，目标是高精度。

强化学习优化。新的强化学习方法，如DeepRetrieval，在召回性能方面取得了显著进步。在出版物搜索任务中，该方法实现了65%以上的召回率，而之前的最佳水平约为24%。这类方法将检索视为序贯决策问题，通过强化学习优化检索路径。

信噪比优化。重排序器的核心功能是提高信噪比——将最相关的信息置于前列，同时过滤掉噪声文档。通过细粒度的相关性排序，重排序器确保关键的长尾信息不被海量低相关文档淹没。

4.4 混合检索策略

单一检索策略往往难以应对所有类型的查询。研究者因此探索了混合检索策略，结合不同方法的优势。

VectorRAG与GraphRAG的结合。VectorRAG擅长处理需要连续文本理解的查询，从相似段落中生成连贯回答；GraphRAG则擅长处理需要结构化知识的查询，从实体和关系中抽取精确信息。混合检索（HybridRAG）策略结合两者——对于抽象问题或缺乏明确实体的问题，依赖VectorRAG；对于需要精确事实的问题，调用GraphRAG。在多智能体框架中，不同的智能体可以分别专注于不同的检索策略，通过协作提供最优答案。

专家反馈集成。在某些高价值领域（如工程文档问答），专家反馈可以显著提升检索质量。多智能体协作机制支持专家实时编辑答案、提供经验知识，这些反馈被用于优化后续检索。

5 数据基础设施的架构演进

5.1 从数据存储到智能数据平台

传统的数据存储系统（关系数据库、数据湖、数据仓库）是为人类编写的应用程序而设计的，而非为智能体自主访问而设计。向智能体人工智能的转变要求存储系统演变为功能全面的人工智能数据平台（AI Data Platforms）。

智能数据平台的核心特征是以知识为中心，而非以数据为中心。这意味着：

存储系统管理的不只是原始字节，而是实体、关系、概念及其语义关联。
数据访问接口不再是SQL或文件API，而是语义查询和知识导航。
元数据不再是静态的技术描述，而是活跃的、持续更新的语义增强层。

5.2 以知识为中心的存储模型

传统存储模型现在被认为不足以支持智能体人工智能。存储系统必须不断发展，通过以下机制管理“业务含义”：

领域词汇表。为特定领域定义规范化的术语集合，确保智能体和数据系统使用共同的语言。例如，在医疗领域，“心肌梗死”与“心脏病发作”应被识别为同一概念。

语义层。在底层数据格式之上构建语义抽象层，将异构数据映射到统一的领域模型。智能体通过语义层访问数据，无需关心底层存储细节。

检索索引。除传统的B树和哈希索引外，现代系统需要维护多种面向智能体的索引结构：向量索引支持相似性检索，知识图谱索引支持关系导航，全文索引支持关键词搜索。

5.3 活跃元数据与上下文增强

元数据在智能体数据平台中扮演着核心角色。与传统系统中静态的、主要用于管理的元数据不同，智能体数据平台需要活跃元数据——持续收集和更新模式、血缘关系、数据质量评分、访问模式等信息。

活跃元数据向智能体提供关键的上下文线索：

数据血缘帮助智能体理解数据的来源和转换过程，评估其可信度。
质量评分为智能体提供数据可靠性的量化指标，支持风险感知决策。
访问模式历史揭示数据的常见用途和相关查询，辅助智能体理解数据的适用场景。

5.4 认知功能的微服务化

智能体人工智能的架构正从单体系统向微服务演化。新兴框架利用Kubernetes等平台上的微服务来封装认知功能，使其能够独立扩展。

认知功能解耦。内存管理、规划、推理、工具调用等认知功能被实现为独立的微服务。这种解耦带来多重优势：

独立扩缩：规划密集型任务可以增加规划服务实例，而不影响其他功能。
技术异构：不同功能可以使用最适合的技术实现（如规划用符号AI、推理用神经网络）。
故障隔离：单一功能的故障不会导致整个智能体系统崩溃。

服务网格协调。在Kubernetes环境中，服务网格（如Istio）负责管理微服务间的通信，提供负载均衡、服务发现、流量控制、可观测性等功能。这为多智能体协作提供了可靠的基础设施。

有状态服务设计。与传统微服务的无状态设计偏好不同，智能体微服务通常需要维护状态（如对话历史、任务进度）。这要求基础设施支持有状态服务的弹性伸缩和故障恢复。

5.5 智能体中心的数据架构

研究者提出了“智能体中心数据架构”（Agent-Centric Data Architecture）的概念，重新思考数据系统如何服务、优化、协调智能体工作负载。这一架构的核心机制包括：

注意力引导的数据检索。数据系统通过观察智能体的注意力焦点（当前处理的文档、频繁访问的实体），预测其后续数据需求，并主动预取相关数据。

语义微缓存。在多智能体协作中，多个智能体可能请求相似的语义上下文。语义微缓存存储近期访问的语义表示（而非原始数据），使后续请求能够快速命中。

预测性数据预取。基于智能体的任务目标和历史行为，预测其未来可能需要的数捃，并在实际请求前加载到高速存储。

仲裁式数据服务。当多个智能体竞争同一数据资源时，仲裁机制根据任务优先级、数据一致性要求等策略，协调数据访问顺序和方式。

6 评估指标与研究进展

6.1 知识提取与对齐的评估

评估知识提取和多模态对齐系统需要多维度的指标体系。

信息抽取的完整性。在从异构数据源构建知识库时，核心指标包括：

召回率：相关实体和关系被成功抽取的比例。
精确率：抽取结果中正确部分的比例。
F1分数：召回率和精确率的调和平均。

多模态对齐的准确性。对于将结构化数据（如电子健康记录）与非结构化数据（临床笔记）相结合的多模态方法，研究表明在临床预测任务中可以实现0.90以上的AUROC（Area Under the Receiver Operating Characteristic Curve，受试者工作特征曲线下面积）。这一指标衡量模型区分正负样本的能力，值越接近1.0表示性能越好。

语义对齐的细粒度评估。在多模态语义树和知识图谱构建中，需要评估跨模态链接的准确性——图像中的实体是否被正确链接到文本中的相应描述。

6.2 检索系统的质量度量

检索系统的评估涉及多个维度，既关注结果的相关性，也关注用户体验。

归一化折扣累积增益。衡量排序质量的NDCG（Normalized Discounted Cumulative Gain）是检索系统的核心指标之一。它评估排名结果与理想顺序的一致性，既考虑相关文档是否被检索到，也考虑它们是否被排在正确的位置。NDCG的值范围为0到1，越高表示排序质量越好。

平均精度均值。MAP（Mean Average Precision）是另一个广泛使用的指标，计算多个查询的平均精度得分的均值。它对完全排序顺序敏感，特别适合评估系统是否将最相关的文档排在前面。

召回率@K。衡量在前K个检索结果中包含相关文档的比例。这一指标对需要高召回率的应用（如文献综述、故障诊断）尤为重要。

6.3 检索增强生成的性能突破

检索增强生成（Retrieval-Augmented Generation, RAG）将检索系统与大语言模型相结合，在多个任务上取得了显著进展。

召回性能的提升。传统的检索方法在复杂搜索任务中往往表现有限。新的强化学习方法，如DeepRetrieval，在出版物搜索任务中实现了65%以上的召回率，而之前的最佳水平约为24%。这一突破展示了强化学习优化检索路径的潜力。

生成质量的改进。在工程文档问答等专业领域，结合多模态对齐和增强检索的RAG系统显著提升了回答的准确性。SAMAC-R3-MED框架在多模态检索和生成任务中达到了当前最佳水平。

6.4 数据基础设施的性能基准

智能体数据平台需要满足严格的性能要求：

处理带宽：知识提取流水线应达到1GB/s以上的数据处理能力，支持大规模实时数据流。
检索延迟：从查询到生成可检索知识的时间应在100ms以下，支持交互式智能体应用。
目标达成率：意图驱动的数据放置框架在原型实现中显示了88%的用户输入准确响应率，并在约30秒内达成目标。

7 未来研究方向

7.1 神经-符号混合架构

当前研究揭示了一个关键洞见：智能体人工智能的未来不在于单一范式的统治，而在于有意整合符号系统（依赖算法规划和持久状态）和神经/生成系统（依赖随机生成和提示驱动编排）。符号系统在安全关键领域（如医疗保健）占主导，而神经系统在自适应、数据丰富的环境（如金融）中表现优越。

构建混合架构的数据基础设施需要解决多重挑战：如何将符号推理的确定性、可解释性与神经表示的灵活性、可学习性相结合？如何在存储层面统一管理符号知识库和神经嵌入？

7.2 可信赖与可治理的智能体数据平台

随着智能体人工智能在关键领域的应用，信任问题日益凸显。研究指出，现有系统在治理模型方面存在显著不足，特别是对于符号系统的治理。

可信赖的数据平台需要提供：

可解释性：智能体的决策过程应可追溯至其使用的数据，数据来源和推理路径应清晰可见。
一致性保证：在多智能体并发访问数据时，需要类似数据库MVCC（多版本并发控制）的机制，确保智能体看到一致的数据快照。
治理嵌入：数据访问控制、隐私保护、合规性检查应作为平台的内置功能，而非事后附加。

7.3 持续学习与知识演化

智能体数据平台必须支持知识的持续演化。未来研究需要探索：

增量学习机制：平台应能从智能体的交互反馈中学习，不断优化知识表示和检索策略。
知识版本控制：随着知识的演化，需要维护版本历史，支持时间旅行查询和回溯分析。
遗忘机制：当知识过时或需要符合隐私法规（如“被遗忘权”）时，平台应能有效移除特定知识。

7.4 从RAG到智能体原生检索

当前的检索增强生成（RAG）范式将检索视为大语言模型的辅助模块。未来的方向是构建“智能体原生检索”——检索系统本身具有智能体特性，能够主动与智能体协作，而非被动响应。

多智能体检索增强生成（Multi-modal Agentic Retrieval-Augmented Generation, MMA-RAG）代表了这一方向的前沿。在这一框架中，多个专门的检索智能体协同工作，每个智能体负责不同的数据源或模态，通过协作提供更全面、更准确的检索结果。

8 结论

智能体人工智能的兴起标志着人工智能系统从被动分析向主动决策的根本转变。这一转变对数据基础设施提出了全新的要求——从面向静态、确定性工作负载的传统存储系统，演进为能够支持动态上下文感知与自主规划能力的智能数据平台。

本文系统论述了构建智能体原生数据基础面临的三大核心挑战：知识提取的规模化与完整性、多模态语义对齐的准确性、以及检索系统在高信噪比下的可靠性。针对这些挑战，我们分析了应对的关键技术：以知识图谱为核心的异构数据知识提取框架、基于多模态语义树和对齐训练的多模态融合方法、融合查询重写与重排序的增强检索机制。

在基础设施层面，我们提出了从数据存储向知识管理系统的演进路径——以知识为中心的存储模型、活跃元数据驱动的上下文增强、基于Kubernetes的认知功能微服务化，以及智能体中心的数据架构。这些架构创新共同构成了支撑智能体人工智能运行的基础。

评估指标与研究进展显示，这一领域正经历快速创新。神经-符号混合架构、可信赖治理机制、持续学习能力、以及智能体原生检索代表了未来研究的重要方向。随着这些技术的成熟，智能体人工智能将能够更可靠、更高效地服务于医疗、金融、工程等高价值领域，真正实现从数据到知识、从知识到行动的完整闭环。

参考文献

[1] Wissuchek, C., & Zschech, P. et al. (2026). Agentic AI: a comprehensive survey of architectures, applications, and future directions. Artificial Intelligence Review, 59(11), 1-38.

[2] Giurgiu, I., et al. (2025). Supporting Dynamic Agentic Workloads: How Data and Agents Interact. arXiv preprint arXiv:2512.09548.

[3] Li, F., Li, X., Wen, S., Huang, H., & Bao, J. (2025). SAMAC-R3-MED: Semantic alignment and multi-agent collaboration of retriever-reranker-responder models for multimodal engineering documents. Computers in Industry, 171, 104336.

[4] Shah, J. K. (2025). Agentic AI for Autonomous Micro-Frontend User Interfaces and Microservices Evolution in Cloud Platforms. Journal of Computer Science and Technology Studies, 7(8), 135-152.

[5] ScienceDirect. (2025). Agentic AI: The age of reasoning—A review. Information Processing & Management.

[6] Tagliabue, J., et al. (2025). Trustworthy AI in the Agentic Lakehouse: from Concurrency to Governance. arXiv preprint arXiv:2511.16402.

[7] Perlić, V., Lebailly, S., Malvone, V., Nguyen, V.-T., & Urard, P. (2025). MMA-RAG: A Survey on Multimodal Agentic Retrieval-Augmented Generation. HAL preprint hal-05322313.

[8] Kunal, J., & Shah, J. K. (2025). Agentic AI for Autonomous Micro-Frontend User Interfaces and Microservices Evolution in Cloud Platforms. Semantic Scholar.

[9] ScienceDirect. (2026). AI Agents vs. Agentic AI: A Conceptual taxonomy, applications and challenges. Information Fusion, 126(Part B), 103599.

[10] IEEE. (2025). Intent-Based Agentic AI Framework For Data Placement in Compute Continuum. 2025 IEEE International Conference on Cloud Engineering.

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

东方云权通 v1.0：一款高并发、多功能的手戳+AI辅助电商系统发布

2048 AI社区

【AI开发】—— 山东省智能政策助手部署实战：从 0 到 1 上线与更新避坑指南

2048 AI社区

LangChain v1 版本变更学习

LangChain v1版本进行了重大架构重构，主要围绕三个核心改进方向：全新的Agent创建方式、统一的内容块标准和简化的命名空间。其中最显著的变化是Agent创建机制从create_react_agent升级为更灵活的create_agent，引入了中间件架构，通过六大钩子（before_agent、before_model等）实现对Agent生命周期的完全控制。同时，结构化输出功能从需要额外