随着书生大模型开源生态的不断壮大,越来越多的产品和平台纷纷接入书生大模型。科研人员依托书生大模型持续探索创新,取得了丰富的研究成果;社区用户也不断创造出令人耳目一新的项目。“与书生共创”将推出一系列文章,聚焦这些合作与创新案例。欢迎订阅并踊跃投稿,一起分享经验与成果,共同推动大模型技术的应用与发展。

本文来自兴智杯“书生优秀合作案例”征集,作者为中国铁塔股份有限公司铁塔 AI 冲锋队(以下简称“团队”,成员包括:闫凯、李波、孙红亮、王蓉蓉、花逸、何阳、于贵发、杨庆成、李丹)。

中国铁塔股份有限公司是全球规模最大的通信基础设施服务提供商。在科技强国战略与国务院国资委“AI+”专项行动的双重引领下,团队依托公司自研的「擎天人工智能应用开发平台」,与书生大模型(InternLM、InternVL)深度协同,构建了知识图谱与大模型 RAG 相结合的闭环系统。

该系统于 2025 年 4 月上线集团内部知识智能体,调用量始终稳居第一,显著提升了知识获取效率,有效减轻了员工的重复性工作负担,验证了相关技术在通信运营与能源服务等垂直场景的可迁移性与扩展性。

书生大模型在线体验链接:

https://chat.intern-ai.org.cn/

项目背景

随着企业数字化程度的加深,流程知识的管理与应用正成为智能化升级的新需求。无论是通信运营、工程建设,还是政务审批、金融服务,内部流程往往复杂且高度依赖文档规范,人工检索效率低、易出错。基于此,流程智能体的概念应运而生:通过知识图谱构建、向量检索与大模型推理,将企业流程知识结构化为可调用的知识单元,不仅能在问答交互中提供精准流程指引,还能进一步推动流程自动化与任务执行。这一方向为知识智能体的纵深发展提供了新的切入点,也预示着未来大模型应用将从“答题助手”走向“行动助手”。

这一背景下,如何科学地理解与定义“知识”本身,成为推动智能体构建与应用落地的关键。为此,团队决定构建一个面向垂类行业的专业化、高可用的 RAG(Retrieval-AugmentedGeneration,检索增强生成)知识库。核心目标包括:

  • 自动化知识构建:实现从海量、异构的行业文档中自动抽取、整合知识,并形成结构化的知识体系。

  • 提升检索精准度:结合向量检索与知识图谱查询,实现对用户问题的深度理解和对知识的精准定位。

  • 保证内容可信度:利用 RAG 技术,确保大模型的回答均基于知识库中的可信内容,做到有据可查,减少幻觉。融合大模型能力:充分利用书生大模型强大的语言理解和生成能力,提供专业、流畅、多维度的智能问答与知识探索服务。

图片

RAG系统模块化架构图

项目成果

目前,该方案已在中国铁塔集团内部成功落地,形成统一的「知识智能体」服务入口。智能体围绕通用知识、系统操作手册、宣传推广材料、监控终端说明及规章制度流程等五大类内容,构建起系统化的企业知识体系,累计接入文档超过 11,200 份。智能体支持深度语义检索、图文混合查询、上下文关联问答及图文精准回答,同时输出结果可一键生成 Word 报告,并提供知识摘要、答案溯源与可视化展示能力,有效支撑员工学习、业务办理与规范化运营。

在此基础上,系统还融合了 DeepResearch 深度研究能力,能够对跨文档、跨主题的问题进行多轮推理与证据整合,不仅给出答案,还能呈现完整的推理链路与引用依据。这一能力特别适用于政策法规解读、业务流程比对、行业趋势分析等复杂场景,为企业提供由“检索式问答”向“研究式分析”的跃升。

该系统于 2025 年 4 月中旬正式上线后,调用量长期位居集团内部应用首位,显著提升了知识获取效率,切实减轻了一线员工的重复性工作负担。相关实践也验证了本方案在不同垂直领域中的可迁移性与可扩展性,展现了其在大规模知识管理、跨行业推广以及知识安全与合规保障方面的应用价值。

在此基础上,团队进一步开展流程智能体研发,已完成相关算法设计与专利申报,并计划发表学术论文。这一拓展不仅展示了知识智能体在不同场景下的灵活演化能力,也为其在更复杂业务流程中的应用奠定了理论与实践基础。

图片

智能体问答界面

图片

文本问答演示

图片

流程图问答演示

核心创新

面向流程图的多模态关系抽取

针对流程图节点与关系解析的准确性难题,团队基于书生 InternVL 多模态模型,提出了多项创新策略:通过采用“通用基础微调→行业场景适配→流程细节优化”的三级微调策略,突破传统模型对特定场景流程图解析能力不足的问题。针对流程图中“视觉节点-文本标注”语义错位问题,在跨模态融合层新增动态对齐机制。同时引入 RAGAS 评估框架,不仅对检索与问答结果进行系统化量化评估,还将评估结果反向作用于知识库建设与检索策略优化,实现知识库内容与索引策略的持续优化,从而提升整体问答系统的准确性与鲁棒性。除此之外,结合 RAG 长时记忆能力,能够在多轮交互和跨任务场景中保留并复用历史知识与上下文,确保知识智能体具备持续学习与动态演化的能力。

流程知识图谱创建

在模型层面,团队基于 InternLM 与 InternVL 进行了领域化适配与轻量级微调:在流程类语料上进行任务指令微调,使模型能够更准确理解“流程节点—规则约束—业务主题”的语义结构。在图谱构建任务中引入“正负样本对比”,以增强模型区分正确/错误关系的能力,显著减少“错误连边”问题。同时结合流程文档与流程图的多模态对齐数据,对 InternLM 和 InternVL 进行联合训练,使其在跨模态关系抽取中具备更强的鲁棒性。最后,补充流程管理、业务审批等高频专业词汇,提升模型在流程知识中的实体识别精度。除此之外,团队还结合 GraphRAG 的图结构构建能力,突破了传统按流程图等级划分实体的局限。

跨模态数据对齐与价值观对齐

在跨模态数据对齐方面,通过对比预训练与零样本预测,将图像、文本、视频等多模态数据映射到共享语义空间,通过文本编码器和图像编码器的特征匹配实现语义精确对齐,并在零样本预测中验证模型的泛化能力;在价值观对齐方面,基于个人与国家层面的典型语料,构建价值观识别与过滤机制,结合细粒度检测、变体识别和语义泛化理解等方法,能够在字符、词汇及语境层面识别并屏蔽不符合社会主义核心价值观的内容,从而在保证跨模态对齐精度的同时,提升模型在多模态理解与生成中的鲁棒性、可控性和价值导向可靠性。

任务执行智能体构建

智能体不仅局限于基于 RAG 的检索问答,还具备执行任务和行动的能力。实现方法上,系统集成了工具调用与任务编排机制:一方面,智能体能够根据用户意图自动调用外部 API 或脚本(如数据处理、文件生成、系统操作等),完成具体工作任务;另一方面,通过工作流编排与上下文管理,智能体可以将检索、推理和行动有机结合,实现从“被动回答”到“主动执行”的转变。这种能力使智能体不仅是知识问答助手,更是任务协同者,可在复杂业务场景中承担实际职能,提升业务流程的智能化与自动化水平。

同时,系统引入人机协同机制:对于高敏感度或高风险的操作(如涉及财务审批、合规审查、关键系统改动等),智能体会主动提示并交由人工确认或执行;而在低风险、标准化任务中,智能体则可自主完成,实现“智能执行+人工把控”的平衡。这一机制既保证了系统在高频场景中的自动化效率,又确保在敏感业务环节中的安全性与合规性。

技术方案概览

整体方案基于自研知识平台与智能体编排平台构建,以书生大模型技术体系为核心底座,形成“知识获取与构建—知识存储与检索—大模型推理—应用与编排”的闭环架构。

图片

技术方案整体架构图

知识获取与构建层对应知识平台的核心能力,负责将原始数据转化为结构化和半结构化的知识。知识存储与检索层依托中国铁塔自研的“擎天”人工智能应用开发平台,采用“向量+图谱”的双重存储与检索模式,以实现高效、精准的检索。大模型推理层融合 InternLM 自然语言理解与生成优势,以及知识图谱的结构化知识表达与逻辑约束能力,实现面向复杂问题的联合推理。应用与编排层基于智能体编排平台,支持低代码开发,可实现快速搭建和管理智能问答助手。

图片

中国擎天人工智能应用开发平台

图片

智能体编排平台

图片

智能体编排

总结与展望

本项目以书生大模型技术体系为核心技术底座,深度融合 InternVL 与 InternLM 在多模态理解、知识推理与生成方面的能力,成功构建了面向企业真实业务场景的知识智能体与流程智能体解决方案。在实践过程中,团队切实感受到书生大模型在专业语义理解、复杂流程解析与系统稳定性方面的优势,为企业级应用落地提供了可靠支撑。

面向未来,团队将持续围绕流程智能体方向推进产品迭代:一方面深化跨模态流程理解与推理能力,提升智能体在复杂业务场景下的决策可靠性;另一方面拓展任务执行与人机协同机制,推动智能体从“知识助手”向“业务协作者”演进。同时期待与书生大模型开源生态持续共创,共同探索大模型在垂直行业中的更深层次应用价值。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐