​2025 年 8 月,一场以星火大模型技术实践为核心的学术交流活动于西安举行。此次研讨围绕大模型核心技术架构展开,系统梳理了模型运行机制、行业适配优化方法及智能体构建规范。

参会人员结合自身业务场景,携带实际技术难题参与交流。与会专家与从业者就技术演进方向、典型应用案例、Agent 体系设计及文旅领域创新应用等议题展开深度对话。现场讨论紧密贴合产业落地需求,形成多维度的技术观点交锋,现将活动中的关键讨论要点进行整理呈现。

PART 1
从技术原理到落地案例,层层展开

嘉宾们结合西安硬科技与文旅需求,分享前沿洞见


科大讯飞西安研究院常务副院长付中华在《大模型技术发展与趋势分析》的报告中讲到,人工智能的发展从来不是一条直线,而是一次次浪潮的更迭。从最初的符号逻辑与定理证明,到后来的专家系统与规则推理,再到统计建模与深度学习,每一次尝试都在寻找解决智能问题的不同路径。现在处AI给我们带来了一个重大的启示,就是之前实现智能的方法可能都不太合适,真正要靠的是智能涌现。所谓涌现,就是没有明确教会的知识,模型也能自己学会,这成为人类对智能认知的全新理解。

大模型的发展轨迹有三个关键阶段。第一阶段是博览群书,大规模预训练与有监督的微调让模型吸收了互联网上几乎所有的知识,像一个贪婪的学生先把能找到的书全部读完,再通过习题训练不断熟练。第二阶段是慢思考与强化学习的结合。不同于以往的快问快答,大模型开始学会像人一样展开思维链条,反复推敲,再给出结论。这一改变让复杂的逻辑推理和数学证明得到前所未有的提升。第三阶段,则是正在发生的跨越——多模态与具身智能。语言、图像、音频、视频乃至真实世界的感知被统一纳入建模,AI正在尝试突破“只能用文本理解世界”的限制,向更接近人类智能的方向迈进。

大模型应用开发实践案例分享

科大讯飞开放平台运营总监汪舰分享了帮助客户用大模型开发应用的丰富案例。

讯飞星火为例,调用量在今年年初迎来爆发性增长。更有意思的是,调用量结构也在变化:过去C端的Chat类应用是主力,但到2025年,这类应用的调用量反而下降,原因就在于用户产生了审美疲劳。大模型解决了80%的问题,但剩下的20%迟迟无解,半年过去也没什么进步,于是C端用户的热情下降。而B端不同,它有降本增效的刚需,也有竞争压力和预算支持,所以驱动力更强。很多企业应用的调用量相比以前增长了八九倍,大模型正在B端场景中被更深度地使用。

以个性化内容生成为例,和常见的通用生成不同,B端用户尤其看重表达方式和风格。如果我是一个有IP价值的博主,我的粉丝不仅看我的观点,也看我的行文风格。如果只是通用模型生成,哪怕模仿了小红书、公众号的格式,还是会显得千篇一律。但通过微调,把博主以往上千条作品输入模型,效果就不一样了。比如有位博主喜欢用“今天我来跟你讲一个很新的东西——中华长程。你肯定听过长征吧,但是你听说过长程吗?”这种开场白,模型学会这种风格后,粉丝会觉得内容更真实、更“像本人”。这种微调才是让内容生成真正落地的关键。

另一个典型场景是知识问答。百科类问题,大模型加上搜索功能已经能答得很好。但一旦涉及私域知识,比如讯飞内部的考勤时间,或者职业教育中的专业题库,通用模型就不行了。我们有客户要求的不只是给出正确答案,还要解释为什么选B不选A,并把涉及的知识点梳理成网络。这种需求一开始让我们走了不少弯路,通用模型要么解释含糊,要么自信地给出错误解释。后来我们在工程上做了两件事:一是对问题进行拓写,把原题衍生出十几种不同问法,让检索尽可能覆盖相关知识;二是在得到答案后引导模型“反思”,再回答一遍。这种方式,结合RAG技术和微调,才逐步达到了客户要求。甚至连语气也需要调整,要像一个有耐心的老师,这同样需要微调数据来约束。

回过头来看,这些案例的共同点在于:大模型不是“通用即万能”,而是必须经过工程化的改造和贴近业务的训练,才能真正落地。无论是内容生成、知识问答,还是客服、物流、视觉识别,本质上都是把通用能力和场景需求结合起来。客户的期望常常很高,有人要求“一定要100%准确”,但实际落地往往要经历一个迭代过程:先做到80%—95%的上线可用,再通过数据回流不断优化。

星辰Agent开发平台落地与实践

站在工程的角度,如何构建有价值的 Agent 应用?星辰Agent平台工具系统负责人葛锐锋分享了三个关键维度。产品形态要从简单走向复杂,支持任务编排与规划;数据要从通用走向场景化和个性化,结合公域和私域信息;模型层面也会从通用基座逐渐走向场景化定制,小模型经过微调后在效果、性能和成本之间找到最优解。企业落地最终看的不仅是效果,还要考虑算力成本和运行效率

基于这些思考,讯飞星辰推出了 Agent 开发平台,面向企业 IT 从业者和开发者。平台主要分为三部分:低代码 Agent 构建模式,满足快速原型的需求;丰富的工具系统,作为 Agent 的“手脚”;以及全链路的效果定制与优化工具链,帮助开发者持续调优。开发范式上,现在主流有三种:Prompt 工程、工作流模式和自主 Agent。Prompt 工程简单直接,但幻觉问题严重;工作流是为了解决这个问题,把流程逻辑枚举出来,通过模型组合与分支控制让结果更可控,还能用大小模型组合降低成本;而自主 Agent 更开放,适合那些无法预先枚举流程的复杂场景,比如调研报告生成、PPT 制作或复杂文档问答。


举个例子,企业常见的文档问答需求,涉及不同日期、不同表格,工作流往往应对不了,幻觉频出。但通过“固定大流程 + 自主规划”的混合方式,就能在明确的主路径下,让 Agent 自行处理场景内的开放任务。平台已经支持这种 Agentic Workflow 的范式,开发者可以直接体验。

要让 Agent 真正有用,核心还是RAG和工具,是大模型的“记忆和手脚”,是实现Agent应用的核心,从通用到场景化的知识和工具,是实现应用个性化效果的关键。最典型的落地场景是信息检索,平台上上线了知识库Pro节点,支持二次反思与推理,也就是Agentic RAG的模式。它会在首次召回后再判断是否继续搜索,从而避免片面回答,效果提升非常明显。与此同时,平台还提供了丰富的通用工具,比如联网搜索、OCR 识别,也针对开发者常见需求内置了 Excel 解析、文档解析等插件。

当然,快速搭建 Agent 只是第一步,真正上线时最大的问题是调优。很多开发者抱怨:半天能做出一个 Agent,但还要半天调效果。为此,我们构建了端到端的测评体系,支持对模型、工具、知识库的快速测评,生成智能和人工结合的报告,再用平台提供的调优工具快速优化,包括 Prompt 工程、模型对比测试、版本管理等。完成调优后,还能通过灰度发布和效果观测形成闭环,数据飞轮不断驱动 Agent 应用进化。


举一个案例:我们帮地铁做虚拟人购票系统。最初开发者用最大尺寸的通用模型,结果效果不行、成本太高、响应太慢。后来通过 Workflow 拆解,把大任务分为预处理、意图分类、操控执行等多步骤,每一步用小模型配合微调。最终只用 2.6B 的小模型,就满足了需求,性能提升 70%,成本降到原来的 5%。

重新定义文旅

当旅游不再是单纯的看风景,而是一场沉浸式的探险,会发生什么?当文旅行业遇上AIGC,我们又该如何重新定义旅游的意义?我们在其中又能扮演怎样的角色?讯飞创孵伙伴、方天圣华数字科技有限公司的总经理陈冠宇结合行业实践分享了破解思路。方天圣华在2023年获得讯飞开放平台生态投资,公司借助讯飞超拟人合成和星火大模型,通过AR虚拟导游进行文化讲解、交互合影、实景导航,让游客在景区旅行中,通过与古人跨时空对话和文物自述中熟悉历史。

- 沉浸式剧本体验。借鉴年轻人喜欢的剧本杀,把故事放在真实的景区环境中,并赋予深厚的文化背景。传统旅游就像一场设定好的电影,游客只能被动观看;而沉浸式剧本让游客亲自扮演角色,成为故事的主角。AI 技术帮我们为景区生成多条非线性剧情线,每个身份对应一套专属剧情,每次选择都会影响最终结局。这样,游客的体验从“打卡式”转变为“探索式”,参与感和新鲜感大大增强。游客之间还能通过身份设定在同一地点互动,交换情报,形成社交关系。


- “时空宝藏”活动。我们不希望项目停留在虚拟层面,而是打造线上线下融合的商业闭环。游客用 APP 扫描景区指定地点,就能获得宝藏卡牌,每张卡牌背后都有历史人物的生平和故事。这样一来,游客在寻宝的过程中既获得奖励,也学习知识。得益于AIGC,我们得以在短时间内完成从文本撰写、卡牌设计、技术开发的上到上线的全流程。


- 开发“宿命匹配系统”。旅游不只是看风景,更是结交朋友。传统交友基于外貌、年龄等浅层条件,而宿命匹配系统基于文化兴趣和价值观,通过沉浸式剧情选择、历史任务完成、命理解读等方式,为游客匹配志同道合的伙伴。

PART 2
活动不止于分享,更注重互动与共创

Q&A环节,开发者们踊跃提问


“为什么同一个问题多次提问,模型给出的答案会前后不一,甚至在文本纠错和知识库检索时出现随机性和上下文丢失,这种不稳定究竟由哪些因素造成?随着 C 端调用量下降、B 端需求激增,大模型是否会逐渐从通用走向垂直与专家化,规模越来越小?在探索自主 Agent 的过程中,如何应对 token 消耗过大的成本挑战,是否有更高效的优化方式?对于数字文旅项目,又该如何保障知识产权,并真正将游客的需求转化为 AI 产品?”

现场嘉宾围绕这些问题进行了回应与深度交流,分享了不同角度的思考与实践经验。

讯飞开放平台与AI大学堂长期以来致力于链接开发者,通过知识分享与交流,帮助开发者在AI领域一站式学习和项目成功。


 

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐