2025软件工程领域顶级国际会议ASE(THS)
AI4SE技术成熟: AI技术在软件工程领域的应用达到新高度自动化水平提升: 从辅助工具向自主智能体演进真实场景验证: 研究更加贴近实际开发需求跨领域融合: 程序分析、AI、形式化方法的深度结合智能化程度不断提升: AI技术从辅助工具发展为智能伙伴自动化范围持续扩大: 覆盖软件开发全生命周期可靠性要求日益严格: 特别是在安全关键领域人机协作模式优化: 探索最佳的人机协作方式ASE 2025会议展示

Date: November 17-20, 2025
Location: Seoul, South Korea
会议概况
ASE(Automated Software Engineering)是软件工程领域的顶级国际会议,2025年会议在韩国首尔举办。本次会议聚焦于AI时代软件工程的全栈自动化技术,涵盖了AI4SE/SE4AI、自主系统、程序分析与修复、仓库挖掘、正式方法等前沿方向。
会议基本信息
- 会议名称: 第30届自动化软件工程国际会议 (ASE 2025)
- 举办地点: 韩国首尔
- 参会人数: 接近1000人
- 中国参与度: 接受论文数量最多,占比58.6%
近五年大会主题分析
主题演变趋势
|
年份 |
大会主题 |
核心技术方向 |
|
ASE 2025 |
AI时代的软件工程全栈自动化 |
AI4SE/SE4AI、自主系统、程序分析/修复、仓库挖掘、正式方法强化 |
|
ASE 2024 |
AI驱动SE + 可持续性 |
AI-for-SE、云/移动/区块链,软件伦理、经济与绿色软件 |
|
ASE 2023 |
自动化全谱持续推进,强化人因 |
程序分析/生成 + 协作开发、程序理解、可视化 |
|
ASE 2022 |
传统SE自动化核心加强,与AI深度融合 |
测试、程序修复、MDE、DevOps、形式验证 |
|
ASE 2021 |
自动化测试、程序分析与AI辅助工程的基础巩固期 |
重构、调试、形式方法 |
关键趋势洞察
- AI4SE从弱到强的演进:
- 2021年:AI技术开始试探性应用
- 2023年:AI技术成为主流研究方向
- 2025年:AI技术成为大会绝对核心
- 传统技术持续深化:
- 程序分析、自动修复、自动生成等技术保持持续热度
- 成为ASE会议的技术基石和创新源泉
- 正式方法回归重点:
- 随着AI系统与复杂软件的可靠性需求增加
- 形式化验证和安全性分析重新成为研究热点
- 人因工程地位上升:
- LLM技术推动"AI+人类协同开发"模式
- 人机协作成为软件工程的重要发展方向
2025年会议数据统计
投稿与接受情况
- 投稿数量: 持续增长趋势
- 中国地区表现: 接受论文数量最多,占比58.6%
- 参会规模: 接近1000人,体现了会议的国际影响力
研究热点关键词
- 代码: 代码质量、代码生成、代码分析
- 测试: 自动化测试、测试生成、测试优化
- 大模型: LLM应用、AI辅助开发、智能代码生成
可视化数据展示




论文研究热点
主要研究方向概览
本次会议论文主要集中在以下几个热点方向:
1. 代码质量与测试
- 自动化代码修复技术
- 智能代码审查系统
- 漏洞检测与安全分析
- 软件测试自动化
2. 代码生成技术
- 基于大模型的代码生成
- 代码上下文压缩优化
- 错误导向的代码生成
- 代码编辑加速技术
3. 软件工程智能体
- 软件智能体框架设计
- 面向软件场景的LLM后训练
- 真实世界软件问题解决
4. 程序分析与理解
- 后续代码编辑预测
- 代码执行轨迹分析
- 软件演化模式识别
代码质量与测试研究
研究内容
随着软件复杂度的不断增加,传统的人工代码质量保证方法已难以满足需求。AI技术的发展为自动化代码质量保证提供了新的解决方案。
BitsAI-Fix: LLM-Driven Approach for Automated Lint Error Resolution in Practice(字节)

动机: 成千上万的技术债务直接让大模型修复时,经常出现"修坏了"或者"修多了"的问题,影响修复效果和可靠性。
方法:
- 上下文提取: 先用静态工具提取代码上下文、依赖关系,为模型提供更完整的信息
- 环境验证: 使用实际的代码运行环境检查修复是否成功,确保通过编译验证
- 人工确认: 只有成功通过编译的修复才会推给人类确认
- 持续优化: 收集线上成功、失败案例,通过强化学习训练模型
效果:
- 支持超过5,000名工程师
- 解决了12,000多条静态分析问题
- 修复准确率约为85%
- 每周活跃使用者约1,000
iCodeReviewer: Improving Secure Code Review with Mixture of Prompts(华为)

动机: 现有的代码审查工具要么漏报(未能发现实际问题),要么误报(报告大量假阳性问题),影响开发效率。
方法:
- 专家分类: 根据代码特征自动分类问题类型
- 指针操作 → 内存专家
- 数据库操作 → SQL注入专家
- 专业检查: 不同专家使用专门设计的检查清单
- 意见汇总: 综合多个相关专家的意见生成最终评审结果
效果:
- F1值达到63.98%
- 相比直接使用GPT-4高出30%的准确率
- 显著降低了误报率和漏报率
LAURA: Enhancing Code Review Generation with Context-Enriched Retrieval-Augmented LLM(中国科学院大学)

动机: 现有的AI代码评审(Code Review)经常生成无关紧要的评论,或者无法理解Pull Request的背景和意图。
方法:
- 背景补全: 读取PR标题、描述、Commit信息,全面理解变更背景
- 历史学习: 搜索历史代码变动,学习资深程序员的评审模式
- 结构化思考: 强制AI按照"理解意图 → 找问题 → 给建议"的步骤进行推理
效果: 通过人工评审验证,历史审查例子显著增强了AI评审的质量和相关性。
研究趋势分析
趋势一:LLM与程序分析深度融合
- 挑战: LLM仅凭仓库代码难以满足高可靠性需求
- 解决方案: 程序分析(静态/动态)提供可验证的语义信息
- 目标: 形成"可验证的测试AI",确保AI生成结果的正确性
趋势二:自动化修复进入"闭环"阶段
- 演进: 从"手工修复代码"迈向"自动修复与自动判定"
- 技术支撑: 利用可运行、可观测的沙盒系统
- 优势: 获得更为可靠的修复结果,减少人工干预
趋势三:审查方法细分专业化
- 问题: 单一方向审查准确度低下、误报率高
- 对策: 深入具体子领域(加密漏洞、空指针等)
- 效果: 取得更细致的审查和更好的效果
代码生成技术进展
研究内容
代码生成是AI在软件工程领域应用的重要方向,如何提高生成代码的质量、效率和准确性是当前研究的重点。
Learning Project-wise Subsequent Code Edits via Interleaving Neural-based Induction and Tool-based Deduction (TRAE)


动机:后续代码编辑预测,即修改了代码A后,预测仓库中其他需要修改的代码
主要方法:
- 编辑组合触发器(神经网络分类器): 判断是否需要使用预定义工具组合直接定位修改点
- 编辑定位器(掩码语言模型):预定义一些行内和行间的操作,比如这一行是否需要修改、删除。预测下一步需要修改的地方
- 最后生成器生成预测修改代码
问题:中间的错误可能会累积,比如神经网络的预测不一定准确
LongCodeZip: Compress Long Context for Code Language Models(上交)

动机: 传统RAG检索到的上下文过长,影响大模型的处理效率和生成质量。需要一种有效的上下文压缩方法。
方法:
- 函数级压缩: 用困惑度评价每个函数的重要性,筛选关键函数
- 代码段级压缩: 继续用困惑度筛选函数中的重要代码片段
- 智能生成: 基于压缩后的上下文生成代码
优势:
- 有效压缩上下文,保持生成效果接近不压缩情况
- 提高大模型处理长代码的效率
- 减少计算资源消耗
局限:
- 压缩过程需要额外时间
- 可能筛选掉部分有用代码
- 在某些场景下可能不需要压缩
FGIT: Fault-Guided Fine-Tuning for Code Generation(浙大)

动机: 在代码生成过程中,某些特定模式的错误频繁出现,需要针对性优化。
方法:
- 数据收集: 获取指令和正确代码样本
- 错误构建: 人为构建常见错误代码模式
- 错误标记: 对错误代码位置进行特殊标记
- 加权训练: 训练时对易错位置给予更高权重
技术创新:
- 首次将错误导向的思想应用于代码生成
- 提高模型对易错点的关注度
- 减少常见错误的发生频率
局限:
- 对比方法相对陈旧(GPT-3.5)
- 需要更多最新模型的对比验证
EFFICIENTEDIT: Accelerating Code Editing via Edit-Oriented Speculative Decoding(北航)

动机: 代码编辑是软件开发的核心活动,如何提高代码编辑的效率具有重要意义。
方法:
- 小模型快速生成: 先用小模型生成多个token
- 大模型验证优化: 然后让大模型验证准确性
- 迭代生成: 循环迭代直到生成完整输出
技术创新:
- 将推测解码(Speculative Decoding)技术应用到代码生成
- 平衡生成速度和质量
- 显著提升代码编辑效率
Demystifying LLM-based Software Engineering Agents
报告人: 张令明教授(特邀嘉宾)
报告核心内容
张令明教授在keynote报告中深入讨论了软件工程智能体的发展历史和最新趋势,介绍了在智能体框架设计和面向软件场景的LLM后训练方面的重要工作。
总体设计理念
- 更真实的场景: 基于实际软件开发环境
- 更聚焦的问题: 针对具体软件工程任务
- 更复杂的环境交互: 模拟真实开发过程
- 深度理解关联: 学习软件、代码及工程师之间的关系
Agentless: Demystifying LLM-based Software Engineering Agents

核心思想
LLM不负责复杂的计划(planning)和工具操作,避免了agent-based方法中"决策空间太大/迭代过深"的问题,属于高度任务定制化的固定智能体。
三阶段处理流程
- 问题定位阶段
- 确定bug或问题所在的文件、类、函数、具体代码行
- 结合LLM能力和传统信息检索(IR)方法
- 提高问题定位的准确性和效率
- 补丁生成阶段
- 基于定位好的位置生成多个候选补丁
- 输出格式为简单的diff,而非重写整个代码文件
- 确保修复的精确性和可理解性
- 测试验证阶段
- 生成重现测试(LLM参与测试生成)
- 运行测试和回归测试
- 对候选补丁进行排序和筛选
SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

主要思想
利用真实软件演化数据(issue-代码-patch轨迹)构造基于规则奖励的强化学习信号,对LLM进行面向软件工程场景的后训练。
技术实现
- 基础模型: 在Llama3基础上进行优化
- 数据构建: 使用开源项目的issue、代码上下文与真实补丁
- 奖励设计: 轻量级相似度奖励(rule-based reward)
- 学习目标: 端到端推理过程(问题分析 → 代码定位 → 生成修复patch)
预期效果
使模型学会开发者式的推理与补丁生成能力,大幅提升真实GitHub issue的解决率。
CWM: An Open-Weights LLM for Research on Code Generation with World Models

核心理念
通过"代码世界建模",让模型学习代码执行轨迹和环境交互,提升在软件工程任务上的表现。
四阶段训练流程
- 预训练阶段: 基础语言模型训练
- 中期训练阶段:
- 使用大量Python解释器执行轨迹
- 容器环境中的observation-action交互数据
- 让模型理解"代码执行如何改变程序状态"
- 监督微调阶段:
- 针对特定任务进行微调
- 优化模型在具体场景的表现
- 强化学习阶段:
- 在多任务软件工程环境中优化
- 数学和代码生成环境中的进一步提升
研究趋势分析
趋势一:AI与软件工程深度融合
技术演进路径
- 初级阶段: AI辅助工具,提高开发效率
- 中级阶段: AI驱动的自动化系统,减少人工干预
- 高级阶段: 自主软件工程智能体,具备独立决策能力
关键技术突破
- 大模型在代码理解和生成方面的能力提升
- 程序分析技术与AI的结合
- 真实开发环境的模拟和建模
趋势二:软件工程智能化程度不断提升
自动化水平演进
- 代码生成: 从模板化到智能化
- 测试自动化: 从单元测试到端到端测试
- 代码修复: 从简单修复到复杂问题解决
智能化特征
- 自我学习和持续优化能力
- 上下文理解和推理能力
- 多任务协同处理能力
趋势三:真实场景驱动的研究
研究方法论变化
- 从实验室环境转向真实开发环境
- 从人工数据集转向真实项目数据
- 从单一任务转向复杂场景
技术挑战
- 处理真实世界的复杂性和不确定性
- 确保AI系统的可靠性和安全性
- 平衡自动化和人工干预
总结与展望
会议主要成果
技术创新亮点
- AI4SE技术成熟: AI技术在软件工程领域的应用达到新高度
- 自动化水平提升: 从辅助工具向自主智能体演进
- 真实场景验证: 研究更加贴近实际开发需求
- 跨领域融合: 程序分析、AI、形式化方法的深度结合
研究趋势总结
- 智能化程度不断提升: AI技术从辅助工具发展为智能伙伴
- 自动化范围持续扩大: 覆盖软件开发全生命周期
- 可靠性要求日益严格: 特别是在安全关键领域
- 人机协作模式优化: 探索最佳的人机协作方式
对产业发展的影响
技术变革
- 软件开发效率大幅提升
- 软件质量和可靠性显著改善
- 开发成本有效降低
人才需求变化
- 对AI技术的需求增加
- 传统开发技能的转型升级
- 跨学科人才的需求增长
产业生态重构
- 新的工具和平台涌现
- 软件开发流程的重新设计
- 新的商业模式和服务模式
结语
ASE 2025会议展示了AI时代软件工程的最新发展成果,预示着软件工程正进入一个智能化、自动化的新时代。
本报告基于ASE 2025会议资料整理而成,旨在总结会议主要成果和研究趋势,为相关研究和实践提供参考。
更多推荐

所有评论(0)