Date: November 17-20, 2025

Location: Seoul, South Korea


会议概况

ASE(Automated Software Engineering)是软件工程领域的顶级国际会议,2025年会议在韩国首尔举办。本次会议聚焦于AI时代软件工程的全栈自动化技术,涵盖了AI4SE/SE4AI、自主系统、程序分析与修复、仓库挖掘、正式方法等前沿方向。

会议基本信息

  • 会议名称: 第30届自动化软件工程国际会议 (ASE 2025)
  • 举办地点: 韩国首尔
  • 参会人数: 接近1000人
  • 中国参与度: 接受论文数量最多,占比58.6%

近五年大会主题分析

主题演变趋势

年份

大会主题

核心技术方向

ASE 2025

AI时代的软件工程全栈自动化

AI4SE/SE4AI、自主系统、程序分析/修复、仓库挖掘、正式方法强化

ASE 2024

AI驱动SE + 可持续性

AI-for-SE、云/移动/区块链,软件伦理、经济与绿色软件

ASE 2023

自动化全谱持续推进,强化人因

程序分析/生成 + 协作开发、程序理解、可视化

ASE 2022

传统SE自动化核心加强,与AI深度融合

测试、程序修复、MDE、DevOps、形式验证

ASE 2021

自动化测试、程序分析与AI辅助工程的基础巩固期

重构、调试、形式方法

关键趋势洞察

  1. AI4SE从弱到强的演进
  • 2021年:AI技术开始试探性应用
  • 2023年:AI技术成为主流研究方向
  • 2025年:AI技术成为大会绝对核心
  1. 传统技术持续深化
  • 程序分析、自动修复、自动生成等技术保持持续热度
  • 成为ASE会议的技术基石和创新源泉
  1. 正式方法回归重点
  • 随着AI系统与复杂软件的可靠性需求增加
  • 形式化验证和安全性分析重新成为研究热点
  1. 人因工程地位上升
  • LLM技术推动"AI+人类协同开发"模式
  • 人机协作成为软件工程的重要发展方向

2025年会议数据统计

投稿与接受情况

  • 投稿数量: 持续增长趋势
  • 中国地区表现: 接受论文数量最多,占比58.6%
  • 参会规模: 接近1000人,体现了会议的国际影响力

研究热点关键词

  • 代码: 代码质量、代码生成、代码分析
  • 测试: 自动化测试、测试生成、测试优化
  • 大模型: LLM应用、AI辅助开发、智能代码生成

可视化数据展示


论文研究热点

主要研究方向概览

本次会议论文主要集中在以下几个热点方向:

1. 代码质量与测试
  • 自动化代码修复技术
  • 智能代码审查系统
  • 漏洞检测与安全分析
  • 软件测试自动化
2. 代码生成技术
  • 基于大模型的代码生成
  • 代码上下文压缩优化
  • 错误导向的代码生成
  • 代码编辑加速技术
3. 软件工程智能体
  • 软件智能体框架设计
  • 面向软件场景的LLM后训练
  • 真实世界软件问题解决
4. 程序分析与理解
  • 后续代码编辑预测
  • 代码执行轨迹分析
  • 软件演化模式识别

代码质量与测试研究

研究内容

随着软件复杂度的不断增加,传统的人工代码质量保证方法已难以满足需求。AI技术的发展为自动化代码质量保证提供了新的解决方案。


BitsAI-Fix: LLM-Driven Approach for Automated Lint Error Resolution in Practice(字节)

动机: 成千上万的技术债务直接让大模型修复时,经常出现"修坏了"或者"修多了"的问题,影响修复效果和可靠性。

方法:

  1. 上下文提取: 先用静态工具提取代码上下文、依赖关系,为模型提供更完整的信息
  2. 环境验证: 使用实际的代码运行环境检查修复是否成功,确保通过编译验证
  3. 人工确认: 只有成功通过编译的修复才会推给人类确认
  4. 持续优化: 收集线上成功、失败案例,通过强化学习训练模型

效果:

  • 支持超过5,000名工程师
  • 解决了12,000多条静态分析问题
  • 修复准确率约为85%
  • 每周活跃使用者约1,000


iCodeReviewer: Improving Secure Code Review with Mixture of Prompts(华为)

动机: 现有的代码审查工具要么漏报(未能发现实际问题),要么误报(报告大量假阳性问题),影响开发效率。

方法:

  1. 专家分类: 根据代码特征自动分类问题类型
  • 指针操作 → 内存专家
  • 数据库操作 → SQL注入专家
  1. 专业检查: 不同专家使用专门设计的检查清单
  2. 意见汇总: 综合多个相关专家的意见生成最终评审结果

效果:

  • F1值达到63.98%
  • 相比直接使用GPT-4高出30%的准确率
  • 显著降低了误报率和漏报率

LAURA: Enhancing Code Review Generation with Context-Enriched Retrieval-Augmented LLM(中国科学院大学)

动机: 现有的AI代码评审(Code Review)经常生成无关紧要的评论,或者无法理解Pull Request的背景和意图。

方法:

  1. 背景补全: 读取PR标题、描述、Commit信息,全面理解变更背景
  2. 历史学习: 搜索历史代码变动,学习资深程序员的评审模式
  3. 结构化思考: 强制AI按照"理解意图 → 找问题 → 给建议"的步骤进行推理

效果: 通过人工评审验证,历史审查例子显著增强了AI评审的质量和相关性。


研究趋势分析

趋势一:LLM与程序分析深度融合
  • 挑战: LLM仅凭仓库代码难以满足高可靠性需求
  • 解决方案: 程序分析(静态/动态)提供可验证的语义信息
  • 目标: 形成"可验证的测试AI",确保AI生成结果的正确性
趋势二:自动化修复进入"闭环"阶段
  • 演进: 从"手工修复代码"迈向"自动修复与自动判定"
  • 技术支撑: 利用可运行、可观测的沙盒系统
  • 优势: 获得更为可靠的修复结果,减少人工干预
趋势三:审查方法细分专业化
  • 问题: 单一方向审查准确度低下、误报率高
  • 对策: 深入具体子领域(加密漏洞、空指针等)
  • 效果: 取得更细致的审查和更好的效果

代码生成技术进展

研究内容

代码生成是AI在软件工程领域应用的重要方向,如何提高生成代码的质量、效率和准确性是当前研究的重点。


Learning Project-wise Subsequent Code Edits via Interleaving Neural-based Induction and Tool-based Deduction (TRAE)

动机:后续代码编辑预测,即修改了代码A后,预测仓库中其他需要修改的代码

主要方法:

  • 编辑组合触发器(神经网络分类器): 判断是否需要使用预定义工具组合直接定位修改点
  • 编辑定位器(掩码语言模型):预定义一些行内和行间的操作,比如这一行是否需要修改、删除。预测下一步需要修改的地方
  • 最后生成器生成预测修改代码

问题:中间的错误可能会累积,比如神经网络的预测不一定准确

LongCodeZip: Compress Long Context for Code Language Models(上交)

动机: 传统RAG检索到的上下文过长,影响大模型的处理效率和生成质量。需要一种有效的上下文压缩方法。

方法:

  1. 函数级压缩: 用困惑度评价每个函数的重要性,筛选关键函数
  2. 代码段级压缩: 继续用困惑度筛选函数中的重要代码片段
  3. 智能生成: 基于压缩后的上下文生成代码

优势:

  • 有效压缩上下文,保持生成效果接近不压缩情况
  • 提高大模型处理长代码的效率
  • 减少计算资源消耗

局限:

  • 压缩过程需要额外时间
  • 可能筛选掉部分有用代码
  • 在某些场景下可能不需要压缩

FGIT: Fault-Guided Fine-Tuning for Code Generation(浙大)

动机: 在代码生成过程中,某些特定模式的错误频繁出现,需要针对性优化。

方法:

  1. 数据收集: 获取指令和正确代码样本
  2. 错误构建: 人为构建常见错误代码模式
  3. 错误标记: 对错误代码位置进行特殊标记
  4. 加权训练: 训练时对易错位置给予更高权重

技术创新:

  • 首次将错误导向的思想应用于代码生成
  • 提高模型对易错点的关注度
  • 减少常见错误的发生频率

局限:

  • 对比方法相对陈旧(GPT-3.5)
  • 需要更多最新模型的对比验证

EFFICIENTEDIT: Accelerating Code Editing via Edit-Oriented Speculative Decoding(北航)

动机: 代码编辑是软件开发的核心活动,如何提高代码编辑的效率具有重要意义。

方法:

  1. 小模型快速生成: 先用小模型生成多个token
  2. 大模型验证优化: 然后让大模型验证准确性
  3. 迭代生成: 循环迭代直到生成完整输出

技术创新:

  • 将推测解码(Speculative Decoding)技术应用到代码生成
  • 平衡生成速度和质量
  • 显著提升代码编辑效率

Demystifying LLM-based Software Engineering Agents

报告人: 张令明教授(特邀嘉宾)

报告核心内容

张令明教授在keynote报告中深入讨论了软件工程智能体的发展历史和最新趋势,介绍了在智能体框架设计和面向软件场景的LLM后训练方面的重要工作。

总体设计理念

  • 更真实的场景: 基于实际软件开发环境
  • 更聚焦的问题: 针对具体软件工程任务
  • 更复杂的环境交互: 模拟真实开发过程
  • 深度理解关联: 学习软件、代码及工程师之间的关系

Agentless: Demystifying LLM-based Software Engineering Agents

核心思想

LLM不负责复杂的计划(planning)和工具操作,避免了agent-based方法中"决策空间太大/迭代过深"的问题,属于高度任务定制化的固定智能体。

三阶段处理流程
  1. 问题定位阶段
  • 确定bug或问题所在的文件、类、函数、具体代码行
  • 结合LLM能力和传统信息检索(IR)方法
  • 提高问题定位的准确性和效率
  1. 补丁生成阶段
  • 基于定位好的位置生成多个候选补丁
  • 输出格式为简单的diff,而非重写整个代码文件
  • 确保修复的精确性和可理解性
  1. 测试验证阶段
  • 生成重现测试(LLM参与测试生成)
  • 运行测试和回归测试
  • 对候选补丁进行排序和筛选

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

主要思想

利用真实软件演化数据(issue-代码-patch轨迹)构造基于规则奖励的强化学习信号,对LLM进行面向软件工程场景的后训练。

技术实现

  1. 基础模型: 在Llama3基础上进行优化
  2. 数据构建: 使用开源项目的issue、代码上下文与真实补丁
  3. 奖励设计: 轻量级相似度奖励(rule-based reward)
  4. 学习目标: 端到端推理过程(问题分析 → 代码定位 → 生成修复patch)

预期效果

使模型学会开发者式的推理与补丁生成能力,大幅提升真实GitHub issue的解决率。


CWM: An Open-Weights LLM for Research on Code Generation with World Models

核心理念

通过"代码世界建模",让模型学习代码执行轨迹和环境交互,提升在软件工程任务上的表现。

四阶段训练流程
  1. 预训练阶段: 基础语言模型训练
  2. 中期训练阶段:
  • 使用大量Python解释器执行轨迹
  • 容器环境中的observation-action交互数据
  • 让模型理解"代码执行如何改变程序状态"
  1. 监督微调阶段:
  • 针对特定任务进行微调
  • 优化模型在具体场景的表现
  1. 强化学习阶段:
  • 在多任务软件工程环境中优化
  • 数学和代码生成环境中的进一步提升

研究趋势分析

趋势一:AI与软件工程深度融合

技术演进路径
  • 初级阶段: AI辅助工具,提高开发效率
  • 中级阶段: AI驱动的自动化系统,减少人工干预
  • 高级阶段: 自主软件工程智能体,具备独立决策能力
关键技术突破
  • 大模型在代码理解和生成方面的能力提升
  • 程序分析技术与AI的结合
  • 真实开发环境的模拟和建模

趋势二:软件工程智能化程度不断提升

自动化水平演进
  • 代码生成: 从模板化到智能化
  • 测试自动化: 从单元测试到端到端测试
  • 代码修复: 从简单修复到复杂问题解决
智能化特征
  • 自我学习和持续优化能力
  • 上下文理解和推理能力
  • 多任务协同处理能力

趋势三:真实场景驱动的研究

研究方法论变化
  • 从实验室环境转向真实开发环境
  • 从人工数据集转向真实项目数据
  • 从单一任务转向复杂场景
技术挑战
  • 处理真实世界的复杂性和不确定性
  • 确保AI系统的可靠性和安全性
  • 平衡自动化和人工干预

总结与展望

会议主要成果

技术创新亮点
  1. AI4SE技术成熟: AI技术在软件工程领域的应用达到新高度
  2. 自动化水平提升: 从辅助工具向自主智能体演进
  3. 真实场景验证: 研究更加贴近实际开发需求
  4. 跨领域融合: 程序分析、AI、形式化方法的深度结合
研究趋势总结
  • 智能化程度不断提升: AI技术从辅助工具发展为智能伙伴
  • 自动化范围持续扩大: 覆盖软件开发全生命周期
  • 可靠性要求日益严格: 特别是在安全关键领域
  • 人机协作模式优化: 探索最佳的人机协作方式

对产业发展的影响

技术变革
  • 软件开发效率大幅提升
  • 软件质量和可靠性显著改善
  • 开发成本有效降低
人才需求变化
  • 对AI技术的需求增加
  • 传统开发技能的转型升级
  • 跨学科人才的需求增长
产业生态重构
  • 新的工具和平台涌现
  • 软件开发流程的重新设计
  • 新的商业模式和服务模式

结语

ASE 2025会议展示了AI时代软件工程的最新发展成果,预示着软件工程正进入一个智能化、自动化的新时代。


本报告基于ASE 2025会议资料整理而成,旨在总结会议主要成果和研究趋势,为相关研究和实践提供参考。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐