2025软件工程领域顶级国际会议ASE（THS）

AI4SE技术成熟: AI技术在软件工程领域的应用达到新高度自动化水平提升: 从辅助工具向自主智能体演进真实场景验证: 研究更加贴近实际开发需求跨领域融合: 程序分析、AI、形式化方法的深度结合智能化程度不断提升: AI技术从辅助工具发展为智能伙伴自动化范围持续扩大: 覆盖软件开发全生命周期可靠性要求日益严格: 特别是在安全关键领域人机协作模式优化: 探索最佳的人机协作方式ASE 2025会议展示

DK_Allen

527人浏览 · 2025-12-02 20:28:12

DK_Allen · 2025-12-02 20:28:12 发布

Date: November 17-20, 2025

Location: Seoul, South Korea

会议概况

ASE（Automated Software Engineering）是软件工程领域的顶级国际会议，2025年会议在韩国首尔举办。本次会议聚焦于AI时代软件工程的全栈自动化技术，涵盖了AI4SE/SE4AI、自主系统、程序分析与修复、仓库挖掘、正式方法等前沿方向。

会议基本信息

会议名称: 第30届自动化软件工程国际会议 (ASE 2025)
举办地点: 韩国首尔
参会人数: 接近1000人
中国参与度: 接受论文数量最多，占比58.6%

近五年大会主题分析

主题演变趋势

年份	大会主题	核心技术方向
ASE 2025	AI时代的软件工程全栈自动化	AI4SE/SE4AI、自主系统、程序分析/修复、仓库挖掘、正式方法强化
ASE 2024	AI驱动SE + 可持续性	AI-for-SE、云/移动/区块链，软件伦理、经济与绿色软件
ASE 2023	自动化全谱持续推进，强化人因	程序分析/生成 + 协作开发、程序理解、可视化
ASE 2022	传统SE自动化核心加强，与AI深度融合	测试、程序修复、MDE、DevOps、形式验证
ASE 2021	自动化测试、程序分析与AI辅助工程的基础巩固期	重构、调试、形式方法

关键趋势洞察

AI4SE从弱到强的演进：

2021年：AI技术开始试探性应用
2023年：AI技术成为主流研究方向
2025年：AI技术成为大会绝对核心

传统技术持续深化：

程序分析、自动修复、自动生成等技术保持持续热度
成为ASE会议的技术基石和创新源泉

正式方法回归重点：

随着AI系统与复杂软件的可靠性需求增加
形式化验证和安全性分析重新成为研究热点

人因工程地位上升：

LLM技术推动"AI+人类协同开发"模式
人机协作成为软件工程的重要发展方向

2025年会议数据统计

投稿与接受情况

投稿数量: 持续增长趋势
中国地区表现: 接受论文数量最多，占比58.6%
参会规模: 接近1000人，体现了会议的国际影响力

研究热点关键词

代码: 代码质量、代码生成、代码分析
测试: 自动化测试、测试生成、测试优化
大模型: LLM应用、AI辅助开发、智能代码生成

可视化数据展示

论文研究热点

主要研究方向概览

本次会议论文主要集中在以下几个热点方向：

1. 代码质量与测试

自动化代码修复技术
智能代码审查系统
漏洞检测与安全分析
软件测试自动化

2. 代码生成技术

基于大模型的代码生成
代码上下文压缩优化
错误导向的代码生成
代码编辑加速技术

3. 软件工程智能体

软件智能体框架设计
面向软件场景的LLM后训练
真实世界软件问题解决

4. 程序分析与理解

后续代码编辑预测
代码执行轨迹分析
软件演化模式识别

代码质量与测试研究

研究内容

随着软件复杂度的不断增加，传统的人工代码质量保证方法已难以满足需求。AI技术的发展为自动化代码质量保证提供了新的解决方案。

BitsAI-Fix: LLM-Driven Approach for Automated Lint Error Resolution in Practice（字节）

动机: 成千上万的技术债务直接让大模型修复时，经常出现"修坏了"或者"修多了"的问题，影响修复效果和可靠性。

方法:

上下文提取: 先用静态工具提取代码上下文、依赖关系，为模型提供更完整的信息
环境验证: 使用实际的代码运行环境检查修复是否成功，确保通过编译验证
人工确认: 只有成功通过编译的修复才会推给人类确认
持续优化: 收集线上成功、失败案例，通过强化学习训练模型

效果:

支持超过5,000名工程师
解决了12,000多条静态分析问题
修复准确率约为85%
每周活跃使用者约1,000

iCodeReviewer: Improving Secure Code Review with Mixture of Prompts（华为）

动机: 现有的代码审查工具要么漏报（未能发现实际问题），要么误报（报告大量假阳性问题），影响开发效率。

方法:

专家分类: 根据代码特征自动分类问题类型

指针操作 → 内存专家
数据库操作 → SQL注入专家

专业检查: 不同专家使用专门设计的检查清单
意见汇总: 综合多个相关专家的意见生成最终评审结果

效果:

F1值达到63.98%
相比直接使用GPT-4高出30%的准确率
显著降低了误报率和漏报率

LAURA: Enhancing Code Review Generation with Context-Enriched Retrieval-Augmented LLM（中国科学院大学）

动机: 现有的AI代码评审（Code Review）经常生成无关紧要的评论，或者无法理解Pull Request的背景和意图。

方法:

背景补全: 读取PR标题、描述、Commit信息，全面理解变更背景
历史学习: 搜索历史代码变动，学习资深程序员的评审模式
结构化思考: 强制AI按照"理解意图 → 找问题 → 给建议"的步骤进行推理

效果: 通过人工评审验证，历史审查例子显著增强了AI评审的质量和相关性。

研究趋势分析

趋势一：LLM与程序分析深度融合

挑战: LLM仅凭仓库代码难以满足高可靠性需求
解决方案: 程序分析（静态/动态）提供可验证的语义信息
目标: 形成"可验证的测试AI"，确保AI生成结果的正确性

趋势二：自动化修复进入"闭环"阶段

演进: 从"手工修复代码"迈向"自动修复与自动判定"
技术支撑: 利用可运行、可观测的沙盒系统
优势: 获得更为可靠的修复结果，减少人工干预

趋势三：审查方法细分专业化

问题: 单一方向审查准确度低下、误报率高
对策: 深入具体子领域（加密漏洞、空指针等）
效果: 取得更细致的审查和更好的效果

代码生成技术进展

研究内容

代码生成是AI在软件工程领域应用的重要方向，如何提高生成代码的质量、效率和准确性是当前研究的重点。

Learning Project-wise Subsequent Code Edits via Interleaving Neural-based Induction and Tool-based Deduction （TRAE）

动机：后续代码编辑预测，即修改了代码A后，预测仓库中其他需要修改的代码

主要方法：

编辑组合触发器（神经网络分类器）：判断是否需要使用预定义工具组合直接定位修改点
编辑定位器（掩码语言模型）：预定义一些行内和行间的操作，比如这一行是否需要修改、删除。预测下一步需要修改的地方
最后生成器生成预测修改代码

问题：中间的错误可能会累积，比如神经网络的预测不一定准确

LongCodeZip: Compress Long Context for Code Language Models（上交）

动机: 传统RAG检索到的上下文过长，影响大模型的处理效率和生成质量。需要一种有效的上下文压缩方法。

方法:

函数级压缩: 用困惑度评价每个函数的重要性，筛选关键函数
代码段级压缩: 继续用困惑度筛选函数中的重要代码片段
智能生成: 基于压缩后的上下文生成代码

优势:

有效压缩上下文，保持生成效果接近不压缩情况
提高大模型处理长代码的效率
减少计算资源消耗

局限:

压缩过程需要额外时间
可能筛选掉部分有用代码
在某些场景下可能不需要压缩

FGIT: Fault-Guided Fine-Tuning for Code Generation（浙大）

动机: 在代码生成过程中，某些特定模式的错误频繁出现，需要针对性优化。

方法:

数据收集: 获取指令和正确代码样本
错误构建: 人为构建常见错误代码模式
错误标记: 对错误代码位置进行特殊标记
加权训练: 训练时对易错位置给予更高权重

技术创新:

首次将错误导向的思想应用于代码生成
提高模型对易错点的关注度
减少常见错误的发生频率

局限:

对比方法相对陈旧（GPT-3.5）
需要更多最新模型的对比验证

EFFICIENTEDIT: Accelerating Code Editing via Edit-Oriented Speculative Decoding（北航）

动机: 代码编辑是软件开发的核心活动，如何提高代码编辑的效率具有重要意义。

方法:

小模型快速生成: 先用小模型生成多个token
大模型验证优化: 然后让大模型验证准确性
迭代生成: 循环迭代直到生成完整输出

技术创新:

将推测解码（Speculative Decoding）技术应用到代码生成
平衡生成速度和质量
显著提升代码编辑效率

Demystifying LLM-based Software Engineering Agents

报告人: 张令明教授（特邀嘉宾）

报告核心内容

张令明教授在keynote报告中深入讨论了软件工程智能体的发展历史和最新趋势，介绍了在智能体框架设计和面向软件场景的LLM后训练方面的重要工作。

总体设计理念

更真实的场景: 基于实际软件开发环境
更聚焦的问题: 针对具体软件工程任务
更复杂的环境交互: 模拟真实开发过程
深度理解关联: 学习软件、代码及工程师之间的关系

Agentless: Demystifying LLM-based Software Engineering Agents

核心思想

LLM不负责复杂的计划（planning）和工具操作，避免了agent-based方法中"决策空间太大/迭代过深"的问题，属于高度任务定制化的固定智能体。

三阶段处理流程

问题定位阶段

确定bug或问题所在的文件、类、函数、具体代码行
结合LLM能力和传统信息检索（IR）方法
提高问题定位的准确性和效率

补丁生成阶段

基于定位好的位置生成多个候选补丁
输出格式为简单的diff，而非重写整个代码文件
确保修复的精确性和可理解性

测试验证阶段

生成重现测试（LLM参与测试生成）
运行测试和回归测试
对候选补丁进行排序和筛选

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

主要思想

利用真实软件演化数据（issue-代码-patch轨迹）构造基于规则奖励的强化学习信号，对LLM进行面向软件工程场景的后训练。

技术实现

基础模型: 在Llama3基础上进行优化
数据构建: 使用开源项目的issue、代码上下文与真实补丁
奖励设计: 轻量级相似度奖励（rule-based reward）
学习目标: 端到端推理过程（问题分析 → 代码定位 → 生成修复patch）

预期效果

使模型学会开发者式的推理与补丁生成能力，大幅提升真实GitHub issue的解决率。

CWM: An Open-Weights LLM for Research on Code Generation with World Models

核心理念

通过"代码世界建模"，让模型学习代码执行轨迹和环境交互，提升在软件工程任务上的表现。

四阶段训练流程

预训练阶段: 基础语言模型训练
中期训练阶段:

使用大量Python解释器执行轨迹
容器环境中的observation-action交互数据
让模型理解"代码执行如何改变程序状态"

监督微调阶段:

针对特定任务进行微调
优化模型在具体场景的表现

强化学习阶段:

在多任务软件工程环境中优化
数学和代码生成环境中的进一步提升

研究趋势分析

趋势一：AI与软件工程深度融合

技术演进路径

初级阶段: AI辅助工具，提高开发效率
中级阶段: AI驱动的自动化系统，减少人工干预
高级阶段: 自主软件工程智能体，具备独立决策能力

关键技术突破

大模型在代码理解和生成方面的能力提升
程序分析技术与AI的结合
真实开发环境的模拟和建模

趋势二：软件工程智能化程度不断提升

自动化水平演进

代码生成: 从模板化到智能化
测试自动化: 从单元测试到端到端测试
代码修复: 从简单修复到复杂问题解决

智能化特征

自我学习和持续优化能力
上下文理解和推理能力
多任务协同处理能力

趋势三：真实场景驱动的研究

研究方法论变化

从实验室环境转向真实开发环境
从人工数据集转向真实项目数据
从单一任务转向复杂场景

技术挑战

处理真实世界的复杂性和不确定性
确保AI系统的可靠性和安全性
平衡自动化和人工干预

总结与展望

会议主要成果

技术创新亮点

AI4SE技术成熟: AI技术在软件工程领域的应用达到新高度
自动化水平提升: 从辅助工具向自主智能体演进
真实场景验证: 研究更加贴近实际开发需求
跨领域融合: 程序分析、AI、形式化方法的深度结合

研究趋势总结

智能化程度不断提升: AI技术从辅助工具发展为智能伙伴
自动化范围持续扩大: 覆盖软件开发全生命周期
可靠性要求日益严格: 特别是在安全关键领域
人机协作模式优化: 探索最佳的人机协作方式

对产业发展的影响

技术变革

软件开发效率大幅提升
软件质量和可靠性显著改善
开发成本有效降低

人才需求变化

对AI技术的需求增加
传统开发技能的转型升级
跨学科人才的需求增长

产业生态重构

新的工具和平台涌现
软件开发流程的重新设计
新的商业模式和服务模式

结语

ASE 2025会议展示了AI时代软件工程的最新发展成果，预示着软件工程正进入一个智能化、自动化的新时代。

本报告基于ASE 2025会议资料整理而成，旨在总结会议主要成果和研究趋势，为相关研究和实践提供参考。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

基于多源信息融合的杂草生长中心识别与判定技术研究

本文提出基于多源数据融合的杂草生长中心智能判定技术框架，旨在实现农田杂草热点的精准定位。通过融合无人机航拍、卫星遥感和地面传感器数据，结合U-Net语义分割和核密度估计算法，构建了从数据采集、杂草识别到空间分析的全流程技术方案。研究验证该技术可实现85%以上的识别精度，显著优于传统人工方法。文章还探讨了阴影干扰、成本优化等现实挑战，并指出多模态融合模型和边缘AI集成是未来发展方向，为精准农业中的变

2048 AI社区

UVa 10486 Mountain Village

2048 AI社区

可持续发展绩效与公司财务表现的相关性

本研究旨在深入探究可持续发展绩效与公司财务表现之间的关联机制。通过对相关理论和实际案例的分析，明确可持续发展绩效的提升如何影响公司的财务指标，以及公司财务状况的变化对可持续发展战略实施的反馈作用。研究范围涵盖了不同行业、不同规模的企业，分析其在可持续发展实践和财务表现方面的共性与差异。本文首先介绍了研究的背景和相关概念，包括可持续发展绩效和公司财务表现的定义及内涵。接着阐述了核心概念之间的联系，并