半监督医学分割的“新范式”!AAAI Oral DualFete,如何用“双向奔赴”解决模型偏见?
大家好!今天想和大家聊一篇非常有意思的论文,它来自四川大学和新加坡A\*STAR的学者们,被人工智能顶会AAAI 2026接收。这篇工作聚焦于半监督医学图像分割领域一个相当棘手的问题——“确认偏误”(Confirmation Bias)。

- 论文标题: DualFete: Revisiting Teacher-Student Interactions from a Feedback Perspective for Semi-supervised Medical Image Segmentation
- 作者: Le Yi, Wei Huang, Lei Zhang, Kefu Zhao (四川大学), Yan Wang, Zizhou Wang (A*STAR)
- 论文地址: https://arxiv.org/abs/2511.09319
- 代码仓库: https://github.com/lyricsyee/dualfete
- 录用信息: AAAI 2026 Oral
大家好!今天想和大家聊一篇非常有意思的论文,它来自四川大学和新加坡A*STAR的学者们,被人工智能顶会AAAI 2026接收。这篇工作聚焦于半监督医学图像分割领域一个相当棘手的问题——“确认偏误”(Confirmation Bias)。
简单来说,在数据有限的情况下,我们常常使用“教师-学生”(Teacher-Student)模型来挖掘未标注数据的价值。老师(Teacher模型)先给没标签的图片打上“伪标签”,然后学生(Student模型)去学习这些伪标签。听起来很美好,但如果老师一开始就看错了,给出了错误的伪标签,学生不仅会学错,还会在后续迭代中把这些错误“反馈”给老师,导致老师也越来越坚信自己的错误判断。这就形成了一个恶性循环,模型的偏见被不断放大。
为了打破这个僵局,研究者们提出了一个名为 DualFete 的新框架。这里的“Fete”是“Feedback-coupled Teacher-Student”的缩写,核心思想是在师生之间建立一个新颖的“反馈机制”,让学生拥有“纠错”的能力。
一、“确认偏误”的困境与现有方法的局限
在半监督医学图像分割(Semi-supervised Medical Image Segmentation, SSMIS)任务中,由于医学图像本身存在的模糊性,尤其是在器官或病灶的边界区域,模型很容易产生不确定的、甚至错误的预测。
传统的教师-学生框架,比如经典的Mean Teacher模型,虽然通过模型扰动等方式试图让师生模型产生差异,从而学习到更鲁棒的特征,但它们缺少一个内在的纠错机制。一旦老师犯错,学生只能被动接受,整个系统会陷入“自我感觉良好”的陷阱,不断累积和强化错误。如下图所示,传统的交叉监督(CrossSupervise)方法会产生大量持续性的错误。

虽然有些工作尝试通过更复杂的策略来缓解这个问题,但大多依赖于外部约束,没有从根本上改变师生互动的模式。这篇论文的作者们则另辟蹊径,决定从师生框架的内部动刀。
二、DualFete:引入“学生反馈”的智慧
DualFete的核心创新在于,它让学生模型扮演了一个“质检员”的角色。具体是怎么做的呢?
- 学生模型先用老师给的伪标签(来自无标签数据)更新一次自己的参数。
- 然后,用一小部分带真实标签的数据来检验这次更新的效果。如果这次更新让学生在真实标签上的表现变好了,说明老师给的伪标签是“好”的;反之,则是“坏”的。
- 这个“好”或“坏”的信号,就是学生给老师的 反馈(Feedback)。
- 老师接收到这个反馈信号后,会相应地调整自己的伪标签策略:如果是积极反馈,就增强产生类似伪标签的信心;如果是消极反馈,就降低这种可能性。
这个过程可以用下面的公式简单理解。反馈信号 被定义为学生模型在有标签数据上的损失变化:
其中 是学生更新前的参数, 是用伪标签更新一次后的参数。当 时,表示损失减小,性能提升,是积极反馈。
1.从“单师”到“双师”:更动态、更高效的反馈
单个老师的反馈机制虽然能纠错,但所有伪标签的调整方向是统一的,不够灵活。为了解决这个问题,作者们进一步提出了一个 双教师(Dual-Teacher) 框架,让反馈机制变得更加动态和强大。

在这个双师框架中,有两个老师( 和 )共同指导一个学生。整个反馈过程被拆解为两个关键部分:
- 反馈归因者(Feedback Attributor): 区分出哪些伪标签触发了学生的更新。这里巧妙地分成了两种情况:两个老师意见一致(Agreement)的区域和意见不一致(Disagreement)的区域。
- 反馈接收者(Feedback Receiver): 决定反馈信号具体作用在哪个老师的哪个预测区域上。
设计思路非常精妙:
- 对于两位老师 意见一致 的区域,如果学生反馈是积极的,就去提升那个置信度 较低 的老师的信心,相当于巩固共识的下限;如果是消极反馈,则降低置信度较低老师的信心,鼓励产生分歧。
- 对于两位老师 意见不一致 的区域,如果学生反馈是积极的,就去提升那个置信度 较高 的老师的信心,鼓励“强者更强”;如果是消极反馈,则降低置信度较高老师的信心,促使它向另一个老师的预测“妥协”。
通过这种方式,DualFete不仅避免了简单的、统一的更新,还促进了两位老师之间的良性竞争与协作,通过解决分歧来共同进步,从而更有效地抑制了持续性错误的产生。整个训练流程如算法1所示。

三、实验效果:显著超越SOTA
为了验证DualFete的有效性,研究者们在三个主流的医学图像分割基准数据集(LA、Pancreas-CT、BraTS19)上进行了全面的实验。
从下表的核心结果可以看出,无论在哪种标签比例(5%、10%、20%)的半监督设定下,DualFete都取得了非常亮眼的性能,在绝大多数指标上超越了现有的SOTA方法。例如,在Pancreas数据集10%标签的设定下,DualFete的Dice得分达到了 81.99%,比之前的最佳方法提升了近 1.7% 。

从分割结果的可视化对比中也能直观地看到,DualFete生成的分割掩码(Mask)与金标准(Ground-truth)最为接近,尤其在一些细节和边界部分处理得更好,这说明模型具有更强的泛化能力。

1.消融实验的洞见
作者还通过详尽的消融实验,证明了DualFete中每个设计的重要性。
- 反馈机制的有效性:实验证明,引入反馈机制()和交叉监督()都能带来性能提升,而将两者结合时效果最好。这说明反馈纠错和教师间的相互学习是互补的。

- 双师反馈设计的精妙:通过对比不同的归因者和接收者组合,实验验证了论文中提出的“一致区域反馈给低置信度、不一致区域反馈给高置信度”策略是最优的,错误的组合会导致性能下降。
- 反馈与一致性正则化的区别:实验还揭示了反馈损失()与传统的一致性正则化损失(如)有着本质区别。单独使用时,模型对输入的扰动非常敏感,但它能有效纠正错误;而则能提升模型的鲁棒性。DualFete将两者结合,取长补短,实现了最佳效果。
下图清晰地展示了在训练过程中,与仅使用交叉监督(CS)的方法相比,加入了反馈机制(CS+DF)后,伪标签的错误率(PL Error)显著降低,同时两位老师之间的“良性分歧”(Disagreement)得以维持在更高水平,避免了模型过早地陷入“共识陷阱”。

四、总结
总的来说,DualFete这篇工作非常有启发性。它没有满足于在现有框架上“缝缝补补”,而是深入师生范式的核心,通过引入一个符合直觉且设计精妙的“学生反馈”机制,赋予了模型内在的纠错能力。双教师的设定更是将这种反馈的效用发挥到了极致,不仅有效抑制了半监督学习中的“确认偏误”,也为我们思考如何设计更智能、更鲁棒的学习系统提供了新的视角。
对于从事医学影像分析或半监督学习研究的朋友们来说,这无疑是一篇值得精读的佳作。
那么,如何系统的去学习大模型LLM?
作为一名深耕行业的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!
更多推荐


所有评论(0)