UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wisePerspective with Transforme

UCTransNet

翰墨大人

2309人浏览 · 2022-08-26 10:42:25

翰墨大人 · 2022-08-26 10:42:25 发布

对文章简单的理解，不对之处还请指正。

引言

本文主要对U-Net这一经典的网络进行研究改进，作者指出U-Net对全局上下文多尺度建模有待改进，是因为1：encoder和decoder一些不相容的特征图造成不是每一个跳连接都有效:2：原始的U-Net在一些数据集上表现不如不加跳连接的U-net。

因此作者提出了UCTransNet，模型包含多尺度通道交叉融合Transformer（CCT），和逐通道交叉注意力（CCA），来引导多尺度逐通道信息和decoder特征进行融合。

在医学领域，U-Net网络用的十分广泛，传统的U-Net通过encoder进行捕获低层和高层特征，跳连接将空间信息恢复到原来的分辨率，decoder结合语义信息进行最终结果的输出。

作者提出了两个问题：

哪一层的encoder和decoder进行连接？

如何有效的融合特征？

首先不同的通道关注于不同的语义模态，因此自适应的融合充足的逐通道特征对于复杂的分割有帮助。因此这里首先用CCT从逐通道视角融合多尺度特征，使用CCA融合融合了的多尺度特征和decoder特征。

实验：

消融实验：

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Expect脚本实战：多条件匹配与防卡死技巧

在自动化测试和系统初始化中，我们常常使用 Expect 脚本来完成一系列交互操作，比如自动输入密码、监听输出并作出响应。然而，实际项目中可能遇到多步骤输出匹配的场景：只有在先匹配到某一行输出，再匹配到另一行输出时，才需要做出响应。同时，如果 “testX failed” 出现了，但 “set params error” 没有在合理时间内出现，不要卡死，而是打印警告并继续。这个写法的问题在于：如

2048 AI社区

AI模型版本控制的标签管理：架构师的技巧

在AI模型生命周期中，版本控制是保障模型可追溯性、协作效率与生产可靠性的核心环节。而标签管理作为版本控制的"语义接口"，其设计质量直接决定了团队对模型版本的理解、检索与复用能力。本文从架构师视角出发，结合第一性原理与MLOps实践，系统阐述AI模型标签管理的理论框架、架构设计、实现机制与高级考量。通过拆解标签的"唯一标识+语义描述"本质，提出四维标签模型。