Pytorch复现FCN--论文简略解读+代码复现
FCN复现
FCN:
论文涉及重点:(想要详细了解FCN文章内容,推荐:摘要逐句解读:玩转图像分割吃透FCN顶会大佬的学习经验《摘要逐句精读》_哔哩哔哩_bilibili;论文解读:FCN文章_哔哩哔哩_bilibili)
The natural next step in the progression from coarse to fine inference is to make a prediction at every pixel. —— 像素级分类。
作者的主要工作:
- 将图像分类中的全连接层(fully connected layer)换成了卷积层,因此网络里都是卷积层,也是网络名字的由来(Fully Convolutional Networks,全卷积网络)。而且没有输入限制,是可以任意尺度的图像。
- deconvolution networks(反卷积层,实际是个卷积层,正确的名字叫转置卷积),采用上采样恢复图的大小。
- 在PASCAL VOC数据集和NYUDv2数据集上达到了state of the art(达到最高水准的)

4.作者经过实验,测试出VGG16作为backbone的性能最好,便在该backbone基础上进行其他实 验。
(具体可看推荐视频)
代码复现:
1.源代码下载地址:pochih/FCN-pytorch:🚘最简单的全卷积网络 (github.com)
https://github.com/pochih/FCN-pytorch
2.数据集下载地址:Download – Cityscapes Dataset (cityscapes-dataset.com)
https://www.cityscapes-dataset.com/downloads/(1)需要注册账号才能下载,带edu的邮箱是可以免费下载的, 下载前面三个。

(2)下载后对数据进行处理,建立一个新的文件Cityscapes;分别解压三个数据的压缩包;删掉除了下图展示的其他数据(或许保留也可以)

(3)配置环境:pip3 install -r requirements.txt
可能会出现一些一些包无法安装或者网络问题。可以逐个下载。
scipy==0.19.1
(4)代码的修改:

train.py可以换成另外作者推荐的代码,亲测非常实用,也可以看这位作者的复现。大家可以给他点赞+打赏。 (102条消息) 从零开始的图像语义分割:FCN快速复现教程(Pytorch+CityScapes数据集)_fcn复现_Regan_zhx的博客-CSDN博客
不过在上面提到的下载的源码需要做出一些修改:复制完上个连接推荐的train.py后,修改如下:


跑起来的样子:

本人使用的3060,12G。感觉挺慢的,目测跑完500 epoch需要两天以上。
感谢参考的博主们,本内容不作为任何的商业用途,仅分享复现经验,若侵权,请联系删除。
后续还会有更多经典论文的复现。
更多推荐

所有评论(0)