简介:卫星影像包括高分十四号、高分二号、高分七号、北京二号、北京三号、高景一号等数字正射影像,影像空间分辨率为亚米级。RGB三通道8位,数据地貌覆盖包括:山地、丘陵、平原、城镇等,分辨率为0.3米-0.8米,数据量512x512尺寸大小28371张。类别包括:铁路、公路、土路、桥梁。

Key Value
卫星类型 高分十四号、高分二号、高分七号、北京二号、北京三号、高景一号
覆盖区域 全国各典型城市,如北京、深圳、上海等等
场景 山地、丘陵、平原、城镇
分辨率 0.3米-0.8米
原始影像位深 8位
标签图片位深 8位
原始影像通道数 三通道数据(B,G,R)
标签图片通道数 单通道
小图数据量 512x512大小共28371张

标签类别对照表

像素值 类别名 RGB
0 背景 [0, 0, 0]
1 铁路 [255, 0, 0]
2 公路 [0, 255, 0]
3 土路 [0, 0, 255]
4 桥梁 [255, 255, 0]

彩色表添加

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变标签图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:

在这里插入图片描述

数据预处理

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原始数据包括原始影像和RGB真值图片,需要将RGB波段转化为单波段图片,然后根据自己训练模型的图片尺寸大小使用代码批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加彩色表,这样就可以轻易看出影像和真值标签是否一致了。

最后可以直接用于训练的数据集结构如下所示:

├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

获取相关数据集或咨询交流见 博主首页 个人简介
裁剪后可直接训练的小图数据集;

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐