遥感影像-语义分割数据集：铁路公路土路桥梁要素详细介绍及训练样本处理流程

该卫星影像数据集包含高分系列、北京系列等高分辨率卫星拍摄的亚米级（0.3-0.8米）数字正射影像，覆盖山地、丘陵等多样地貌。数据集含28,371张512x512尺寸的RGB影像，标注类别包括铁路、公路、土路、桥梁4类。预处理时需将RGB标签转为单通道，并通过添加彩色表解决标签可视化问题。最终整理为可直接用于模型训练的train/val结构，包含匹配的影像和标签文件。该数据集适用于遥感图像分割任务，

GIS潮流

308人浏览 · 2025-09-21 15:41:25

GIS潮流 · 2025-09-21 15:41:25 发布

简介：卫星影像包括高分十四号、高分二号、高分七号、北京二号、北京三号、高景一号等数字正射影像，影像空间分辨率为亚米级。RGB三通道8位，数据地貌覆盖包括：山地、丘陵、平原、城镇等，分辨率为0.3米-0.8米，数据量512x512尺寸大小28371张。类别包括：铁路、公路、土路、桥梁。

Key	Value
卫星类型	高分十四号、高分二号、高分七号、北京二号、北京三号、高景一号
覆盖区域	全国各典型城市，如北京、深圳、上海等等
场景	山地、丘陵、平原、城镇
分辨率	0.3米-0.8米
原始影像位深	8位
标签图片位深	8位
原始影像通道数	三通道数据（B,G,R）
标签图片通道数	单通道
小图数据量	512x512大小共28371张

标签类别对照表

像素值	类别名	RGB
0	背景	[0, 0, 0]
1	铁路	[255, 0, 0]
2	公路	[0, 255, 0]
3	土路	[0, 0, 255]
4	桥梁	[255, 255, 0]

彩色表添加

大家是否有这样的困惑？真值标签图片的像素值太小，比如1、2、3······，由于像素值太小，导致看上去标签图片全为黑色，无法看出真值标签与影像图片的像素位置是否对应？如果真值标签的像素值间隔太大，又无法直接作为训练样本。

其实有办法可以解决这个问题，那就是在像素值为1、2、3等的图片上添加一个彩色表，添加的彩色表不会改变标签图片的像素值，但是可以由彩色的视觉效果展示，如下图所示：

在这里插入图片描述

数据预处理

下面对原始影像及标签进行模型训练前的数据预处理，根据这套数据集的原始信息，原始数据包括原始影像和RGB真值图片，需要将RGB波段转化为单波段图片，然后根据自己训练模型的图片尺寸大小使用代码批量裁剪原始影像和标签为所需要的尺寸，比如512*512，另外如果需要检查裁剪后的数据是否一一对应，最好给标签数据添加彩色表，这样就可以轻易看出影像和真值标签是否一致了。

最后可以直接用于训练的数据集结构如下所示：

├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

获取相关数据集或咨询交流见博主首页个人简介
裁剪后可直接训练的小图数据集；

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Java 生态下的 RAG 宝藏：解锁专业开发新姿势

2048 AI社区

AI算力加速指南：让设计、办公、创作效率翻倍的系统性方案

2025年AI算力加速实战指南：从硬件选型到效率翻倍本文提供了一份完整的AI算力加速方案，帮助用户实现2-10倍的效率提升。核心内容包括：1）硬件选型决策树，根据预算推荐最优配置，从3万元的RTX4070到50万元以上的云端方案；2）软件优化三板斧——混合精度、并行维度和编译优化，可提升73%的GPU利用率；3）行业案例验证，如3D仿真从14小时缩短至25分钟，会议纪要处理效率提升15倍。关键公

2048 AI社区

提示工程架构师必学：Agentic AI需求预测模型

目的：帮提示工程架构师理解——Agentic AI的“智能”不是天生的，而是通过需求预测模型提示工程规则实现的。用生活比喻拆解需求预测的核心逻辑；用代码构建“能预判需求”的Agent模块；用提示工程定义Agent的“思考边界”（比如“什么时候该主动问，什么时候该直接做”）。范围：聚焦Agentic AI中的需求预测模型（不涉及Agent的执行层、记忆层），覆盖从“感知用户行为”到“输出预测结果”的