欢迎大家关注我的公众号:一刻AI

682c67aab3d338ed3c7fc8e925f163d1.png

本文目前汇总了常见的28个开源工业缺陷数据集,持续更新中

(欢迎大家留言补充,共同建设一个为大家提供便利的文章)


东北大学热轧带钢表面缺陷数据集

官方链接:Vision-based SIS for steel

该数据集是东北大学的宋克臣等几位老师收集的,一共包含了三类数据,官网有时打不开,三种缺陷数据集我都我保存到了百度网盘里

百度网盘链接:

链接:pan.baidu.com/s/1bAKoSG

提取码:ibje

(1)NEU surface defect database

数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷,每种缺陷300张,图像尺寸为200×200。数据集包括分类和目标检测两部分,不过目标检测的标注中有少量错误,需要注意。部分示例如下:

c629428ef7d7ad868310816384e0c873.png


(2)Micro surface defect database

微小型的带钢缺陷数据,缺陷只有约6×6个像素大小

c8904facb6641b10f846cafa5f14022b.png

(3)Oil pollution defect database

油污干扰的硅钢表面缺陷数据集

782686b26cec797fe1bb3a65456c3042.png

Kaggle中谢韦尔钢铁公司提供的带钢缺陷数据集

该数据集中提供了四种类型的带钢表面缺陷。训练集共有12568张,测试集5506张。图像尺寸为1600×256。

136e6c0d89887473fc4cf85649789ff0.png
谢韦尔带钢缺陷数据集

有如果有学术研究的需要,可以无限制使用,请将PAO Severstal(https://www.severstal.com/)指定为数据集所有者。

官方链接:kaggle.com/c/severstal-

本来想传到百度网盘供大家下载的,奈何500个文件以上需要超级会员。。。上万张图片,数量实在是太多了,没法手动上传。


UCI Steel Plates Faults Data Set

该数据集包含了7种带钢缺陷类型。这个数据集不是图像数据,而是带钢缺陷的28种特征数据,可用于机器学习项目。

d79998cbbae6663a8e3a7844b106a241.png

官方链接:archive.ics.uci.edu/ml/

百度网盘链接:

链接:pan.baidu.com/s/1VhEW8x

提取码:9uv2


DAGM 2007数据集

该数据集是人为生成的,一共包含了10个class,图像大小为512×512。该数据集为部分示例如下:

5415e92019cec6b0d33477b90f455904.png

官方链接:hci.iwr.uni-heidelberg.de

百度网盘链接:

链接:pan.baidu.com/s/1EyK3fl

提取码:j9qz


磁瓦缺陷数据集

中国科学院自动所一个课题组收集的数据集,是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像,并做了语义分割的标注。

65215aa8afb152298ddf50c68a47244f.png

官方链接:github.com/abin24/Magne

百度网盘链接:

链接:pan.baidu.com/s/1iuSHXo

提取码:ky8i


Kolektor 表面缺陷数据集

该数据集是Kolektor Group收集并标注的电子换向器缺陷数据集。数据集中包含了50种编写的电子换向器,每种有8张图片以及其语义分割的label。图像的大小为500×1240像素。为了更方便的训练,需提前将图像调整为512×1408。

cd3b02ceeea35a366d8ba4e1a121a815.png

官方链接:vicos.si/Downloads/Kole

百度网盘链接:

链接:pan.baidu.com/s/1HSzHC1

提取码:1zlb


铁轨表面缺陷数据集

RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的I型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集,其中包含128个具有挑战性的图像。

两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。

RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

5a0d482e4e6988a0b30ed8d0e8903965.png

官方链接:icn.bjtu.edu.cn/Visint/

百度网盘链接:

链接:pan.baidu.com/s/1svsnqL

提取码:nanr


水泥道路裂缝数据集

主要针对水泥路面的裂缝检测,可用于分类、分割和Detection

55c81870643e90f6d46566c3850b2afd.png

官方链接:cuilimeng/CrackForest

百度网盘链接:

链接:pan.baidu.com/s/19qEBt0

提取码:7nzx


桥梁裂缝图像数据

桥梁裂缝的检测数据:

e10a0f95dcb70fe2247747411ff700b2.png

百度网盘链接:

链接:pan.baidu.com/s/1z-y3Gh

提取码:z493


混凝土表面裂纹缺陷数据集

数据集包含带有和不带有裂纹的各种混凝土表面的图像。 图像数据在单独的文件夹中分为负片(无裂纹)和正片(无裂纹)两部分,用于图像分类。 每个类别有20000张图像,总共40000张图像,带227 x 227像素的RGB通道。

f0c82a9d588166f751a77f7dd290982f.png

官方链接:kaggle.com/arunrk7/surf


天池铝型材表面缺陷数据集

2018年阿里天池大赛,广东工业智造大数据创新大赛—智能算法赛中提供的数据集。

661e05ba9ad55502029f2d8ca3e3dbce.png

官方链接:[飞粤云端2018]广东工业智造大数据创新大赛-智能算法赛赛题与数据-天池大赛-阿里云天池

百度网盘链接:

链接:pan.baidu.com/s/1jnSwJ2

提取码:i10s


天池纺织品表面异常数据集

在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约8000张,用于初赛;花色布数据约12000张,用于复赛。

百度网盘链接:

链接:pan.baidu.com/s/1eRCCpQ

提取码:2j46


AITEX织物缺陷数据集

该数据集包含245张4096x256像素的图像,具有7种不同的织物结构。数据集中有140张无缺陷图像,每种类型的织物有20张。此外,在纺织行业中常见的12种不同类型的织物疵点有105张图片。

AITEX FABRIC IMAGE DATABASE - Aitex

6793e2cdbe9b954b26f69789448d869e.png

工件磨损数据集:BSData

该数据集包含1104个3通道图像和394个图像注释,表面损伤类型为“点蚀”。

2Obe/BSData: Dataset for classification, detection and prognostics of surface defects on ball screw drives (github.com)

28a53ce259e4c8d5e9df8f57dec1d34c.png

KTH-TIPS database

瑞典皇家理工学院提供的背景纹理数据集,类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共10类。

9690716d624eba57ab8b903e1af4de88.png

百度网盘链接:

链接:pan.baidu.com/s/10essXd

提取码:am65


印刷电路板(PCB)瑕疵数据集

这是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。

0fa887b8048934e5964a5c8e4688c7a5.png

官方链接:北京大学智能机器人开放实验室

百度网盘链接:pan.baidu.com/s/1hoPNd7


印刷电路板(PCB)瑕疵数据集

DeepPCB:一个数据集包含1500对图像,每对图像由一个无缺陷的模板图像和一个对齐的测试图像组成,其中标注了6种最常见的PCB缺陷:open, short, mousebite, spur, pin hole and spurious copper。

Surface-Defect-Detection/DeepPCB at master · Charmve/Surface-Defect-Detection

3fd2ff9fe91e7051a4a297d1c28ddc2b.png

AITEX数据集

该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。Internet上的数据库还包含所有具有缺陷的图像的分割mask,使得白色像素表示缺陷区域,其余像素为黑色。

a850c9c9a21fdb60f03b51c8f24d0c27.png

官方链接:aitex.es/afid/

百度网盘链接:

链接:pan.baidu.com/s/1u-trbe

提取码:z9yc


Kylberg Texture Dataset v. 1.0

28种纹理图像,每一种有160个独特的纹理。图像大小为576x576像素。

b829d7b7f71114d9b8611ed6c02cf534.png

官方链接:cb.uu.se/~gustaf/textur


输电线路绝缘子数据集

数据集中,Normal_Insulators包含由无人机捕获的绝缘子图像,数量为600张。

Defective_Insulators包含有缺陷的绝缘体,绝缘子缺陷图像的数量为248张。

数据集中包括数据集和标签。

24580ed8edbf3740ed07d0d62dc30523.png

官方链接:InsulatorData/InsulatorDataS百度AI Studio中的数据集

百度AI Studio中有很多的数据集,可以直接去搜索

Baidu AI Studio - 人工智能学习与实训社区

1b0f4dd97b358251cd2ec0cc91354aec.png

例如:

布匹缺陷数据集:布匹缺陷数据集:

瓷砖缺陷数据集:瓷砖缺陷数据集

绝缘子自爆缺陷图像:绝缘子自爆缺陷图像

工业缺陷检测:工业缺陷检测

PCB缺陷检测:PCB缺陷检测

手扶电梯梯级缺陷:手扶电梯梯级缺陷


CV Datasets on the web

汇总了CV领域的常见数据集,与工业缺陷的关系不大。

官方链接:cvpapers.com/datasets.h


太阳能电池板缺陷数据集

太阳能电池板数据集,该数据集包含了2624张300x300的太阳能电池板缺陷图像。

zae-bayern/elpv-dataset: A dataset of functional and defective solar cells extracted from EL images of solar modules (github.com)

63cb1e9b3f808e6d07566a58e7700f7e.png


欢迎大家留言补充,共同建设一个为大家提供便利的文章。

图像分类与检测领域场景的数据集可参考我的另一篇文章:

李是Lyapunov的李:图像分类与检测领域常用数据集汇总

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐