标注好的息肉检测数据集,可识别腺瘤性的和增生性的息肉,9263张原始图片,识别率可达94.8%,支持yolo,coco json, pascal voc xml格式的标注
在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。
在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。
数据集核心规格:高质量标注,多格式兼容
本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:
- 数据规模与多样性:包含9263 张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
- 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉与增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8% ,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
- 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的
.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。
核心使用场景:覆盖医疗 AI 全链路研发
数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:
- 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
- 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
- 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。
数据集概览:
标签信息:
adenomatous
hyperplastic
数据集拆分
预处理
增强
训练指标:

数据集图片和标注信息:







模型训练图:

数据集下载地址
yolo v11:https://download.csdn.net/download/pbymw8iwm/92465801
yolo v9: https://download.csdn.net/download/pbymw8iwm/92465808
yolo v8: https://download.csdn.net/download/pbymw8iwm/92465814
yolo v7: https://download.csdn.net/download/pbymw8iwm/92465817
yolo v5: https://download.csdn.net/download/pbymw8iwm/92465975
coco json:https://download.csdn.net/download/pbymw8iwm/92466192
yolo darknet:https://download.csdn.net/download/pbymw8iwm/92466188
pascal voc xml:https://download.csdn.net/download/pbymw8iwm/92466185
技术与临床前景:推动消化道早癌筛查智能化
从技术与临床价值双维度看,本数据集的应用前景显著:
- 技术层面:填补当前息肉分型数据集规模小、标注精度低的缺口 —— 现有公开数据集多聚焦 “息肉有无检测”,缺乏分型标注,而本数据集针对性解决 “腺瘤性 vs 增生性” 区分难题,可推动细分领域算法突破,尤其助力小样本学习、半监督学习等技术在医疗场景的落地,进一步降低算法对大规模标注数据的依赖。
- 临床层面:助力消化道早癌筛查普及 —— 据《中国早期胃癌筛查及内镜诊治共识》,腺瘤性息肉若未及时干预,5-10 年内癌变风险超 10%;本数据集支撑的 AI 模型可提升基层医院息肉分型效率,缩短诊断时间(从传统人工判断 5-10 分钟 / 例缩短至 1 分钟内),推动早筛下沉至社区医院,降低晚期胃癌 / 结直肠癌发生率。
- 产业层面:赋能医疗 AI 生态建设 —— 可作为医疗 AI 企业、高校科研团队的标准化数据资源,加速 “消化内镜 AI 辅助诊断” 产品研发,同时为后续拓展 “息肉恶性程度分级”“治疗方案推荐” 等更复杂任务奠定数据基础,推动消化道疾病 AI 诊疗全链条发展。
未来,数据集还将进一步扩充 “息肉合并炎症”“多发息肉” 等复杂场景样本,并新增病理切片与内镜图像的关联标注,为 “内镜 - 病理联合诊断” AI 模型研发提供更全面的数据支撑。
更多推荐
所有评论(0)