在我之前的博文中已经写过几篇关于特定场景下的裂痕裂缝检测的模型实践文章,后面也有很项目应用都是基于此构建的,这里主要是对前面几篇博文的数据集进行介绍。
相应的系列文章如下,感兴趣的话可以自行移步阅读即可。
《基于yolov5s+bifpn实践隧道裂缝裂痕检测》
《基于YOLOV7的桥梁基建裂缝检测》
裂缝检测系统演示
《基于DeepLabV3实践路面、桥梁、基建裂缝裂痕分割》
《助力交通出行,基于目标检测模型实现路面裂痕缺陷智能识别》
《YOLO 3/4/5/6/7/x、Efficient、MaskRcnn、FasterRcnn、FCOS、SSD、M2Det、Retina、CenterNet、PicoDet等系列数据模型汇总持续更新中》
简单的回顾介绍就到这里,接下来回归本文正题。
接下来主要是针对性地对数据集进行介绍
【基础数据集】
整体数据单样本尺寸为416*416,可以直接用于模型训练,该型数据集全部来源于真实采集、网络爬取等,全部由人工标注。精细粒度的小框覆盖标注方式完成的数据标注,如下:
图像数据如下:
这里同时提供了YOLO和VOC两种格式的数据集,如下所示:
这里共有8168的样本量。
【旋转数据集】
由于在实际业务场景中,经常会发生摄像头旋转偏移等问题,导致采集到的图像复杂多变,这里基于特定角度实现了数据集的增强处理,如下:
图像数据如下所示:
这里也是同时提供了yolo格式和voc格式的标注文件,分别如下所示:
这里共有12252的样本量。
【深度数据集】
这批数据集主要是考虑到将当前一些比较好的数据增强技术应用到实际项目中的数据增强中去,获取到更加高阶的数据,使得模型能够更加高效鲁棒地去学习,如下:
图像数据如下:
同样这里也是同时提供了YOLO和VOC两种格式的标注数据,如下:
这里共有8888的样本量。
【尺度数据集】
考虑到不同渠道获取到的数据集其实从尺寸和分辨率等角度都是不相同的,这里为了尽可能使得训练所需的数据集更加丰富化,对各个源头渠道获取到的数据集进行了不同程度的形变尺度处理,如下所示:
图像数据如下:
同样,这里也是同时提供了YOLO和VOC两种格式的数据集,如下所示:
开发不易,最初是由于实际业务项目有需要从零获取到的未标注的数据集,后面花了大量的时间人工去标注,因为裂缝本身最初的检测识别技术基本都是以分割模型为基础的,但是分割模型计算量大,且计算提取到的结果不是很好能够实际业务应用结合起来,后面经过研究后决定借助于检测的方法来实现裂缝检测识别,由于现实中裂痕裂缝千奇百怪,如果直接使用简单粗暴的框去标注的话不仅识别效果会很差,模型计算也会是一个大问题,所以这里我基于细粒度的覆盖框实现了精细的标注,经过一个多月的开发迭代目前上线后效果还是很不错的。
因为后面有很多在咨询这个,所以我今天专门抽时间写了这篇文章,数据资源并不是无偿的,这都是辛苦开发的,非必要的话可以直接网上搜索开源数据集诸如VOC COCO做模型即可,确实需要的话可以再联系我。
下面是一些样本标注实例:
还有一些检测结果实例: