
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:5
- 浏览量:729
相关文章
暂无数据
改进YOLOv8的光伏板缺陷检测方法
Improved YOLOv8 for Photovoltaic Panel Defect Detection
引言
在全球能源绿色转型背景下,光伏发电已成为实现“双碳”目标的核心路径之一。然而,光伏组件长期户外运行易产生热斑、裂纹、断栅等缺陷,导致功率衰减甚至引发安全事故,亟需高效精准的缺陷检测技术保障电站安全运行。
深度学习目标检测算法为光伏缺陷检测带来突破,主要分为双阶段(如Faster-RCNN)和单阶段(如SSD、YOLO)两类。双阶段方法精度较高,伊欣同等引入残差通道注意力机制,陈海永等提出多尺度Faster-RCNN模型,均提升了缺陷检测精度,但存在参数量大、速度慢的问题。单阶段方法在效率上具有优势:王道累等改进SSD实现97.9%检测精度;郭岚等、孔松涛等分别优化YOLOv5模型,在轻量化和精度上取得进展;涂俊博等提升小目标检测能力;Cao等提出YOLOv8-GD模型兼顾精度与速度;刘闯闯等实现91.8%平均精度。然而,现有研究普遍难以在提升精度的同时实现模型轻量化。
针对上述问题,本文提出基于YOLOv8改进的DEL-Net模型。该模型在C2f结构中引入细节增强卷积(DEConv)增强边缘感知;采用EfficientRepBiPAN颈部网络实现高效跨尺度特征融合;并设计集成GroupNorm与共享卷积的轻量化检测头,在保持较高检测精度的同时显著降低计算量。
1 改进模型DEL-Net
DEL-Net的结构如图1所示。为了提高光伏板缺陷检测精度、实时性和细小缺陷的识别能力,本文对YOLOv8的所有三个部分进行了改进:主干网络、颈部和头部。在主干中引入细节增强卷积C2f-DEConv,有效提升模型对缺陷边缘信息的感知能力;在颈部采用了EfficientRepBiPAN结构,实现了更加高效且轻量的多尺度特征融合,显著提高检测效率;同时设计了一个轻量共享卷积检测头LSCDH,该模块强化了对小目标的缺陷的敏感力和判别力,在保持精度的同时减少计算量。实验结果表明,该模型在保持高精度的同时显着降低了计算成本,实现了轻量级设计,且鲁棒性强,适合在多尺度环境中进行检测任务。
1.1细节增强卷积
为增强模型捕捉细粒度特征的能力、提升其在复杂场景下的性能,同时保持计算效率,本文在 C2f结构中引入了细节增强卷积(DEConv)。传统卷积操作往往难以充分捕捉图像边缘和纹理等精细细节,尤其是在复杂背景下,检测性能容易下降。如图2所示,DEConv结构由五个并行的卷积层组成:四个差分卷积层——中心差分卷积(CDC)、角度差分卷积(ADC)、水平差分卷积(HDC)和垂直差分卷积(VDC),它们通过计算像素差异来增强梯度特征提取。此外,还融入了一个标准卷积层(VC),用于提取强度信息并补充细节特征。部署五个并行卷积层会增加参数量和推理时间。然而,由于卷积具有可加性,这些并行卷积可以简化为一个标准卷积核,从而在保持性能的同时最大限度地降低计算成本。DEConv 的公式如式(1)所示(为简洁起见,省略了偏置项)。给定输入特征,令(其中 i=1:5)分别表示 VC、CDC、ADC、HDC 和 VDC 的卷积核,并让表示整合了这些并行卷积的变换后卷积核。
1.2轻量级网络——EfficientRepBiPAN
在实际应用中,多尺度特征融合已被证明是目标检测中一个关键且有效的要素。原始的 YOLOv8 框架集成了金字塔注意力网络(PANet)。PANet在传统的特征金字塔网络(FPN)中引入了自底向上的路径,缩短了低级特征和高级特征之间的距离,并增强了来自低级特征的精确信号的传递。然而,在小目标检测中,这种线性方法可能会限制鲁棒的多尺度交互,从而降低低级特征与高级特征融合的效果。双向特征金字塔网络(BiFPN)为不同的输入特征引入了可学习的权重,并对PAN进行了优化,同时提升了性能和效率。
受上述研究的启发,本文采用了一种高效的PAN作为检测颈部,称为 EfficientRepBiPAN,结构如图3所示。为减少计算开销的同时增强定位信号,本文设计了一种双向融合(BiFusion)模块,如图4所示。该BiFusion模块在下采样过程中集成了一个3×3卷积层,以缩小并对齐特征尺寸,从而显著提高定位信号的准确性。此外,该模块融合了三个相邻层的特征图,并将来自 backbone的额外低级特征Ci−1整合到Pi中,以实现多层双向特征交换。在此过程中,特征图内的信息流和特征表示得到增强,保留了更精确的定位信号,提高了光伏板表面小缺陷的检测精度。再者,为增强模型对小目标检测的适用性,结构中融入了RepBlock,并对宽度和深度进行了相应调整,以捕捉光伏板表面丰富的缺陷信息,进而提高目标缺陷的检测准确率。RepBlock结构如图5所示。

1.3轻量共享卷积检测头
YOLOv8的原始检测头有一定的局限性,三个检测头都需要分别通过两次3×3卷积和一次1×1卷积提取图像信息,这种结构导致了算法参数量的显著增加。其次,原算法采用传统的单尺度预测结构,不能很好地处理多尺度目标,它只从特征映射的一个尺度进行预测,忽略了其他尺度特征对检测的贡献。
为了解决以上两个问题,本文构建了一种基于群归一化GroupNorm和共享卷积的轻量化检测头,命名为LSCDH(Lightweight Shared Convolutional Detection head)。在这个检测头中引入了GroupNorm卷积,该卷积的操作方法如图6所示,其中N表示数据的批次轴,C作为通道轴,H,W作为空间轴。GroupNorm对输入大小为[N, C, H, W]的图像,首先将通道设定成若干组(如图6蓝色部分),在每个组内计算方差和平均值,然后根据计算结果对这组内的所有数据进行归一化。GroupNorm的计算区域与输入的通道数C有关,而不是批次大小N。因此,它不依赖批量大小,在目标检测等计算机视觉应用中,当计算机内存受到限制或者必须设置较小的样本数量的情况下,群归一化会非常有效。它具有更好的适应性、能够保持通道之间的相对关系、提高模型的鲁棒性、在一些场景下性能更佳,从而大幅提高目标检测定位和分类性能,且在FCOS论文中得到了证明。
检测头的结构如图7所示。这种结构设计的核心思想就是用一个共享的GroupNorm卷积(如图7中绿色和蓝色部分所示)代替三个检测头使用的两个普通卷积。同时,为了解决各个检测头所检测目标尺度不一致的问题,采用尺度层对特征进行缩放。通过上述结构可以有效地减少参数量,同时使检测头具有更强的多尺度感知能力,以便部署在资源受限的设备上。
实验与结果
1 实验数据集
Panel-2数据集可以在https://aistudio.baidu.com/上获得,该数据集包含许多不明显的小缺陷,总共有2400张缺陷图像,按照8:1:1的比例分为1920张训练集、240张验证集和240张测试集。如图8所示,该数据集包含三种类型的缺陷:裂纹、断栅和污点。信息如表1所示。
| Classes | Crack | Grid | Spot |
|---|---|---|---|
| Instances | 712 | 704 | 684 |
2 实验环境和参数设置
本文选择YOLOv8s作为基线模型,且所有实验都在相同的环境配置中进行。由于篇幅限制,表2仅列出主要配置,如GPU、CPU、操作系统、Python、PyTorch、Cuda版本等。模型使用初始权值进行训练,部分训练超参数如表3所示,其余未列出的超参数均采用YOLOv8官方项目推荐的默认值。
| Item | Configuration |
|---|---|
| 配置项 | Operation System: Windows11
CPU: Intel(R) Core(TM) i9-14900HX GPU: GeForce RTX40608G Python:3.8.20 Cuda:11.6 PyTorch:1.13.0 |
| Hyperparameter | Value |
|---|---|
| 设置 | Epochs:150
Batch Size:4 Image Size:640×640 Optimizer: SGD Mosaic:1.0 Momentum:0.973 lr0:0.01 lrf:0.01 Weight-Decay:0.0005 |
3评价指标
为了评估模型的性能,本文使用精度(P)、召回率(R)、参数量和平均精度(mAP)作为评估指标。精确率(Precision)的定义是准确分类的正样本数量与预测为正的样本总数之比。同时,召回率(Recall)指的是正确分类的正样本在所有实际正样本中所占的比例。AP表示模型对每个类别的平均识别精度。mAP是所有类别ap的平均值,作为在不同阈值下检测性能的评估指标。其中,mAP0.5为IoU =0.5时计算的mAP, mAP0.5:0.95为IoU(0.5,0.95)范围内的平均mAP,步长为0.05。评价指标的公式如下:
式中,TP、FP、FN分别为正确检测次数、误检测次数、漏检次数;p(r)为p -r曲线;n是缺陷的类别。
4结果与分析
4.1 对比实验
为了评估所提出的算法相对于现有先进的目标检测方法的优越性,本文在相同的实验条件下将改进的模型(DEL-Net)与当前主流检测模型进行了对比。主要根据精度、召回率、mAP@0.5、mAP@0.5:0.95、参数数量和模型大小进行比较,结果如表4所示。从表中可以明显看出,所提出的DEL-Net模型取得了显著的改进效果,实现了0.911的mAP@0.5和0.481的mAP@0.5:0.95,分别超过了YOLOv8s的0.889和0.454,同时也优于其他所有对比模型。虽然改进模型的精度为0.880略低于YOLOv8s的0.881,但其召回率为0.878远远高于YOLOv8s的0.828,漏检率显著降低。此外,该模型的参数量和计算复杂度也都低于YOLOv8s,这使得DEL-Net更适合在资源受限的环境中部署,且同时保持卓越的检测能力。
| Model | Precision | Recall | mAP0.5 | mAP0.5:0.95 | Para (M) | GFLOPs |
|---|---|---|---|---|---|---|
| Yolov5s | 0.904 | 0.790 | 0.886 | 0.457 | 9.1 | 23.8 |
| Yolov6s | 0.871 | 0.849 | 0.889 | 0.456 | 16.3 | 44.0 |
| Yolov8s | 0.881 | 0.828 | 0.889 | 0.454 | 11.1 | 28.4 |
| Yolov8m | 0.876 | 0.819 | 0.871 | 0.468 | 25.8 | 78.7 |
| Yolov9c | 0.874 | 0.806 | 0.892 | 0.471 | 25.3 | 102.3 |
| Yolov10s | 0.819 | 0.801 | 0.857 | 0.444 | 7.2 | 21.4 |
| Yolov11s | 0.830 | 0.838 | 0.893 | 0.460 | 9.4 | 21.3 |
| Yolov12s | 0.823 | 0.845 | 0.874 | 0.463 | 9.2 | 21.2 |
| Rtdetr | 0.782 | 0.812 | 0.842 | 0.423 | 28.4 | 100.6 |
| DEL-Net | 0.880 | 0.878 | 0.911 | 0.481 | 9.7 | 27.9 |
4.2 消融实验
为了验证改进模型各改进模块的有效性,本文进行了一系列消融实验。同时为了确保公平,所有模型的训练参数和数据集均保持一致。C2f-DEConv、EfficientRepBiPAN和LSCDH三个改进模块被逐步集成到YOLOv8s模型中,每个生成的模型经过单独的训练和评估,比较结果如表5所示。从表中可以看出,每个模块单独插入YOLOv8s模型中时,在mAP@0.5和mAP@0.5:0.95上均取得不同程度上的提升。而在两两组合上除了Case4的mAP@0.5较YOLOv8s有所下降,但其mAP@0.5:0.95还是有所提升的,Case5和Case6在mAP@0.5和mAP@0.5:0.95上均有提升,且均优于其单独插入的情况。最后将这三个模块全部集成到YOLOv8s中,此时的mAP@0.5和mAP@0.5:0.95分别为0.911和0.481,优于以上所有情况。这表明三个改进模块在模型中均发挥了各自的作用。最终,DEL-Net在光伏板缺陷检测任务中表现出了鲁棒性和适应性,验证了所提出的改进的有效性。
| Case | C2f-DEConv | EfficientRepBiPAN | LSCDH | mAP0.5 | mAP0.5:0.95 |
|---|---|---|---|---|---|
| Baseline | × | × | × | 0.889 | 0.454 |
| 1 | √ | × | × | 0.892 | 0.464 |
| 2 | × | √ | × | 0.891 | 0.458 |
| 3 | × | × | √ | 0.889 | 0.467 |
| 4 | √ | √ | × | 0.878 | 0.460 |
| 5 | √ | × | √ | 0.907 | 0.474 |
| 6 | × | √ | √ | 0.899 | 0.479 |
| Ours | √ | √ | √ | 0.911 | 0.481 |
4.3 可视化分析
为了进一步直观评估本文提出的DEL-Net模型在光伏板缺陷检测任务中的实际性能,我们从测试集中随机选取了16幅具有代表性的图像进行推理对比实验,结果如图9所示。原始YOLOv8s模型在多处关键缺陷上出现漏检:在第二行第二列的图像中,两个尺寸较小、对比度较低的污点缺陷未被识别;第二行第四列的图像中,一个细微的断栅缺陷以及一处裂纹缺陷均被遗漏;此外,第三行第一列的图像中还存在一个污点缺陷未被检出。上述漏检现象表明,基线模型在面对小目标、弱纹理或与背景相似度高的缺陷时,特征提取能力有限,难以有效捕捉关键信息。相比之下,图9(b)展示了本文DEL-Net模型的检测结果。改进后的模型成功识别出所有上述缺陷,包括YOLOv8s遗漏的细小污点、断栅和裂纹等。尤其是在小目标检测方面,DEL-Net表现出显著的性能优势。

结语
本文针对传统光伏板缺陷检测在精度、实时性及小目标识别方面的不足,提出了一种基于改进YOLOv8s的轻量化检测模型——DEL-Net。该模型在主干网络中引入C2f-DEConv结构以增强细节特征提取能力,在颈部采用EfficientRepBiPAN实现高效多尺度特征融合,并设计了轻量共享卷积检测头LSCDH以提升小目标检测性能和降低计算成本。该模型在保持较高检测精度的同时显著提升了召回率与模型效率,具备良好的鲁棒性与工程应用价值。
尽管如此,DEL-Net仍存在一定局限,例如在极端条件或更复杂的真实场景中,其泛化能力和适应性仍需进一步验证。未来研究可从以下几个方面展开:一是结合多模态数据(如红外、热成像与RGB融合),进一步提升对微小缺陷的检测能力;二是探索更高效的轻量化注意力机制与知识蒸馏方法,以适应边缘计算设备的部署需求;三是构建更大规模、更多样化的光伏板缺陷数据集,以增强模型的泛化性和实用性。
参考文献:
- [1] 伊欣同, 单亚峰. 基于改进Faster R-CNN的光伏电池内部缺陷检测[J].电子测量与仪器学报,2021,35(01):40-47.
- [2] 陈海永,赵鹏, 闫皓炜. 融合注意力的多尺度Faster RCNN的裂纹检测[J]. 光电工程,2021,48(01):64-74.
- [3] 王道累, 李明山, 姚勇, 等. 改进SSD的光伏组件热斑缺陷检测方法[J].太阳能学报,2023,44(04):420-425.
- [4] 郭岚, 刘正新. 基于改进YOLOv5的光伏组件缺陷检测[J]. 激光与光电子学进展,2023,60(20):2015005.
- [5] 孔松涛, 徐甄泽, 林星宇, 等. 基于改进YOLOv5算法的光伏组件红外热成像缺陷检测[J]. 红外技术,2023,45(09):974-981.
- [6] 涂俊博, 曾佳林, 唐越新, 等. 基于深度学习的太阳能电池板表面缺陷检测及分类[J]. 激光与光电子学进展,2025,62(02):0237013.
- [7] Cao Y K, Pang D D, Zhao Q C, et al. Improved YOLOv8-GD deep learning model for defect detection in electroluminescence images of solar photovoltaic modules[J]. Engineering applications of artificial intelligence,2024,131:107866.
- [8] 刘闯闯, 袁金丽, 郑美曼, 等. 基于改进YOLOv8的光伏电池缺陷检测[J].电子测量技术,2025,48(21):139-147.
