思路是什么意思( 二 )

思路是什么意思

文章插图
上式第二个算式中,A为预测箱,B为实箱,IoU为传统的交点-并集比,即预测箱与实箱的交点面积与并集面积之比;Ac为预测框与实框最小包围矩形的面积 。U为预测框和实框的面积 。第三个算式中,LGIOU为GIoU的损失 。
【思路是什么意思】当预测框包含在目标框内时,GIoU _ Loss退化为IoU _ Loss,相对位置关系无法区分 。为了更好地优化目标盒和预测盒,本文提出用CIoU _ Loss代替原来的GIoU _ Loss作为包围盒损失函数 。CIoU的计算过程如下边第一个算式所示 。
思路是什么意思

文章插图
上述第二个算式中,ωA, hA为实际帧宽,ωB, hB为预测帧宽,α是权重,υ度量长宽比的相似度 。C为两个矩形的最小对角线限定比例尺;ρ是A和B的中心点的欧氏距离;上述第三个算式中,LCIoU为CIoU的损失 。
激活函数的改进
激活函数的目的是提高神经网络的非线性拟合能力 。在YOLOv5网络结构中,骨干网中的LeakyReLU激活函数替换为SiLU(Sigmoid-Weighted Linear Units)激活函数 。SiLU激活函数借鉴了ReLU函数族的思想,但更流畅 。由于SiLU激活函数具有较强的非线性能力,可以解决LeakyReLU梯度爆炸的问题 。如下图所示,改进后的CBS模块表示卷积层、批处理归一层和SiLU激活函数的串联模式 。
思路是什么意思

文章插图
SiLU激活函数表达式如下:
思路是什么意思

文章插图
如上式第一个算式中,Sigmoid是常用的激活单元,SiLU函数表示Sigmoid的加权组合 。由于SiLU激活函数本身具有自稳定特性,如上述第二个算式所示,它可以有效抑制大量权重的学习,从而避免网络过拟合,降低网络泛化性能 。
5.实验结果与分析A. 获取数据集所获得的数据包含图像和视频两种格式类型 。将得到的视频转换为视频图像序列,去除部分相似度高的图片 。经过处理的样本图片被打乱,生成一个新的数据集用于训练 。为了更好地评价工厂中火焰烟雾的目标识别性能,实验选择火焰和烟雾两种类型作为目标识别对象如下图,可以更好地反映YOLO模型在真实环境中的效果 。
思路是什么意思

文章插图
为了从有限的工厂火焰烟雾数据集中充分获取目标特征信息,通过随机变换剔除模型中部分相似度较高的样本图像,防止过拟合导致特征学习停止,有利于模型的泛化 。随机变换包括翻转、旋转、尺度变换、随机抠图、高斯噪声、随机模糊、颜色抖动等,以达到扩展数据集的目的 。文章采用马赛克数据增强技术,通过随机缩放、随机裁剪和随机发射,将4张随机图像拼接成1张图像,丰富了数据集,提高了小目标的检测精度,增强了网络特征提取能力 。下图显示了Mosaic数据增强结果 。
思路是什么意思

文章插图
B. 自适应图像缩放在一般的检测任务中,数据集图像的长度和宽度是不同的 。由于小目标分布不均匀,严重影响了网络运行效率 。
常见的处理方法是在训练和测试时将样本图像缩放到固定大小,然后将其发送到网络进行学习 。如果在输入端仅以马赛克增强作为小样本图像处理的主要手段,则提高了小目标的检测精度,而减少了大目标的数据集,导致算法的平均精度下降 。因此,传统的数据处理方法效果并不理想 。
文章采用自适应缩放技术对数据输入端的数据进行处理 。通过将原始图像缩放到标准尺寸,解决了原始数据集样本大小不同的问题 。通过计算缩放后的尺度大小,得到黑边的填充值,在图像周围自适应添加最小黑边,减少计算量,从而加快检测速度 。向这个示例添加黑边的效果如下图所示 。

推荐阅读