分享
基于改进YOLO_v5的道路小目标检测算法_牛为华.pdf
下载文档

ID:2252679

大小:2.18MB

页数:9页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 改进 YOLO_v5 道路 目标 检测 算法
第 卷 第 期 年 月传 感 技 术 学 报 .项目来源:中央高校基本科研业务费专项资助项目()收稿日期:修改日期:,(,):,;,:;:基于改进 的道路小目标检测算法牛为华,殷苗苗(华北电力大学计算机系,河北 保定)摘 要:针对小目标检测精度低、检测过程中易出现目标漏检和误检等问题,提出一种改进的 道路小目标检测算法。首先在 中计了 模块;在特征融合部分使用双线性插值上采样操作,并插入 个 注意力机制模块,减少小目标特征的丢失,增强小目标语义及位置信息;另外增加了一个大小为 的小目标检测层,利用浅层特征层中包含的丰富的语义及位置信息精确定位识别小目标。实验使用 数据集,对该数据集进行处理并划分训练集和测试集。实验结果表明,改进的 模型在 数据集上平均精度均值达到,与原 算法相比有显著提高,小目标检测效果更好。关键词:小目标检测;双线性插值上采样;注意力机制中图分类号:;文献标识码:文章编号:()近年来,随着计算机技术飞速进步,计算机在各大领域得到充分推动与发展。计算机视觉领域是计算机一大重要领域,目标检测作为该领域之一,可应用于缺陷检测、状态监测、交通监测、自动驾驶及遥感等领域,在生活的方方面面发挥了不可或缺的作用。目标检测在最初期使用手工方法设计检测目标,近年来,深度卷积网络快速发展并应用于方方面面,基于深度学习的目标检测算法相继被提出。现阶段基于深度学习的目标检测算法可分为两大类,第一类是基于区域提取的目标检测算法,也可称为两阶段目标检测算法,代表算法有、和 等,该类算法在目标检测上分两步,首先在图片上生成候选区域,然后利用回归等方法对候选区域进行分类及预测;第二类是基于回归的目标检测算法,也可称为一阶段目标检测算法,代表算法有、等,该类算法无需提前生成候选区域,而是直接在卷积后的图像上预测目标的位置和分类。近两年,多数学者在前人目标检测算法基础上继续研究,结合所用算法的优缺点以及检测目标的特点设计有效模块。如 等结合一阶段 算法和二阶段 算法优缺点,设计了 目标检测网络;等第 期牛为华,殷苗苗:基于改进 的道路小目标检测算法 针对目标检测中 存在的缺点,设计 指标,解决了梯度回传缺失及两框重合度大小的精确计算问题;等针对人类具有识别未知物体的本能,设计了一种开放世界目标检测算法。尽管目标检测算法已很成熟,在计算机视觉领域取得了一定成绩,但在小目标检测方面仍存在一定问题与困难。现阶段,小目标检测多以主流目标检测算法为基础,从特征提取、特征融合、注意力机制及检测头等方面进行改进以提升小目标检测能力。如顾恭等设计了 模型,该模型主要在以 为基础的网络上更改残差网络来增强小目标特征提取能力;等设计了 模型,以 网络为基础,从锚框、后处理算法和注意力三方面进行改进提升小目标检测。小目标对象分辨率低,像素占比小,多数算法在使用卷积网络进行特征提取时,所提信息有限,不足以对小目标进行表达。随着卷积神经网络的多次下采样,特征图尺寸不断减小,小目标的特征难以提取,导致小目标检测过程中出现严重的误检、漏检。为降低小目标漏检、误检率,提高小目标检测平均精度,本文以 算法模型为基础,提出了一种应用于道路场景小目标检测的改进 算法,相比、等模型具有更高的检测速度及平均精度。本文算法引入双线性插值法进行上采样操作以缓解多数算法中存在的特征损失严重问题;另外对 算法网络结构进行改进,将原始的三层检测层扩展到四层,设计了一个 模块替换原模型的 模块,并在特征融合部分插入 个 注意力机制模块,改善了多数算法存在的主干网络特征提取能力不足、融合网络有用信息提取不聚焦等缺陷。本文对 数据集进行处理,并在处理后的数据集上将原算法、改进算法以及其他目标、小目标检测算法做实验对比,由结果可得,改进的 算法在保证原模型较好检测速度的同时,对于小目标检测评价指标更优,检测各个类别的平均精度和平均精度均值提升明显。原始 算法 由 公司提出,是一个基于 改进的轻量型版本,该网络相较于 之前版本,检测性能有进一步的提升。对于目标检测,在检测精度及速度上都有一定的提升,并满足轻量型模型特点,其网络结构分为四部分:、,模型网络结构如图 所示。图 网络结构 :端包含 数据增强、自适应锚框计算以及自适应图片缩放三部分。数据增强技术采用随机裁剪、随机缩放、随机排列方法对四幅图像进行拼接,有利于小目标的检测。对于不同数据集,算法将根据自适应锚框计算该数据集所对锚框。原模型中锚框效果已达到很好的效果,故本文使用原模型锚框。自适应图片缩放操作将输入的不同尺寸图像统一缩放至同一尺寸,本文图像缩放尺寸至。:部分由 结构和特征提取结构组成,图像经过 结构后,像素尺寸缩减一半。结构主要对图像进行切片,当输入图像为 时,经过 的切片、以及卷积操作,输出 的特征映射。传 感 技 术 学 报第 卷 部分的特征提取结构由、和 模块组成,其中,模块是由 和若干 结构组成的残差结构,在保证模型轻量化的前提下可增强特征提取能力。模块相当于 倍下采样操作,经过一次 模块,特征图通道数增加一倍。模块先使用 模块提取特征,再经过卷积核尺寸分别为,的三个最大池化操作,连同输入一起进行 连接,最后再经过一个 模块将输出恢复至输入尺寸。:部分由 结构组成,融合 部分提取的特征。和 是两个方向相反的特征金字塔网络,分别从相反方向进行层间特征融合。其中,自上而下,使用上采样操作逐层扩充特征图尺寸;自下而上,通过卷积操作缩小特征图尺寸。与 结构结合后,网络的特征融合能力进一步加强。:包括 损失和 非极大值抑制算法。在目标检测的预测阶段,经过 算法后,冗余预测框被去除,留下最优目标框。网络模型改进本文针对小目标检测存在的问题,分别从四个方面对 算法进行改进。首先使用双线性插值法上采样操作扩大特征图,其次改进网络结构,将 模块替换为设计的 模块,增加一个小目标检测层,并在特征融合部分共插入 个 注意力机制模块,从通道和空间两个方面聚焦有用特征,加强网络特征提取能力。改进的 算法网络结构如图 所示。图 改进的 网络结构 双线性插值法上采样操作 模型中,在特征融合部分使用最近邻插值法实现特征图上采样。最近邻插值上采样法没有计算新插值特征图像素矩阵中点的数值,直接在原特征图像的位置信息找对应像素点的值,采样速度较快,但这种采样方法极易破坏原特征图的像素关系,导致图像失真,造成小目标特征及位置信息的损失,增大小目标漏检及误检率。针对该问题,本文引入双线性插值法上采样操作实现特征图的上采样,扩大特征图尺度。双线性插值上采样在计算新特征图像素点值时,从原图像中选择 个点并在两个方向进行插值,是单线性插值的拓展。该采样方法通过两个方向上的三次插值,在保证原特征图像素间关系的同时对特征图进行上采样,可提高采样后特征图的清晰度,减少小目标特征信息及位置信息的损失,降低小目标检测漏检及误检率。该采样方法原理如下。假设在原图像选择的四个点分别为(,),(,),(,),(,),设(,),(,),(,)。首先在 方向上做两次插值得:()()()()()()()()然后在 方向进行插值,得:()()()()整理可得(,)()()()()()第 期牛为华,殷苗苗:基于改进 的道路小目标检测算法()()()()()()()()()()()()()()()()网络结构改进 设计 模块在原 模型中,输入网络的图片在 部分首先会进入 模块。模块对每个通道的数据进行切片操作,通过隔像素取值,每一通道均得四个切片,每一切片相当于 倍下采样所得。所有切片将按照通道 在一起,并通过卷积操作实现下采样。操作类似于计算量和参数量都较少的下采样操作,但在进行小目标检测时,直接对输入图像进行分片下采样操作,会损失原图像中小目标信息,造成小目标特征提取不充分,出现小目标漏检问题,影响小目标检测的精确度。针对该问题,设计了 模块,如图 所示,该模块借鉴了 的核心结构,将 模块和卷积操作并行连接,实现残差结构。在 模块中,左侧分支包含两个 卷积,在不增大参数量和计算量的前提下实现图像的降维及升维;右侧分支是原 模块。将左右两侧的分支用 方法连接融合并进行 激活,通过融合连接,既增多了图像的特征数,也实现了在降低图像复杂度的前提下保持原图特征信息的完整性,减少小目标的信息损失。图 模块 增加小目标检测层 特征融合部分包含 结构,该部分进行两次上采样和两次下采样,融合深层特征与浅层特征。特征融合完成后,在检测层输出大小为、的 种不同尺度的特征图。特征图尺度越大,感受野越小,包含目标位置信息和局部特征细节越详细,利于检测小目标;特征图尺度越小,感受野越大,语义信息越丰富,但局部细节不明显,适合检测大目标。为了提高小目标检测的平均精度,避免由于下采样导致目标的局部细节特征损失过大、小目标信息丢失,对原 模型网络结构进行改进,在原网络中添加一层特征图尺度为 的小目标检测层,该层经过深层特征的传递以及与浅层特征的融合,包含更多的小目标轮廓信息以及位置信息,利于小目标定位与识别,降低小目标的漏检、误检。插入注意力机制注意力机制是对有限的输入进行权重偏好的选择,使用注意力机制,可更快地对输入选择权重偏好,提取感兴趣区域。在目标检测中,引入注意力机制,可以聚焦图像的局部信息,提取出检测中感兴趣区域。因此,本文在特征融合部分,共插入 个 注意力机制模块,分别位于每个 模块后,在通道和空间两个不同维度实现特征细化与提取,聚焦图像局部信息,降低小目标特征提取时的损失,增强网络表达能力,提升小目标检测的平均精度。是一个轻量型即插即用的注意力机制模块,如图 所示,包括通道注意力模块和空间注意力模块,依次在通道和空间上两个维度实现映射。图 注意力机制模块图 通道注意力模块 的通道注意力模块和 的通道注意力机制模块相像,如图 所示。通过通道注意力模块后,模型可学习不同通道特征的重要程度,从而更关注特征信息强的通道,抑制特征信息较少且不重要的通道。在 的通道注意力模块,输入特征图,首先会分别经过全局最大池化和全局平局池化获得通道注意力的一维向量,实现空间维度的压缩,聚合特征映射的空间信息,然后经过共享感知机 模块,将经过 后输出的两条分支加传 感 技 术 学 报第 卷和,使用 激活函数,得到权重系数。通道注意力机制表达式如下:()()()()()()将通道注意力模块输出的权重系数 与原输入特征 进行相乘加权,得到新的特征 并输入空间注意力模块(如图 所示)。空间注意力模块输出权重系数,与输入的新特征 相乘得到最终结果,该模块实现通道维度上的压缩。对于输入特征,首先进行全局最大池化和全局平均池化,并按通道拼接,最后通过卷积核为 的卷积层和激活函数得到权重系数。空间注意力机制表达式如式():()(),()(;)()图 空间注意力模块 实验设置与结果分析 实验环境及参数配置本次实验基于 操作系统,使用 语言实现,应用深度学习框架 搭建网络模型,编译程序,硬件环境为:()()、内存、。网络训练阶段,将批量大小设置为,初始学习率设置为 ,动量为 ,权重衰减系数为。使用 预热学习率方式使模型逐渐趋于稳定,当 将学习率调整到一定数值时,开始进行余弦退火方式调整学习率。数据集小目标指在图像中分辨率低,像素占比小的物体,其定义方式有两种,即相对尺寸定义和绝对尺寸定义。相对尺寸根据国际组织 将 的图像中像素少于 的目标称为小目标;绝对尺寸根据 数据集定义,尺寸小于 像素的目标即可称为小目标。此外,小目标也可根据场景进行定义,如 等针对交通场景数据,定义像素在 到 的物体为小目标;行人识别数据集 中定义像素高度小于 的为小目标。本次实验使用 数据集,部分图片如图 所示,该数据集包括从市区、乡村以及高速公路等多个场景中获取的现实图像数据,图像像素大小为,每幅图像最多包含 部车辆及 名行人,多数目标像素低于 或,可定义为道路小目标。原数据集共包含、()、以及 八个类别,本实验对原数据集进行了处理,将 和 这两类目标标注不清晰且数据量较少的数据删除,并将 和()进行合并。从处理后的数据集中选取 张图片做为实验数据,其中 张图片用于训

此文档下载收益归作者所有

下载文档
收起
展开