183信息:技术与应用信息记录材料2022年12月第23卷第12期0引言目前,基于深度学习的目标检测算法包括两阶段目标检测算法和单阶段目标检测算法两大类。两阶段目标检测算法首先对输入的图像进行候选区域的选择,然后对候选区域进行分类和定位。典型的两阶段目标检测算法有:R-CNN、FastR-CNN、MaskR-CNN等。而单阶段目标检测算法没有候选区域选择这一阶段。典型的单阶段目标检算法有:YOLOv1、YOLOv2、SSD等。随着科技的发展,目标检测技术在生活中被广泛使用[1-2]。然而卷积神经网络由于其构建模块固定的几何结构天然地局限于建模的几何变换,导致检测效果不理想,而可形变卷积可以提高模型对发生形变物体的建模能力。黄凤琪等[3]提出一种基于可形变卷积的YOLO检测算法。张善文等[4]在VGG的基础上提出一种可形变VGG模型,应用于害虫检测。虽然可形变卷积网络在检测精度上相较于普通卷积网络有很大提升,但是可形变卷积会产生巨大的计算开销,导致检测速度降低。本文提出了一种方法:采用可形变逐点卷积来提升检测速度。通过实验证明,可形变逐点卷积同样能够增强卷积核对感受野的适应能力,来适应不同形状和大小的几何形变。除此之外,结合使用深度卷积和可形变逐点卷积所带来的计算量相对较少,从而降低计算开销,提升检测速度。1本文方法1.1可形变逐点卷积普通的卷积操作使用固定的卷积核,感受野范围也相对固定,因此难以适应目标的非规则几何形变。可形变卷积通过引入可学习的像素偏移量,使得卷积核不受固定位置的限制,可以进行伸缩变化,寻找最合适的感受野。但与普通卷积相比,可形变卷积引入了较高的额外计算量,主要用于其中所需的形变插值计算。针对以上问题,本文提出可形变逐点卷积,能有效地缩减计算量,降低计算消耗,在保持非规则感受野特性并获得精度提升的同时,有效提高检测速度。在普通卷积中,设输入特征图为x,卷积核为w,x上任意一点P0的一个3×3采样区R={(-1,-1),(-1,0),…,(0,1),(1,1)},则P0点对应输出特征图y上的操作如式(1)所示:y(P0)=∑Pn∈Rw(Pn)·x(P0+Pn)(1)其中Pn枚举了R中的每一个位置,最后对采样点进行加权运算。在可形变卷积中,引入偏移量{ΔPn|n=1,2,…,N},N=|R|,将经过卷积计算得出的像素偏移量与原始像素位置相加后得到偏移后的位置,同时引入权重Δmn,那么同样位置P0点的操作变为如式(2)所示:y(P0)=∑Pn∈Rw(Pn)·x(P0+Pn+ΔPn)·Δmn(2)其中偏移量一般是小...