DOI:10.11991/yykj.202302003网络出版地址:https://link.cnki.net/urlid/23.1191.U.20231129.1742.002基于改进Deformable-DETR的水下图像目标检测方法崔颖,韩佳成,高山,陈立伟哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001摘要:针对由于水下复杂环境造成的目标检测效果较差、检测精度较低的问题,基于Deformable-DETR算法提出一种改进的水下目标检测算法Deformable-DETR-DA。使用空间注意力模块结合标准Transformer块设计了一个用于增加模型深度的深度特征金字塔(deepfeaturepyramidnetworks,DFPN)模块,将其嵌入到模型中提高模型对深层纹理信息的提取能力。使用注意力引导的方式对原模型中编码器部分进行改进,加强了对特征信息的聚合能力,提高了模型在复杂环境下的检测能力。针对URPC数据集,模型各交并比尺度的平均准确度(averageprecision,AP)为39.5%,相比原模型提升1%,与一些DETR(detectiontransformer)类的模型相比,不同目标尺度的平均准确度均有1%~4%左右的提高,表明改进的模型能够很好解决复杂环境的水下目标检测的问题。本文提出的模型可作为其他水下目标检测模型设计的参考。关键词:水下光学图像;Deformable-DETR;目标检测;Transformer;注意力机制;深度学习;图像处理;残差网络中图分类号:TP391文献标志码:A文章编号:1009−671X(2024)01−0030−08AnobjectdetectionmethodofunderwaterimagebasedonimprovedDeformable-DETRCUIYing,HANJiacheng,GAOShan,CHENLiweiCollegeofInformationandCommunicationEngineering,HarbinEngineeringUniversity,Harbin150001,ChinaAbstract:Aimingattheproblemofpoorobjectdetectioneffectandlowdetectionaccuracycausedbycomplexunderwaterenvironments,animprovedunderwatertargetdetectionalgorithmDeformable-DETR-DAisproposedbasedontheDeformable-DETRalgorithm.UsingthespatialattentionmoduleandthestandardTransformerblock,aDFPNblockisdesignedtoincreasethedepthofmodel,andtheDFPNblockisembeddedintothemodeltoimprovetheabilityofthemodeltoextractthedeeptextureinformation.Theencoderpartoftheoriginalmodelisimprovedbyusingattentionguidance,whichstrengthenstheaggregationabilityoffeatureinformationandimprovesthedetectionabilityofthemodelinacomplexenvironment.FortheURPCdataset,theaverageprecision(AP)ofeachintersectionoverunio...