第49卷第4期2023年4月ComputerEngineering计算机工程结合卷积Transformer的目标跟踪算法王春雷1,2,3,张建林1,2,李美惠1,2,徐智勇1,2,魏宇星1,2(1.中国科学院光束控制重点实验室,成都610209;2.中国科学院光电技术研究所,成都610209;3.中国科学院大学电子电气与通信工程学院,北京100049)摘要:现有基于Transformer的目标跟踪算法未充分利用Transformer的长距离依赖属性,导致算法提取的特征判别性不足,跟踪稳定性较差。为提高孪生网络目标跟踪算法在复杂场景中的跟踪能力,结合卷积与Transformer的优势,提出目标跟踪算法CTTrack。在特征提取方面,利用卷积丰富的局部信息和Transformer的长距离依赖属性,以卷积和窗口注意力串联的方式和层次化的结构构建一个通用的目标跟踪骨干网络CTFormer。在特征融合方面,利用互注意力机制构建特征互增强与聚合网络以简化网络结构,加快跟踪速度。在搜索区域选择方面,结合目标运动速度估计,设计自适应调整搜索区域的跟踪策略。实验结果表明,CTTrack在GOT-10k数据集上的平均重叠度为70.3%,相比基于Transformer的跟踪算法TransT和TrDiMP均提高3.2个百分点,在UAV123数据集上的曲线下面积为71.1%,相比TransT和TrDiMP分别提高2.0个百分点和3.6个百分点。在TrackingNet、LaSOT、OTB2015、NFS数据集上分别取得82.1%、66.8%、70.1%、66.3%的曲线下面积,并能以43帧/s的速度进行实时跟踪。关键词:孪生网络;Transformer目标跟踪;窗口注意力;互注意力;运动估计;搜索区域开放科学(资源服务)标志码(OSID):中文引用格式:王春雷,张建林,李美惠,等.结合卷积Transformer的目标跟踪算法[J].计算机工程,2023,49(4):281-288,296.英文引用格式:WANGCL,ZHANGJL,LIMH,etal.ObjecttrackingalgorithmcombiningconvolutionandTransformer[J].ComputerEngineering,2023,49(4):281-288,296.ObjectTrackingAlgorithmCombiningConvolutionandTransformerWANGChunlei1,2,3,ZHANGJianlin1,2,LIMeihui1,2,XUZhiyong1,2,WEIYuxing1,2(1.KeyLaboratoryofBeamControl,ChineseAcademyofSciences,Chengdu610209,China;2.InstituteofOpticsandElectronics,ChineseAcademyofSciences,Chengdu610209,China;3.SchoolofElectronic,ElectricalandCommunicationEngineering,UniversityofChineseAcademyofSciences,Beijing100049,China)【Abstract】Theexistingtargetobje...