第49卷第2期2023年2月ComputerEngineering计算机工程基于多尺度注意力机制的道路场景语义分割模型范润泽,刘宇红,张荣芬,李景玉(贵州大学大数据与信息工程学院,贵阳550025)摘要:通过对道路场景进行语义分割可以辅助车辆感知周边环境,达到避让行人、车辆以及各类小目标物体障碍的目的,提高行驶的安全性。针对道路场景语义分割中小目标物体识别精度不高、网络参数量过大等问题,提出一种基于多尺度注意力机制的语义分割模型。利用小波变换的多尺度多频率信息分析特性,设计一种多尺度小波注意力模块,并将其嵌入到编码器结构中,通过融合不同尺度及频率的特征信息,保留更多的边缘轮廓细节。使用编码器与解码器之间的层级连接,以及改进的金字塔池化模块进行多方面特征提取,在保留上下文特征信息的同时获得更多的图像细节。通过设计多级损失函数训练网络模型,从而加快网络收敛。在剑桥驾驶标注视频数据集上的实验结果表明,该模型的平均交并比为60.21%,与DeepLabV3+和DenseASPP模型相比参数量减少近30%,在不额外增加参数量的前提下提升了模型的分割精度,且在不同场景下均具有较好的鲁棒性。关键词:深度学习;语义分割;注意力机制;小波变换;金字塔池化开放科学(资源服务)标志码(OSID):中文引用格式:范润泽,刘宇红,张荣芬,等.基于多尺度注意力机制的道路场景语义分割模型[J].计算机工程,2023,49(2):288-295.英文引用格式:FANRZ,LIUYH,ZHANGRF,etal.Roadscenesemanticsegmentationmodelbasedonmulti-scaleattentionmechanism[J].ComputerEngineering,2023,49(2):288-295.RoadSceneSemanticSegmentationModelBasedonMulti-ScaleAttentionMechanismFANRunze,LIUYuhong,ZHANGRongfen,LIJingyu(CollegeofBigDataandInformationEngineering,GuizhouUniversity,Guiyang550025,China)【Abstract】Semanticsegmentationofroadscenescanassistvehiclestoperceivethesurroundingenvironment,toavoidpedestrians,vehiclesandallkindsofsmallobjectobstacles,andfurtherimprovethesafetyofdriving.Thisstudyproposesasemanticsegmentationnetworkbasedonmulti-scaleattentionmechanism,aimingattheproblemsoflowrecognitionaccuracyofsmallobjectsinsemanticsegmentationofroadsceneindeeplearning,andthelargenumberofnetworkparametersadverselyaffectingthedeployment.Amulti-scalewaveletattentionmod...