文章编号:1002-2082(2024)02-0373-12基于卷积神经网络的路面裂缝分割设计与研究刘艳宁,章国宝(东南大学自动化学院,南京210000)摘要:裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取多尺度特征,特征的最高层使用金字塔池化模块进一步获取全局先验特征,通过具有横向连接和自上而下的金字塔结构进行特征融合。针对裂缝和背景不平衡问题,使用平衡交叉熵损失函数提高模型的检测性能。此外,构建了一个包含2876张裂缝图片的数据集UCrack,覆盖多种裂缝类型和广泛的背景范围,以提供丰富的特征供模型学习。实验表明,在UCrack测试数据集上模型的召回率和F1得分比其他表现最佳的模型提高了2.68%和6.89%;在CrackDataset数据集上的测试取得了85.68%的召回率和80.11%的F1得分,说明模型具有较好的泛化性能,可应对背景复杂的路面裂缝分割。关键词:裂缝分割;卷积神经网络;编解码网络;特征金字塔;金字塔池化中图分类号:TN206;TP391文献标志码:ADOI:10.5768/JAO202445.0202004DesignandresearchonpavementcracksegmentationbasedonconvolutionalneuralnetworkLIUYanning,ZHANGGuobao(SchoolofAutomation,SoutheastUniversity,Nanjing210000,China)Abstract:Cracksarethemostimportanttypeofpavementdiseases,andtheaccuratecracksegmentationisanimportantdecisionbasisfornationalpreventivemaintenancemanagementofroads.Toaddresstheproblemofcracksegmentationaccuracyofexistingmodelsforpavementundercomplexbackground,anend-to-endcracksegmentationmodelbasedonconvolutionalneuralnetworkwasproposed,whichusedalayeredstructureofConvNeXtencodertoextractmulti-scalefeatures.Apyramidpoolingmodulewasusedtofurtherobtaintheglobalpriorifeaturesbythetoplayeroffeatures,andthefeaturefusionwasperformedthroughapyramidstructurewithlateralconnectionsandtop-down.Aweightedcross-entropylossfunctionwasemployedtoenhancethedetectionperformanceofmodelforthecrackandbackgroundimbalanceproblem.Inaddition,acrackdatasetUCrackwith2876crackscoveringmultiplecracktypesandawiderangeofbackgroundswascreatedtoproviderichfeaturesf...