第50卷第1期2023年北京化工大学学报(自然科学版)JournalofBeijingUniversityofChemicalTechnology(NaturalScience)Vol.50,No.12023引用格式:杨巧宁,蒋思,纪晓东,等.基于多尺度特征提取的单目图像深度估计[J].北京化工大学学报(自然科学版),2023,50(1):97-106.YANGQiaoNing,JIANGSi,JIXiaoDong,etal.Monocularimagedepthestimationbasedonmulti⁃scalefeatureextraction[J].JournalofBeijingUniversityofChemicalTechnology(NaturalScience),2023,50(1):97-106.基于多尺度特征提取的单目图像深度估计杨巧宁蒋思纪晓东杨秀慧(北京化工大学信息科学与技术学院,北京100029)摘要:在目前基于深度学习的单目图像深度估计方法中,由于网络提取特征不够充分、边缘信息丢失从而导致深度图整体精度不足。因此提出了一种基于多尺度特征提取的单目图像深度估计方法。该方法首先使用Res2Net101作为编码器,通过在单个残差块中进行通道分组,使用阶梯型卷积方式来提取更细粒度的多尺度特征,加强特征提取能力;其次使用高通滤波器提取图像中的物体边缘来保留边缘信息;最后引入结构相似性损失函数,使得网络在训练过程中更加关注图像局部区域,提高网络的特征提取能力。在NYUDepthV2室内场景深度数据集上对本文方法进行验证,实验结果表明所提方法是有效的,提升了深度图的整体精度,其均方根误差(RMSE)达到0.508,并且在阈值为1.25时的准确率达到0.875。关键词:单目图像;深度估计;多尺度特征;结构相似性损失函数中图分类号:TP391DOI:10.13543/j.bhxbzr.2023.01.012收稿日期:20211227第一作者:女,1976年生,副教授,博士E⁃mail:yangqn@mail.buct.edu.cn引言近年来,人工智能技术已经大量应用到人类生活中,如自动分拣机器人[1]、VR虚拟现实、自动驾驶[2]等。深度信息帮助这些应用理解并分析场景的3D结构,提高执行具体任务的准确率。传统的深度信息获取方式主要有两种:一种是通过硬件...