计算机与现代化JISUANJIYUXIANDAIHUA2023年第10期总第338期文章编号:1006-2475(2023)10-0065-05收稿日期:2022-11-20;修回日期:2022-12-09基金项目:重庆市技术创新与应用发展重点项目(cstc2019jscx-mbdxX0061)作者简介:叶思佳(1998—),女,重庆忠县人,硕士研究生,研究方向:图像语义分割,E-mail:895121532@qq.com;通信作者:魏延(1970—),男,四川泸县人,教授,硕士生导师,研究方向:教育大数据,E-mail:weiyan@cqnu.edu.cn;杜韩宇(1997—),男,安徽宿州人,硕士研究生,研究方向:图像暗光增强,E-mail:duhanyu5@163.com;邓金枝(1995—),女,四川南充人,硕士研究生,研究方向:文本生成图像,E-mail:1334548213@qq.com。0引言语义分割[1-2]是计算机视觉领域中常见的任务之一,让计算机理解图像的信息,根据图像的信息来为每一个像素点进行分类,不同类别信息的像素点用不同的颜色区分开,语义分割本质是一种像素级的空间密集型预测任务。语义分割在地理信息系统[3-4]、无人车驾驶[5-6]、医疗影像分析[7-8]等领域都有着广泛的应用。目前语义分割领域依旧面临许多挑战,如分割精度不够、小尺度目标丢失、分割不连续等问题。传统的语义分割方法通常是根据图像自身的低阶视觉信息来提取特征图,这种提取的方式特征图辨别性低从而影响分割精度。传统的语义分割算法主要包括阈值分割[9]、边缘分割[10]、聚类分割[11-12]等。目前语义分割领域中主流的是基于深度学习的方法。和传统方法相比,基于深度学习的图像语义分割能更好地提取图像的特征。基于深度学习的图像语义分割网络结构主要包括3种,即基于编解码的网络结构、基于空间金字塔的网络结构和基于多分支的网络结构。在编解码网络结构中,通过编码器取得低分辨率图像,得到图像的抽象的语义信息,通过解码器取得高分辨率图像,得到像素级预测结果。典型编码器-解码器结构的网络主要有全卷积神经网络FCN[13]、U型网络U-Net[14]以及SegNet[15]网络。空间金字塔网络结构就是在图片特征提取过程当中形成多个不同分辨率的特征图,再将不同分辨率的特征图进行融合,提高模型表征特征的能力。空间金字塔结构的实现目前主要分为2种:一种是通过改变各分支结合注意力机制的HRNet图像语义分割算法叶思佳,魏延,杜韩宇,邓金枝(重庆师范大学计算机与信息科学学院,重庆401331)摘要:目前主流的语义分割算法中依然存在小尺寸目标丢失、分割不精确等问题,...