文档介绍:该【基于HCDeepLabV3+的道路意外障碍物检测算法 】是由【十二贾氏】上传分享,文档一共【9】页,该文档可以免费在线阅读,需要了解更多关于【基于HCDeepLabV3+的道路意外障碍物检测算法 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。第 卷 第 期 湖 州 师 范 学 院 学 报
47 10
年 月
2025 10 JournalofHuzhouUniversity
基于 HCDeepLabV3+的
道路意外障碍物检测算法
慈文彦,葛杨勋,邓 海,侯宏毅,马计划
湖州师范学院 工学 院 浙江 湖州
( , 313000)
摘 要:为了解决复杂道路场景中远距离小目标检测的难题 提出 模型 通过 项改进提升语义
, HCDeepLabV3+ , 3
分割精度 引入高度驱动注意力机制 利用垂直空间信息增强对目标上下文特征的建模 设计跨层
:① (HANet), ;②
特征融合策略 在 的前 个阶段插入卷积层 实现低层细节信息与高层语义表达的互补 在解码
(CLC), ResNet 3 , ;③
端嵌入卷积注意力模块 联合优化通道与空间特征响应 强化目标表征并抑制背景干扰 基于
(CBAM), , 。 Lostand
数据集的实验结果表明 改进模型的像素级检测率 达 假阳性率 降至 相比
Found , (PDR) %, (PFPR) %,
原始模型均有显著提升 该模型在复杂场景障碍物检测中展现出优异的鲁棒性 尤其在远距离目标识别与细节
。 ,
保持方面表现突出 为道路安全预警提供了有效的技术支持
, 。
关键词:语义分割 道路意外障碍物 注意力机制 卷积层
;DeepLabV3+; ; ;
中图分类号: 文献标志码: 文章编号:
U495 A 1009 1734(2025)10 0045 09
随着自动驾驶技术的不断发展 行业对车辆安全性和可靠性的要求日益提高 高级驾驶辅助系统
, 。
作为新一代主动安全技术 能够在危险情况下通过感知周围
(advanceddrivingassistancesystem,ADAS) ,
环境进行预警或主动干预 从而减轻或避免交通事故造成的损害[1] 近年来 为提升自动驾驶车辆的运
, 。 ,
行效率 研究人员提出了多种环境感知方法 然而 部分方法依赖于特定类型的传感器 如立体相机 激
, 。 , , 、
光雷达 和雷达等 这些传感器不仅与现有车辆硬件系统存在兼容性问题 其成本和功耗也较
(LiDAR) 。 ,
高[23] 此外 在实时道路场景中 道路障碍物在颜色 纹理 形状等方面差异显著 增加了检测难度
。 , , 、 、 , 。
目前 基于深度学习的语义分割技术为障碍物检测提供了新的解决方案 主流模型 如 [4]
, 。 ( FCN 、U
[5] [6]等 虽能通过编码器 解码器架构和空洞卷积技术显著提升了分割性能 然而 这
Net 、DeepLabV3+ ) 。 ,
些模型由于感受野设计固定 难以有效适应多尺度目标 且深层网络易丢失细节信息 导致在复杂道路场
, , ,
景中仍存在误检与漏检问题 尽管现有研究在已知类型障碍物检测方面已取得一定进展 但对数据集中
。 ,
未包含的意外障碍物 仍缺乏有效的检测手段 据美国交通报告统计 仅因道路散落货物引发的事故 每
, 。 , ,
年就造成约 人死亡[7] 这类障碍物通常体积小 形态不规则 检测难度较大 因此 研究车辆对意外
150 。 , , 。 ,
障碍物的检测方法对提升道路行驶安全具有重要意义
。
为解决上述问题 研究者们开始探索新的方法 例如 等将常规语义分割与开集识别方法相结合
, 。 ,Ci ,
提出了一种基于贝叶斯融合的检测方法[8] 该方法通过贝叶斯概率推理捕捉像素级异常区域 从而提升
。 ,
系统对意外障碍物的检测能力 然而 该方法在细粒度 识别方面仍存在一定
。 , OoD(out of distribution)
局限 难以准确区分异常像素与正常像素 导致部分障碍物检测精度下降 此外 等通过引入感受
, , 。 ,Xuan
野模块 增强了轻量化网络的特征表示能力 并在解码器中添加 注意
(receptivefieldblock,RFB), , CBAM
力机制 从而显著提高了检测率 同时有效降低了假阳性率[9]
, , 。
收稿日期:
2025 08 16
基金项目:工业控制 技 术 全 国 重 点 实 验 室 开 放 课 题 湖 州 师 范 学 院 工 学 院 院 级 研 究 生 科 研 创 新 项 目
(ICT2025D14);
(2024GXYKYCX03)
通信作者:慈文彦 博士 副教授 从事机器视觉 智能汽车环境感知研究
, , , 、
湖 州 师 范 学 院 学 报 第 卷
46 47
针对上述挑战 本研究提出了一种基于 模块的 改进模型 该模型在编码器
, HANet HCDeepLabV3+ 。
中构建四层残差连接以融合多尺度特征 通过优化 的前 个阶段结构并新增双卷积层以扩展感
, ResNet 3
受野 同时结合跨层特征融合策略 有效融合整合低层细节信息与高层语义表达 在解码器部分引入卷积
, , ;
块注意力模块 通过通道与空间双注意力模块动态增强目
(convolutionalblockattentionmodule,CBAM),
标特征表达
。
研究方法
1
模型网络结构见图 本研究提出 模型 通过引入高度驱动的注
HCDeepLabV3+ 1。 HCDeepLabV3+ ,
意力网络 模块并将其嵌入 主干网络的四个关键层
(height drivenattentionnetwork ,HANet) ResNet
级 利用残差跨层连接融合底层细节特征与高层语义信息 增强多尺度特征提取能力 在主干网浅层引
, , 。
入空洞卷积以扩大感受野 并采用跨层特征金字塔结构实现多层级特征整合 进一步提升细粒度目标检
, ,
测效果 解码器部分集成 双注意力机制 通过通道压缩和空间可变形卷积聚焦关键区域 强化局
。 CBAM , ,
部特征 从而有效提升模型在复杂道路场景中的检测性能
, 。
图 模型网络结构
1 HCDeepLabV3+
网络模块
HANet
利用图像的高度信息 引导分割网络对不同高度区域的特征进行加权处理 以增强网络对各
HANet , ,
高度区域特征的建模能力 其结构见图
。 2。
图 结构图
2 HANet
第 期 慈文彦 等 基于 的道路意外障碍物检测算法
10 , : HCDeepLabV3+ 47
首先 对低级别特征图进行平均池化 将其聚合为一个Cl Hl 的矩阵 从而提取每行的高度上下
, , × ×1 ,
文信息 并在宽度方向上实施粗略的注意力机制 以加强对不同位置特征的关注程度 即
, , ,
Z G Xl
= pool( ), (1)
式中 Z 为通过宽度池化将提取到的高度方向上的上下文信息池化为Cl Hl 的矩阵 G 为宽度池
: × ×1 ; pool
化操作
。
其次 通过插值操作将原始特征图上采样至目标尺寸 使其能够与其他处理后的特征图进行融合或
, ,
进一步分析 从而提升图像分割的准确性与细节捕捉能力 同时应用 函数生成注意力图 此外
, , Sigmoid 。 ,
将较低级别的特征图 Xl 经过主要网络获得较高级别的特征图Xh
。
~
最终 通过逐元素法将给定的 Xh 与注意力图相乘 得到新的特征融合的注意力图 X 该过程可由以
, , 。
下公式表示
:
~
X F Xl Xh A Xh
= HANet( )☉ = ☉ , (2)
C H W C H W
l× l× l h × h × h
式中 Xl R Xh R 这里C 为通道数 H 和 W 分别为输入张量的高度和宽度 为
, ∈ , ∈ 。 ; ;☉
逐元素法
。
注意力机制
CBAM
在意外障碍物检测任务中 由于目标对象种类有限且像素占比极低 原始 在通道和空
, , DeepLabV3+
间维度上的特征提取能力存在一定局限 难以充分捕捉目标区域的细节特征 为增强模型在通道与空间
, 。
信息的建模能 力 本 文 在 解 码 阶 段 引 入 了 模 块 该 模 块 由 通 道 注 意 力 与 空 间 注 意 力
, CBAM 。 (CAM)
两个子模块组成 通道注意力通过自适应调整不同通道的权重 突出对目标检测关键的特征通道
(SAM) : , ,
同时抑制冗余信息 空间注意力则进一步强化目标区域的显著性 使模型更加聚焦于目标的空间分布 减
; , ,
少背景干扰 图 展 示 了 模 块 的 结 构 其 中 包 括 分 别 负 责 在 通 道 和 空 间 维 度 上 施 加 注 意 力 的
。 3 CBAM ,
和 两部分
CAM SAM 。
图 结构
3 CBAM
在 中 输入特征图先经全局平均池化 和全局最大池化 操作 以聚合通道维度上
CAM , (GAP) (GMP) ,
的全局信息 随后通过一个共享的两层 包含 和 激活函数 计算各通道的权重 并通
; MLP( ReLU Sigmoid ) ,
过逐通道相乘的方式实现对关键语义特征的增强与冗余信息的抑制 其计算公式为
。
c c
Mc F σ F F σ W W F W W F
( )= (MLP(AugPool( ))+MLP(MaxPool(