摘要
本发明为一种自动驾驶车辆视觉‑语义协同感知方法及系统。包括视觉‑语义特征编码模块和视觉‑语义特征融合模块;视觉‑语义特征编码模块包括文本语义编码器与视觉时空编码器;视觉时空编码器基于2D视觉编码模型提取单帧语义与结构特征,采用3D视觉编码模型建模形成3D帧级融合视觉感知特征;视觉‑语义特征融合模块包括时间转换器、交叉转换器与上下文丰富转换器,基于动态权重融合策略自适应调整融合权重,生成所需视觉‑语义特征融合信息。本申请自动调整多模态权重,降低环境感知误差与决策延迟,提升自动驾驶车辆对干线物流复杂交通场景的适应性和响应精度,保证智能驾驶系统在复杂道路环境中的安全稳定运行。
技术关键词
融合视觉感知特征
时间转换器
语义特征
文本
语义协同
生成自动驾驶车辆
预训练模型
跨模态
融合特征
车辆视觉
序列
多头注意力机制
特征提取模型
编码模块
融合策略
系统为您推荐了相关专利信息
设备状态监控方法
多模态数据融合
文本
交叉注意力机制
设备状态监控系统
强化学习算法
加密算法
分类规则
智能文件管理系统
文本特征向量
数据处理方法
警情文本数据
决策
关键词
计算机设备
图像编码
文本编码器
样本
采样模块
马尔可夫模型