摘要
本申请涉及一种基于UNITER‑Yolov5模型的多模态交通感知方法。该方法包括:获取交通场景中的图像数据和文本描述数据;将图像数据输入训练好的基于UNITER‑Yolov5的多模态交通感知模型的Yolov5模块进行预处理,获得K个目标区域的图像卷积特征;将文本描述数据和图像数据输入多模态交通感知模型的UNITER模块进行预处理,获得图像的语义特征;将图像的语义特征和K个目标区域的图像卷积特征输入到多模态交通感知模型的改进的Yolov5模块进行感知,输出交通场景的感知结果。能够将图像信息和自然语言信息有效地融合,应对现在多模态环境与复杂交通环境的目标感知,提供更全面的目标理解,从而提高检测的准确性。
技术关键词
图像卷积特征
交通
文本
语义特征
数据
自然语言信息
多模态环境
模块
样本
表达式
分词
场景
坐标
元素
传播算法
精度
通道
系统为您推荐了相关专利信息
还原酶
测试评价方法
统计学方法
抗糖化化妆品
测试试剂盒
数据动态更新方法
斯塔克尔伯格博弈
数据更新
年龄
客户端终端
文件生成方法
布局优化算法
版图
标准单元库
启发式算法