摘要
本发明公开一种车辆自动驾驶听觉信息语义理解学习方法及装置,通过虚拟音频采集模组采集虚拟环境中的声音事件得到虚拟音频数据集,对虚拟音频数据集中的虚拟音频数据进行分类并生成伪标签;获取目标虚拟音频数据的场景信息,并作为目标虚拟音频数据的场景化语义标签;将带有标签的虚拟音频数据集用于深度学习模型训练得到音频分析模型;获取实时音频数据,通过音频分析模型的特征提取层提取实时音频数据的音频特征;获取音频特征在时间序列对应的上下文特征,根据目标音频特征与上下文特征生成音频时间特征;通过音频分析模型的输出层分析音频时间特征得到实时音频数据对应的分类以及场景,提高自动驾驶车辆对听觉信息的感知和理解能力。
技术关键词
音频特征
深度学习模型训练
学习方法
音频事件分类
模态特征
语义标签
数据
听觉
上下文特征
场景
车辆
融合特征
模组
多尺度
学习装置
样本
系统为您推荐了相关专利信息
多模态特征
性能监控
融合特征
注意力
计算机可读指令
多模态特征
动作特征
情绪特征
情绪识别模型
查询特征
资源分配
机器学习模型训练
训练深度神经网络
数据
强化学习算法
演变分析方法
符号
融合特征
特征金字塔网络
知识图谱分析
异种金属管
镁合金
多模态特征
焊接方法
平均晶粒尺寸