摘要
本发明公开了一种汽车环境音增强方法、装置、电子设备及存储介质,用于解决相关技术中汽车外部环境音识别精度低、环境适应性差的技术问题。所述方法包括:采集车外音频数据以及车外视频数据;根据车外音频数据以及车外视频数据进行场景识别,获得当前环境音类型以及当前驾驶环境;从车外视频数据中提取视觉信息,并从车外音频数据中提取音频信息;结合视觉信息以及音频信息进行基于综合置信度的多模态数据融合,获得有效场景判断结果;基于当前驾驶环境,当前环境音类型以及有效场景判断结果,通过音透传增强策略增强车外环境音。从而基于多模态数据融合可以提高环境音识别准确性,结合音透传增强策略实现环境音增强,提高了环境适应性。
技术关键词
多模态数据融合
场景
视频
汽车
存储程序代码
语音识别置信度
人脸关键点
置信度阈值
头部姿态估计
音频特征
视觉特征
人脸检测算法
策略
电子设备
系统为您推荐了相关专利信息
智能投放方法
兴趣
生成广告
深度神经网络模型
无缝嵌入
身份验证信息
硬件安全模块
灌装方法
非对称密钥算法
公钥
颜色空间模型
人工智能识别
可见光图像
像素点
演化特征
决策方法
救援指挥系统
救援场景
航空瞬变电磁
网格