摘要
本公开实施例公开了一种语音质量检测方法、装置、系统、存储介质和电子设备,通过获取针对同一目标场景同步采集的音频信号和视频信号;基于音频信号获取目标用户的目标语音能量和噪声干扰能量;基于视频信号获取目标用户的唇动激活率;根据目标语音能量、噪声干扰能量以及目标用户的唇动激活率,确定音频信号的语音质量检测结果。本公开实施例通过音频信号处理和唇动检测结合的多模态语音质量检测方式,可以对语音质量进行准确地评判,进而使得从语音中提取的目标用户声纹能够有效表征目标用户语音的特征,提升语音服务的用户体验。
技术关键词
环境噪声干扰
人脸
回声消除算法
场景
音频信号处理
电子设备
语音播报装置
音频采集模块
图像采集模块
处理器通信
存储器
端点
可读存储介质
指令
系统为您推荐了相关专利信息
发射组件
数据采集装置
感应组件
场景
多模态生理
光检测器
光电探测器
自动驾驶系统
跟踪识别系统
机器学习算法
异常检测方法
参数
决策树模型
异常监控系统
异常检测装置