摘要
本发明涉及语音质量检测技术领域,具体涉及基于多模态融合的语音质量检测评估方法。该方法包括:将多模态融合的含噪语音信号经过短时傅里叶变换得到若干个含噪语谱,构建含噪语音的复数谱矩阵;基于含噪语音的复数谱矩阵计算得到多模态融合的含噪语音信号对应的实值语音特征矩阵,将实值语音特征矩阵输入到多模态融合的语音信号重构分析模型中,输出最优实值语音特征;以最优实值语音特征为目标训练深度网络,实现语音增强;基于增强后的语音信号计算融合特定人信息的先验信噪比,基于先验信噪比对该语音信号进行质量检测评估,能够提高对多模态融合的语音信号方面进行质量检测评估时的可靠性和准确性。
技术关键词
检测评估方法
语音特征
多模态
信噪比
短时傅里叶变换
重构矩阵
数据样本集合
信号
深度网络模型
频段
分段
指数
节点
编码器
频率
生成特征
系统为您推荐了相关专利信息
跨模态
脱敏方法
预训练模型
区块链存证
差分隐私
交互教学系统
交互教学方法
简化接口
分子
多模态交互
多模态
灾害预测方法
社交媒体平台
上下文特征
计算机视觉技术
基准特征
电机驱动智能
多模态数据融合
多模态数据采集
实时数据处理
企业资源规划
知识图谱构建
企业资源管理技术
风险
市场调研系统