基于多模态融合的语音质量检测评估方法

AITNT
正文
推荐专利
基于多模态融合的语音质量检测评估方法
申请号:CN202510465369
申请日期:2025-04-15
公开号:CN120319272A
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及语音质量检测技术领域,具体涉及基于多模态融合的语音质量检测评估方法。该方法包括:将多模态融合的含噪语音信号经过短时傅里叶变换得到若干个含噪语谱,构建含噪语音的复数谱矩阵;基于含噪语音的复数谱矩阵计算得到多模态融合的含噪语音信号对应的实值语音特征矩阵,将实值语音特征矩阵输入到多模态融合的语音信号重构分析模型中,输出最优实值语音特征;以最优实值语音特征为目标训练深度网络,实现语音增强;基于增强后的语音信号计算融合特定人信息的先验信噪比,基于先验信噪比对该语音信号进行质量检测评估,能够提高对多模态融合的语音信号方面进行质量检测评估时的可靠性和准确性。
技术关键词
检测评估方法 语音特征 多模态 信噪比 短时傅里叶变换 重构矩阵 数据样本集合 信号 深度网络模型 频段 分段 指数 节点 编码器 频率 生成特征
系统为您推荐了相关专利信息
1
一种基于联邦学习与动态语义掩码的智能脱敏方法
跨模态 脱敏方法 预训练模型 区块链存证 差分隐私
2
基于分子模拟的物理多维交互教学系统、方法及介质
交互教学系统 交互教学方法 简化接口 分子 多模态交互
3
基于社交媒体的灾害预测方法、装置、设备及存储介质
多模态 灾害预测方法 社交媒体平台 上下文特征 计算机视觉技术
4
基于多模态数据融合的电机驱动智能控制系统及方法
基准特征 电机驱动智能 多模态数据融合 多模态数据采集 实时数据处理
5
一种企业资源规划的智能化优化系统
企业资源规划 知识图谱构建 企业资源管理技术 风险 市场调研系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号