语音质量预测方法、装置、电子设备、存储介质及产品

正文

推荐专利

申请号：CN202410849435

申请日期：2024-06-27

公开号：CN118841040A

公开日期：2024-10-25

类型：发明专利

摘要

本发明提供一种语音质量预测方法、装置、电子设备、存储介质及产品，包括：获取待预测的视频通话结果的音频信号和视频信号；将音频信号输入多尺度音频特征融合模块，得到多尺度音频特征；将视频信号输入多尺度视频特征融合模块，得到多尺度视频特征；通过多尺度视频特征融合模块中的多尺度残差网络对视频信号的各尺度的视频特征进行处理，得到多尺度视频特征；根据多尺度音频特征和多尺度视频特征，预测视频通话结果的语音质量。本发明通过多尺度残差网络，挖掘视频信号中与语音质量相关的尺度和深度特征信息，使得特征信息更加全面多样，并通过结合多尺度视频特征结合多尺度音频特征进行语音质量预测，可以强化特征信息，提高语音质量预测效果。

技术关键词

音频特征输入多尺度频域特征残差网络语音融合特征二维卷积神经网络三维卷积神经网络音视频模块非暂态计算机可读存储介质深度特征信息短时傅里叶变换信号电子设备处理器强化特征

系统为您推荐了相关专利信息

一种准确识别对话意图的方法、系统及装置

大语言模型意图识别模板服务机器人生成指令

一种肝癌类器官与免疫细胞共培养药敏检测平台

智能控制器人体检测传感器录像免疫细胞工作台板

车辆维修策略的确定方法、装置、电子设备及存储介质

车辆维修数据库车型可读存储介质数据更新电子设备

一种基于智能体平台的智能会议实现方法、设备及介质

智能体平台发言者会议纪要身份语音特征提取

一种基于风格引导的多视角融合处理的人脸伪造检测算法

风格人脸多尺度语义特征分层特征

语音质量预测方法、装置、电子设备、存储介质及产品

站点导航

APP 下载