语音数据的重建方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
语音数据的重建方法、装置、计算机设备及存储介质
申请号:CN202411724501
申请日期:2024-11-27
公开号:CN119559929A
公开日期:2025-03-04
类型:发明专利
摘要
本发明公开了一种语音数据的重建方法、装置、计算机设备及存储介质。所述方法包括:通过预设的文本编码器对音素文本执行编码处理后,得到输出向量;通过预设的说话人编码器对说话人提示语言进行编码处理后,得到全局说话人表示;通过预设的韵律模块对所述输出向量和所述全局说话人表示执行预测处理后,得到韵律表示向量;通过预设的解码器对所述韵律表示向量执行解码处理后,得到重建出的语音数据。本方案使用预设的韵律模块处理说话人编码器的全局说话人表示和文本编码器的输出向量,考虑到韵律的全局一致性和局部变化,捕捉当中韵律的分层变化,最终得到提升韵律质量的重建语音,可在自然度和情感表达方面表现更佳。
技术关键词
韵律模块 正弦激励信号 文本编码器 语音 噪声数据 解码器 适配器 计算机设备 分层 神经网络参数 可读存储介质 处理器 存储器
系统为您推荐了相关专利信息
1
数据备份方法、装置、设备及存储介质
声纹特征 智能语音播放 数据备份方法 验证提示信息 智能语音识别
2
语音识别模型微调方法、电子设备、存储介质及程序产品
语音识别模型 字词 微调方法 记忆 音频
3
一种基于语音识别的制动系统及方法
制动系统 语音采集模块 口令 执行紧急制动 语音识别模块
4
一种基于虚拟外呼的在线问诊系统及方法
在线问诊系统 电子病历 电话 人脸识别验证 云端
5
一种基于CLIP模型的事件相机数据分类算法
数据分类算法 事件相机 对齐模块 生成事件 适配器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号