实时交互的语音克隆方法、装置、设备和介质

正文

推荐专利

申请号：CN202511280625

申请日期：2025-09-09

公开号：CN120766654B

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种实时交互的语音克隆方法、装置、设备和介质。本发明所述语音克隆方法直接基于表达用户交互意图的语音数据作为训练语音克隆模型的训练样本数据，无需事先额外录制用户的源音频数据来训练语音克隆模型，提高了语音交互的实时性，且可以实时对语音克隆模型的模型参数进行调整，可提高语音克隆模型的克隆质量和效率。此外，采用梅尔频率倒谱系数声纹特征提取模型结合生成对抗网络模型实现语音克隆，有利于提高语音克隆的质量，提高语交互的对话流畅性。因此，本发明所述音克隆方法，可以在实现与用户个性化语音交互的同时，提高语音交互的实时性，从而确保与用户的对话流畅性，进而提高了用户语音交互的体验舒适度。

技术关键词

声纹特征特征提取模型克隆方法音频放大器意图梅尔频率倒谱系数对话管理器融合特征表达用户交互文本生成对抗网络模型麦克风随机噪声语音交互模块个性化语音训练样本数据离散余弦变换特征提取模块

系统为您推荐了相关专利信息

音乐对话方法、系统、介质、计算设备和程序产品

人脸特征关键词特征图像语义理解对话方法输入模块

基于难度学习的智能客服引导方法、系统、设备及介质

智能客服筛选算法依赖特征语义特征情绪特征

基于人工智能的任务处理方法、装置、计算机设备及介质

多模态特征性能监控融合特征注意力计算机可读指令

一种智能车载服务的处理方法、系统、介质及电动汽车

图谱执行用户期望智能车载语句数据

一种畜牧养殖舍环境检测方法及系统

环境检测方法畜牧养殖舍 MFCC特征动物体表温度红外热成像装置

实时交互的语音克隆方法、装置、设备和介质

站点导航

APP 下载