基于自回归模型的语音克隆方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510073902

申请日期：2025-01-15

公开号：CN119920234B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技领域，本发明公开了基于自回归模型的语音克隆方法、装置、设备及存储介质，方法包括：对预设参考语音进行自监督特征提取，得到第一特征向量，对预设参考语音进行风格特征提取，得到第二特征向量，对原始文本进行文本特征提取，得到第三特征向量；基于第一特征向量、第二特征向量、第三特征向量，确定原始文本对应的模拟语音；获取模拟语音和预设参考语音之间的损失值，基于损失值，训练自回归模型；通过训练后的自回归模型，对当前参考语音进行自监督特征提取，得到第四特征向量，对第四特征向量进行处理，生成当前文本对应的克隆语音。本发明能生成个性化的克隆语音，有利于满足应用需求。

技术关键词

语音克隆方法文本音频特征风格解码器编码器可读存储介质人工智能技术处理器模块计算机设备页面存储器指令金融

系统为您推荐了相关专利信息

基于AI算法的服装材料数据库可持续性分析方法

AI算法分析方法智能推荐系统图像识别技术智能语音交互系统

一种导览对话系统的答复方法、装置、设备及存储介质

对话系统自然语言多模态信息画像生成推荐信息

使用机器学习进行图像重光照

图像生成模型光照图像嵌入颜色对象

一种电话客服方言口音转换系统及方法

服务器模块客服电话口音转换方法通讯终端

一种基于AI智能体的办公需求解决方法及系统

XGBoost模型图谱特征语义向量多阶段特征动态

基于自回归模型的语音克隆方法、装置、设备及存储介质

站点导航

APP 下载