一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质

正文

推荐专利

申请号：CN202411849270

申请日期：2024-12-16

公开号：CN119943027B

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质，所述训练方法包括：获取方言音频样本及对应的文本信息；将文本编码器、语音分词器、大语言子模型及流匹配子模型的参数设置为固定参数，初始化Lora模块的第一低秩矩阵和第二低秩矩阵；以方言音频样本及文本信息为输入，以文本信息对应的克隆语音为输出，对方言语音克隆模型进行迭代训练，直至损失函数收敛；在训练时，在损失函数未收敛的情况下，对第一低秩矩阵和第二低秩矩阵进行更新，将更新后的第一低秩矩阵和第二低秩矩阵的乘积作为权重矩阵更新量，加入大语言子模型中。通过实施本发明能够提高方言克隆的真实感以及模型的训练效率。

技术关键词

音频语音文本编码器说话人识别技术矩阵克隆方法数据获取模块样本声码器音色特征降噪单元切割单元采样率终端设备语义特征训练装置处理单元格式

系统为您推荐了相关专利信息

基于松弛-正则的电力网络多错误参数辨识方法及装置

参数辨识方法加权最小二乘状态估计模型松弛变量

一种基于多模态形变场分析的LDI曝光机光路变形监测方法

多模态关联特征数据变形监测方法基板变形监测系统

面向低空目标定位的机载相控阵雷达资源管理方法及系统

机载相控阵雷达资源管理方法功率贪婪算法定位组

新能源终端的业务动态访问控制方法和访问控制装置

终端异常流量身份验证动态访问控制方法数据

网络流量测试模型的生成方法及网络流量异常检测方法

网络流量异常检测方法网络流量数据生成方法网络流量特征训练集

一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质

站点导航

APP 下载