摘要
本发明公开了一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质,所述训练方法包括:获取方言音频样本及对应的文本信息;将文本编码器、语音分词器、大语言子模型及流匹配子模型的参数设置为固定参数,初始化Lora模块的第一低秩矩阵和第二低秩矩阵;以方言音频样本及文本信息为输入,以文本信息对应的克隆语音为输出,对方言语音克隆模型进行迭代训练,直至损失函数收敛;在训练时,在损失函数未收敛的情况下,对第一低秩矩阵和第二低秩矩阵进行更新,将更新后的第一低秩矩阵和第二低秩矩阵的乘积作为权重矩阵更新量,加入大语言子模型中。通过实施本发明能够提高方言克隆的真实感以及模型的训练效率。
技术关键词
音频
语音
文本编码器
说话人识别技术
矩阵
克隆方法
数据获取模块
样本
声码器
音色特征
降噪单元
切割单元
采样率
终端设备
语义特征
训练装置
处理单元
格式
系统为您推荐了相关专利信息
参数辨识方法
加权最小二乘
状态估计模型
松弛
变量
多模态
关联特征数据
变形监测方法
基板
变形监测系统
机载相控阵雷达
资源管理方法
功率
贪婪算法
定位组
网络流量异常检测方法
网络流量数据
生成方法
网络流量特征
训练集