一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质

AITNT
正文
推荐专利
一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质
申请号:CN202411849270
申请日期:2024-12-16
公开号:CN119943027B
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种方言语音克隆模型的训练方法、方言语音克隆方法、装置、终端设备及存储介质,所述训练方法包括:获取方言音频样本及对应的文本信息;将文本编码器、语音分词器、大语言子模型及流匹配子模型的参数设置为固定参数,初始化Lora模块的第一低秩矩阵和第二低秩矩阵;以方言音频样本及文本信息为输入,以文本信息对应的克隆语音为输出,对方言语音克隆模型进行迭代训练,直至损失函数收敛;在训练时,在损失函数未收敛的情况下,对第一低秩矩阵和第二低秩矩阵进行更新,将更新后的第一低秩矩阵和第二低秩矩阵的乘积作为权重矩阵更新量,加入大语言子模型中。通过实施本发明能够提高方言克隆的真实感以及模型的训练效率。
技术关键词
音频 语音 文本编码器 说话人识别技术 矩阵 克隆方法 数据获取模块 样本 声码器 音色特征 降噪单元 切割单元 采样率 终端设备 语义特征 训练装置 处理单元 格式
系统为您推荐了相关专利信息
1
基于松弛-正则的电力网络多错误参数辨识方法及装置
参数辨识方法 加权最小二乘 状态估计模型 松弛 变量
2
一种基于多模态形变场分析的LDI曝光机光路变形监测方法
多模态 关联特征数据 变形监测方法 基板 变形监测系统
3
面向低空目标定位的机载相控阵雷达资源管理方法及系统
机载相控阵雷达 资源管理方法 功率 贪婪算法 定位组
4
新能源终端的业务动态访问控制方法和访问控制装置
终端 异常流量 身份验证 动态访问控制方法 数据
5
网络流量测试模型的生成方法及网络流量异常检测方法
网络流量异常检测方法 网络流量数据 生成方法 网络流量特征 训练集
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号