语音合成方法、语音合成模型训练方法及相关装置

AITNT
正文
推荐专利
语音合成方法、语音合成模型训练方法及相关装置
申请号:CN202510848810
申请日期:2025-06-24
公开号:CN120356452B
公开日期:2025-09-19
类型:发明专利
摘要
本申请公开了一种语音合成方法、语音合成模型训练方法及相关装置,该方法包括:获取待合成的目标文本和目标语音;提取目标语音中说话人的声音特征;基于说话人的声音特征和目标文本,生成目标合成语音,目标合成语音为参考目标语音的声音特点、且发音内容与目标文本一致的语音;其中,声音特征是利用Q‑former提取得到;和/或,目标合成语音是利用目标语音合成模型生成的,目标语音合成模型是按照用户对第一样本合成语音的偏好程度,对初始语音合成模型进行强化学习得到,第一样本合成语音为利用初始语音合成模型生成。通过上述方式,本申请能够提高目标合成语音的质量。
技术关键词
样本 注意力 音频特征 子模块 声纹验证系统 模型训练方法 文本 语音识别系统 发音 模型训练装置 网络 参数 可读存储介质 处理器 编码 存储器 程序 指令
系统为您推荐了相关专利信息
1
一种小样本目标检测数据增强方法
训练神经网络 图像 样本 推土机 复制粘贴数据
2
一种基于模块化服务的自动换装智能机器人系统
智能机器人系统 基站 回程 工作模块 自动换装方法
3
基于深度学习的函数入口特征识别方法、装置及设备
特征识别方法 网络参数信息 入口 数据 样本
4
一种基于混合模型的指向性图像分割方法及系统
图像分割方法 融合特征 视觉特征 多模态特征 跨模态
5
一种心理风险评估预警模型构建方法
预警模型构建方法 风险评估模型 数据 话题 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号