语音合成方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
语音合成方法、装置、电子设备和存储介质
申请号:CN202411906533
申请日期:2024-12-23
公开号:CN119763545B
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种语音合成方法、装置、电子设备和存储介质,涉及语音技术领域,其中方法包括:将获取的待合成文本和情感属性输入语音合成模型中,得到语音合成模型输出的目标语音;其中,语音合成模型为基于第一样本语音对应的第一样本文本和第一样本语音对应的第一样本情感特征训练得到的,第一样本情感特征为将第一样本语音输入情感编码模型后得到的,情感编码模型为基于目标编码和第二样本情感特征的最小互信息损失训练得到的。本发明能够基于最小互信息损失训练得到情感编码模型,以使情感编码模型输出的情感特征中不包括音色和文本内容等不相关信息,使得语音合成模型能够实现对细粒度情感的控制,提高了语音合成的控制力。
技术关键词
情感特征 样本 语音解码网络 语音特征提取 文本 语音编码 语义特征 参数 非暂态计算机可读存储介质 电子设备 语音技术 处理器 风格 存储器 模板 对象
系统为您推荐了相关专利信息
1
图像生成方法、装置、计算机设备和存储介质
降噪特征 噪声特征 对象 交叉注意力机制 文本生成图像
2
基于客户业务数据分析的智能交互系统
智能交互系统 查询意图 语音识别模型 声纹认证 客户
3
一种基于光谱预处理的无籽与有籽西瓜可溶性固形物的检测方法
西瓜 可溶性固形物含量 特征提取模块 线性 曲线
4
大语言模型进行会话分析任务的批测方法、设备及介质
大语言模型 标签 神经网络模型 测试场景 模板
5
印章识别方法、装置、计算机设备及存储介质
文本行 印章识别方法 印章识别装置 坐标 计算机设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号