语音生成方法、装置、电子设备及计算机可读存储介质

AITNT
正文
推荐专利
语音生成方法、装置、电子设备及计算机可读存储介质
申请号:CN202410814374
申请日期:2024-06-21
公开号:CN118982977A
公开日期:2024-11-19
类型:发明专利
摘要
本申请公开了一种语音生成方法、装置、电子设备及计算机可读存储介质,涉及互联网技术领域,在构建语音生成模型的过程中额外引入了描述语音特点的音素持续时长和样本语音特征信息同时进行监督训练,使得语音生成模型能够生成较为自然的带有情感表达的特定说话人的高质量语音。所述方法包括:确定待转化为语音的目标声音特征信息、目标情感信息以及目标文本;利用语音生成模型对目标文本、目标声音特征信息和目标情感信息进行训练,得到目标语音;其中语音生成模型是基于样本文本对应的音素持续时长以及样本语音对应的样本语音特征信息对训练模型训练得到;样本语音特征信息包括以下至少一项:样本声音特征信息和样本情感信息;输出目标语音。
技术关键词
语音生成模型 样本 语音特征信息 文本 语音生成方法 对齐工具 序列特征 生成指令 可读存储介质 电子设备 索引 音频 互联网技术 时间段 生成装置 计算机 处理器 输出模块
系统为您推荐了相关专利信息
1
视频脚本生成方法、装置、电子设备及存储介质
视频 文本 脚本生成方法 标签 子模块
2
一种直播素材的推荐方法、系统、电子设备及存储介质
关键词 数据存储结构 推荐方法 主题 文本
3
用于代码分析的对话式GPT数据处理方法及系统
数据处理方法 参数 文本段落 关键词 可执行程序代码
4
代客行为检测方法、装置、设备、存储介质及程序产品
计算机执行指令 终端设备 视频帧 人脸检测模型 状态空间模型
5
一种导航欺骗干扰检测方法、装置及电子设备
相关器 欺骗干扰检测方法 支路 欺骗干扰信号 伪随机码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号