文本到语音的生成方法、装置及电子设备

AITNT
正文
推荐专利
文本到语音的生成方法、装置及电子设备
申请号:CN202411066953
申请日期:2024-08-05
公开号:CN118629395A
公开日期:2024-09-10
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种文本到语音的生成方法、装置及电子设备,该方法包括:获取待处理文本和目标参考语音;对待处理文本进行预处理,得到待处理文本对应的目标编码;基于目标编码、目标参考语音,以及目标语音生成模型中的风格向量单元,生成目标风格向量;基于目标风格向量、待处理文本,以及目标语音生成模型中的生成单元,生成待处理文本和目标参考语音对应的目标合成语音。本申请实施例提供的文本到语音的生成方法所生成的目标合成语音具有待处理文本的韵律特征和目标参考语音的韵律特征,提高了合成语音的真实性和丰富性。
技术关键词
语音生成模型 文本 风格 韵律特征 特征提取器 编码器 生成方法 梅尔频率倒谱系数 序列 音频特征 方差信息 样本 注意力机制 采样器 电子设备 适配器 模块 数据
系统为您推荐了相关专利信息
1
一种基于人工智能技术的多维度人才评估方法及系统
人才评估方法 人工智能技术 序列 文本 BERT模型
2
用户问答方法、装置、设备、存储介质及产品
问答方法 分块方法 文本 问答装置 参数
3
一种AI智能儿童相机系统
儿童相机 照片 微调技术 风格 重建三维模型
4
一种基于锚点匹配的医疗数据分析与处理系统
关键词 锚点 医院 分析单元 对象
5
一种电力负面清单数据的分类方法及系统
分布特征 数据分布 分类方法 样本 支持向量机模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号