基于文本的语音合成方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于文本的语音合成方法、装置、设备及存储介质
申请号:CN202411658753
申请日期:2024-11-19
公开号:CN119400150B
公开日期:2025-10-10
类型:发明专利
摘要
本公开提供了一种基于文本的语音合成方法、装置、设备及存储介质,涉及人工智能领域,尤其涉及文本转语音领域,可应用于智能客服、语音阅读助手、语音内容创作、语音教育培训等领域。具体实现方案为:获取目标文本和参考音频;其中,所述目标文本是待合成语音的文本,所述参考音频为预设音色的音频;对所述目标文本进行特征提取处理,得到所述目标文本的文本特征向量;其中,所述文本特征向量表征文本的语义特征和韵律特征;根据所述文本特征向量和所述参考音频,得到所述目标文本对应的目标音频;其中,所述目标音频的音色与所述参考音频的音色一致。本公开不需要对文本转音素的方法进行维护,通过提取语义特征和韵律特征,提高语音的合成精度。
技术关键词
文本特征向量 音频编码 韵律特征 语义特征 语音编码器 量化器 子模块 特征提取单元 文本编码器 预训练模型 特征提取模块 数据获取单元 处理器 智能客服 计算机程序产品
系统为您推荐了相关专利信息
1
基于多源数据融合的信贷业务风控决策方法、装置、设备和介质
风控决策方法 语义特征 融合置信度 图谱 实体
2
面向图书馆数字资源的用户信息分析系统
书籍 面向图书馆 信息分析系统 感兴趣 特征提取单元
3
一种基于双分支网络结构的裂缝检测方法
路面裂缝图像 裂缝检测方法 网络结构 路面裂缝检测 注意力
4
一种侦察无人机的信号处理方法及系统
中频信号 侦察无人机 信号处理方法 因子 波形特征提取
5
文创产品定制智能化服务系统及方法
智能化服务方法 原型 跨模态 智能化服务系统 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号