一种分层编解码语音合成方法、装置、设备及介质

AITNT
正文
推荐专利
一种分层编解码语音合成方法、装置、设备及介质
申请号:CN202510675453
申请日期:2025-05-23
公开号:CN120472881A
公开日期:2025-08-12
类型:发明专利
摘要
本发明涉及语音合成技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了分层编解码语音合成方法、装置、设备及介质,对预先获取的原始文本进行语义特征提取,得到文本语义特征;对原始文本进行韵律特征提取,得到文本韵律特征;将文本语义特征与文本韵律特征进行特征融合压缩,得到融合压缩特征;对融合压缩特征进行低频解码,得到低频解码特征;对融合压缩特征进行高频解码,得到高频解码特征;将所述低频解码特征和所述高频解码特征合并,并将合并特征转换为目标合成语音。通过高低频解码,还原出更丰富、更准确的语音细节,使合成语音听起来更加自然流畅,提高了语音的可信度和流畅性。
技术关键词
分层编解码 压缩特征 韵律特征 文本 语义特征提取 语音 分词 双向长短期记忆网络 卷积特征 注意力 解码模块 融合特征 波形 可读存储介质 高频特征 医疗健康 处理器 业务系统
系统为您推荐了相关专利信息
1
基于图结构数据的验证方法、装置、电子设备及存储介质
文本 关键词 实体 智能问答系统 答案
2
一种基于深度学习的生殖健康智能护理决策方法及系统
决策方法 监控视频图像 特征工程 决策系统 风险
3
一种工程质量风险隐患智能评级方法及系统
智能评级方法 风险 数据 文本 分词
4
基于图像-文本大模型的岩石岩性智能识别方法及系统
智能识别方法 文本生成器 岩性智能识别系统 高维特征向量 深度学习超参数
5
基于大语言模型的电力系统数字孪生体交互方法及系统
大语言模型 仿真平台 数字孪生体 基础元件 多智能体系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号