语音合成方案、装置、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510210087

申请日期：2025-02-25

公开号：CN120126445A

公开日期：2025-06-10

类型：发明专利

摘要

本发明提供一种语音合成方案、装置、电子设备、存储介质及程序产品，涉及语音处理技术领域，包括：将文本内容输入到LLM语义理解模块，得到所述文本内容对应的深层语义特征以及多模态上下文语义信息；将所述深层语义特征传输到神经编解码器，输出压缩后的声学特征；将压缩后的所述声学特征输入到声学建模模块，输出高精度声学特征；将所述高精度声学特征和所述多模态上下文语义信息输入情感音律控制模块，输入带情感和韵律标注的语音参数；将所述带情感和韵律标注的语音参数，以及参考音频输入到音色迁移模块，得到所述参考音频对应音色的合成语音。

技术关键词

声学特征上下文语义信息语义特征语音编解码器多模态控制模块文本音频音色特征非暂态计算机可读存储介质位置编码单元编码特征多尺度窗口参数编解码模块韵律预测

系统为您推荐了相关专利信息

基于自主决策算法的无人带电作业控制系统

路段决策算法带电作业语义注意力编码特征

基于人工智能和大数据的柔性直流互联供电保障系统控制方法及系统

柔性直流互联工况组态语义特征决策

语音合成方法、系统、设备、存储介质以及程序产品

状态空间模型声码器时序依赖关系语音生成对抗网络训练

一种点餐推荐方法、装置、电子设备及存储介质

菜品信息点餐推荐方法对象场景文本

骨传导耳机的语音清晰度提升方法

骨传导换能器信号处理单元耳机本体语音头戴式框架

语音合成方案、装置、电子设备、存储介质及程序产品

站点导航

APP 下载