一种低延迟语音合成方法、装置、设备和介质

正文

推荐专利

申请号：CN202510214278

申请日期：2025-02-26

公开号：CN120164454B

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种低延迟语音合成方法、装置、介质和设备，属于语音处理技术领域，所述方法包括：S10：对输入文本进行规范化处理，得到规范化文本；S20：对所述规范化文本进行分词处理、词性标注处理和韵律信息分析，得到语言结构化文本；S30：利用深度学习算法对所述语言结构化文本进行特征提取，得到文本特征向量；S40：使用基于变换器的非自回归的语音合成模型，将所述文本特征向量转换为语音信号。本发明降低了语音合成的延迟时间，提高了语音的自然度和表现力。

技术关键词

文本特征向量并行解码方法生成语音信号深度学习算法长度调节器低延迟序列编码器分词变换器语义特征解码器子模块数据语法结构长短期记忆模型

系统为您推荐了相关专利信息

一种招投标文件信息抽取方法

标签体系大语言模型信息抽取方法页面层级

一种基于大数据的大模型测试用例智能生成系统

智能生成系统跨模态参数代码特征多源异构数据

一种基于数字孪生的数字工地劳务人员状态识别方法

状态识别方法中央处理系统热成像传感器高清摄像头智能可穿戴设备

一种医药古籍知识图谱构建方法及系统

大语言模型三元组知识图谱构建方法多模态构建知识图谱

抗湍流的远距离拾音方法、装置及其可读存储介质

数字微镜器件波前传感器相干接收机远距离拾音方法变形镜

一种低延迟语音合成方法、装置、设备和介质

站点导航

APP 下载