一种语音重构方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510666593

申请日期：2025-05-22

公开号：CN120726984A

公开日期：2025-09-30

类型：发明专利

摘要

本申请公开了一种语音重构方法、装置、电子设备及存储介质，该方法包括：获取第一时刻对应的第一语音单元的编码特征，并获取与第一语音单元相关的第二语音单元的文本预测结果；基于第二语音单元的文本预测结果，得到第一语音单元的显式语义特征，以及基于第一语音单元的编码特征，得到第一语音单元的隐式语义特征；将显式语义特征和隐式语义特征进行融合，得到第一语音单元的融合语义特征；基于第一语音单元的融合语义特征，合成第一时刻对应的重构音频。通过上述方法，本申请能够提高重构音频的准确性。

技术关键词

融合语义编码特征显式语义特征文本视野重构方法重构模型样本线性单元音频参数电子设备语音识别模块存储程序指令可读存储介质重构装置数值

系统为您推荐了相关专利信息

一种基于领域知识的渐增式模型推荐系统的构建方法

SysML模型推荐系统推荐方法列表 BERT模型

地形图生成方法、装置、设备以及存储介质

生成方法颜色地形特征网络文本编码器

一种智能体情绪生成方法、系统与存储介质

生成方法社交大语言模型序列可读存储介质

一种人物模型的构建方法、装置、设备、介质和程序产品

人物模型三维模型人体姿态估计视频参数

一种基于AI的智能图像处理方法及系统

智能图像处理方法图片多模态信息随机噪声智能图像处理系统

一种语音重构方法、装置、电子设备及存储介质

站点导航

APP 下载