摘要
本申请公开了一种语音重构方法、装置、电子设备及存储介质,该方法包括:获取第一时刻对应的第一语音单元的编码特征,并获取与第一语音单元相关的第二语音单元的文本预测结果;基于第二语音单元的文本预测结果,得到第一语音单元的显式语义特征,以及基于第一语音单元的编码特征,得到第一语音单元的隐式语义特征;将显式语义特征和隐式语义特征进行融合,得到第一语音单元的融合语义特征;基于第一语音单元的融合语义特征,合成第一时刻对应的重构音频。通过上述方法,本申请能够提高重构音频的准确性。
技术关键词
融合语义
编码特征
显式语义特征
文本
视野
重构方法
重构模型
样本
线性单元
音频
参数
电子设备
语音识别模块
存储程序指令
可读存储介质
重构装置
数值
系统为您推荐了相关专利信息
SysML模型
推荐系统
推荐方法
列表
BERT模型
智能图像处理方法
图片
多模态信息
随机噪声
智能图像处理系统