语音增强方法、训练方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202511272403

申请日期：2025-09-05

公开号：CN121034331A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融及医疗领域，公开了语音增强方法、训练方法、装置、计算机设备及存储介质，语音增强方法包括：接收嘈杂语音输入，通过预训练的分解编解码器对嘈杂语音进行编码处理，得到隐藏表示；利用预训练的语义扩散模型对隐藏表示进行逐步去噪处理，得到清晰语音对应的语义令牌序列；将语义令牌序列与嘈杂语音的隐藏表示结合作为条件，通过预训练的声学扩散模型进行逐步去噪处理，得到清晰语音对应的声学令牌序列；将语义令牌序列和声学令牌序列输入分解编解码器的解码器，重建生成清晰语音信号。本发明显著提升了复杂噪声环境下语音增强的鲁棒性，降低了噪声对语音关键属性的干扰。

技术关键词

令牌语义编解码器序列生成语音计算机设备语音特征处理器信号训练装置跨模态数据可读存储介质存储器鲁棒性噪声编码器

系统为您推荐了相关专利信息

一种基于胶囊网络的科学数据资产多标签文本分类方法

胶囊网络模型主题融合策略解码器资产

一种重要性-多样性耦合的多模态大模型微调数据高效选择方法

数据融合特征评分特征嵌入特征权重模型

基于多层次自适应语义增强的中文医疗命名实体识别方法和装置

医疗命名实体识别方法字符多层次多层感知机语义特征

考虑气象预报和装机容量发展的新能源长时间功率序列生成方法、系统、设备及介质

序列生成方法模糊C均值聚类方法气象预报数据 Mallat算法新能源功率预测

一种基于预测客流进行列车运行调整的方法

列车车站策略搜索方法神经网络预测模型时间段

语音增强方法、训练方法、装置、计算机设备及存储介质

站点导航

APP 下载