一种语言增强方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202511269903

申请日期：2025-09-05

公开号：CN121034328A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融及医疗领域，公开了一种语言增强方法、装置、计算机设备及存储介质，方法包括：获取带噪声的输入语音信号；通过预训练的生成式音频编码器将带噪声的输入语音信号转换为噪声嵌入数据；通过去噪编码器对噪声嵌入数据进行去噪处理，得到干净嵌入数据；通过预训练的声码器将干净嵌入数据转换为增强后的目标语音信号。本发明有效提升增强后语音的自然度与说话人一致性，降低了对复杂噪声分布的建模难度，减少语音失真，同时大幅降低了模型参数量与训练复杂度，提升了推理速度，使其能在低资源环境下实现实时应用。

技术关键词

音频编码器噪声语音数据语音特征解码网络计算机设备信号时域波形多层卷积网络音频特征提取转换单元处理器恢复算法声谱噪声特征声码器

系统为您推荐了相关专利信息

一种基于AI的管道泄漏智能预警方法及系统

泄漏智能预警模型预警方法 LSTM算法节点

贷款风险信息的自动预测方法、装置、电子设备、存储介质及程序产品

风险预测模型自动预测方法数据计算机执行指令消除方法

共享方法、电子设备及存储介质

屏幕共享界面共享方法隐私保护功能显示应用程序

基于数据分析的隧道稳定性风险评估方法及系统

隧道内部结构仿真模型风险评估方法因子隧道结构

基于双任务和双重注意力的舰船提取方法及系统

舰船提取方法注意力残差模块遥感影像特征遥感影像数据

一种语言增强方法、装置、计算机设备及存储介质

站点导航

APP 下载