一种语言增强方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
一种语言增强方法、装置、计算机设备及存储介质
申请号:CN202511269903
申请日期:2025-09-05
公开号:CN121034328A
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及语音处理技术领域,可应用于金融及医疗领域,公开了一种语言增强方法、装置、计算机设备及存储介质,方法包括:获取带噪声的输入语音信号;通过预训练的生成式音频编码器将带噪声的输入语音信号转换为噪声嵌入数据;通过去噪编码器对噪声嵌入数据进行去噪处理,得到干净嵌入数据;通过预训练的声码器将干净嵌入数据转换为增强后的目标语音信号。本发明有效提升增强后语音的自然度与说话人一致性,降低了对复杂噪声分布的建模难度,减少语音失真,同时大幅降低了模型参数量与训练复杂度,提升了推理速度,使其能在低资源环境下实现实时应用。
技术关键词
音频编码器 噪声语音 数据 语音特征 解码网络 计算机设备 信号时域波形 多层卷积网络 音频特征提取 转换单元 处理器 恢复算法 声谱 噪声特征 声码器
系统为您推荐了相关专利信息
1
一种基于AI的管道泄漏智能预警方法及系统
泄漏智能 预警模型 预警方法 LSTM算法 节点
2
贷款风险信息的自动预测方法、装置、电子设备、存储介质及程序产品
风险预测模型 自动预测方法 数据 计算机执行指令 消除方法
3
共享方法、电子设备及存储介质
屏幕共享 界面 共享方法 隐私保护功能 显示应用程序
4
基于数据分析的隧道稳定性风险评估方法及系统
隧道内部结构 仿真模型 风险评估方法 因子 隧道结构
5
基于双任务和双重注意力的舰船提取方法及系统
舰船提取方法 注意力 残差模块 遥感影像特征 遥感影像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号