摘要
本发明提供了一种自适应噪声抑制的多语言长录音转写方法、系统以及设备,包括:对多语言长录音进行音频分割,得到多个音频片段;对每个音频片段进行频谱分析,得到对应的频谱特征;根据频谱特征对各个音频片段进行噪声检测,确定噪声片段;对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,得到去噪后的多语言音频;对去噪后的多语言音频进行语音活动检测,确定语音片段和非语音片段;对语音片段进行特征提取,得到语音特征;将语音特征输入预先训练的多语言转写模型进行转写,得到对应的文本结果。在本发明中,通过对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,有效降低噪声的干扰,提升语音质量。
技术关键词
翻译终端
噪声抑制
转写方法
音频
语音特征
多语言
频谱特征
二叉树结构
语音活动检测
字符
标识
语法特征
噪声特征提取
依序
训练滤波器
语义特征
深度特征提取
系统为您推荐了相关专利信息
地震避险装置
MEMS加速度计
信号接收模块
壳体
音响
音乐特征
预训练模型
辅助分类器
特征提取模块
计算机可执行指令
语音
低延迟
音频编解码技术
深度学习模型
离散余弦
视频生成方法
情感类别
手语
多模态情感识别
非语音