自适应噪声抑制的多语言长录音转写方法、系统以及设备

正文

推荐专利

申请号：CN202411452249

申请日期：2024-10-17

公开号：CN119007740B

公开日期：2025-01-10

类型：发明专利

摘要

本发明提供了一种自适应噪声抑制的多语言长录音转写方法、系统以及设备，包括：对多语言长录音进行音频分割，得到多个音频片段；对每个音频片段进行频谱分析，得到对应的频谱特征；根据频谱特征对各个音频片段进行噪声检测，确定噪声片段；对所述多语言长录音中的各个噪声片段进行自适应噪声抑制，得到去噪后的多语言音频；对去噪后的多语言音频进行语音活动检测，确定语音片段和非语音片段；对语音片段进行特征提取，得到语音特征；将语音特征输入预先训练的多语言转写模型进行转写，得到对应的文本结果。在本发明中，通过对所述多语言长录音中的各个噪声片段进行自适应噪声抑制，有效降低噪声的干扰，提升语音质量。

技术关键词

翻译终端噪声抑制转写方法音频语音特征多语言频谱特征二叉树结构语音活动检测字符标识语法特征噪声特征提取依序训练滤波器语义特征深度特征提取

系统为您推荐了相关专利信息

一种多功能地震避险装置和便携式避险音响

地震避险装置 MEMS加速度计信号接收模块壳体音响

一种模型训练、音频处理方法、设备、介质及程序产品

音乐特征预训练模型辅助分类器特征提取模块计算机可执行指令

倒谱和深度学习的骨导语音增强方法、装置、介质及设备

语音低延迟音频编解码技术深度学习模型离散余弦

手语播报视频生成方法、系统及存储介质

视频生成方法情感类别手语多模态情感识别非语音

视频生成方法、装置、电子设备和存储介质

语音特征视频生成方法对象文本视频生成装置

自适应噪声抑制的多语言长录音转写方法、系统以及设备

站点导航

APP 下载