自适应噪声抑制的多语言长录音转写方法、系统以及设备

AITNT
正文
推荐专利
自适应噪声抑制的多语言长录音转写方法、系统以及设备
申请号:CN202411452249
申请日期:2024-10-17
公开号:CN119007740B
公开日期:2025-01-10
类型:发明专利
摘要
本发明提供了一种自适应噪声抑制的多语言长录音转写方法、系统以及设备,包括:对多语言长录音进行音频分割,得到多个音频片段;对每个音频片段进行频谱分析,得到对应的频谱特征;根据频谱特征对各个音频片段进行噪声检测,确定噪声片段;对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,得到去噪后的多语言音频;对去噪后的多语言音频进行语音活动检测,确定语音片段和非语音片段;对语音片段进行特征提取,得到语音特征;将语音特征输入预先训练的多语言转写模型进行转写,得到对应的文本结果。在本发明中,通过对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,有效降低噪声的干扰,提升语音质量。
技术关键词
翻译终端 噪声抑制 转写方法 音频 语音特征 多语言 频谱特征 二叉树结构 语音活动检测 字符 标识 语法特征 噪声特征提取 依序 训练滤波器 语义特征 深度特征提取
系统为您推荐了相关专利信息
1
一种多功能地震避险装置和便携式避险音响
地震避险装置 MEMS加速度计 信号接收模块 壳体 音响
2
一种模型训练、音频处理方法、设备、介质及程序产品
音乐特征 预训练模型 辅助分类器 特征提取模块 计算机可执行指令
3
倒谱和深度学习的骨导语音增强方法、装置、介质及设备
语音 低延迟 音频编解码技术 深度学习模型 离散余弦
4
手语播报视频生成方法、系统及存储介质
视频生成方法 情感类别 手语 多模态情感识别 非语音
5
视频生成方法、装置、电子设备和存储介质
语音特征 视频生成方法 对象 文本 视频生成装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号