语音活动检测模型训练方法、语音活动检测方法及相关装置

正文

推荐专利

申请号：CN202510417647

申请日期：2025-04-03

公开号：CN120199284A

公开日期：2025-06-24

类型：发明专利

摘要

本申请公开了一种语音活动检测模型训练方法、语音活动检测方法及相关装置，涉及音频处理技术领域，训练方法包括：利用标注有帧级音频类别的第一训练音频，训练得到具有语义完整性判别功能的第一语音活动检测模型，第一训练音频的一音频帧的音频类别为语音、语义不完整处的非语音、语义完整语音后的非语音中的一种；利用标注有帧级音频类别的第二训练音频，辅以第一语音活动检测模型，训练得到能够捕获语音中语义信息的第二语音活动检测模型，第二训练音频的一音频帧的音频类别为语音、非语音中的一种。经由本申请公开的训练方法训练得到的语音活动检测模型能捕获音频的语义信息，进而能够参考语义信息针对音频的每个音频帧给出合理的类别。

技术关键词

模型训练方法语音活动检测方法音频编码语义判别功能文本音频特征非语音模型训练装置计算机可读指令电子设备计算机存储介质模块存储计算机程序计算机程序产品处理器参数

系统为您推荐了相关专利信息

基于大模型的SQL语句审查方法、系统、设备及存储介质

解析工具语句图谱对象抽象语法树

停车场景下的车辆轨迹预测方法、装置和可读存储介质

行驶车辆停车位轨迹预测模型注意力机制车辆轨迹预测方法

一种基于BERT语言模型的网页资产企业归属识别方法

归属识别方法文本注意力机制预训练模型 Softmax函数

基于多模态预训练大模型的输电线路运维算法、装置及计算机可读存储介质

多模态图像处理模型文本输电线路运维装置可读存储介质

一种刚体目标关键部位识别定位方法

识别定位方法语义分割算法像素滑动窗口图像匹配

语音活动检测模型训练方法、语音活动检测方法及相关装置

站点导航

APP 下载