语音活动检测模型训练方法、语音活动检测方法及相关装置

AITNT
正文
推荐专利
语音活动检测模型训练方法、语音活动检测方法及相关装置
申请号:CN202510417647
申请日期:2025-04-03
公开号:CN120199284A
公开日期:2025-06-24
类型:发明专利
摘要
本申请公开了一种语音活动检测模型训练方法、语音活动检测方法及相关装置,涉及音频处理技术领域,训练方法包括:利用标注有帧级音频类别的第一训练音频,训练得到具有语义完整性判别功能的第一语音活动检测模型,第一训练音频的一音频帧的音频类别为语音、语义不完整处的非语音、语义完整语音后的非语音中的一种;利用标注有帧级音频类别的第二训练音频,辅以第一语音活动检测模型,训练得到能够捕获语音中语义信息的第二语音活动检测模型,第二训练音频的一音频帧的音频类别为语音、非语音中的一种。经由本申请公开的训练方法训练得到的语音活动检测模型能捕获音频的语义信息,进而能够参考语义信息针对音频的每个音频帧给出合理的类别。
技术关键词
模型训练方法 语音活动检测方法 音频编码 语义 判别功能 文本 音频特征 非语音 模型训练装置 计算机可读指令 电子设备 计算机存储介质 模块 存储计算机程序 计算机程序产品 处理器 参数
系统为您推荐了相关专利信息
1
基于大模型的SQL语句审查方法、系统、设备及存储介质
解析工具 语句 图谱 对象 抽象语法树
2
停车场景下的车辆轨迹预测方法、装置和可读存储介质
行驶车辆 停车位 轨迹预测模型 注意力机制 车辆轨迹预测方法
3
一种基于BERT语言模型的网页资产企业归属识别方法
归属识别方法 文本 注意力机制 预训练模型 Softmax函数
4
基于多模态预训练大模型的输电线路运维算法、装置及计算机可读存储介质
多模态 图像处理模型 文本 输电线路运维装置 可读存储介质
5
一种刚体目标关键部位识别定位方法
识别定位方法 语义分割算法 像素 滑动窗口 图像匹配
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号