一种面向音频的关键语义信息检测方法

正文

推荐专利

一种面向音频的关键语义信息检测方法

申请号：CN202411874082

申请日期：2024-12-19

公开号：CN119360836A

公开日期：2025-01-24

类型：发明专利

摘要

本发明公开了一种面向音频的关键语义信息检测方法，属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征，各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧，将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时，使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段，提高了计算效率，并降低了关键词位置对检测效果的影响。

技术关键词

信息检测方法音频特征声学特征语义分类器关键词时间域检测模型训练模块时序语音识别技术网络因子策略样本非线性标签矩阵

系统为您推荐了相关专利信息

一种基于大数据的关键词生成方法及系统

层次主题模型生成关键词生成方法大数据关键词生成系统

模糊测试自动化漏洞定位方法

分支测试器分析器分析模块数据

基于大数据的企业财务信息智能分析系统及方法

企业财务信息智能分析系统文本理解信息处理单元编码向量

一种基于深度学习的图像生成方法及装置

图像生成装置图像生成方法生成多尺度自然语言动态更新

一种基于全局上下文感知与几何约束的车道线检测方法及系统

车道线检测方法滑动窗口坐标解码器车道线检测系统

一种面向音频的关键语义信息检测方法

站点导航

APP 下载