摘要
本发明公开了一种面向音频的关键语义信息检测方法,属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段,提高了计算效率,并降低了关键词位置对检测效果的影响。
技术关键词
信息检测方法
音频特征
声学特征
语义
分类器
关键词
时间域
检测模型训练
模块
时序
语音识别技术
网络
因子
策略
样本
非线性
标签
矩阵
系统为您推荐了相关专利信息
层次主题模型
生成关键词
生成方法
大数据
关键词生成系统
企业财务信息
智能分析系统
文本理解
信息处理单元
编码向量
图像生成装置
图像生成方法
生成多尺度
自然语言
动态更新
车道线检测方法
滑动窗口
坐标
解码器
车道线检测系统