一种面向音频的关键语义信息检测方法

AITNT
正文
推荐专利
一种面向音频的关键语义信息检测方法
申请号:CN202411874082
申请日期:2024-12-19
公开号:CN119360836A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种面向音频的关键语义信息检测方法,属于语音识别技术领域。本发明基于的关键语义信息检测模型包括识别网络和多个与预定义的关键词一一对应的分类器。所述识别网络用于输出待检测音频中每一帧各自对应的音频特征,各音频特征同时输入至所有的分类器中。所述分类器用于判断输入的音频特征包含该分类器对应的关键词的概率。对于任一帧,将所有分类器输出的概率组合成与该帧相对应的概率集合。对所述关键语义信息检测模型训练时,使用精细化池化损失策略作为训练目标。本发明通过采用精细化池化损失和关键词时序检测模块等手段,提高了计算效率,并降低了关键词位置对检测效果的影响。
技术关键词
信息检测方法 音频特征 声学特征 语义 分类器 关键词 时间域 检测模型训练 模块 时序 语音识别技术 网络 因子 策略 样本 非线性 标签 矩阵
系统为您推荐了相关专利信息
1
一种基于大数据的关键词生成方法及系统
层次主题模型 生成关键词 生成方法 大数据 关键词生成系统
2
模糊测试自动化漏洞定位方法
分支 测试器 分析器 分析模块 数据
3
基于大数据的企业财务信息智能分析系统及方法
企业财务信息 智能分析系统 文本理解 信息处理单元 编码向量
4
一种基于深度学习的图像生成方法及装置
图像生成装置 图像生成方法 生成多尺度 自然语言 动态更新
5
一种基于全局上下文感知与几何约束的车道线检测方法及系统
车道线检测方法 滑动窗口 坐标 解码器 车道线检测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号