一种自定义关键词检测方法及系统

AITNT
正文
推荐专利
一种自定义关键词检测方法及系统
申请号:CN202510998311
申请日期:2025-07-21
公开号:CN120510838B
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供了一种自定义关键词检测方法及系统,包括:获取原始音频数据和关键词文本;所述原始音频数据为多人混叠语音数据;分别对所述原始音频数据和所述关键词文本进行特征提取,得到语音特征和关键词文本特征;将所述语音特征和所述关键词文本特征作为同一向量空间的模型嵌入,通过融合自动语音识别ASR技术与关键词检测KWS技术的交叉注意力机制,在所述原始音频数据识别所述关键词文本和/或定位所述关键词文本位置。通过本发明,提出一种基于交叉注意力机制的快速自定义关键词检测方案,基于音素级位置预测与动态掩码生成,实现从混叠语音中提取目标语音片段并精准检测关键词的技术突破,显著提升了复杂场景下的检测鲁棒性。
技术关键词
交叉注意力机制 语音特征 文本 自定义关键词 自动语音识别 预测建模 符号 表达式 数学 特征提取模块 掩码矩阵 序列 数据获取模块 音频特征 时序
系统为您推荐了相关专利信息
1
一种视频异常检测系统、方法、计算机设备及存储介质
音频特征 多模态特征 异常检测系统 融合特征 文本
2
一种电能计量箱图像缺陷识别方法
图像缺陷识别方法 电能计量箱 对齐模块 文本 异构
3
基于视觉语言提示学习的工业材料表面形貌测量分析方法
工业材料表面 形貌特征 梯度下降算法 融合特征 多模态信息融合
4
一种基于知识增强神经网络模型的药品不良事件检测方法及系统
事件检测方法 实体 关键词 预训练语言模型 神经网络模型
5
基于知识蒸馏的多模态风格迁移方法、系统及设备
风格迁移方法 分支 学生 教师 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号