摘要
本申请公开了一种免唤醒语音交互方法、装置、设备和可读存储介质,涉及人工智能技术领域。包括:获取语音交互音频,并对所述语音交互音频进行人声识别,得到语音识别文本;对所述语音识别文本进行语义识别,得到所述语音识别文本的语义信息和语义槽位;基于所述语音识别文本和语义信息进行云端置信度计算,并基于所述语义槽位进行云端相似度计算,得到第一置信度、第二置信度和槽位相似度;若从所述语音识别文本中检测到唤醒半词,且所述第一置信度、第二置信度和槽位相似度均大于预设阈值,则基于所述语义信息和语义槽位进行免唤醒语音交互。上述方案实现了在保证端到端达成率的情况下,降低系统误警值。
技术关键词
语音识别文本
语音交互方法
语义
人声识别
置信度阈值
云端
音频
多轮语音交互
语音交互装置
语音交互模块
处理器
可读存储介质
人工智能技术
计算机程序产品
识别模块
存储器
系统为您推荐了相关专利信息
智能生成方法
医院HIS系统
异构
构建知识图谱
医院药品
多任务
分析方法
预训练语言模型
语义特征
标签类别