摘要
本申请公开了一种免唤醒语音交互方法、装置、设备和可读存储介质,涉及人工智能技术领域。包括:先获取语音音频信息,并对所述语音音频信息进行人声检测,得到人声检测结果;再基于所述人声检测结果,对所述语音音频信息进行人声识别,得到语音音频文本;若所述人声识别的持续时间大于时间阈值,则暂停对所述语音音频信息进行人声检测,暂停时间结束后,重新对所述语音音频信息进行人声检测;若所述人声识别的持续时间小于等于时间阈值,则基于所述语音音频文本,进行免唤醒语音交互。本申请中的方法在保证免唤醒语音交互效率的前提下,大大降低了内存的占用。
技术关键词
人声识别
语音交互方法
音频
文本
语义
置信度阈值
语音交互装置
语音交互模块
指令
处理器
可读存储介质
人工智能技术
计算机程序产品
存储器
电子设备
系统为您推荐了相关专利信息
自动化生成方法
大语言模型
编码器模块
网络模块
推理方法
资源配置信息
画像
语义
信息推荐模型
资源信息推荐方法
智能语音识别
早期诊断模型
早期诊断系统
实时数据
语音特征数据