一种免唤醒语音交互方法、装置、设备和可读存储介质

正文

推荐专利

申请号：CN202510388905

申请日期：2025-03-28

公开号：CN120260565A

公开日期：2025-07-04

类型：发明专利

摘要

本申请公开了一种免唤醒语音交互方法、装置、设备和可读存储介质，涉及人工智能技术领域。包括：先获取语音音频信息，并对所述语音音频信息进行人声检测，得到人声检测结果；再基于所述人声检测结果，对所述语音音频信息进行人声识别，得到语音音频文本；若所述人声识别的持续时间大于时间阈值，则暂停对所述语音音频信息进行人声检测，暂停时间结束后，重新对所述语音音频信息进行人声检测；若所述人声识别的持续时间小于等于时间阈值，则基于所述语音音频文本，进行免唤醒语音交互。本申请中的方法在保证免唤醒语音交互效率的前提下，大大降低了内存的占用。

技术关键词

人声识别语音交互方法音频文本语义置信度阈值语音交互装置语音交互模块指令处理器可读存储介质人工智能技术计算机程序产品存储器电子设备

系统为您推荐了相关专利信息

基于对抗学习与标签传播的时序知识图谱中实体对齐方法

实体对齐方法图谱标签时序生成对抗网络

一种基于大语言模型的数字媒体作品自动化生成方法

自动化生成方法大语言模型编码器模块网络模块推理方法

一种基于图像的多模态眼动表征方法及系统

眼动数据表征方法眼动特征文本图像

资源信息推荐方法、设备、存储介质及程序产品

资源配置信息画像语义信息推荐模型资源信息推荐方法

基于智能语音识别分析的帕金森病早期诊断系统

智能语音识别早期诊断模型早期诊断系统实时数据语音特征数据

一种免唤醒语音交互方法、装置、设备和可读存储介质

站点导航

APP 下载