一种免唤醒语音交互方法、装置、设备和可读存储介质

AITNT
正文
推荐专利
一种免唤醒语音交互方法、装置、设备和可读存储介质
申请号:CN202510388905
申请日期:2025-03-28
公开号:CN120260565A
公开日期:2025-07-04
类型:发明专利
摘要
本申请公开了一种免唤醒语音交互方法、装置、设备和可读存储介质,涉及人工智能技术领域。包括:先获取语音音频信息,并对所述语音音频信息进行人声检测,得到人声检测结果;再基于所述人声检测结果,对所述语音音频信息进行人声识别,得到语音音频文本;若所述人声识别的持续时间大于时间阈值,则暂停对所述语音音频信息进行人声检测,暂停时间结束后,重新对所述语音音频信息进行人声检测;若所述人声识别的持续时间小于等于时间阈值,则基于所述语音音频文本,进行免唤醒语音交互。本申请中的方法在保证免唤醒语音交互效率的前提下,大大降低了内存的占用。
技术关键词
人声识别 语音交互方法 音频 文本 语义 置信度阈值 语音交互装置 语音交互模块 指令 处理器 可读存储介质 人工智能技术 计算机程序产品 存储器 电子设备
系统为您推荐了相关专利信息
1
基于对抗学习与标签传播的时序知识图谱中实体对齐方法
实体对齐方法 图谱 标签 时序 生成对抗网络
2
一种基于大语言模型的数字媒体作品自动化生成方法
自动化生成方法 大语言模型 编码器模块 网络模块 推理方法
3
一种基于图像的多模态眼动表征方法及系统
眼动数据 表征方法 眼动特征 文本 图像
4
资源信息推荐方法、设备、存储介质及程序产品
资源配置信息 画像 语义 信息推荐模型 资源信息推荐方法
5
基于智能语音识别分析的帕金森病早期诊断系统
智能语音识别 早期诊断模型 早期诊断系统 实时数据 语音特征数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号