摘要
本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:检测流式语音在当前时刻是否语义完整;响应于检测结果为语义不完整,基于基础时延加上额外时延,得到目标时延,并从当前时刻开始直至等待目标时延的过程中,分析流式语音中是否新增有效语音,若是则返回检测流式语音在当前时刻是否语义完整,若否则生成回复数据;响应于检测结果为语义完整,从当前时刻开始直至等待基础时延的过程中,分析流式语音中是否新增有效语音,若是则返回检测流式语音在当前时刻是否语义完整,若否则生成回复数据。上述方案,能够在缩短语音交互的响应时间前提下,降低发言对象被非预期打断的可能性。
技术关键词
时延
语音交互方法
语义
人工智能模型
语音活动检测
深度学习模型
基础
对象
语音交互装置
数据
大语言模型
消息
子模块
程序
处理器
指令
关系
端点
系统为您推荐了相关专利信息
语义分割方法
语义分割网络
标签
注意力
计算机存储介质