摘要
本申请公开了一种语音交互方法及相关装置、设备、系统和存储介质。该方法包括:基于流式音频进行语音活动检测;响应于检测到语音开始端点,从语音开始端点对流式音频进行语义结束检测,以检测语音开始端点之后的语义结束端点,并从语音开始端点对流式音频继续进行语音活动检测,以检测语音开始端点之后的语音结束端点;基于语音结束端点、语义结束端点中至少一者,确定音频结束端点;基于从语音开始端点至音频结束端点的目标音频,生成用于回应目标音频的目标内容。上述方案,能够提升语音识别和交互的质量。
技术关键词
端点
语音活动检测
语音交互方法
语义
数据处理方式
数据处理设备
数据输出设备
音频采集设备
大语言模型
语音交互装置
语音交互系统
指令
电子设备
程序
处理器
可读存储介质
模块
存储器
系统为您推荐了相关专利信息
计数网络模型
计数方法
融合特征
视觉
多级解码器
语义分割模型
表面缺陷等级
图像拼接算法
评定方法
工业图像处理技术
智能管理方法
精细化结构
视频
视觉特征
场景切换点
分类方法
资源分配信息
可执行程序代码
计算机存储介质
分类装置
数据传递方法
语义向量
关键词
协同系统
多头注意力机制