摘要
本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:对流式语音进行端点检测,并响应于检测到流式语音的起始端点,对流式语音执行滑窗操作,得到语音帧,基于语音帧进行特征提取,得到语音帧的语音特征;输入语音帧的语音特征至用于识别流式语音的语音识别系统,得到语音帧的识别结果,基于语音帧的编码特征进行分类预测,得到语音帧的分类结果;响应于分类结果表征语义结束,基于从起始端点至结束端点各个语音帧的识别结果,得到识别文本,至少基于识别文本由智能对话模型进行处理,生成得到回复文本;响应于分类结果表征语义未结束,继续返回执行滑窗操作。上述方案,能够提升流式语音交互的适时性。
技术关键词
智能对话模型
文本
语音交互方法
端点
语音特征
语音识别系统
编码特征
语义
语音交互方式
语音交互装置
指令
意图识别
程序
处理器
可读存储介质
模块
存储器
系统为您推荐了相关专利信息
机械故障诊断方法
故障诊断信息
旋转设备
信号编码器
大语言模型
多模态数据融合
数据挖掘系统
模态特征
数据挖掘方法
跨模态
知识库构建方法
大语言模型
文本
知识库检索方法
列表
档案管理系统
协同过滤算法
档案室
编码
局部敏感哈希索引