摘要
本发明涉及人工智能技术领域,公开了一种数字人交互方法、系统、存储介质及程序产品,本发明通过对第一语音请求添加目标会话标识,能够关联用户与交互进程,确保了多轮对话上下文连贯,实现了全双工交互。进一步,将语音信号转换为可处理的目标文本并对目标文本中命令任务进行识别并生成第一命令任务文本,能够精准识别用户意图,区分任务类型,提高了语义理解效率。进一步,通过文本断句和语音合成的并行处理,避免了单字输出的机械感,缩短了用户等待时间,提升了交互自然度。进一步,将目标命令任务语音和第二命令任务文本发送至客户端,实现了双模态同步输出,提升了交互自然度,实现了多场景适配,提升了用户体验。
技术关键词
命令
文本
人交互方法
客户端
交互系统
语音识别模块
梅尔频率倒谱系数
计算机
声学特征
语音特征
识别用户意图
会话
韵律预测
可读存储介质
多轮对话
人工智能技术
语法结构
生成技术
系统为您推荐了相关专利信息
语音生成方法
标签特征
交互特征
文本
韵律特征参数
频段
图像分析
图像识别方法
分量特征
图像识别装置