一种数字人交互方法、系统、存储介质及程序产品

正文

推荐专利

申请号：CN202511138333

申请日期：2025-08-14

公开号：CN120932644A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种数字人交互方法、系统、存储介质及程序产品，本发明通过对第一语音请求添加目标会话标识，能够关联用户与交互进程，确保了多轮对话上下文连贯，实现了全双工交互。进一步，将语音信号转换为可处理的目标文本并对目标文本中命令任务进行识别并生成第一命令任务文本，能够精准识别用户意图，区分任务类型，提高了语义理解效率。进一步，通过文本断句和语音合成的并行处理，避免了单字输出的机械感，缩短了用户等待时间，提升了交互自然度。进一步，将目标命令任务语音和第二命令任务文本发送至客户端，实现了双模态同步输出，提升了交互自然度，实现了多场景适配，提升了用户体验。

技术关键词

命令文本人交互方法客户端交互系统语音识别模块梅尔频率倒谱系数计算机声学特征语音特征识别用户意图会话韵律预测可读存储介质多轮对话人工智能技术语法结构生成技术

系统为您推荐了相关专利信息

对话语音生成方法、装置、设备及介质

语音生成方法标签特征交互特征文本韵律特征参数

一种防止篡改网站页面内容的方法及系统

页面内容页面特征分支风险动态更新

一种基于大语言模型的通用文本匹配表单的方法及系统

大语言模型表单文本数据字段

一种图像识别方法、装置、设备以及存储介质

频段图像分析图像识别方法分量特征图像识别装置

一种载具自动上料及PCB自动上料及翻转设备

设备机架翻转设备丝杆模组搬运机构流道

一种数字人交互方法、系统、存储介质及程序产品

站点导航

APP 下载