摘要
本发明为一种基于多模态数据融合的智能助手交互方法、装置和系统,所述方法包括如下步骤:1)多模态感知:用户发出指令,系统通过多模态感知采集数据;2)多模态融合:系统将采集到的多模态数据进行语义融合,生成任务语义表示;3)任务生成与执行:系统根据任务类型分解子任务并分配至相关设备或服务;4)交互反馈:系统将执行结果通过语音播报或显示屏反馈给用户;5)学习以及优化:通过交互反馈后的优质结论进行保存和学习,通过学习使其获得的指令执行更加精准。本发明结合多模态使得系统支持语音、视觉和文本的多种输入方式,提升用户交互体验。
技术关键词
多模态数据融合
交互方法
指令
文本
智能设备
检测用户手势
执行设备
交互系统
智能家居场景
语义
任务分配策略
任务调度
语音
视觉
智慧办公
交互装置
接口单元
解析单元
系统为您推荐了相关专利信息
自动语音识别
话题
交互方法
大语言模型
计算机程序产品
网络流量生成方法
时空图卷积神经网络
网络仿真
轨迹
网络拓扑
远程控制系统
机械臂控制系统
视觉控制系统
视觉控制器
远程联动控制系统
情感识别模型
DS理论
马尔可夫模型
识别方法
数据