摘要
本发明涉及人机交互技术领域,具体涉及一种基于多模态意图理解的对话Agent交互方法,包括以下步骤:S1:实时采集用户交互过程中的多模态数据,计算各模态数据源的时间同步偏差值;S2:构建时空融合特征向量;S3:解析时空融合特征向量中的显性动作指令与隐性行为线索;S4:生成多层级意图解析树;S5:当意图解析树中任一节点的修正后置信度低于设定阈值时,激活针对性传感器补充采集数据;S6:根据最终确认的意图解析树驱动响应决策。本发明,通过构建具备时空一致性融合能力、显隐性意图解析机制及自适应模态澄清策略的多模态交互方法,实现了对话Agent在复杂场景下对用户意图的高精度识别与响应控制。
技术关键词
交互方法
多模态
语义标签
三元组
视频帧
语音
传感器
意图识别
数据
时间同步
波形
文本输入设备
麦克风阵列采集
注意力
节点特征
分类神经网络
图谱
系统为您推荐了相关专利信息
低功耗广域网技术
物联网设备
数据采集模块
分布式数据库
减排策略
统一接口网关
可视化大屏
多模态
布局优化算法
支撑模块
强度检测方法
卷积长短期记忆
模型建模技术
生成建筑材料
回归分析方法