一种基于多模态意图理解的对话Agent交互方法

正文

推荐专利

申请号：CN202510775784

申请日期：2025-06-11

公开号：CN120850193A

公开日期：2025-10-28

类型：发明专利

摘要

本发明涉及人机交互技术领域，具体涉及一种基于多模态意图理解的对话Agent交互方法，包括以下步骤：S1：实时采集用户交互过程中的多模态数据，计算各模态数据源的时间同步偏差值；S2：构建时空融合特征向量；S3：解析时空融合特征向量中的显性动作指令与隐性行为线索；S4：生成多层级意图解析树；S5：当意图解析树中任一节点的修正后置信度低于设定阈值时，激活针对性传感器补充采集数据；S6：根据最终确认的意图解析树驱动响应决策。本发明，通过构建具备时空一致性融合能力、显隐性意图解析机制及自适应模态澄清策略的多模态交互方法，实现了对话Agent在复杂场景下对用户意图的高精度识别与响应控制。

技术关键词

交互方法多模态语义标签三元组视频帧语音传感器意图识别数据时间同步波形文本输入设备麦克风阵列采集注意力节点特征分类神经网络图谱

系统为您推荐了相关专利信息

一种基于人工智能的企业碳足迹高效追踪和计量的系统

低功耗广域网技术物联网设备数据采集模块分布式数据库减排策略

基于知识图谱嵌入、GNN和Bi-LSTM的抗癌药物协同预测方法

协同预测方法细胞系实体构建知识图谱邻域

一种基于多模态大模型的可视化大屏开发的方法及系统

统一接口网关可视化大屏多模态布局优化算法支撑模块

一种基于人工智能的建筑材料强度检测方法及系统

强度检测方法卷积长短期记忆模型建模技术生成建筑材料回归分析方法

一种合成革尾气多模态相变冷凝回收VOCs集成工艺与系统

冷凝多模态混合气尾气气相

一种基于多模态意图理解的对话Agent交互方法

站点导航

APP 下载