摘要
本发明涉及智能决策技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种基于多模态融合的意图识别方法、装置、设备及介质,包括:提取操作界面的界面文本与界面图像;提取界面文本的文本语义特征向量,提取界面图像的设计模式结构特征及点云结构特征;利用空间注意力矩阵将设计模式结构特征与点云结构特征融合,得到结构融合特征向量;将结构融合特征向量与文本语义特征向量进行融合,得到多模态融合特征;对分类模型进行训练,输出用户意图识别模型,并利用用户意图识别模型对多模态融合特征进行意图分析,得到意图类型;根据意图类型及预先获取的操作消息确定目标用户的操作意图。提升用户真实意图识别时的准确性。
技术关键词
意图识别方法
意图识别模型
多模态
融合特征
焦点损失函数
文本特征向量
协同注意力
操作界面
语义
矩阵
消息特征
图像
加权特征
智能决策技术
意图识别装置
结构特征提取
系统为您推荐了相关专利信息
数据挖掘方法
多模态
数据挖掘设备
数据挖掘装置
场景
企业数据安全
序列
节点状态信息
GCN模型
图谱
动态量化方法
命名实体识别模型
复杂度
样本
语义注意力
故障诊断方法
旋转机械
特征提取模块
分支
故障诊断模型
焊接路径规划方法
激光测距模块
多模态特征融合
深度学习模型
三维坐标信息