摘要
本发明提供了一种多模态操作指令的语义表示方法及系统,涉及语义表示技术领域,包括:根据多模态指令数据的特性得到不同模态的指令特征;根据用户意图的抽象描述确定语义标签;根据不同模态的指令特征与语义标签输入至WSABIE模型进行训练,以确定不同模态的指令特征与语义标签的最优映射关系;基于最优映射关系,对不同模态的指令特征与语义标签的相关性进行量化评估,以在语义层面精确解析多模态指令数据,得到多模态指令数据的语义表示。本发明通过多模态特征提取、语义标签生成、基于WSABIE模型的语义映射以及相关性量化评估,成功实现了多模态指令的语义对齐和精确解析,具有高精度、高适应性、高效率的优点。
技术关键词
语义标签
多模态
指令
语义层面
数据
注意力机制
图像特征提取
语义场景
滤波
手势
纹理特征提取
信号处理算法
意图
表达式
触摸面积
窗口检测
关系
姿态特征
系统为您推荐了相关专利信息
塔设备
多元线性回归模型
训练样本数据
负荷预测模型
数据存储单元
磁盘阵列控制器
配置管理工具
主机设备
RAID控制器
配置推荐信息
导航可视化方法
现实世界图像
表面配准方法
结构光扫描仪
导航设备
集装箱表面
破损检测方法
多模态数据融合
破损检测装置
多模态数据采集