摘要
本申请公开了一种多模态知识图谱表示方法及装置,属于计算机视觉表示领域。首先,获取目标实体的多模态嵌入,包括视觉模态、文本模态和结构模态,并计算由多模态嵌入形成的Gram矩阵。计算Gram矩阵的行列式,并最小化由Gram矩阵表示的几何体积,以协调不同模态之间的语义对齐,优化多模态表示。通过GraCon对比学习框架引入体积最小化约束,进一步优化多模态嵌入的几何体积,确保不同模态之间的语义一致性。引入实体锚定匹配损失,利用结构模态对齐每个实体,从而显著增强实体表示的准确性和一致性。使用Transformer编码器进行知识图谱补全任务的推理与预测。能够提升多模态表示质量,优化实体表示,提升了知识图谱补全的精度和鲁棒性。
技术关键词
多模态
实体
知识图谱补全
矩阵
文本
三元组
语义
编码器
数据
框架
解码器执行
可读存储介质
计算机视觉
学习方法
模块
代表
定义
关系
系统为您推荐了相关专利信息
深度强化学习模型
风电机组功率
历史监测数据
计算机程序产品
切换运行模式
能力评估方法
长短期记忆网络
多模态
多层感知机
员工
风险评估方法
血流
多模态融合机制
医学特征
时序分析方法
配电网无功优化
风光
进化算法
蚁群算法
无功补偿装置容量