摘要
本发明公开的多源异构数据语义对齐方法、装置、设备及介质,通过获取多源异构数据,并对所述多源异构数据进行预处理获得标准化数据单元集合;根据所述标准化数据单元集合结合对比学习构建样本对,对所述样本对间的距离进行训练优化,识别单元语义特征中的数据一致性,输出一致性标签;对所述标准化数据单元集合的每个单元进行无监督特征提取,获得单元潜在语义特征;基于所述一致性标签和所述单元潜在语义特征对所述多源异构数据进行语义对齐,构建语义空间。本申请方案能够实现多源异构数据的语义标准化对齐,确保设备多源异构数据在知识图谱中准确映射与融合。
技术关键词
多源异构数据
异构数据语义
语义特征
对齐方法
无监督特征提取
样本
非结构化文本
可读存储介质
节点
实体
神经网络参数
词向量模型
深度神经网络
降维算法
标签模块
对齐装置
图谱
系统为您推荐了相关专利信息
多模态数据采集
辅助决策系统
可视化交互平台
多源异构数据
文本
语义特征
多层感知器网络
车载相机参数
图像
射线
电力系统
实时监测数据
调控方法
多源异构数据
电力运行数据