一种多源异构数据语义对齐方法、装置、设备及介质

正文

推荐专利

申请号：CN202511484948

申请日期：2025-10-17

公开号：CN120952012A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开的多源异构数据语义对齐方法、装置、设备及介质，通过获取多源异构数据，并对所述多源异构数据进行预处理获得标准化数据单元集合；根据所述标准化数据单元集合结合对比学习构建样本对，对所述样本对间的距离进行训练优化，识别单元语义特征中的数据一致性，输出一致性标签；对所述标准化数据单元集合的每个单元进行无监督特征提取，获得单元潜在语义特征；基于所述一致性标签和所述单元潜在语义特征对所述多源异构数据进行语义对齐，构建语义空间。本申请方案能够实现多源异构数据的语义标准化对齐，确保设备多源异构数据在知识图谱中准确映射与融合。

技术关键词

多源异构数据异构数据语义语义特征对齐方法无监督特征提取样本非结构化文本可读存储介质节点实体神经网络参数词向量模型深度神经网络降维算法标签模块对齐装置图谱

一种多源异构数据语义对齐方法、装置、设备及介质

站点导航

APP 下载