摘要
本发明涉及数据挖掘技术领域,特别涉及一种基于相似样本的对比学习实体匹配方法及系统,对待匹配实体数据集中的待匹配实体进行序列化表示;将待匹配实体的序列化表示输入至实体匹配模型,利用实体匹配模型得到待匹配实体数据集中各实体对匹配结果,所述实体匹配模型为基于正实体对样本、负实体对样本和相似实体对样本并利用对比学习机制对模型进行训练,以使模型学习不同实体间的相似性和差异性,其中,所述相似实体对样本为实体对相似但不匹配的实体样本数据。本发明将相似但不匹配的实体作为相似样本,为对比学习过程提供更全面的高质量对比样本,通过对比学习学习正、负和相似样本三类样本实体对的相似性与差异性特征,提升实体匹配效果。
技术关键词
实体匹配方法
样本
标记标签
预训练语言模型
矩阵
匹配模块
数据挖掘技术
可读存储介质
机制
注意力
表达式
语义特征
处理器
存储器
计算机
代表
序列
系统为您推荐了相关专利信息
可拓云模型
储能选址方法
评估指标体系
节点
储能需求
教学系统
视频采集单元
三维虚拟形象
深度学习训练
识别模块
机械装备故障诊断
小波核函数
分支卷积神经网络
级联
评价方法