摘要
本发明提供了基于预训练语言模型的数据资源自动挂接方法及系统,属于数据管理领域。该方法包括以下步骤:获取用户填写的数据资源信息。划分三种类别的属性三元组。利用预训练语言模型生成新的数据资源信息的属性三元组向量表示,再使用余弦相似度与已有数据资源计算相似度。使用排序算法生成相似度排序在前10的数据资源列表。将新的数据资源选择排序后相似度最高的数据资源进行自动挂接。系统包括数据资源获取模块、属性三元组生成模块、相似度计算模块、数据筛选模块和数据挂接模块。该方法和系统能有效进行数据清洗和预处理,去除重复、错误或不完整的数据项,确保数据一致性和完整性。
技术关键词
预训练语言模型
三元组
挂接方法
资源
数据项
排序算法
梯度下降法
金融
信息模块
挂接系统
列表
数据管理
摘要
参数
编码器
节点
术语