基于预训练语言模型的数据资源自动挂接方法及系统

AITNT
正文
推荐专利
基于预训练语言模型的数据资源自动挂接方法及系统
申请号:CN202411808411
申请日期:2024-12-10
公开号:CN119293032B
公开日期:2025-03-04
类型:发明专利
摘要
本发明提供了基于预训练语言模型的数据资源自动挂接方法及系统,属于数据管理领域。该方法包括以下步骤:获取用户填写的数据资源信息。划分三种类别的属性三元组。利用预训练语言模型生成新的数据资源信息的属性三元组向量表示,再使用余弦相似度与已有数据资源计算相似度。使用排序算法生成相似度排序在前10的数据资源列表。将新的数据资源选择排序后相似度最高的数据资源进行自动挂接。系统包括数据资源获取模块、属性三元组生成模块、相似度计算模块、数据筛选模块和数据挂接模块。该方法和系统能有效进行数据清洗和预处理,去除重复、错误或不完整的数据项,确保数据一致性和完整性。
技术关键词
预训练语言模型 三元组 挂接方法 资源 数据项 排序算法 梯度下降法 金融 信息模块 挂接系统 列表 数据管理 摘要 参数 编码器 节点 术语
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号