一种数据出版物可复用性的综合测度方法

正文

推荐专利

一种数据出版物可复用性的综合测度方法

申请号：CN202410971793

申请日期：2024-07-19

公开号：CN118897986A

公开日期：2024-11-05

类型：发明专利

摘要

本发明公开了一种数据出版物可复用性的综合测度方法，该方法包括以下步骤：获取用于构建样本集的数据出版物的施引文献全文；通过数据清洗，识别样本集中数据出版物在全部施引文献全文中所处的章节位置，并提取引用位置所在的段落文本，作为后续模型输入的总样本；定义引用功能及引用极性分类标准，依托语义增强训练具备泛化能力的分类模型；通过不断迭代，获取模型调优参数集，基于总样本形成引用功能及引用极性自动分类的结果样本集；构建并计算数据出版物可复用性影响因子指标，所述影响因子指标包括：引用强度指数、引用热度指数和引用广度指数；构建并计算数据出版物可复用性综合指数。本发明可以实现引用功能和极性的自动分类，形成由引用功能和极性校正后的引用强度，在此基础上，构建由引用强度、引用热度、引用广度组成的计量框架，以客观、完整地揭示数据出版物及其关联数据集可复用性的真实情况与发展潜力。

技术关键词

样本综合测度方法指数数据文本人工标记预训练语言模型训练分类模型矩阵半监督训练转译方法更新模型参数因子指标强度校正语义元素

系统为您推荐了相关专利信息

基于激光点云的公路资产自动识别及建模系统

建模系统资产自动建模技术三维建模数据倾斜摄影数据

一种基于Token的视觉任务生成方法

生成方法序列跨模态文本图像

一种复杂地质环境下盾构泥水分离综合处理系统及方法

数据融合算法检测重金属含量盾构机液压设备强化学习算法物联网传输协议

一种塔机结构损伤无人机自适应巡检系统及方法

塔机结构指数巡检方法裂纹路径规划算法

一种基于大模型的运维告警关联知识库的方法

拓扑网络运维数据处理技术图谱服务调用关系注意力

一种数据出版物可复用性的综合测度方法

站点导航

APP 下载