摘要
本发明公开了一种基于大型语言模型的作者姓名消歧与错误分配检测方法,涉及分配检测技术领域。该方法包括以下步骤:S1.形成标准化学术文献数据集合;S2.生成用于表征各文本信息上下文语义关系的高维语义特征向量表示;S3.形成统一的作者身份表征向量;S4.利用原始学术文献数据集构建学术文献引用、作者与学术文献、作者与机构以及合著关系多元关系图;S5.生成初步作者身份匹配结果;S6.生成作者身份概率分布预测结果;S7.生成优化的作者身份匹配数据;S8.利用反向推理策略对作者身份匹配数据进行自动校正,形成最终作者身份归属结果。本发明提高了对署名变体的识别能力,避免因表述不同导致的身份错判。
技术关键词
双向注意力
结构特征提取方法
融合特征
摘要
BERT模型
细粒度特征
数据
综合语义
文献引用关系
统一身份标识
动态位置编码
网络
文本特征向量
序列
系统为您推荐了相关专利信息
遥感影像特征
特征提取器
模型预训练
特征提取模块
分支
电涡流传感器
多通道
信号特征
数据处理方法
融合特征
图像鉴别方法
离散余弦变换
载荷特征
空域特征
滤波器