摘要
本申请提供了一种科技文档查重方法、装置、设备和介质,方法包括:根据获取的样本科技文档集得到微调样本集,以对所述候选大模型进行微调,得到微调后的目标大模型;构建对应的目标科技知识图谱,并基于所述目标科技知识图谱,得到待查重的文档对象的相似文档集;调用所述目标大模型的模型能力,并通过模型能力基于所述相似文档集得到所述文档对象的目标查重结果。通过目标科技知识图谱缩小了文档对象进行查重的文档范围,通过对大模型进行微调,提高了目标大模型与科技文档所属行业的适配度,基于目标大模型获取科技文档的目标查重结果,提高了科技文档的查重效率和准确率,优化了科技文档的查重方法。
技术关键词
样本
文本
文档查重方法
科技
对象
知识图谱构建
答案
查重装置
列表
处理器通信
存储器
策略
电子设备
模块
介质
指令
语义
数据