摘要
基于多级摘要生成的科技项目文档查重方法、设备及介质,属于文档查重技术领域,解决如何提高科技项目文档查重的可靠性和准确性的问题;本发明首先对于待查重的项目文档进行结构化解析,传入微调过的摘要生成模型获得待查重项目的多层级摘要,通过微调训练后的文本特征提取模型提取出多层级摘要的特征向量;其次,基于主要摘要维度对应的特征向量在向量数据库中进行相似度搜索,再进一步计算基于从属摘要维度的余弦相似度,对加权后的相似度排序,获取相似度排名;最后根据结构化解析信息与相似度排名结果,使用大语言模型进行LLM相似性分析,形成文档查重报告,确保科技项目的原创性,避免重复资助,对于科技项目管理具有重要的实际应用价值。
技术关键词
文档查重方法
摘要
文本
语义特征提取
大语言模型
特征提取模型
专用数据集
文档查重技术
生成文档
科技项目管理
条目
层级
文档特征
指令
处理器
原创性
存储器
系统为您推荐了相关专利信息
交通智能监管方法
交通智能监管系统
摘要
中心服务器
交通视频数据