基于多级摘要生成的科技项目文档查重方法、设备及介质

AITNT
正文
推荐专利
基于多级摘要生成的科技项目文档查重方法、设备及介质
申请号:CN202510548709
申请日期:2025-04-28
公开号:CN120509394A
公开日期:2025-08-19
类型:发明专利
摘要
基于多级摘要生成的科技项目文档查重方法、设备及介质,属于文档查重技术领域,解决如何提高科技项目文档查重的可靠性和准确性的问题;本发明首先对于待查重的项目文档进行结构化解析,传入微调过的摘要生成模型获得待查重项目的多层级摘要,通过微调训练后的文本特征提取模型提取出多层级摘要的特征向量;其次,基于主要摘要维度对应的特征向量在向量数据库中进行相似度搜索,再进一步计算基于从属摘要维度的余弦相似度,对加权后的相似度排序,获取相似度排名;最后根据结构化解析信息与相似度排名结果,使用大语言模型进行LLM相似性分析,形成文档查重报告,确保科技项目的原创性,避免重复资助,对于科技项目管理具有重要的实际应用价值。
技术关键词
文档查重方法 摘要 文本 语义特征提取 大语言模型 特征提取模型 专用数据集 文档查重技术 生成文档 科技项目管理 条目 层级 文档特征 指令 处理器 原创性 存储器
系统为您推荐了相关专利信息
1
模型控制方法、装置、计算机设备及存储介质
模型控制方法 文本 注意力 序列 内存
2
大模型数据筛选方法、设备和存储介质
数据筛选方法 指标 专业 大语言模型 指令
3
基于国网文档数据特征的层次聚类与目录自动构建方法
自动构建方法 目录 生成关键词 词嵌入模型 层级
4
报告单解析方法、装置、设备、系统及程序产品
大语言模型 报告 解析方法 页面 解析单元
5
基于区块链的交通智能监管方法及系统
交通智能监管方法 交通智能监管系统 摘要 中心服务器 交通视频数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号