摘要
本发明属于人工智能领域,提出一种基于语义向量库和大语言模型的文档抄袭判断方法及系统,通过语义向量化模型将拆分出的各检索文本映射为语义向量,有效捕捉文本的深层语义信息,为后续提供数据基础。通过从语义向量库中检索与各检索文本的检索语义向量匹配的比对语义向量,精准筛选相似文本,缩小文档比对范围。将各检索文本与相似文档的各比对文本一一对应,组成各相似文本对。基于语义相似度、文本重合度以及大语言模型判断三个维度综合判断各相似文本对间是否存在抄袭以及生成判断依据,不仅提高语义比对准确性,还为判断提供客观、可解释的依据,显著提升科技查新和论文查重的智能化水平。
技术关键词
语义向量
文本
大语言模型
判断方法
判断系统
数据存储模块
报告
标签
自然语言
模板
关系
层级
字段
论文
科技
基础