基于语义向量库和大语言模型的文档抄袭判断方法及系统

正文

推荐专利

申请号：CN202510703998

申请日期：2025-05-29

公开号：CN120234420A

公开日期：2025-07-01

类型：发明专利

摘要

本发明属于人工智能领域，提出一种基于语义向量库和大语言模型的文档抄袭判断方法及系统，通过语义向量化模型将拆分出的各检索文本映射为语义向量，有效捕捉文本的深层语义信息，为后续提供数据基础。通过从语义向量库中检索与各检索文本的检索语义向量匹配的比对语义向量，精准筛选相似文本，缩小文档比对范围。将各检索文本与相似文档的各比对文本一一对应，组成各相似文本对。基于语义相似度、文本重合度以及大语言模型判断三个维度综合判断各相似文本对间是否存在抄袭以及生成判断依据，不仅提高语义比对准确性，还为判断提供客观、可解释的依据，显著提升科技查新和论文查重的智能化水平。

技术关键词

语义向量文本大语言模型判断方法判断系统数据存储模块报告标签自然语言模板关系层级字段论文科技基础

基于语义向量库和大语言模型的文档抄袭判断方法及系统

站点导航

APP 下载