摘要
本发明公开了一种非结构化文档溯源方法和系统,其中,该非结构化文档溯源方法包括以下步骤:S1,识别待溯源的第一非结构化文档的第一结构化特征,并识别目标系统中第二非结构化文档的第二结构化特征;S2,将所述第一结构化特征与所述第二结构化特征进行特征比较;S3,根据特征比较结果判断所述第一非结构化文档是否来源于所述目标系统。根据本发明的非结构化文档溯源方法,通过识别非结构化文档的结构化特征,能够有效地对非结构化文档进行溯源。
技术关键词
非结构化文档
命名实体识别模型
文档溯源方法
主题
非临时性计算机可读存储介质
识别模块
校准
溯源系统
处理器
网络
计算机设备
文本
存储器
参数
程序
系统为您推荐了相关专利信息
地理坐标信息
地图瓦片数据
图片
转换算法
非临时性计算机可读存储介质
数据识别方法
大语言模型
主题
双曲正切函数
样本