摘要
本申请公开了一种商业秘密文档识别方法、装置、设备及存储介质,涉及计算机技术领域,应用于包括引擎层、能力层、服务层和产品层的预设分层架构,包括:将基于大语言模型的基础能力确定的商业秘密处理技术下发至服务层;利用商业秘密处理技术生成商业秘密定密细则制定服务与商业秘密识别服务,并预处理初始企业文档,利用商业秘密定密细则制定服务处理得到的待处理企业文档,得到目标定密规则;调整大语言模型,得到目标大语言模型,并基于商业秘密识别服务对目标定密细则进行段落与待识别文档的关联操作,得到关联结果,利用目标大语言模型对关联结果进行密级判定,得到密级判定结果。这样能够提高识别商业秘密文档的准确率。
技术关键词
大语言模型
文档识别方法
企业
自然语言理解
文档识别装置
界面
特征描述信息
数据
文本
标记
溯源功能
逻辑
微调技术
分词
参数
分层
语义
基础
格式
载体