摘要
本发明提供了一种基于大语言模型的计算机辅助密点标注方法及系统,包括:对于待密点标注的长文本数据,基于预先训练的大语言模型进行涉密句的提取;其中,所述大语言模型以待标注的长文本数据作为输入,输出若干涉密句构成的涉密句集合;对于涉密句集合中的每条涉密句,利用微调后的自然语言模型,获得涉密句的语义特征向量表示;基于涉密句集合中每条涉密句对应的语义特征向量表示,与预先构建的密点向量库中的样本进行匹配,基于密点向量库中匹配样本对应的标注结果对涉密句集合中的每条涉密句进行密点标注,实现对长文本数据的密点标注。
技术关键词
计算机辅助密点标注方法
大语言模型
自然语言模型
语义
文本
样本
非暂态计算机可读存储介质
数据
特征提取单元
标注系统
处理器
存储器
电子设备
程序
模式
关系
策略