摘要
本申请涉及一种分布式数据标注方法和行业文件重要性识别方法,其中,该行业文件重要性识别方法包括:将提问集合Q输入大语言模型向大语言模型提问目标行业文件的特征属性,获取大语言模型响应提问集合Q而输出的答案集合A;将答案集合A在目标特征库中进行匹配,确定目标行业文件的各个特征属性类别的权重,目标特征库具有不同特征属性与不同类别的映射关系,不同特征属性与不同类别的映射关系通过目标数据标注方法得到,不同类别用于表征不同程度的重要性;基于目标行业文件的各个特征属性的类别权重确定目标行业文件的重要性等级。解决了目前的行业文件重要性识别方法难以对半结构化或是非结构化的行业文件进行较为准确地识别问题。
技术关键词
重要性识别方法
数据标注方法
大语言模型
中文特征
答案
服务器系统
干扰特征
数据标注系统
数据分类分级
关系
特征提取模块
识别装置
匹配模块
索引
系统为您推荐了相关专利信息
代码分析方法
异构
自然语言
大语言模型
计算机程序产品
代码评审方法
大语言模型
可执行程序代码
指令
数据压缩
数据处理方法
大语言模型
模型训练技术
电子设备
数据处理装置