分布式数据标注方法和行业文件重要性识别方法

AITNT
正文
推荐专利
分布式数据标注方法和行业文件重要性识别方法
申请号:CN202411848227
申请日期:2024-12-16
公开号:CN119782447A
公开日期:2025-04-08
类型:发明专利
摘要
本申请涉及一种分布式数据标注方法和行业文件重要性识别方法,其中,该行业文件重要性识别方法包括:将提问集合Q输入大语言模型向大语言模型提问目标行业文件的特征属性,获取大语言模型响应提问集合Q而输出的答案集合A;将答案集合A在目标特征库中进行匹配,确定目标行业文件的各个特征属性类别的权重,目标特征库具有不同特征属性与不同类别的映射关系,不同特征属性与不同类别的映射关系通过目标数据标注方法得到,不同类别用于表征不同程度的重要性;基于目标行业文件的各个特征属性的类别权重确定目标行业文件的重要性等级。解决了目前的行业文件重要性识别方法难以对半结构化或是非结构化的行业文件进行较为准确地识别问题。
技术关键词
重要性识别方法 数据标注方法 大语言模型 中文特征 答案 服务器系统 干扰特征 数据标注系统 数据分类分级 关系 特征提取模块 识别装置 匹配模块 索引
系统为您推荐了相关专利信息
1
用于车辆环境可视化的基于深度学习的环境建模
虚拟现实内容 处理器 协作内容 大语言模型 对象
2
异构代码分析方法、装置、设备、存储介质及产品
代码分析方法 异构 自然语言 大语言模型 计算机程序产品
3
一种基于知识图谱和时间序列的招聘趋势预测与问答方法
问答方法 图谱 需求预测模型 自然语言 语义
4
代码评审方法、装置、电子设备及存储介质
代码评审方法 大语言模型 可执行程序代码 指令 数据压缩
5
基于大模型的数据处理方法、装置、电子设备
数据处理方法 大语言模型 模型训练技术 电子设备 数据处理装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号