摘要
本发明涉及一种公共数据自动化分类分级方法、系统,属数据自动化分类分级领域。包括步骤:构建分类分级向量知识库;针对输入待分类分级的数据,基于最临近搜索算法与分类分级向量知识库内容进行相似性匹配,获得数据所属领域和分级规则的匹配信息;对大模型进行预训练,然后基于公共数据分类分级向量知识库对预训练好的大模型进行适配微调;将待分类分级的数据,以及与分类分级向量知识库的匹配信息输入大模型进行自动化分类分级,输出分类分级结果。本发明解决了现有分类分级缺少自动化方法而需大量依赖人工定制化服务的问题,实现了自动化公共数据分类分级,提高了分类分级的泛化性和效率。
技术关键词
分类分级方法
搜索算法
文本
数据
OCR识别技术
分类规则
命名实体识别
词嵌入向量
模型预训练
注意力
自动化方法
处理器
可读存储介质
微调方法
分词
词袋模型
分级系统
参数
大语言模型
计算机
系统为您推荐了相关专利信息
防冻加热系统
闸板
发热板
防冻加热装置
机器学习模型
强化学习模型
节点
数据分布
判别模块
特征提取模块