一种公共数据自动化分类分级方法、系统

AITNT
正文
推荐专利
一种公共数据自动化分类分级方法、系统
申请号:CN202411587567
申请日期:2024-11-08
公开号:CN119128607B
公开日期:2025-01-17
类型:发明专利
摘要
本发明涉及一种公共数据自动化分类分级方法、系统,属数据自动化分类分级领域。包括步骤:构建分类分级向量知识库;针对输入待分类分级的数据,基于最临近搜索算法与分类分级向量知识库内容进行相似性匹配,获得数据所属领域和分级规则的匹配信息;对大模型进行预训练,然后基于公共数据分类分级向量知识库对预训练好的大模型进行适配微调;将待分类分级的数据,以及与分类分级向量知识库的匹配信息输入大模型进行自动化分类分级,输出分类分级结果。本发明解决了现有分类分级缺少自动化方法而需大量依赖人工定制化服务的问题,实现了自动化公共数据分类分级,提高了分类分级的泛化性和效率。
技术关键词
分类分级方法 搜索算法 文本 数据 OCR识别技术 分类规则 命名实体识别 词嵌入向量 模型预训练 注意力 自动化方法 处理器 可读存储介质 微调方法 分词 词袋模型 分级系统 参数 大语言模型 计算机
系统为您推荐了相关专利信息
1
基于状态图谱的单页应用动态漏洞回溯检测方法
漏洞 图谱 页面数据 发现敏感数据 高风险
2
基于CNOs的落煤口闸板防冻加热系统及装置
防冻加热系统 闸板 发热板 防冻加热装置 机器学习模型
3
摄像头防抖方法、电子设备和计算机可读存储介质
传感集线器 频率 参数 摄像头防抖方法 终端设备
4
一种互联网广告标识分发平台系统及其方法
分发平台系统 标识 子模块 广告互动 点击率
5
感知模型的训练方法、装置、设备、存储介质和产品
强化学习模型 节点 数据分布 判别模块 特征提取模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号