一种用于专利分类的方法和系统

AITNT
正文
推荐专利
一种用于专利分类的方法和系统
申请号:CN202410861528
申请日期:2024-06-28
公开号:CN118690246A
公开日期:2024-09-24
类型:发明专利
摘要
本申请涉及数据处理技术领域,公开了一种用于专利分类的方法和系统,包括:对有标签数据集进行数据扩充后训练分类模型,得到第一分类模型;使用第一分类模型对无标签数据集进行分类,将分类结果中置信度大于预设置信度阈值的所有无标签数据作为第一待补充数据;根据分类结果、第一待补充数据和无标签数据集的聚类结果确定第二待补充数据;对第二待补充数据进行扩充后加入至扩充后的有标签数据集,对第一分类模型进行训练,得到训练好的分类模型。本申请能够获取高质量的无标签数据,将其进行扩充后加入至有标签数据集对第一分类模型进行训练,从而将高质量无标签数据的数量用于模型训练,充分利用无标签专利数据得到准确度高的分类模型。
技术关键词
无标签数据 训练分类模型 置信度阈值 聚类 文本 数据处理技术 数据获取模块 样本
系统为您推荐了相关专利信息
1
基于文本语音相关性判别生成动作序列的大模型训练方法
语义特征 融合特征 文本 语音 模型训练方法
2
一种岩石薄片细节识别及薄片文本描述生成方法
岩石薄片 偏光显微镜 文本生成模型 生成方法 图像特征向量
3
用于多条件音频生成的系统和方法
生成音频数据 音频特征提取 风格 文本 浅层卷积神经网络
4
基于内容属性和受众特征融合的信息推送渠道推荐方法
渠道 推荐方法 关键词 兴趣 表达式
5
一种用于ERP系统的多语言快速处理方法
ERP系统 多语言 矩阵 语义特征 语法结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号