一种文档分类方法、装置、设备及介质

AITNT
正文
推荐专利
一种文档分类方法、装置、设备及介质
申请号:CN202510243351
申请日期:2025-03-03
公开号:CN120144761A
公开日期:2025-06-13
类型:发明专利
摘要
本说明书实施例公开了一种文档分类方法、装置、设备及介质,包括:获取预先生成的分类语料库;获取指定企业的领域词汇表;基于领域词汇表中的预设词汇与各文档的相关度,得到各文档的关键词;将多个文档特中的训练集文档与测试集文档,分别转化为由训练集文档的关键词的相关度组成的各训练集文档的第一特征向量,以及由测试集文档的关键词的相关度组成的各测试集文档的第二特征向量;基于各训练集文档的第一特征向量,训练得到文档分类器,文档分类器通过机器学习模型构建;基于第二特征向量对文档分类器进行测试评估;若文档分类器通过测试评估,将文档分类器进行部署,以便通过文档分类器对分类语料库的新增文档进行分类。
技术关键词
文档分类器 分类语料库 训练集 关键词 机器学习模型 文档分类方法 搜索词 非易失性计算机存储介质 计算机可执行指令 文档分类装置 朴素贝叶斯算法 支持向量机算法 企业级 分类器训练 决策树算法 分词技术 处理器
系统为您推荐了相关专利信息
1
基于特征波段选择的XGBoost悬浮物浓度航空遥感反演方法
反演方法 XGBoost模型 无人机遥感 多光谱遥感数据 最佳特征
2
基于心电图信息的异常生物标志物预测方法及系统
生物标志物 变压器结构 变压器模块 随机梯度下降 预训练模型
3
一种嵌入式冰箱冷藏温度的智能控制方法及系统
嵌入式冰箱 智能控制方法 机器学习模型 压缩机运行状态 基准
4
仪表识别的方法、装置、设备和存储介质
仪表表盘 仪表指针 数值 线段 图像
5
基于物理约束-混合动力机器学习的梅雨预测方法
混合动力机器 机器学习方法 物理系统 机器学习模型 指数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号