摘要
本发明公开了一种面向大模型的政务类文档预处理系统与方法,包括S1:建立政务类文档类别数据库,政务类文档类别数据库包含有政务类文档的基础特征信息M1;S2:利用机器视觉设备扫描待分类的政务类文档,通过机器视觉识别政务类文档的基础特征信息M2;S3:利用面向大模型的政务分类系统对M2和M1进行相似度匹配,所述面向大模型的政务分类系统采用加权综合评分模型进行匹配,为政务类文档的每个属性进行分配权重,计算每一属性与目标属性的加权相似度得分,从而找到最匹配的类型;S4:将通过采用加权综合评分模型进行匹配的结果与其综合评分设定阈值进行对比并生成推荐分类的报告。本发明结合机器视觉和大模型算法实现文档的高效分类。
技术关键词
政务
预处理系统
训练样本集
分类系统
机器视觉设备
机器视觉识别
文档分类特征
文档分类数据
模块
重构算法
模型算法
基础
报告
互联网
滑动窗
移动终端
关键词
系统为您推荐了相关专利信息
支持向量回归模型
导频信号
接收端
解调方法
训练样本集