摘要
本发明提供了基于文本分类技术与金额特征双维度的智能报销分类系统,涉及机器学习技术领域;本发明基于文本分类的机器学习方法来解决财务报销自动化的问题,通过文本分类器将发票内容特征信息按照给定的费用项类别进行划分,得到费用项大类数据,再通过费用项分类器根据费用项大类数据和发票金额特征信息,确定待报销发票的报销费用项分类项,从而解决了财务报销效率低下,大量人工投入到重复劳动的问题;通过混淆矩阵和评价指标设计了分类效果评价体系,并获取到了文本分类器和费用项分类器所使用的分类模型;此外,通过实验还能确定算法缺陷并进行专项改进,从而进一步提高分类准确率。
技术关键词
文本分类技术
分类系统
发票
文本分类器
线性支持向量机
决策树算法
机器学习算法
数据
朴素贝叶斯算法
逻辑回归算法
指标
光学字符识别
矩阵
机器学习技术
机器学习方法
交叉验证法
分类准确率