摘要
本发明提供一种快速筛选有效案件信息的方法,快速筛选有效案件信息的方法包括以下步骤:获取到银行证据压缩包,上传到库,筛选出压缩包完整的待解压对象,对筛选后的压缩包完整的待解压对象进行解压,构建业务上下文对象获取压缩包中的信息并检验信息是否正确,其中,检验是利用随机森林算法,不对应的信息进行标注,正确的信息保存,人工对不正确的信息进行检查及修改,本发明通过使用的随机森林算法,利用训练好的随机森林模型来验证和校正身份证ocr的结果,随机森林模型通过综合多个特征(如身份证号码的长度、校验码的有效性、姓名的格式等)来进行预测,而不仅仅是依赖单一的ocr输出,从而有助于提高整体的准确性。
技术关键词
随机森林模型
身份证
案件
账单
收集训练数据
对象
标记
算法
字段
日期
号码
条形码
校正
标签
有效性
格式
样本
组织
系统为您推荐了相关专利信息
专业气象服务
决策方法
决策支持系统
指数
非易失性计算机可读存储介质
单体电池开路电压
电池历史数据
电池簇
内存
定位方法
随机森林模型
温湿度
网格搜索方法
交叉验证方法
数据