摘要
本发明提出通过机器学习实现格式文件规范化的方法,通过检测模型对文件进行标识和纠正,根据纠正后的文件确定文件类型,再根据文件类型检验文件完整性、校验位置规范性以及校验内容规范性;本发明通过对文件可能出现的类型进行穷尽构建模型,通过模型对比判断文件中的类型并判断其完整性、规范性,能够实现格式文件规范化的迅速判断,通过机器人对某些不规范的文件进行校正,校正后的文件重新校验直至符合格式文件的完整性、规范性,大大减少人工校正的工作量,有利于利用文件的分类归档。
技术关键词
元素
校验位置
污点
校正
模板
标识
内容排序
数据
标记
错位
格式
外边框
印章
机器人
模版
工作量
箭头
表格
日期
符号
系统为您推荐了相关专利信息
投影设备
参数标定方法
颜色校正
标定板图像
光强
双层长短期记忆网络
气压控制方法
家用呼吸机
云端服务器
客户端
汽车电子控制单元
虚拟驾驶场景
多自由度运动平台
测试设备
云平台服务器