摘要
本申请涉及资料识别和匹配技术领域,公开了一种基于资料自动识别的项目匹配方法及系统。所述方法包括:获取原始票据资料数据,并对所述原始票据资料数据进行预处理,得到目标票据资料数据;对所述目标票据资料数据进行类型识别和版面分析,得到结构化区域数据;对所述结构化区域数据进行字符识别和信息提取,得到票据结构化数据;对所述票据结构化数据进行汇总和分析,得到多维度数据分析结果;获取多个候选项目信息,并对多个候选项目信息进行特征提取和向量化,得到项目特征库;对所述多维度数据分析结果和所述项目特征库进行智能匹配,得到推荐项目列表,本申请通过自动对票据资料进行识别,从而提高了项目匹配的精准度。
技术关键词
项目特征
票据区域
规则集
资料
字符识别
列表
深度学习模型训练
异常数据分析
协同过滤推荐
图像
聚类
版面结构
项目匹配系统
多尺度特征
训练样本集
加权特征
轮廓数据