摘要
本发明实施例提供一种用于招标文件的文本识别方法及系统,属于招标文件的识别技术领域。所述文本识别方法包括:获取待识别的招标文件;基于预设的标签在所述招标文件中搜索信息文档;遍历每个所述信息文档,确定每个所述信息文档的字词向量和图像;提取所述字词向量对应的文本信息和所述图像对应的证明信息;采用所述文本信息和所述证明信息根据预设的显示布局生成显示页面。相较于现有技术而言,本发明提供的文本识别方法及系统由于是分别针对招标文件中的每个信息文档进行识别,同时采用对字词向量以及证明信息的分别提取,克服了现有技术的统一文件整理的方法的技术缺陷,提高了对招标文件的识别效率。
技术关键词
文本识别方法
词向量模型
标签
字词
积层
文本识别系统
页面
图像识别模型
关键词
布局
索引
处理器
关系
系统为您推荐了相关专利信息
小数据
标签数据库
传输控制方法
拼接技术
重复数据删除技术
培训系统
输液港
数字孪生技术
风险评估值
数据管理模块