摘要
本申请涉及人工智能技术领域,尤其涉及一种面向招投标领域大模型预训练的表格数据处理方法及系统,方法包括获取表格数据,判断是否属于业务专用表格,若不属于,基于启发性规则判断表格数据属于数字型表格或是文本型表格;若是业务专用表格,在预构建的文本模板库中选择对应的文本模板,从表格数据提取数据并填充至文本模板得到业务专用表格的文本描述;若是数字型表格,转换成结构化数据并添加注释得到数字型表格的文本描述;若是文本型表格,使用OCR识别方法识别表格数据中的文本,将识别出的文本组织成文本格式得到文本型表格的文本描述。本申请能够应对多样化的表格数据,提升面对招投标领域表格数据的处理效率以及表格数据处理结果的准确性。
技术关键词
业务专用
表格数据处理方法
关键词
文本
模型预训练
OCR识别方法
数字型
模板
合并单元格
语义
动态更新
数据处理系统
人工智能技术
矩阵
表头
程序
处理器
系统为您推荐了相关专利信息
裁判文书
语义特征
分类方法
双向长短期记忆
网络模块
融合知识图谱
问答方法
实体
双向注意力机制
答案
电力数据处理方法
关键词
文本
图像分割模型
图像类别