摘要
本公开实施例涉及一种文档处理方法、模型训练方法、装置、设备和存储介质。模型训练方法包括:获取文档样本对应的文本信息、文本信息在文档样本中的布局信息、问题样本和问题样本对应的参照答案;布局信息用于表征文本信息位置;对布局信息进行向量化处理,生成布局向量,并对文本信息进行向量化处理,生成文本向量;基于文本信息和布局信息的对应关系,交错排列布局向量和文本向量,并将交错排列的布局向量和文本向量、以及问题样本,输入初始文档处理模型,确定预测答案;基于预测答案和参照答案,对初始文档处理模型进行迭代训练,生成目标文档处理模型。根据本公开实施例,在不增加额外的输入长度的同时,还提高了文档处理的精度。
技术关键词
布局
文本
模型训练方法
答案
样本
矩阵
光学字符识别
模型训练装置
模型训练模块
处理器
关系
可读存储介质
指令
存储器
电子设备
计算机
坐标
精度
系统为您推荐了相关专利信息
水稻细菌性条斑病菌
离心式微流控芯片
引物
核苷酸
快速检测方法
映射控制方法
语义知识图谱
语义协同
跨模态
概念
视频摘要生成方法
动态时间规整
语义
视觉特征
文本