文档处理方法、模型训练方法、装置、设备和存储介质

AITNT
正文
推荐专利
文档处理方法、模型训练方法、装置、设备和存储介质
申请号:CN202410866994
申请日期:2024-06-28
公开号:CN118734949A
公开日期:2024-10-01
类型:发明专利
摘要
本公开实施例涉及一种文档处理方法、模型训练方法、装置、设备和存储介质。模型训练方法包括:获取文档样本对应的文本信息、文本信息在文档样本中的布局信息、问题样本和问题样本对应的参照答案;布局信息用于表征文本信息位置;对布局信息进行向量化处理,生成布局向量,并对文本信息进行向量化处理,生成文本向量;基于文本信息和布局信息的对应关系,交错排列布局向量和文本向量,并将交错排列的布局向量和文本向量、以及问题样本,输入初始文档处理模型,确定预测答案;基于预测答案和参照答案,对初始文档处理模型进行迭代训练,生成目标文档处理模型。根据本公开实施例,在不增加额外的输入长度的同时,还提高了文档处理的精度。
技术关键词
布局 文本 模型训练方法 答案 样本 矩阵 光学字符识别 模型训练装置 模型训练模块 处理器 关系 可读存储介质 指令 存储器 电子设备 计算机 坐标 精度
系统为您推荐了相关专利信息
1
一种基于语言模型的智能双语法律问答方法和系统
问答方法 大语言模型 语义库 文本 注意力机制
2
一种基于RPA-CRISPR/Cas12b技术的水稻三种病原菌快速检测方法
水稻细菌性条斑病菌 离心式微流控芯片 引物 核苷酸 快速检测方法
3
一种基于Modelica的数字化隔振系统设计优化方法
隔振系统 隔振元件 设计优化方法 阻尼元件 刚度
4
一种基于自然语言处理的材料信息语义映射控制方法
映射控制方法 语义知识图谱 语义协同 跨模态 概念
5
一种基于时序对齐和语义增强的多模态视频摘要生成方法
视频摘要生成方法 动态时间规整 语义 视觉特征 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号