文档理解模型预训练方法、文档理解方法、电子设备及存储介质

正文

推荐专利

申请号：CN202510564868

申请日期：2025-04-30

公开号：CN120449889A

公开日期：2025-08-08

类型：发明专利

摘要

本发明提供一种文档理解模型预训练方法、文档理解方法、电子设备及存储介质，涉及文档理解技术领域，该方法中结合语义块信息和文本信息，确定文本信息的输入顺序，可以模拟人类的阅读流程，使初始文档理解模型更容易捕捉样本文档的逻辑结构及上下文依赖，增强样本文档对的语义连贯性，无需设计复杂的规则或算法使初始文档理解模型确定各元素的优先级或重要性。而且，保持输入顺序可以避免因重新排列各元素的文本信息而丢失上下文信息，减少信息丢失，提高模型理解准确性。该方法采用的初始文档理解模型包括基于空间状态模型构建的编码器，计算复杂度从二次降低为线性，显著提高文档处理效率，缩短模型所需的计算时间，降低模型内存开销。

技术关键词

预训练方法元素扫描策略语义向量样本编码器序列理解技术电子设备文本识别处理器分析工具可读存储介质存储器复杂度内存布局逻辑

系统为您推荐了相关专利信息

基于多模态数据融合的骨质疏松早期筛查方法及系统

早期筛查方法多模态数据融合样本女性激素

结直肠癌分类网络的训练方法、装置、设备及介质

特征提取模块核心生物标志物样本分类网络

一种基于深度学习的病毒基因组数据分析与预测系统

卷积神经网络模型预测系统鲁棒性评估分析模块生成卷积神经网络

一种基于数字孪生的注塑机工艺参数智能优化系统

智能优化系统数字孪生模型优化工艺参数周期模块

一种配电台区风险分级预警方法及系统

历史监测数据指标协方差矩阵灰度关联度神经网络模型

文档理解模型预训练方法、文档理解方法、电子设备及存储介质

站点导航

APP 下载