摘要
本申请涉及人工智能技术领域,公开了一种文档分析方法、装置、存储介质及文档分析设备,该方法包括:获取待分析文档,并对待分析文档进行识别,获得待分析文档的待分析布局信息;通过预设大语言模型基于待分析布局信息对待分析文档进行分析,获得分析结果;预设大语言模型根据样本文档的样本布局信息以及对应的预训练任务进行模型训练获得,预训练任务为模型训练后使预设大语言模型具有对样本布局信息进行理解的能力的任务。相比于现有的大语言模型仅能理解纯文本内容,本申请中的预设大语言模型还可理解其中的布局信息,从而提升了模型理解分析能力,提升后续下游任务分析的准确性。
技术关键词
大语言模型
布局
文档分析方法
样本
元素
指令
分析设备
坐标
文档分析装置
掩膜
空间结构关系
文本概括
人工智能技术
处理器
视觉
分析模块
存储器
表格
系统为您推荐了相关专利信息
综合污染指数
地下水渗流速度
网格模型
生态风险评估
热力图
知识图谱补全方法
结构编码器
实体
文本编码器
语义
大语言模型
决策
软件交互方法
交互系统
可视化大屏
图像分类方法
图像分类模型
非暂态计算机可读存储介质
内存
图像分类系统