一种基于大模型的文档数据处理方法和装置

正文

推荐专利

一种基于大模型的文档数据处理方法和装置

申请号：CN202510128695

申请日期：2025-01-27

公开号：CN119940343A

公开日期：2025-05-06

类型：发明专利

摘要

提供了一种基于大模型的文档数据处理方法和装置，涉及人工智能技术领域，尤其涉及大模型、计算机视觉技术。实现方案为数据处理方法包括：获取从可携带文档格式PDF文件中识别的多种不同类型的元素中的至少一个PDF元素；基于所识别的PDF元素确定待处理图像和待处理文本，其中，待处理图像包括所识别的至少一个PDF元素的图像，待处理文本包括从待处理图像中识别的文本；基于自注意力机制对待处理文本进行特征提取，以得到待处理文本的自注意力特征；基于交叉注意力机制对待处理文本的自注意力特征和待处理图像的图像特征进行特征提取，以得到用于PDF文件的文本‑图像交叉注意力特征；以及至少基于交叉注意力特征确定PDF文件的解析结果。

技术关键词

图像交叉注意力机制文本文档数据处理方法元素特征提取单元计算机视觉技术格式数据处理装置人工智能技术计算机程序产品处理器通信指令可读存储介质存储器

系统为您推荐了相关专利信息

一种新对虾养殖全过程监控方法、系统及存储介质

全过程监控方法疾病生物全过程监控系统检索标签

一种Linux服务器网络安全等级保护测评方法

服务器网络安全测评方法 BERT模型自动化测试脚本依存句法分析

机器人控制方法、装置、计算机设备及存储介质

机器人控制方法多模态生成动作解码器序列

一种巡检装置、巡检机器人及巡检设备

巡检装置数字量采集模块开关量采集模块模拟量采集模块温度检测模块

一种文本生成方法、装置、电子设备及可读介质

文本生成方法主题关键词实体关系文本生成装置

一种基于大模型的文档数据处理方法和装置

站点导航

APP 下载