一种基于大模型的文档数据处理方法和装置

AITNT
正文
推荐专利
一种基于大模型的文档数据处理方法和装置
申请号:CN202510128695
申请日期:2025-01-27
公开号:CN119940343A
公开日期:2025-05-06
类型:发明专利
摘要
提供了一种基于大模型的文档数据处理方法和装置,涉及人工智能技术领域,尤其涉及大模型、计算机视觉技术。实现方案为数据处理方法包括:获取从可携带文档格式PDF文件中识别的多种不同类型的元素中的至少一个PDF元素;基于所识别的PDF元素确定待处理图像和待处理文本,其中,待处理图像包括所识别的至少一个PDF元素的图像,待处理文本包括从待处理图像中识别的文本;基于自注意力机制对待处理文本进行特征提取,以得到待处理文本的自注意力特征;基于交叉注意力机制对待处理文本的自注意力特征和待处理图像的图像特征进行特征提取,以得到用于PDF文件的文本‑图像交叉注意力特征;以及至少基于交叉注意力特征确定PDF文件的解析结果。
技术关键词
图像 交叉注意力机制 文本 文档数据处理方法 元素 特征提取单元 计算机视觉技术 格式 数据处理装置 人工智能技术 计算机程序产品 处理器通信 指令 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种新对虾养殖全过程监控方法、系统及存储介质
全过程监控方法 疾病 生物 全过程监控系统 检索标签
2
一种Linux服务器网络安全等级保护测评方法
服务器网络安全 测评方法 BERT模型 自动化测试脚本 依存句法分析
3
机器人控制方法、装置、计算机设备及存储介质
机器人控制方法 多模态 生成动作 解码器 序列
4
一种巡检装置、巡检机器人及巡检设备
巡检装置 数字量采集模块 开关量采集模块 模拟量采集模块 温度检测模块
5
一种文本生成方法、装置、电子设备及可读介质
文本生成方法 主题关键词 实体 关系 文本生成装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号