一种针对PDF文档的转化装置、方法、存储介质及计算机设备

AITNT
正文
推荐专利
一种针对PDF文档的转化装置、方法、存储介质及计算机设备
申请号:CN202510916111
申请日期:2025-07-03
公开号:CN120893387A
公开日期:2025-11-04
类型:发明专利
摘要
本申请公开了一种针对PDF文档的转化装置、方法、存储介质及计算机设备。该装置包括数据处理模块将PDF文档转化为待处理图像以及获取内嵌图像的原始图像数据;版面解析模块对待处理图像执行区域划分,确定PDF文档的文本区域、公式区域和表格区域;第一识别模块对文本区域、公式区域和表格区域分别进行内容识别生成文本识别结果、公式识别结果以及表格识别结果;第二识别模块基于原始图像数据生成图像识别结果;语义解析模块通过大语言模型生成文本识别结果、公式识别结果、表格识别结果和图像识别结果的语义表示;演示文稿生成模块将获取的识别结果和语义表示映射到演示文稿模版生成最终演示文稿。可以提高基于PDF文档生成演示文稿的准确性和内容丰富度。
技术关键词
转化装置 文本识别 原始图像数据 表格 图像编码数据 大语言模型 数据处理模块 识别模块 转换方法 语义 内存 计算机设备 像素矩阵 多模态 关系 格式 模版
系统为您推荐了相关专利信息
1
一种基于自编码器与领域知识图谱的文本数据增广方法
数据增广方法 文本 编码器 图谱 多模态信息
2
基于合同的业务流程生成方法、装置、设备及存储介质
业务流程生成方法 关键词 序列 实时系统 文本识别
3
一种机油泵电机角度补偿方法
角度补偿方法 机油泵 两相静止坐标系 同步电机矢量控制 机械
4
模型训练、文本内容识别方法、装置、设备及介质
风险 模板 内容识别方法 冗余 大语言模型
5
一种基于RFM模型的用户运营转化方法及系统
RFM模型 转化方法 语义分析模型 强度 计算机存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号