摘要
本申请公开了一种针对PDF文档的转化装置、方法、存储介质及计算机设备。该装置包括数据处理模块将PDF文档转化为待处理图像以及获取内嵌图像的原始图像数据;版面解析模块对待处理图像执行区域划分,确定PDF文档的文本区域、公式区域和表格区域;第一识别模块对文本区域、公式区域和表格区域分别进行内容识别生成文本识别结果、公式识别结果以及表格识别结果;第二识别模块基于原始图像数据生成图像识别结果;语义解析模块通过大语言模型生成文本识别结果、公式识别结果、表格识别结果和图像识别结果的语义表示;演示文稿生成模块将获取的识别结果和语义表示映射到演示文稿模版生成最终演示文稿。可以提高基于PDF文档生成演示文稿的准确性和内容丰富度。
技术关键词
转化装置
文本识别
原始图像数据
表格
图像编码数据
大语言模型
数据处理模块
识别模块
转换方法
语义
内存
计算机设备
像素矩阵
多模态
关系
格式
模版
系统为您推荐了相关专利信息
业务流程生成方法
关键词
序列
实时系统
文本识别
角度补偿方法
机油泵
两相静止坐标系
同步电机矢量控制
机械
RFM模型
转化方法
语义分析模型
强度
计算机存储介质