文档图像还原及多模态大模型训练方法和装置

正文

推荐专利

申请号：CN202410867247

申请日期：2024-06-28

公开号：CN118823798A

公开日期：2024-10-22

类型：发明专利

摘要

本公开提供了文档图像还原及多模态大模型训练方法和装置，涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括：获取待处理的目标文档图像；将目标文档图像作为多模态大模型的输入，得到输出的第一文件，第一文件为符合预定表示格式的超文本标记语言文件；根据第一文件生成作为还原结果的第二文件，第二文件为可编辑的文件，且第二文件中包括目标文档图像中的文档内容。

技术关键词

超文本标记语言表格坐标样本大语言模型多模态语义特征图像编码器标签模型训练方法矫正格式图像特征提取模型训练模块图像获取模块图像还原装置图像还原方法

系统为您推荐了相关专利信息

基于人工智能的森林资源量的估算方法和装置

机器学习模型数据点云训练样本集可读存储介质

一种用于产品3D打印模型设计的数据处理方法

数据处理方法特征值聚类分层立体

一种基于Ricci曲率加权的蛋白质-配体对接方法

配体对接方法口袋输入端数据编码

一种基于改进U-Net的宫颈TCT图像的细胞分割方法

细胞分割方法宫颈图像分割模型形态学特征结构编码器

数据模型处理方法、装置、设备及存储介质

感兴趣样本标签异常数据更新模型参数

文档图像还原及多模态大模型训练方法和装置

站点导航

APP 下载