文档图像还原及多模态大模型训练方法和装置

AITNT
正文
推荐专利
文档图像还原及多模态大模型训练方法和装置
申请号:CN202410867247
申请日期:2024-06-28
公开号:CN118823798A
公开日期:2024-10-22
类型:发明专利
摘要
本公开提供了文档图像还原及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域。其中的方法可包括:获取待处理的目标文档图像;将目标文档图像作为多模态大模型的输入,得到输出的第一文件,第一文件为符合预定表示格式的超文本标记语言文件;根据第一文件生成作为还原结果的第二文件,第二文件为可编辑的文件,且第二文件中包括目标文档图像中的文档内容。
技术关键词
超文本标记语言 表格 坐标 样本 大语言模型 多模态 语义特征 图像编码器 标签 模型训练方法 矫正 格式 图像特征提取 模型训练模块 图像获取模块 图像还原装置 图像还原方法
系统为您推荐了相关专利信息
1
基于人工智能的森林资源量的估算方法和装置
机器学习模型 数据 点云 训练样本集 可读存储介质
2
一种用于产品3D打印模型设计的数据处理方法
数据处理方法 特征值 聚类 分层 立体
3
一种基于Ricci曲率加权的蛋白质-配体对接方法
配体 对接方法 口袋 输入端 数据编码
4
一种基于改进U-Net的宫颈TCT图像的细胞分割方法
细胞分割方法 宫颈 图像分割模型 形态学特征 结构编码器
5
数据模型处理方法、装置、设备及存储介质
感兴趣 样本 标签 异常数据 更新模型参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号