摘要
本公开提供了一种基于多模态大模型的表格处理方法及装置、电子设备,涉及人工智能领域。该方法包括:采用预先训练好的视觉编码器对表格图像进行处理,得到表格图像的视觉数据单元,其中,视觉编码器是采用自监督对比学习方法训练得到的;将视觉数据单元以及文本数据单元输入至大语言模型,对表格图像中的表格进行处理,其中,文本数据单元用于记录采用大语言模型对表格进行处理的任务信息。本公开解决了现有的多模态大模型对复杂表格的解析效果较差的技术问题。
技术关键词
表格
大语言模型
学习方法
视觉
多模态
文本
数据
解码器
样本
锚点
电子设备
特征提取模块
计算机程序产品
处理器
复杂度
图像处理
可读存储介质
存储器
语义
系统为您推荐了相关专利信息
轧制方法
齿轮钢
大规格
独立冷却系统
多角度环形光源
无畸变图像
运动感知模块
速度传感器
代表
线阵工业
交互数据处理方法
语音点歌
序列
多模态
噪声强度
融合特征
语义分割方法
点云特征
激光点云数据
多模态传感器