基于多模态大模型的表格处理方法及装置、电子设备

正文

推荐专利

申请号：CN202511078803

申请日期：2025-08-01

公开号：CN120894794A

公开日期：2025-11-04

类型：发明专利

摘要

本公开提供了一种基于多模态大模型的表格处理方法及装置、电子设备，涉及人工智能领域。该方法包括：采用预先训练好的视觉编码器对表格图像进行处理，得到表格图像的视觉数据单元，其中，视觉编码器是采用自监督对比学习方法训练得到的；将视觉数据单元以及文本数据单元输入至大语言模型，对表格图像中的表格进行处理，其中，文本数据单元用于记录采用大语言模型对表格进行处理的任务信息。本公开解决了现有的多模态大模型对复杂表格的解析效果较差的技术问题。

技术关键词

表格大语言模型学习方法视觉多模态文本数据解码器样本锚点电子设备特征提取模块计算机程序产品处理器复杂度图像处理可读存储介质存储器语义

系统为您推荐了相关专利信息

基于多模态最优噪声调度的分子生成方法和装置

噪声动态规划算法生成方法多模态参数

一种提高大规格齿轮钢晶粒度的轧制方法

轧制方法齿轮钢大规格独立冷却系统多角度环形光源

一种变速运动目标无畸变图像采集系统及方法

无畸变图像运动感知模块速度传感器代表线阵工业

基于多模态融合的语音点歌交互数据处理方法及系统

交互数据处理方法语音点歌序列多模态噪声强度

3D语义分割方法、装置及设备、计算机程序产品

融合特征语义分割方法点云特征激光点云数据多模态传感器

基于多模态大模型的表格处理方法及装置、电子设备

站点导航

APP 下载