摘要
本公开提供了基于大语言模型的图表结构化方法、模型训练方法及装置,涉及自然语言处理、大语言模型、深度学习等人工智能技术领域,可应用于金融、教育和研究等领域。具体实现方案为:获取待处理的图表和文本提示词;利用大语言模型对图表和文本提示词进行处理,得到大语言模型输出的预测Token(词元)向量序列;大语言模型用于基于图表和文本提示词预测匹配的Token向量序列;对预测Token向量序列进行解码处理,得到文本描述信息和用于将图表转换为结构化数据所使用的特定字符;基于特定字符,将文本描述信息转化为结构化数据。本公开实施例可以自动化地从图表中提取数据,提高了数据处理的速度和准确性,便于进一步的数据处理和分析。
技术关键词
大语言模型
图表
预训练语言模型
文本
结构化方法
序列
数据
视觉特征
字符
融合特征
模型训练方法
多模态
标签
结构化装置
处理器
人工智能技术
分类器
计算机程序产品
模块