基于大语言模型的图表结构化方法、模型训练方法及装置

正文

推荐专利

申请号：CN202411866666

申请日期：2024-12-17

公开号：CN119862246A

公开日期：2025-04-22

类型：发明专利

摘要

本公开提供了基于大语言模型的图表结构化方法、模型训练方法及装置，涉及自然语言处理、大语言模型、深度学习等人工智能技术领域，可应用于金融、教育和研究等领域。具体实现方案为：获取待处理的图表和文本提示词；利用大语言模型对图表和文本提示词进行处理，得到大语言模型输出的预测Token(词元)向量序列；大语言模型用于基于图表和文本提示词预测匹配的Token向量序列；对预测Token向量序列进行解码处理，得到文本描述信息和用于将图表转换为结构化数据所使用的特定字符；基于特定字符，将文本描述信息转化为结构化数据。本公开实施例可以自动化地从图表中提取数据，提高了数据处理的速度和准确性，便于进一步的数据处理和分析。

技术关键词

大语言模型图表预训练语言模型文本结构化方法序列数据视觉特征字符融合特征模型训练方法多模态标签结构化装置处理器人工智能技术分类器计算机程序产品模块

基于大语言模型的图表结构化方法、模型训练方法及装置

站点导航

APP 下载