摘要
本发明公开一种数据构造方法、装置、电子设备和存储介质,涉及人工智能技术领域。方法包括:为预先确定的每个图表类型各自构建一个原始图表数据集;针对任一原始图表数据集,为原始图表数据集中每个图表图片各自构建一个用于生成图表图片的代码程序;对每个代码程序进行修改扩增处理,并基于修改扩增处理后的代码程序生成新图表图片;根据新图表图片更新原始图表数据集,使更新后原始图表数据集中图表图片数量等于预设的图表数量需求阈值;通过多模态大语言模型,根据更新后原始图表数据集中的图表图片,构建用于训练模型图表理解能力的图表理解指令数据。本发明提高了图表理解指令数据的构建效率,且构建的各类图表理解指令数据的数量均衡。
技术关键词
图片
大语言模型
数据构造方法
多模态
指令
绘图工具
指标
样式
电子设备
可读存储介质
生成图表
文本
人工智能技术
计算机程序产品
处理器通信
系统为您推荐了相关专利信息
医疗影像数据处理
标签
多模态
影像数据处理系统
影像数据处理技术
硫化设备
橡胶地板
报警系统
机器学习分类器
模块
骨骼节点信息
手势模型库
图像
控制显示设备
手势控制
信号线
有效载荷数据
报文
统一诊断服务
校验算法
高精度定位系统
水下机器人
定位子系统
集群
多源融合