摘要
本发明涉及一种基于大语言模型的复杂图表问答数据自动生成方法,包括使用大语言模型通过多阶段逐层细化的方式生成多领域的重大事件标题;使用大语言模型生成与每个标题和图表类型相关的非表格数值类数据;根据生成的复杂图表数据,使用编写的代码生成相应的图表图像,通过自定义的代码脚本,将数据转换为不同类型的图表图像;生成与图表数据相关的问答问题,涵盖简单理解题、中等复杂度题和高难度推理题,图表数据涵盖多种类型的问答问题,包括数据解读、趋势分析、因果关系推理,本发明通过生成内容涵盖多领域、多时期、多区域的复杂图表数据,提高了传统图表问答数据集的多样性和复杂性,有效提升了多模态学习模型在实际应用中的表现。
技术关键词
数据自动生成方法
大语言模型
图表
多阶段
主题集合
生成主题
控制点
图像
复杂度
时间段
多区域
脚本
表格
曲线
定义
数值
频率
时序
系统为您推荐了相关专利信息
动态构建方法
大语言模型
三元组
标记机制
两阶段提交协议