摘要
本申请提供一种测试数据集生成方法、装置、存储介质和计算机设备,该方法包括:根据不同科学领域下的科学研究文档,确定第一数据集;所述第一数据集中包括多条第一图表数据;确定每条第一图表数据在多个图表分析维度下的复杂性得分,并基于所述复杂性得分,确定所述第一数据集在所述多个图表分析维度下的复杂性分布;根据所述复杂性分布,对至少部分所述第一图表数据在各个图表分析维度下的复杂性得分进行条件采样,得到与所述复杂性分布相匹配的第二数据集;利用所述第二数据集中每条第二图表数据,生成对图表问答模型进行能力测试的测试数据集。
技术关键词
图表
问答模型
生成方法
计算机设备
生成训练数据
神经网络模型
处理器
数据分布
采样模块
生成装置
可读存储介质
图片
存储器
程序
刻度
视觉
图案