摘要
本申请提供一种图表问答数据集生成方法、设备及存储介质,所述方法包括:结合目标领域的论文的内容与所述论文中多个图表的信息,确定出与所述论文的研究结论之间相关性最高的图表为目标图表;通过结合论文的内容分析,在不仅仅依赖图像特征的相似性的情况下,提高图表选择的精准度,确保最终选出的图表对研究结论的支撑作用最大化。接着,基于所述目标图表与所述论文的研究结论之间的关联,生成所述目标图表对应的问答对;这不仅扩展了图表问答的应用范围,还能够深入挖掘图表中的信息,确保图表选择和问答生成的科学性和准确性,基于多个所述问答对,创建所述目标领域的图表问答数据集,支持科研人员更全面的分析。
技术关键词
图表
论文
生成方法
大语言模型
生成程序
摘要
答案
数据
图像提取技术
可读存储介质
处理器
计算机设备
存储器
系统为您推荐了相关专利信息
检测报告生成方法
异构
数据集成中间件
缺失值填补方法
机器学习模型
内容展示方法
设备运行数据
电子
画像
生成提示词