摘要
本发明公开了一种基于大语言模型的表格问答数据生成方法、设备、介质,包括:获取表格问答数据集作为种子数据集;针对表格数据生成的每次迭代,从种子数据集中采样一表格数据;将该表格数据以及问题改写方向填入提示词模板,通过大语言模型改写该表格数据的原始问题,得到改写问题;对表格数据进行采样或扩增;将改写问题以及经采样或扩增后的表格数据输入至大语言模型中生成模型响应,将该模型响应作为改写问题对应的改写答案;对改写答案进行质量检验;将通过质量检验的改写答案以及改写问题作为更新的表格数据;对更新的表格数据进行增强,将增强后的表格数据添加至下一次迭代的种子数据集中,经迭代得到表格问答数据生成结果。
技术关键词
问答数据生成方法
表格
大语言模型
答案
有向无环图
种子
模板
处理器
计算机程序产品
存储器
可读存储介质
节点
电子设备
指令
系统为您推荐了相关专利信息
负荷转供
评价指标体系
大语言模型
强化学习方法
变压器
电力设备监测系统
大语言模型
图像处理方式
画像
模块