摘要
一种数据扩展方法,包括:获取待扩展的数据集,并构建对所述数据集进行数据扩展的流水线任务;其中,所述数据集用于对与LLM相关的目标服务进行评估测试;流水线任务包括按照顺序执行的多个子任务;多个子任务包括用于提取所述数据集中的数据样本中包含的关键数据片段的第一子任务;以及,用于基于关键数据片段对所述数据集中的数据样本进行同语义改写的第二子任务;响应于触发执行所述流水线任务的请求,执行所述第一子任务,提取所述数据集中的数据样本中包含的关键数据片段;响应于所述第一子任务执行完毕,进一步执行所述第二子任务,基于所述关键数据片段对所述数据集中的数据样本进行同语义改写,以得到与所述数据集对应的扩展数据集。
技术关键词
样本
语义
数据扩展方法
流水线
自然语言
数据扩展装置
命名实体识别
模板
计算机程序产品
处理器
答案
计算机设备
标记
关键词
存储器
模块
指令
系统为您推荐了相关专利信息
测试特征
待测元素
训练特征
一元线性回归方法
矿石