摘要
本申请提供一种评测数据集生成方法、装置及存储介质,涉及人工智能技术领域,用于根据原始文本生成问题以及回答该问题需要参考的目标文本及副本文本,增加了与问题相关的文本的数量,副本文本与原始文本融合得到的增强文本可以更深层次的考察人工智能模型的性能。该方法包括:获取原始文本,并将原始文本拆分为多个子文档,并确定每个子文档对应的问题及问题的答案;针对每个子文档,从子文档中提取与问题的答案相关的目标文本,并对目标文本进行修改,得到子文档对应的多个副本文本;基于所述原始文本、所述多个子文档对应的所述多个问题及所述多个副本文本,得到评测数据集。
技术关键词
文本
副本
生成方法
答案
计算机程序指令
拆分规则
计算机程序产品
处理单元
数据
通信单元
人工智能模型
处理器
可读存储介质
人工智能技术
存储器
生成装置
电子设备
语义
系统为您推荐了相关专利信息
自动生成方法
配电网拓扑结构
单线
变压器
箱式变电站
视频
深度学习模型
动作定位方法
多模态
文本特征向量