摘要
本公开涉及文本评测集的构建方法、构建装置、电子设备及介质。所述方法可以通过收集原始基础文本信息,基于原始基础文本信息构建混淆文本信息;基于预设规则对所述原始基础文本信息中的公共信息进行修改,得到更新后的基础文本信息;将混淆文本信息随机置入所述更新后的基础文本信息中,得到扩展文本信息;利用大预言模型LLM算法对所述扩展文本信息和更新后的基础文本信息的格式和内容进行确认,当确认结果满足要求时,将所述扩展文本信息添加到所述文本评测集。本公开所述方法及相关设备能够支持256k tokens及以上长度的语言能力测试,提升对大语言模型等算法的长文本处理能力进行衡量的效率和准确性。
技术关键词
文本
大语言模型
基础
格式
电子设备
可读存储介质
预定算法
处理器
模块
存储器
计算机
元素
答案
定义