文本评测集的构建方法、构建装置、电子设备及介质

正文

推荐专利

申请号：CN202411743394

申请日期：2024-11-30

公开号：CN119670888A

公开日期：2025-03-21

类型：发明专利

摘要

本公开涉及文本评测集的构建方法、构建装置、电子设备及介质。所述方法可以通过收集原始基础文本信息，基于原始基础文本信息构建混淆文本信息；基于预设规则对所述原始基础文本信息中的公共信息进行修改，得到更新后的基础文本信息；将混淆文本信息随机置入所述更新后的基础文本信息中，得到扩展文本信息；利用大预言模型LLM算法对所述扩展文本信息和更新后的基础文本信息的格式和内容进行确认，当确认结果满足要求时，将所述扩展文本信息添加到所述文本评测集。本公开所述方法及相关设备能够支持256k tokens及以上长度的语言能力测试，提升对大语言模型等算法的长文本处理能力进行衡量的效率和准确性。

技术关键词

文本大语言模型基础格式电子设备可读存储介质预定算法处理器模块存储器计算机元素答案定义

系统为您推荐了相关专利信息

一种障碍物的定位方法、装置、电子设备及可读存储介质

车载雷达坐标系回波定位方法障碍物轮廓

一种用于保险服务的文本推理方法、装置、设备及介质

文本推理方法节点层级推理装置可读存储介质

定位请求的控制方法、装置、电子设备、存储介质及芯片

无线信标控制移动设备运动周期无线设备

工单的审核方法、装置、存储介质

审核模型审核方法样本误差处理器

基于领域泛化和图神经网络的多模态情感识别方法及系统

情感识别方法节点特征语音特征文本训练特征

文本评测集的构建方法、构建装置、电子设备及介质

站点导航

APP 下载