摘要
本发明提供了一种自然资源领域大模型评测集生成方法,方法包括基于数据分布模型和标注模型,通过统计推断获得数据集的标注质量分布;将核密度估计的核函数数量设为自然资源领域数据源数量,对标注质量分布进行展开近似,确定各核函数的中心和带宽;将各核函数中心作为无偏估计值,通过加权平均融合算法优化数据融合,获得数据集标注质量的融合估计值。本发明可以提升数据集标注质量的准确性和可靠性,为大模型评测集的生成提供高质量的数据支持。
技术关键词
数据分布
非标准
核密度估计模型
自然资源
噪声
生成方法
融合算法
样本
协方差矩阵
生成装置
处理器
可读存储介质
关系
存储器
电子设备
模块
计算机
系统为您推荐了相关专利信息
量子随机数发生器
FPGA芯片
超辐射发光二极管
光耦合器
数据采集模块
风险检测方法
聚类分析方法
高风险
长短期记忆网络
检测异常状态
员工
绩效管理方法
项目
绩效管理系统
马尔可夫链蒙特卡罗