摘要
本说明书实施例披露一种数据价值评估方法及装置。该方法包括以下步骤:首先,接收评估目标数据集在若干领域下价值的评估请求;接着,通过解析所述评估请求,确定预训练后的大语言模型在所述目标数据集上的第一梯度数据;然后,针对所述若干领域中的任一目标领域,获取所述大语言模型在该目标领域的支持集上的第二梯度数据;之后,基于所述第一梯度数据和第二梯度数据之间的内积,确定所述目标数据集在所述目标领域下的目标价值,归入所述评估请求的处理结果。如此,基于梯度内积追踪,能够在无需训练的情况下,准确且高效地估计不同领域下的数据价值分布。对于多个数据提供方同时存在的场景,可以将梯度追踪机制与Shapley值理论相结合,实现高效评估。
技术关键词
大语言模型
数据价值评估方法
评估装置
样本
可信平台
解析单元
计算机
内存
可读存储介质
存储器
处理器
机制
理论
场景
指令
系统为您推荐了相关专利信息
语音识别模型
音频特征数据
唤醒词识别方法
命令词识别方法
智能眼镜
融合语义分割
变化检测模型
地理实体
异常检测方法
面状
企业风险评估
风险评估测试
样本
模型训练方法
指标
手语翻译方法
语义
层级
视觉特征
交叉注意力机制