摘要
本发明提供了一种样本优选方法、装置、终端设备及介质,其样本优选方法包括:确定目标模型,获取训练数据;按照大语言模型针对训练数据依次进行标准化处理和向量化处理,然后基于训练数据向量信息针对训练样本进行聚类分析,并按照聚类分析结果选取类别代表,得到初始示例样本,确定初始示例样本集合;针对初始示例样本集合进行Shapley近似计算,并按照Shapley近似值进一步筛选,得到优选样本。本发明采用了Shapley近似计算进行样本优选,考量了示例之间相互作用对模型效果的潜在影响,使得优选样本能够更好的引导模型正确响应的提示,提高大语言模型性能,同时还能够减少Shapley计算,提高Shapley计算效率。
技术关键词
样本
标准化模板
大语言模型
计算机可读指令
序列
初始聚类中心
代表
数值
数据获取模块
对象
终端设备
文本
元素
可读存储介质
聚类特征
处理器
系统为您推荐了相关专利信息
语音数据处理方法
车机
文本
语音数据处理装置
人工智能AI模型
重构误差
开集识别方法
光学图像数据
无人机
极值
水分含量检测方法
羊肉
筛选预处理方法
反射率
连续投影算法
摔倒识别方法
姿态检测模型
大语言模型
云端
数据