一种样本优选方法、装置、终端设备及介质

AITNT
正文
推荐专利
一种样本优选方法、装置、终端设备及介质
申请号:CN202411063230
申请日期:2024-08-05
公开号:CN118981648B
公开日期:2025-02-07
类型:发明专利
摘要
本发明提供了一种样本优选方法、装置、终端设备及介质,其样本优选方法包括:确定目标模型,获取训练数据;按照大语言模型针对训练数据依次进行标准化处理和向量化处理,然后基于训练数据向量信息针对训练样本进行聚类分析,并按照聚类分析结果选取类别代表,得到初始示例样本,确定初始示例样本集合;针对初始示例样本集合进行Shapley近似计算,并按照Shapley近似值进一步筛选,得到优选样本。本发明采用了Shapley近似计算进行样本优选,考量了示例之间相互作用对模型效果的潜在影响,使得优选样本能够更好的引导模型正确响应的提示,提高大语言模型性能,同时还能够减少Shapley计算,提高Shapley计算效率。
技术关键词
样本 标准化模板 大语言模型 计算机可读指令 序列 初始聚类中心 代表 数值 数据获取模块 对象 终端设备 文本 元素 可读存储介质 聚类特征 处理器
系统为您推荐了相关专利信息
1
语音数据处理方法、装置、设备、介质和产品
语音数据处理方法 车机 文本 语音数据处理装置 人工智能AI模型
2
一种无人机开集识别方法及系统
重构误差 开集识别方法 光学图像数据 无人机 极值
3
一种羊肉水分含量检测方法、装置、介质及产品
水分含量检测方法 羊肉 筛选预处理方法 反射率 连续投影算法
4
一种模型训练、对象识别方法及装置
图像块特征 对象识别模型 文本 转换器 视觉
5
一种摔倒识别方法、装置、系统与存储介质
摔倒识别方法 姿态检测模型 大语言模型 云端 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号