摘要
本申请涉及大语言模型技术领域,公开了一种大模型优化方法、装置、设备及存储介质,该方法包括:获取采样语料集合;基于数据相似度对采样语料集合中的语料样本进行数据压缩,得到数据集;基于所述数据集对大模型进行训练,得到优化后的大语言模型。本申请通过根据数据相似度进行数据压缩去除大语言模型训练数据中的冗余数据,有效提高了数据质量,进而通过压缩后的数据进行模型训练,有效提高了模型训练效率和模型性能。
技术关键词
模型优化方法
样本
数据压缩
大语言模型
优化设备
优化装置
聚类
矩阵
元素
程序
标签
处理器
索引
存储器
模块
冗余
系统为您推荐了相关专利信息
排卵试纸检测方法
预测对象位置
预测对象类别
融合特征
试纸检测装置
样本
评价方法
数据获取模块
评价系统
脊椎动物饲养技术