摘要
本公开涉及一种基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质,该方法包括:根据目标自然语言处理任务对应的样本数据集,确定初始大语言模型中任意两个相邻网络层之间的网络层相似度;根据初始大语言模型中任意两个相邻网络层之间的网络层相似度,构建初始大语言模型对应的子模型;根据样本数据集对子模型进行训练,确定训练后的子模型;根据训练后的子模型对应的模型参数对初始大语言模型进行调整,确定具备处理目标自然语言处理任务的能力的目标大语言模型。通过本公开实施例,可以利用网络层相似度有针对性地进行网络层选择,构建子模型以用于初始大语言模型的微调,可以保护用户数据和模型参数隐私,并提高模型微调效率。
技术关键词
大语言模型
自然语言
输出特征
微调方法
非易失性计算机可读存储介质
样本
计算机程序指令
数据
索引
参数
代表
模型训练模块
电子设备
聚类方法
微调装置
处理器
令牌
分析方法
分析模块