基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质

正文

推荐专利

申请号：CN202411697921

申请日期：2024-11-25

公开号：CN119647556A

公开日期：2025-03-18

类型：发明专利

摘要

本公开涉及一种基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质，该方法包括：根据目标自然语言处理任务对应的样本数据集，确定初始大语言模型中任意两个相邻网络层之间的网络层相似度；根据初始大语言模型中任意两个相邻网络层之间的网络层相似度，构建初始大语言模型对应的子模型；根据样本数据集对子模型进行训练，确定训练后的子模型；根据训练后的子模型对应的模型参数对初始大语言模型进行调整，确定具备处理目标自然语言处理任务的能力的目标大语言模型。通过本公开实施例，可以利用网络层相似度有针对性地进行网络层选择，构建子模型以用于初始大语言模型的微调，可以保护用户数据和模型参数隐私，并提高模型微调效率。

技术关键词

大语言模型自然语言输出特征微调方法非易失性计算机可读存储介质样本计算机程序指令数据索引参数代表模型训练模块电子设备聚类方法微调装置处理器令牌分析方法分析模块

基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质

站点导航

APP 下载