基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质

AITNT
正文
推荐专利
基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质
申请号:CN202411697921
申请日期:2024-11-25
公开号:CN119647556A
公开日期:2025-03-18
类型:发明专利
摘要
本公开涉及一种基于网络层相似度的大语言模型微调方法、装置及电子设备和存储介质,该方法包括:根据目标自然语言处理任务对应的样本数据集,确定初始大语言模型中任意两个相邻网络层之间的网络层相似度;根据初始大语言模型中任意两个相邻网络层之间的网络层相似度,构建初始大语言模型对应的子模型;根据样本数据集对子模型进行训练,确定训练后的子模型;根据训练后的子模型对应的模型参数对初始大语言模型进行调整,确定具备处理目标自然语言处理任务的能力的目标大语言模型。通过本公开实施例,可以利用网络层相似度有针对性地进行网络层选择,构建子模型以用于初始大语言模型的微调,可以保护用户数据和模型参数隐私,并提高模型微调效率。
技术关键词
大语言模型 自然语言 输出特征 微调方法 非易失性计算机可读存储介质 样本 计算机程序指令 数据 索引 参数 代表 模型训练模块 电子设备 聚类方法 微调装置 处理器 令牌 分析方法 分析模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号