一种语言模型动态结构化高效微调方法及电子设备

正文

推荐专利

申请号：CN202510083046

申请日期：2025-01-20

公开号：CN119962581B

公开日期：2025-10-24

类型：发明专利

摘要

本发明公开了一种语言模型动态结构化高效微调方法及电子设备，其中方法包括：获取需要微调的自然语言模型；获取自然语言下游任务的数据集，设计提示语句，用于引导模型理解下游任务；采用数据集和提示语句对自然语言模型进行微调；其中，微调过程中包括：使用零阶优化方法更新模型的参数；使用结构化剪枝方案调整前向传播过程；使用遗传算法和随机选择方法动态调整剪枝结构；使用强化学习策略决定探索或者执行最佳的剪枝方案。本发明引入了结构化剪枝、强化学习和遗传算法来解决零阶优化过程计算开销大、训练时间长的问题。本发明可以在维持模型表现的前提下降低零阶优化在所有模型和任务上的计算开销，可广泛应用于自然语言模型微调领域。

技术关键词

微调方法自然语言模型遗传算法强化学习策略贪心策略更新模型参数随机梯度下降动态贪心算法编码器结构解码器结构人工智能神经网络电子设备语句注意力级联因子

系统为您推荐了相关专利信息

一种基于遗传算法的新能源发电功率参数寻优方法和相关装置

新能源发电功率参数寻优方法遗传算法阶段因子

一种光伏电站智能化运维决策支持系统

决策支持系统智能化运维设备运行状态数据采集层数据质量检查

面向无人集群抗干扰通信的可用链路智能预测与最优选择方法

功率链路变异策略遗传算法求解时序特征

一种基于遗传算法的增亮膜中心波长优化方法及电子设备

遗传算法波长多层膜矩阵参数

一种配电网短期负荷预测方法及系统

短期负荷预测模型非暂态计算机可读存储介质储能系统配电网负荷预测技术短期负荷预测系统

一种语言模型动态结构化高效微调方法及电子设备

站点导航

APP 下载