摘要
本发明公开了一种语言模型动态结构化高效微调方法及电子设备,其中方法包括:获取需要微调的自然语言模型;获取自然语言下游任务的数据集,设计提示语句,用于引导模型理解下游任务;采用数据集和提示语句对自然语言模型进行微调;其中,微调过程中包括:使用零阶优化方法更新模型的参数;使用结构化剪枝方案调整前向传播过程;使用遗传算法和随机选择方法动态调整剪枝结构;使用强化学习策略决定探索或者执行最佳的剪枝方案。本发明引入了结构化剪枝、强化学习和遗传算法来解决零阶优化过程计算开销大、训练时间长的问题。本发明可以在维持模型表现的前提下降低零阶优化在所有模型和任务上的计算开销,可广泛应用于自然语言模型微调领域。
技术关键词
微调方法
自然语言模型
遗传算法
强化学习策略
贪心策略
更新模型参数
随机梯度下降
动态
贪心算法
编码器结构
解码器结构
人工智能神经网络
电子设备
语句
注意力
级联
因子
系统为您推荐了相关专利信息
新能源发电功率
参数寻优方法
遗传算法
阶段
因子
决策支持系统
智能化运维
设备运行状态
数据采集层
数据质量检查
短期负荷预测模型
非暂态计算机可读存储介质
储能系统
配电网负荷预测技术
短期负荷预测系统