一种语言模型动态结构化高效微调方法及电子设备

AITNT
正文
推荐专利
一种语言模型动态结构化高效微调方法及电子设备
申请号:CN202510083046
申请日期:2025-01-20
公开号:CN119962581B
公开日期:2025-10-24
类型:发明专利
摘要
本发明公开了一种语言模型动态结构化高效微调方法及电子设备,其中方法包括:获取需要微调的自然语言模型;获取自然语言下游任务的数据集,设计提示语句,用于引导模型理解下游任务;采用数据集和提示语句对自然语言模型进行微调;其中,微调过程中包括:使用零阶优化方法更新模型的参数;使用结构化剪枝方案调整前向传播过程;使用遗传算法和随机选择方法动态调整剪枝结构;使用强化学习策略决定探索或者执行最佳的剪枝方案。本发明引入了结构化剪枝、强化学习和遗传算法来解决零阶优化过程计算开销大、训练时间长的问题。本发明可以在维持模型表现的前提下降低零阶优化在所有模型和任务上的计算开销,可广泛应用于自然语言模型微调领域。
技术关键词
微调方法 自然语言模型 遗传算法 强化学习策略 贪心策略 更新模型参数 随机梯度下降 动态 贪心算法 编码器结构 解码器结构 人工智能神经网络 电子设备 语句 注意力 级联 因子
系统为您推荐了相关专利信息
1
一种基于遗传算法的新能源发电功率参数寻优方法和相关装置
新能源发电功率 参数寻优方法 遗传算法 阶段 因子
2
一种光伏电站智能化运维决策支持系统
决策支持系统 智能化运维 设备运行状态 数据采集层 数据质量检查
3
面向无人集群抗干扰通信的可用链路智能预测与最优选择方法
功率 链路 变异策略 遗传算法求解 时序特征
4
一种基于遗传算法的增亮膜中心波长优化方法及电子设备
遗传算法 波长 多层膜 矩阵 参数
5
一种配电网短期负荷预测方法及系统
短期负荷预测模型 非暂态计算机可读存储介质 储能系统 配电网负荷预测技术 短期负荷预测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号