基于增强学习的大模型参数优化与自适应调整方法及装置

正文

推荐专利

申请号：CN202510682792

申请日期：2025-05-26

公开号：CN120597935A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及大模型优化技术领域，公开了基于增强学习的大模型参数优化与自适应调整方法及装置，方法包括：获取目标大模型的当前运行状态，结合数据特征对目标大模型的运行状态进行综合评估，得到运行状态向量；构建智能体，并将运行状态向量输入智能体，得到参数优化策略；基于参数优化策略对目标大模型的参数进行优化，得到优化大模型；利用奖励函数计算优化大模型的多个预设指标，作为奖励结果；基于奖励结果自适应调整智能体的参数。大模型在训练及实际应用中，借助智能体动态调整大模型参数，确保训练初期能够快速收敛，后期能精准逼近全局最优解，有效提升训练效率与质量，借助奖励机制，使智能体自适应调整参数，提高大模型的泛化能力。

技术关键词

参数策略指标网络模型优化技术数据成分分析法可读存储介质层次分析法指令计算机程序产品动态存储器速度处理器计算机设备模块批量内存

系统为您推荐了相关专利信息

一种乳粉干燥塔内壁结焦区域图像识别方法及系统

条件随机场模型 BRDF模型区域图像识别编码器干燥塔

文本识别模型的训练方法、装置、电子设备及介质

文本识别模型图片融合特征字符训练集

一种引入了拓扑变量的移动可变形组件优化方法

可变形组件变量结构拓扑优化节点坐标

web应用的网络弹性测评方法、装置、产品及设备

弹性测评方法仿真环境现网环境网络动态

一种多障碍环境下有向视频传感器网络覆盖优化方法及系统

网络覆盖优化方法多障碍环境传感器节点虚拟势场障碍物

基于增强学习的大模型参数优化与自适应调整方法及装置

站点导航

APP 下载