基于增强学习的大模型参数优化与自适应调整方法及装置

AITNT
正文
推荐专利
基于增强学习的大模型参数优化与自适应调整方法及装置
申请号:CN202510682792
申请日期:2025-05-26
公开号:CN120597935A
公开日期:2025-09-05
类型:发明专利
摘要
本发明涉及大模型优化技术领域,公开了基于增强学习的大模型参数优化与自适应调整方法及装置,方法包括:获取目标大模型的当前运行状态,结合数据特征对目标大模型的运行状态进行综合评估,得到运行状态向量;构建智能体,并将运行状态向量输入智能体,得到参数优化策略;基于参数优化策略对目标大模型的参数进行优化,得到优化大模型;利用奖励函数计算优化大模型的多个预设指标,作为奖励结果;基于奖励结果自适应调整智能体的参数。大模型在训练及实际应用中,借助智能体动态调整大模型参数,确保训练初期能够快速收敛,后期能精准逼近全局最优解,有效提升训练效率与质量,借助奖励机制,使智能体自适应调整参数,提高大模型的泛化能力。
技术关键词
参数 策略 指标 网络 模型优化技术 数据 成分分析法 可读存储介质 层次分析法 指令 计算机程序产品 动态 存储器 速度 处理器 计算机设备 模块 批量 内存
系统为您推荐了相关专利信息
1
一种乳粉干燥塔内壁结焦区域图像识别方法及系统
条件随机场模型 BRDF模型 区域图像识别 编码器 干燥塔
2
文本识别模型的训练方法、装置、电子设备及介质
文本识别模型 图片 融合特征 字符 训练集
3
一种引入了拓扑变量的移动可变形组件优化方法
可变形组件 变量 结构拓扑优化 节点 坐标
4
web应用的网络弹性测评方法、装置、产品及设备
弹性测评方法 仿真环境 现网环境 网络 动态
5
一种多障碍环境下有向视频传感器网络覆盖优化方法及系统
网络覆盖优化方法 多障碍环境 传感器节点 虚拟势场 障碍物
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号