摘要
本申请公开了一种基于强化学习的能耗时序预测方法、设备及介质,方法包括:对行业基础模型的超参数进行随机初始化,并获取LoRA微调产生的损失和趋势;将超参数、损失和趋势作为当前状态信息,并将当前状态信息输入到预先构建的强化学习智能体中的价值网络中,以通过价值网络,输出当前状态信息对应的当前状态价值;通过策略网络确定当前状态对应的随机动作;根据执行随机动作产生的奖励值对策略网络进行迭代优化,直至得到优化完成的策略网络,通过优化完成的策略网络,采样得到超参数调整值;通过超参数调整值对行业基础模型进行微调,得到目标能耗预测模型,将采集的能耗时序数据输入到能耗预测模型中,输出对应的能耗预测值。
技术关键词
时序预测方法
能耗预测模型
超参数
网络
策略
概率分布函数
非易失性计算机存储介质
计算机可执行指令
基础
微调技术
退火算法
数据
传播算法
处理器通信
存储器
因子
系统为您推荐了相关专利信息
智能移动平台
人体特征
采集环境参数
舒适度
监测机器人
无人机机场
电力线路巡检
选址方法
TOPSIS算法
贪心策略
高精密数控
轴承热处理工艺
深度学习模型训练
热处理工艺参数
关键工艺参数
医学图像分割方法
注意力编码器
融合特征
解码器
医学影像数据
知识抽取方法
网络安全威胁
预训练模型
网络安全分析
前馈神经网络