一种基于近端策略优化的粒子群算法自适应参数控制方法

正文

推荐专利

申请号：CN202510897183

申请日期：2025-07-01

公开号：CN120851069A

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种基于近端策略优化的粒子群算法自适应参数控制方法，包括：S1：初始化；S2：根据粒子群参数状态为子群选择参数动作，更新子群粒子速度与位置，评估每个粒子新位置的适应度值；S3：周期性地执行精英粒子迁移策略，依据全局最优适应度计算奖励信号；S4：将交互过程中所产生的状态、动作、奖励和新状态作为经验元组存储于经验缓冲区内；S5：当所述经验缓冲区内的数据量达到预设阈值时，使用缓冲区中的数据执行PPO算法更新，训练策略网络和价值网络；S6：循环执行S2‑S5，直至预设的最大评估次数，输出当前所获得的全局最优解及其对应的适应度值。本发明具有对不同问题和不同优化阶段的高度自适应能力。

技术关键词

参数控制方法粒子群算法策略网络 Softmax函数因子粒子群优化算法速度比率超参数决策索引数据轨迹社会时序信号

一种基于近端策略优化的粒子群算法自适应参数控制方法

站点导航

APP 下载