摘要
本发明公开了一种基于Ray的轻量级分布式强化学习训练平台的设计方法,包括获取原始数据流集合,构建拓扑特征表示,进行动态平滑处理,生成稳定化特征表示;计算信息保持率和拓扑保持度,构建状态流形和切空间和优先级队列,更新经验池;采集策略参数和梯度,计算Karcher均值并进行动量修正,构建参数流形分层结构和层间映射,优化参数结构;构建知识图谱,进行结构化剪枝和量化优化,得到最终压缩模型参数;构建负载分配矩阵,生成初始参数分布方案并进行迭代优化,构建负载均衡目标函数,生成任务调度策略,最终部署配置。本发明有效地减少数据处理的复杂度,提高计算效率,通过多种自动化优化减少了对开发人员手动调整的需求。
技术关键词
分布式强化学习
拓扑特征
压缩特征
任务调度策略
参数
构建知识图谱
节点
指标
度量
敏感度矩阵
复杂度
Hessian矩阵
拉普拉斯
特征值
平台
时序
分布式模型