基于Ray的轻量级分布式强化学习训练平台的设计方法

正文

推荐专利

申请号：CN202411658542

申请日期：2024-11-20

公开号：CN119151019B

公开日期：2025-01-24

类型：发明专利

摘要

本发明公开了一种基于Ray的轻量级分布式强化学习训练平台的设计方法，包括获取原始数据流集合，构建拓扑特征表示，进行动态平滑处理，生成稳定化特征表示；计算信息保持率和拓扑保持度，构建状态流形和切空间和优先级队列，更新经验池；采集策略参数和梯度，计算Karcher均值并进行动量修正，构建参数流形分层结构和层间映射，优化参数结构；构建知识图谱，进行结构化剪枝和量化优化，得到最终压缩模型参数；构建负载分配矩阵，生成初始参数分布方案并进行迭代优化，构建负载均衡目标函数，生成任务调度策略，最终部署配置。本发明有效地减少数据处理的复杂度，提高计算效率，通过多种自动化优化减少了对开发人员手动调整的需求。

技术关键词

分布式强化学习拓扑特征压缩特征任务调度策略参数构建知识图谱节点指标度量敏感度矩阵复杂度 Hessian矩阵拉普拉斯特征值平台时序分布式模型

基于Ray的轻量级分布式强化学习训练平台的设计方法

站点导航

APP 下载