基于Ray的轻量级分布式强化学习训练平台的设计方法

AITNT
正文
推荐专利
基于Ray的轻量级分布式强化学习训练平台的设计方法
申请号:CN202411658542
申请日期:2024-11-20
公开号:CN119151019B
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种基于Ray的轻量级分布式强化学习训练平台的设计方法,包括获取原始数据流集合,构建拓扑特征表示,进行动态平滑处理,生成稳定化特征表示;计算信息保持率和拓扑保持度,构建状态流形和切空间和优先级队列,更新经验池;采集策略参数和梯度,计算Karcher均值并进行动量修正,构建参数流形分层结构和层间映射,优化参数结构;构建知识图谱,进行结构化剪枝和量化优化,得到最终压缩模型参数;构建负载分配矩阵,生成初始参数分布方案并进行迭代优化,构建负载均衡目标函数,生成任务调度策略,最终部署配置。本发明有效地减少数据处理的复杂度,提高计算效率,通过多种自动化优化减少了对开发人员手动调整的需求。
技术关键词
分布式强化学习 拓扑特征 压缩特征 任务调度策略 参数 构建知识图谱 节点 指标 度量 敏感度矩阵 复杂度 Hessian矩阵 拉普拉斯 特征值 平台 时序 分布式模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号