摘要
本申请涉及无模型强化学习算法的分布式数据处理方法、设备及介质,首先根据强化学习算法训练过程中的任务类型,封装不同任务级别的角色,然后定义各角色之间的通信拓扑结构,实现分布式通信模式的基本计算单元组,进而对基本计算单元组进行扩展,根据选定的聚合、分发策略,预设模型的聚合和分发方式,最后根据既定规则进行全局参数自适应适配和任务调度,直至训练完毕。其将单一算法训练拓展演变至大规模分布式训练,从原来单一的串行计算,通过分离计算组件,抽象为任务角色单独计算,通过角色任务分工以及拓展角色数量达到快速积累以及探索样本的目的,并将各训练任务并行执行,能够大幅提高整体样本生产和训练效率。
技术关键词
强化学习算法
学习器
接口
通信拓扑结构
分发策略
任务调度
分布式训练
初始化算法
样本
参数
数据吞吐量
权重策略
可读存储介质
通信结构
处理器
节点
存储器
系统为您推荐了相关专利信息
心理健康评估系统
数据处理模块
数据采集模块
大数据
时间滑动窗口
程序模糊测试方法
虚拟机监控器
KVM虚拟机
代码库
控制面板
人机交互方法
识别用户身份
标识符
速度
形式呈现给用户