无模型强化学习算法的分布式数据处理方法、设备及介质

正文

推荐专利

申请号：CN202510082755

申请日期：2025-01-20

公开号：CN119903895B

公开日期：2025-10-10

类型：发明专利

摘要

本申请涉及无模型强化学习算法的分布式数据处理方法、设备及介质，首先根据强化学习算法训练过程中的任务类型，封装不同任务级别的角色，然后定义各角色之间的通信拓扑结构，实现分布式通信模式的基本计算单元组，进而对基本计算单元组进行扩展，根据选定的聚合、分发策略，预设模型的聚合和分发方式，最后根据既定规则进行全局参数自适应适配和任务调度，直至训练完毕。其将单一算法训练拓展演变至大规模分布式训练，从原来单一的串行计算，通过分离计算组件，抽象为任务角色单独计算，通过角色任务分工以及拓展角色数量达到快速积累以及探索样本的目的，并将各训练任务并行执行，能够大幅提高整体样本生产和训练效率。

技术关键词

强化学习算法学习器接口通信拓扑结构分发策略任务调度分布式训练初始化算法样本参数数据吞吐量权重策略可读存储介质通信结构处理器节点存储器

系统为您推荐了相关专利信息

网络连通方法、装置、电子设备、芯片、存储介质及计算机程序产品

集群网络连通方法关节点模式计算机程序产品

可对外供电的外骨骼机器人

外骨骼机器人电池包控制模块接口校验模块

一种基于大数据的心理健康评估系统

心理健康评估系统数据处理模块数据采集模块大数据时间滑动窗口

GUI程序模糊测试方法、系统、计算机设备和存储介质

程序模糊测试方法虚拟机监控器 KVM虚拟机代码库控制面板

基于浏览器的敏锐感知网络状态的人机交互方法及系统

人机交互方法识别用户身份标识符速度形式呈现给用户

无模型强化学习算法的分布式数据处理方法、设备及介质

站点导航

APP 下载