摘要
本申请公开了一种机器人控制方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,方法包括:响应于控制指令,通过预先构建的环境动力学适应模型对机器人进行控制,所述环境动力学适应模型是基于对抗的连续动力学域对齐强化学习框架训练得到的,本申请考虑到动力学参数是连续值,并提取动力学参数连续变化中的规律对机器人进行控制。
技术关键词
强化学习模型
机器人控制方法
编码器
强化学习框架
网络
计算机程序产品
策略
轨迹
学生
机器人控制设备
教师
机器人控制模块
机器人控制装置
对抗性
参数
强化学习算法
数据
人工智能技术
处理器
系统为您推荐了相关专利信息
补偿拓扑结构
光纤定位系统
生成特征向量
避障路径
监测环境数据
时间序列预测模型
策略
移动平均算法
强化学习方法
关键词
空间金字塔池化
特征提取模块
全局平均池化
交互特征
通道