摘要
本发明涉及四足机器人技术领域,具体提供一种基于强化学习的步态学习方法、系统、设备及存储介质,包括:收集历史专家策略执行过程中产生的多种状态作为初始化状态;利用预构建的深度强化学习模型,基于所述初始化状态执行步态学习,得到步态控制策略。本发明丰富了深度强化学习模型的初始状态,提升了学习得到的步态控制策略的适应性。
技术关键词
深度强化学习模型
样本
学习方法
控制策略
邻域
数据收集模块
核心
四足机器人技术
对象
可读存储介质
学习系统
队列
程序
度量
聚类
存储单元
周期
速度
系统为您推荐了相关专利信息
事件抽取方法
语义依存分析
文本编码器
预训练语言模型
标注工具
折叠关节
双层卷积神经网络
电信号
膜结构
二阶低通滤波器
模型训练方法
商品识别方法
识别模型训练
训练集
样本
云团
计算机可执行指令
数据处理方法
关系预测模型
矩阵
分割方法
计算机可读指令
染色
图像
canny算法