摘要
本申请提供一种运动控制模型训练方法、运动控制方法、设备及介质,涉及人工智能技术领域。该方法包括:获取模拟仿真环境中的第一扫描点信息、第二扫描点信息以及第一感知信息;根据第一扫描点信息和第一感知信息,采用教师模型预测第一动作信息;根据第二扫描点信息和第一感知信息,采用学生模型基于新策略预测第二动作信息;根据第一动作信息和第二动作信息计算第一训练损失;根据第二动作信息和第三动作信息计算第二训练损失,第三动作信息为学生模型在前一训练轮次采用旧策略生成的动作信息;根据第一训练损失和第二训练损失,对学生模型的策略进行训练,得到目标机器人的运动控制模型。本申请可以提高运动控制模型在现实场景中的表现。
技术关键词
运动控制模型
人形机器人
感知特征
运动控制方法
仿真环境
历史感知信息
地形特征
高程地图
学生
关节
三维点云数据
策略
特征提取模块
教师
处理器
人工智能技术
生成动作
电子设备
可读存储介质
系统为您推荐了相关专利信息
三元组损失函数
注意力
感知特征
计数方法
计数系统
絮凝设备
仿真环境
仿真系统
砂石废水处理系统
对象
连杆驱动机构
灵巧手指
三角连接件
摆动件
主连杆
激光雷达数据
地理信息系统数据
融合特征
巡查方法
无人机