摘要
本发明涉及一种基于动态神经符号距离场的机器人感知与控制方法和系统,方法包括:获取机器人的各个原始网格文件;根据网格文件构建整体机器人,并进行随机采样,计算采样点到每个机器人关节处的SDF真实值,并进行拟合,得到静态神经符号距离场;采样机器人的关节位置,得到前向运动学结果作为输入,对静态神经符号距离场进行蒸馏,得到动态神经符号距离场;利用强化学习技术对机器人进行训练,使用动态神经符号距离场作为外部感知输入,以关节角度作为机器人的输出,训练得到教师策略;对教师策略进行蒸馏,得到学生策略,用于进行机器人的运动控制。与现有技术相比,本发明具有实现了碰撞情况的提前预判、控制准确、处理效率高等优点。
技术关键词
符号
机器人关节
采样机器人
动态
教师
网格
仿真器
策略
误差函数
深度强化学习技术
蒸馏
模仿学习方法
多层感知机
门控循环网络
坐标系
采样点
监督学习方法
系统为您推荐了相关专利信息
多源遥感图像
融合特征
图谱
自动编码器
图像像素
服务器系统
速率切换方法
端口
SPI接口
SPI总线