摘要
本申请实施例公开了一种控制方法、训练方法、控制组件及机器人,其中,所述控制方法应用于机器人,所述控制方法包括:基于机器人所处的环境图像确定针对待交互对象的第一交互位姿;基于上一个时间步的输出指令和所述第一交互位姿,生成当前时间步的拼接特征;将当前时间步的拼接特征和至少一个历史时间步的拼接特征输入训练后的属性预测模块,得到属性特征;所述属性特征用于表征所述待交互对象的与影响交互相关的属性数据;将所述属性特征和所述当前时间步的拼接特征,输入训练后的强化学习模块,得到当前时间步的输出指令。这样,强化学习模块能够更好地理解物体的内在特性,在处理未见过的物体时具有较高的泛化能力。
技术关键词
控制机器人运动
指令
控制组件
仿真环境
编码模块
交互设备
样本
彩色图像
生成机器人
交互动作
对象识别
矩阵
能量消耗
点云
平滑度
系统为您推荐了相关专利信息
嵌入特征
情绪识别模型
MFCC特征
音频
计算机程序指令
装配特征信息
装配部件
图像捕获装置
移动装置
计算机执行指令
关键视觉信息
图像生成模型
图文
主题关键词
风格