摘要
本申请提供了一种人形机器人控制方法、系统以及人形机器人,其中,该方法包括:获取任务指令以及视野图像;将视野图像以及任务指令输入视觉语言感知模型,得到目标物体的三维坐标;获取提示词,并将提示词以及三维坐标输入任务规划器,确定提示词对应的控制信息;通过臂控制模块控制人形机器人的臂部运动,并通过手控制模块控制人形机器人的手部运动,并通过主体控制模块控制人形机器人的腿部运动。本申请能够将视觉感知、语言理解、任务规划、运动控制等多个模块集成到一个统一的框架中,实现了从感知到执行的端到端控制,提高了人形机器人控制过程的集成度,增强了机器人在复杂环境中的适应能力,提高了人形机器人控制过程的透明度和可信度。
技术关键词
强化学习策略
运动控制系统
编码模块
控制模块
人形机器人控制
视野
指令
规划
图像编码
解码模块
大语言模型
坐标
文本
视觉
系统为您推荐了相关专利信息
行李搬运系统
行李传送装置
行李车
计算机视觉
图像采集设备
冷却液
电子节温器
发动机冷却系统
散热器
电控硅油风扇离合器总成
证券交易系统
流量控制系统
流量控制模块
速率
漏桶算法
非视觉特征
GRU模型
视觉特征提取
意图预测方法
融合特征