摘要
本公开属于机器人控制的技术领域,涉及一种控制机器人的方法、装置、介质及电子设备。该方法包括:获取机器人的三视图图片,并获取控制机器人的目标指令;将三视图图片输入至训练好的视觉模型中,以使训练好的视觉模型输出视觉向量;获取与目标指令对应的文本向量,并将视觉向量和文本向量输入至训练好的转换器模型中,以使训练好的转换器模型输出目标数值,该目标数值用于控制机器人的运动。本公开使视觉模型能够更加清晰和准确的理解机器人及其所处的环境,并将大模型应用到了机器人控制领域,使机器人能够更好的理解目标指令和做出正确的反应,更为精准的控制机器人执行对应任务,极大地提升了机器人的智能化程度和自动化程度。
技术关键词
转换器
视觉
数值
图片
样本
文本
机器人控制
指令
电子设备
数据获取模块
输出模块
运动
存储器
解码器
处理器
编码器
序列
介质