摘要
本申请涉及一种机器人控制方法、装置、设备及介质。该方法通过将当前视觉信息输入训练好的视觉编码器,将控制指令输入训练好的文本编码器,将当前图像编码输入训练好的适配器,将调节后的当前图像编码和目标文本编码输入训练好的语言模型,控制机器人执行相应动作。本申请可应用于机器人领域,金融科技领域以及智能医疗领域中,通过当前视觉信息得到当前图像编码,根据控制指令得到目标文本编码,根据当前图像编码,得到调节后的图像编码,根据调节后的图像编码和目标文本编码,得到目标预测结果,根据目标预测结果得到第一控制策略并控制机器人。从而全面地对机器人的视觉信息进行处理,以准确得到控制机器人的控制策略。
技术关键词
文本编码器
机器人控制方法
图像编码
控制策略
适配器
机器人控制装置
机器人控制模块
训练集
参数
视觉
指示机器人
计算机设备
微调技术
可读存储介质
处理器
存储器
系统为您推荐了相关专利信息
跨模态检索方法
共享适配器
文本特征向量
图像特征向量
多分支
执行机构系统
主控单元
实时仿真系统
无线电通信模块
容错控制
室内安防监控
文本编码器
注意力模型
多模态
图像编码器
集成电路芯片
智能保温
监测集成电路
饮品容器
热传导