摘要
本申请涉及机器人控制技术领域及保险业务和智慧医疗领域,提供了一种机器人控制方法、装置、电子设备及计算机可读存储介质,方法包括:获取语音指令和初始观察图像;基于预训练的视觉语言模型中的因果注意力子模块、语音指令和初始观察图像进行视觉推理处理,得到子目标图像;基于视觉语言模型中的全注意力子模块、语音指令、初始观察图像和子目标图像进行动作预测处理,得到预测动作序列信息;对预测动作序列信息进行评估处理,得到动作评估信息;在动作评估信息表征预测动作序列信息满足预设条件的情况下,将预测动作序列信息确定为最终动作序列信息。通过上述技术方案,能够提升机器人的任务执行的准确度。
技术关键词
机器人控制方法
图像特征信息
序列
视觉推理
注意力
子模块
语音
计算机可执行指令
机器人控制装置
机器人控制技术
可读存储介质
融合特征
文本
有效性
标记
电子设备
多模态
系统为您推荐了相关专利信息
电梯应急救援
风险评估报告
电梯系统
综合故障
卷积神经网络模型
分支
转换器模块
超分辨率重建图像
注意力
输出特征
通风气楼
调节控制方法
模糊PID控制器
连续动作空间
设备运行状态数据
动态邻接矩阵
需求预测方法
热力图
依赖特征
多模态注意力