摘要
本发明涉及人工智能技术领域,可应用于医疗健康、金融科技等业务系统平台中,公开了机器人控制方法、装置、计算机设备及存储介质,其中,通过获取用于执行目标任务的语言指令和视野图像;对所述语言指令和所述视野图像进行特征提取,分别获取语言特征向量和视觉特征向量;将所述语言特征向量和所述视觉特征向量进行特征融合,生成多模态嵌入向量;利用扩散策略解码器,将所述多模态嵌入向量转换为条件控制信号,并根据所述条件控制信号,通过所述扩散策略解码器中的去噪扩散过程生成动作序列;基于所述动作序列,控制目标机器人执行所述目标任务;从而通过本发明可以实现更加智能、高效、灵活且安全的控制目标机器人执行目标任务。
技术关键词
机器人控制方法
多模态
生成动作
解码器
序列
视觉
视野
策略
指令
图像
计算机设备
机器人控制装置
语音识别装置
信号
可读存储介质
特征提取模块
人工智能技术
噪声信息
医疗健康
系统为您推荐了相关专利信息
斑马鱼模型
Cas9基因
打靶位点
序列
突变体斑马鱼
储能调度方法
负荷预测模型
电力系统运行状态
序列
预测电力系统
决策控制模块
垃圾车
报警系统
立体视觉测距装置
多模态
数据异常检测方法
异构特征
多模态特征
样本
煤炭