摘要
本发明提供一种结合状态记忆机制的扩散策略模型优化方法及具身智能体,涉及人工智能技术领域。该方法包括:获取目标对象在当前时刻的状态信息及图像信息;基于状态信息及图像信息生成全局条件向量;将全局条件向量输入至扩散网络模型,得到多个时间步的动作数据构成的预测动作序列;基于全局条件向量及多个时间步中第一时间步的动作数据,使用状态估计器进行状态预测,得到下一时刻的状态预测结果。通过实施本发明,使得所生成的控制指令能够更加贴合目标对象的动作及状态,实现更加准确的控制,提升动作执行的成功率。
技术关键词
状态估计器
模型优化方法
记忆机制
样本
数据
网络
多层感知器
机器人本体
缩放参数
图像
对象
标签
人工智能技术
策略
序列
执行器
训练集
非线性
闭环
系统为您推荐了相关专利信息
协调控制模块
智能控制模块
容错控制
系统级
局部控制系统
抹平机器人
抹平机构
履带底盘
视觉采集机构
砂浆