摘要
本发明属于人工智能相关技术领域,其公开了一种基于Mamba编码完整历史的机器人时序模仿学习方法及系统,方法包括:接收机器人执行任务过程中的多模态观测序列,多模态观测序列包括至少一种传感器的观测数据;利用基于状态空间模型的序列处理模块处理多模态观测序列,在每个时间步更新一个编码截至当前时间步的完整历史信息的时序输出;基于当前时间步的时序输出,预测机器人下一步或未来一系列的动作,进而控制机器人进行模仿。本发明利用基于状态空间模型的时序处理模块来处理和编码机器人任务执行过程中的完整观测历史,以实现非马尔可夫决策的模仿学习方法,提升了机器人在复杂、状态依赖的长时序操作任务中的学习效率和执行成功率。
技术关键词
模仿学习方法
时序
状态空间模型
多模态
预测机器人
序列
数据编码器
视觉特征
模块
视觉传感器
学习系统
矩阵
存储器
策略
处理器
系统为您推荐了相关专利信息
区块链共识方法
消息
主节点
生成交易信息
客户端
分系统
商品特征
特征工程
XGBoost模型
统计特征