摘要
本申请涉及机器人技术领域,公开了一种用于机器人的任务规划方法、装置、设备及介质,其中方法包括:建立包含环境空间拓扑及对象属性的场景关系图模型;将接收的自然语言指令输入第一语言模型,输出结构化任务目标;基于结构化任务目标和实时环境感知数据,通过第二语言模型生成辅助信息,并更新场景关系图模型;将更新后的场景关系图模型输入强化学习模型,输出动作决策序列;控制目标机器人执行动作决策序列,并根据环境反馈信息调整场景关系图模型和强化学习模型的强化学习策略。本申请能够实现机器人在复杂动态场景中高效、灵活且精准的任务规划,提高机器人任务规划的效率与适应性。
技术关键词
强化学习模型
环境感知数据
强化学习策略
关系
规划
自然语言
决策
节点特征
语义场景
序列
对象标识符
深度Q网络
拓扑特征
生成场景
动态场景
机器人技术
系统为您推荐了相关专利信息
集成优化方法
铺层设计
复材构件
铺放工艺
路径生成方法
标签生成方法
关键词
语义关联度
有效性
语义标签
急倾斜煤层
神经网络模型
构建数值模型
力学
地面