摘要
本发明公开了一种磁微机器人在复杂环境下的路径任务规划方法,涉及微纳控制技术领域,该方法采用线性时序逻辑LTL对多目标任务需求进行形式化编码;构建基于DQN神经网络的决策模块,结合实时环境状态和执行动作的结果输入给以LTL编码的多级奖励函数生成奖惩信号,并反馈给网络以引导路径优化决策;网络优化过程中引入逻辑修正状态转移模型加权提升合规动作的概率,使磁微机器人的状态转移过程向满足LTL约束的方向偏移。本方法通过双向GRU提取任务逻辑特征,将其作为决策的先验知识嵌入神经网络,既解决了传统DQN处理时序任务的低效性,又通过显式逻辑约束提升了决策的可解释性与安全性。
技术关键词
状态转移模型
机器人
状态更新机制
线性时序逻辑
编码
规划
决策
时序特征
序列
样本
贪婪策略
网络优化
合规性
网络结构
优化器
信号