一种结合大模型与强化学习的无人艇多层级任务决策方法

正文

推荐专利

申请号：CN202510701786

申请日期：2025-05-28

公开号：CN120688549A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种结合大模型与强化学习的无人艇多层级任务决策方法，涉及人工智能技术领域，该方法包括：获取无人艇在当前状态下的环境观测值；将环境观测值和无人艇的当前状态作为无人艇的环境状态，输入至策略模型中得到无人艇的执行策略；其中，策略模型是基于大语言模型与强化学习训练得到的。本发明的结合大模型与强化学习的无人艇多层级任务决策方法利用教师‑学生方法，通过融合大语言模型的对抗规则引导与强化学习的动态决策能力，显著提升了无人艇在复杂对抗环境下的执行能力。

技术关键词

决策方法策略网络优化学生层级大语言模型教师动态决策能力翻译器强化学习算法编码环境意图指令模块数据存储时序正则化参数人工智能技术误差

一种结合大模型与强化学习的无人艇多层级任务决策方法

站点导航

APP 下载