基于大语言模型增强的可解释强化学习决策系统及方法

AITNT
正文
推荐专利
基于大语言模型增强的可解释强化学习决策系统及方法
申请号:CN202511210997
申请日期:2025-08-27
公开号:CN120722758B
公开日期:2025-11-14
类型:发明专利
摘要
本申请涉及一种基于大语言模型增强的可解释强化学习决策系统及方法。系统包括:白盒策略模块,含均采用软决策树构建的上层和下层策略模型,上层根据对抗态势数据和预设奖励函数决策输出上层子目标,下层依据上层子目标和对抗态势数据决策输出无人机控制量及行动轨迹数据;自然语言解释模块,利用决策行为解释大模型处理上、下层策略模型的软决策树参数、运算过程数据、预设奖励函数及无人机行动轨迹数据,输出行为解释内容;策略优化模块,利用决策行为优化大模型分析行为解释内容及无人机行动轨迹数据,结合交互数据提供奖励函数修改建议和失败轨迹修复方案。采用本系统可提高无人机对抗决策的智能性、实时性和可解释性。
技术关键词
策略 决策系统 大语言模型 轨迹 自然语言 计数器 白盒 生成无人机 模块 参数 意图 节点 数据变化趋势 逻辑 决策方法 模式 矩阵
系统为您推荐了相关专利信息
1
烟草生产监测方法、系统、电子设备及存储介质
偏差 动态 指标 数据 阶段
2
基于师生协作经验的目标检测知识蒸馏方法
知识蒸馏方法 特征提取模块 教师 检测头 调控策略
3
一种电化学储能电站空调的优化运行方法及系统
电化学储能电站 优化运行方法 液冷系统 电池仓 调控空调
4
宽谱红外与事件相机信息融合的铲斗受阻轨迹规划方法
事件相机 轨迹规划方法 短波红外 感兴趣 工况
5
一种飞行器最优中止制导与在线轨迹规划方法
在线轨迹规划方法 表达式 制导算法 轨迹算法 推力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号