摘要
本申请涉及一种面向复杂动态博弈场景的推理决策方法、装置及设备。所述方法包括:在兵棋对抗博弈仿真中,以智能体决策流程为基础,构建两步马尔可夫推理框架,将决策分为状态推理和动作决策两步。基于该框架设计结构化动态决策选项库,构建动态推理决策链。提示词生成阶段,依链生成提示词并结合实时观测信息输入大语言模型;状态推理阶段,模型从状态选项库选取选项组成结构化态势描述;动作决策阶段,根据状态推理结果从策略选项库选取策略并转化为仿真执行动作。该方法通过分层约束与结构化处理,提升兵棋对抗中关键信息提取准确率。
技术关键词
大语言模型
推理决策方法
仿真环境
策略
动态
生成提示词
阶段
框架
自然语言
子模块
场景
计算机设备
序列
语义
列表
基础
存储器
处理器
系统为您推荐了相关专利信息
机器人模型
硬件性能信息
实时数据采集
超参数
预训练模型
虚拟电厂系统
多层次
在线学习方法
网络拓扑结构
全局优化算法
数据加密传输方法
加密策略
非对称加密算法
资产
明文
节点
数据模型构建方法
远程智能控制方法
存储结构
文本