摘要
本发明公开了融合专家策略与多思维链推理的游戏提示词生成方法,包括以下步骤:获取文本与图像组成的多模态输入;将多思维链推理与专家策略注入多模态信息,实现多模态信息的高效接入和提示词拼接;将融合专家多阶段策略与多思维链推理的微操多模态提示词输入至大语言模型;大语言模型对输入信息进行综合分析,并行生成多条思维链,通过评估选取最优方案,并将高层决策映射为具体的游戏操作指令;大语言模型输出动作指令到LLM‑PySC2接口,执行并影响游戏环境;将游戏信息、相关知识、合法动作、动作参数和上一步动作输出回到大模型中,再次进行学习和评估。
技术关键词
融合专家
大语言模型
生成方法
策略
多模态信息
多阶段
决策
游戏截图
游戏环境
武器
延长生存时间
文本
指令
关键点
地形特征
格式
消息
系统为您推荐了相关专利信息
拉格朗日对偶
分层
时空注意力机制
大规模无人机
双时间尺度
文章生成方法
融合特征
多张图像数据
视觉特征提取
文本
表面损伤检测
航空器
软件系统模块
高分辨率相机
无人机