一种基于上下文提示的世界模型增强方法及装置

正文

推荐专利

申请号：CN202510855255

申请日期：2025-06-25

公开号：CN120373360B

公开日期：2025-09-02

类型：发明专利

摘要

本发明提供了一种基于上下文提示的世界模型增强方法及装置，属于深度强化学习技术领域。方法根据当前图像输入得到图像描述语句；通过卷积神经网络得到当前图像输入的向量表示，利用语言模型得到图像描述语句的向量表示，将图向量表示与语句向量表示拼接，得到新的向量表示；将新的向量表示利用循环神经网络实现对世界模型的建模，世界模型根据当前的向量输入，在历史动作和环境信息上下文基础上进行动作决策，有效减轻了智能体探索时的轨迹回退现象出现的频率。在环境变化时，智能体能根据上下文信息及时进行调整，提高智能体的适应性与灵活性。本发明有效减少了智能体错误决策的可能性，有效提升了在限定步数之内智能体的背景任务完成数量。

技术关键词

文本特征向量动作指令信息仿真环境图像特征向量状态更新语句视觉特征提取网络深度强化学习技术大语言模型多层感知机决策序列代表超参数多模态动作模块算法

系统为您推荐了相关专利信息

一种基于选图机制的图像移相评价和相位计算方法及系统

相位计算方法图像采集模块图像特征向量相关系数阈值灰度特征描述

一种6D可移动天线的姿态状态更新方法

状态更新方法移动天线面板博弈方法决策

基于重建和记忆融合的轻量化无监督缺陷检测方法

无监督缺陷检测方法太阳能网版特征提取器记忆多层次深度特征

芯片验证系统、方法、装置、验证设备、介质及程序

仿真通信测试平台芯片验证方法芯片验证系统仿真环境

复杂地形下四足机器人摔倒自恢复控制方法及系统

恢复控制方法四足机器人网络机器人本体学生

一种基于上下文提示的世界模型增强方法及装置

站点导航

APP 下载