摘要
本发明公开了一种基于Transformer构建样本高效世界模型的方法及装置,该方法包括将历史交互数据分离得到历史动作序列数据和历史原始状态数据;将原始状态数据转换为多尺度特征数据并进行去噪增强处理,生成增强状态数据;对增强状态数据进行自适应量化编码得到离散潜变量数据;基于历史数据构建因果结构数据并设计注意力权重,生成因果增强表征数据;基于时序关联数据计算不确定性数据并生成多步预测序列数据;将长期预测目标分解得到分层价值数据并计算策略梯度数据;对新交互数据进行筛选并更新模型参数。本发明通过多尺度特征提取、因果结构学习和分层价值评估等方法,提高了世界模型的预测准确性和样本利用效率。
技术关键词
预测序列数据
滤波特征
变量
样本
编码向量
高斯核函数
注意力
加权特征
策略
时序
方差特征
条件依赖关系
矩阵
信息熵
局部搜索算法
多尺度特征提取
分布特征
分层
系统为您推荐了相关专利信息
多模态
标注方法
组织层次数据
数据标注系统
扩充训练样本
多模态
融合特征
农作物识别方法
图像
资产评估方法
任务分配算法
任务分配方法
多机器人任务分配
多机器人系统
邻居