摘要
本发明涉及序贯决策模型构建技术领域,具体为一种融合Hp‑ST信息交互的鸽子序贯决策模型构建方法,模型构建方法包括以下步骤:步骤1:使用每个被试鸽的前n个试次作为初始训练集,得到格兰杰信息传递量,并得到MB的权重;步骤2:更新MF学习策略得到的行为价值;步骤3:更新MF学习策略得到的行为价值;步骤四:更新两种学习策略加权得到的行为价值;步骤5:使用SoftMax策略做出动作选择,输出下一试次的行为,后继状态,以及奖励。这些输出结果将被用于下一个试次模型的输入。本申请中基于Hp‑ST信息交互的MB‑MF动态加权的鸽子序贯决策模型(DW‑SDMHp‑ST),与仅基于行为数据构建的HybridMB/MF模型相比,DW‑SDMHp‑ST模型参数和所需样本量显著减少,预测准确性更高。
技术关键词
决策模型构建方法
Sigmoid函数
模型构建技术
训练集
参数
数据
策略
多通道
进程
线性
样本
矩阵
动态
系统为您推荐了相关专利信息
轨迹优化方法
三维模型
神经网络遗传算法
数字孪生模型
机器人喷涂轨迹
大语言模型
字段
业务处理结果
训练集
文本分类模型
数字孪生模型
发电量
光伏组件
光伏电站
电子装置