摘要
本申请提供一种DeFi协议链上治理智能策略模型、方法、设备及介质,其中包括预测网络、目标网络和误差函数;预测网络根据输入的DeFi环境状态,获得链上各个动作的预测值,并将最大预测值对应的动作作为最优动作向目标网络输出;目标网络接收预测网络输出的最优动作,并根据所述最优动作选择出所述最优动作对应的动作值和奖励值;误差函数计算最优动作对应的预测值和目标值之间的误差,并在误差满足预设阈值时将最优动作输出,以及在误差未满足预设阈值时,更新所述预测网络的网络参数并重新训练所述预测网络,直到误差满足预设阈值。降低人工成本、减少人为误差,提高治理效率还可灵活适应不同的DeFi协议环境。
技术关键词
智能决策模型
协议
网络
误差函数
动作策略
计算机可执行指令
参数
计算机存储介质
最小化误差
随机梯度下降
生成动作
序列
处理器通信
存储器
电子设备
数据