一种面向可信度的基于LSTM与PPO的MCS激励方法

正文

推荐专利

申请号：CN202510137339

申请日期：2025-02-07

公开号：CN120216900A

公开日期：2025-06-27

类型：发明专利

摘要

本发明提供一种面向可信度的基于LSTM与PPO的MCS激励方法，能够将参与者的感知决策过程建模为非合作博弈，并采用马尔可夫决策过程MDP来描述其行为。在不了解全局信息的情况下，利用长短期记忆网络LSTM与近端策略优化算法PPO相结合的激励模型LSTM‑PPO，为每位参与者制定最合理且有效的感知时长策略，以最大化效用奖励。任务完成后，通过评估上传数据的质量来动态更新参与者的可信度，从而调整其下一阶段的效用奖励。在真实数据集上，我们对CIM‑LP和现有的其他激励机制进行了大量的仿真实验。结果表明，CIM‑LP机制使参与者平均效用提高了19.3%，任务完成率提高了12.8%。

技术关键词

激励方法长短期记忆网络决策策略动态更新非合作博弈转移概率矩阵深度强化学习平台数据估计算法社交机制

系统为您推荐了相关专利信息

一种交易仿真回测框架及系统

模式识别模型策略特征识别模块数据管理模块双塔结构

用于科氏流量计的信号处理方法、模块及控制系统

科氏流量计信号处理方法信号处理模块鲸鱼算法幅值

心肺复苏后神经功能预后预测模型的构建方法及其应用

机器学习模型神经元特异性烯醇化酶梯度提升模型预后预测模型变量

基于混合增强智能的船体外板曲面成形智能决策方法

船体外板曲面成形智能决策方法支持向量机模型 Sigmoid函数仿真数据

一种多网口防护方法、装置、电子设备和存储介质

数据挖掘技术封堵设备网口防护决策树模型模式匹配算法

一种面向可信度的基于LSTM与PPO的MCS激励方法

站点导航

APP 下载