摘要
本发明公开了一种基于强化学习的群智感知平台工人信誉评估优化方法,平台收集请求者的任务集合,获取工人的时空位置分布、信誉和任务偏好类型;然后,判断是否存在信誉检测任务,最后,综合评估工人质量后支付相应报酬,并基于平台利润和整体工人质量联合构成奖励函数,优化信誉检测任务投放策略。本发明利用强化学习设计信誉检测任务投放策略,解决了工人信誉冷启动问题,结合两轮信誉调整机制,显著提升了可信工人识别比例,从长远角度来看,能有效提高平台利润与任务完成质量。
技术关键词
评估优化方法
DQN算法
平台
信誉值
利润
报酬
黄金
编码向量
决策
策略
数据
机制
偏差
动态
定义
系统为您推荐了相关专利信息
设备智能诊断
辅助维修方法
云平台
辅助机器人
三维模型
一体化系统
超短基线安装误差
应答器
安装误差角
GNSS系统
整车动力学模型
故障注入板卡
执行器
硬件平台
电磁阀
优化调度算法
优化资源配置
能源
启发式算法
电力