摘要
本发明公开了一种基于强化学习的群智感知平台任务捆绑优化方法,旨在提高群智感知平台的任务完成率和质量。首先,平台根据流行度对接收的任务进行预处理和分类;然后,利用深度强化学习算法,将不受欢迎任务与受欢迎任务进行捆绑组合,并依据工人意愿筛选捆绑包对应的工人集合;在任务执行过程中,平台以可信高质量工人数据为基准评估未知工人,并动态更新其质量和信誉;最后,将平台利润、任务完成率和质量联合构成奖励函数,持续优化任务捆绑策略。本发明能在最大化平台利润的同时提升任务完成率和质量。
技术关键词
利润
群智感知平台
深度强化学习算法
强化学习模型
DQN算法
距离补偿
策略更新
信誉
动态更新
定义
基准
报酬
数据
闭环
系统为您推荐了相关专利信息
线性滑轨
预测系统
大数据分析平台
运动补偿单元
视觉
智能故障诊断
故障自愈
自愈方法
低压
强化学习模型
给料控制
配比控制系统
电磁感应加热技术
染液
pH值
任务调度优化方法
深度强化学习算法
状态空间预测
深度强化学习模型
Softmax函数