摘要
本发明公开了一种急诊医疗资源的调度方法、系统、设备与存储介质,涉及资源分配技术领域,包括步骤:获取急诊室内的医疗资源调度状态信息和相关动作;通过深度强化学习模型估计相关动作;使用粒子群算法优化深度强化学习模型的参数,随机初始化粒子群中每个粒子的位置和速度;根据个体历史最佳位置和全局历史最佳位置更新每个粒子的速度和位置;选择最优粒子更新深度强化学习模型的参数,获得优化后的深度强化学习模型;将医疗资源调度状态信息和相关动作输入优化后的深度强化学习模型中,获得最优的资源调度策略。本发明利用粒子群算法改善优化深度强化学习模型训练的方法,提高了资源调度中获得最佳参数的速度和准确性。
技术关键词
深度强化学习模型
资源调度信息
深度神经网络
资源调度策略
参数
急诊
表达式
粒子群算法优化
资源分配技术
患者
速度
模块
处理器
调度系统
误差
位置更新