摘要
本发明公开了一种基于深度强化学习的手术病例分配方法,包括以下步骤:步骤1、获取历史手术病例分配数据集划分为训练集、测试集;建立深度强化学习的智能体,智能体中以病例信息特征和手术室信息特征构成状态空间,并定义两层规则的动作空间,智能体以分布奖励和整体奖励结合形成执行动作的奖励函数;步骤2、采用深度Q网络对所述智能体进行训练,得到分配模型;步骤3、将步骤2得到的分配模型部署于医院进行手术病例分配。本发明在动态适应性、计算效率、自主学习能力等方面均具有显著优势,为智慧医疗和智能化手术调度提供了有效支撑。
技术关键词
深度强化学习
手术室
深度Q网络
更新网络参数
缓冲池
贪心策略
贪婪策略
训练集
传播算法
医院
决策
数据
机制
定义
动态