摘要
本发明涉及一种自适应优化的治疗计划系统及强化学习方法,包括物理师制作训练用病例,将每个时间的操作和治疗计划系统软件当前的状态记录;将治疗计划系统软件的状态参数作为数据集整合,定义为强化学习的状态空间;将物理师进行的操作整合,定义为动作空间;将影响治疗计划质量的参数整合,定义为奖励空间;将状态空间作为输入,动作空间作为输出,训练DQN网络;Agent训练完成后,将该模型置入治疗计划系统软件中,输入新的患者病例时,软件将病例转换为初始状态,Agent根据训练的动作进行计划制作,并根据反馈奖励不断修改调整,得到一个最优奖励的结果。本发明依据输入的病人图像,自动的制作符合临床要求的个体化的治疗计划。
技术关键词
计划系统
强化学习方法
放疗计划
定义
放疗设备
覆盖率
肿瘤
梯度下降算法
深度Q网络
动作策略
代表
回放模块
数据
物理
影像
软件
参数
系统为您推荐了相关专利信息
智能除湿
垃圾桶
核回归模型
控制执行模块
光照强度数据