摘要
本发明公开一种提升辅助医疗决策系统安全性的方法、设备及介质,方法包括:步骤1,构建基于自注意力模型进行逆约束强化学习模型:采用因果屏蔽自注意力模型,以有患者的长历史状态序列的医疗专家数据和违背数据为输入,对患者的行动惩罚为输出,得到对医疗专家数据约束最小化,对违规数据约束最大化的成本函数梯度方程;步骤2,用成本函数学习约束策略:对步骤1的基于因果屏蔽自注意力的逆约束强化学习模型训练得到能观测长历史序列并能捕捉关键状态的成本函数,将成本函数用于医疗决策系统的现有约束强化学习算法对策略约束优化,得到安全的医疗决策系统。该方法在医疗场景下实现辅助医疗决策系统安全策略学习,提升辅助医疗决策系统安全性。
技术关键词
医疗决策系统
强化学习模型
线性
注意力模型
患者
数据
序列
强化学习算法
轨迹
方程
键值
医疗场景
医院
参数
策略
处理器
编码
医学
输出端
系统为您推荐了相关专利信息
储能优化配置方法
混合整数线性规划模型
典型
节点
吸收式制冷装置
请求调度方法
服务器
深度学习模型
重构误差
门控循环单元
效能评估方法
认知障碍患者
脱氧血红蛋白
功能近红外
同步性
条件生成对抗网络
交互控制方法
深度强化学习模型
任务分配策略
多模态传感器
认知功能评估
癫痫
神经网络架构
动态时间规整
神经架构搜索