摘要
本发明提供一种术后护理决策支持方法及系统,融合患者的生理时序数据、静态病历和即时检验结果,构建多模态状态向量St,并输入深度Q网络。该网络包括共享编码层、状态价值评估流、双通道优势函数流及临床事件预测流。通过状态价值与优势函数计算动作Q值Q(St,a),再计算其香农熵H,映射为探索率ε,采用ε‑贪心策略选择当前动作At,执行后根据患者反应和临床事件计算奖励Rt,形成状态转移四元组(St,At,Rt,St+1)存入经验池;采样时结合时间差分误差δᵢ和临床风险Cᵢ计算优先级Pᵢ并进行优先采样,通过Q值损失与临床事件预测损失的加权求和,更新网络参数。
技术关键词
深度Q网络
长短期记忆网络
决策支持方法
联合损失函数
更新网络参数
多层感知机
贪心策略
多模态
时序
病历
生理
患者
通道
数据
决策支持系统
编码
非线性
误差
饱和度
风险
系统为您推荐了相关专利信息
工业机器人
WebSocket协议
关节空间轨迹
力矩传感器
长短期记忆网络
大气温室气体浓度
多尺度
监测方法
异常点
数据处理中心
分层注意力
联合损失函数
动态
文本
多层注意力机制
节点管理方法
集群
长短期记忆网络
基础
计算机程序产品
裂缝预测系统
施工墙体
材料特性数据
注意力机制
数据采集模块