摘要
本发明涉及智能医疗技术领域,公开了一种基于强化学习算法的医疗诊断方法、系统、设备及介质,获取每一目标医生的第一诊断风格向量;采用基于人类反馈的强化学习算法,构建医疗诊断模型;基于当前目标医生的历史问诊记录数据,对医疗诊断模型进行训练,得到目标医疗诊断模型,训练过程为基于医疗诊断模型生成的医疗诊断结果和奖励函数,对医疗诊断模型进行优化,以使医疗诊断模型输出与当前目标医生相匹配的最优策略,奖励函数为准确性奖励、诊断风格匹配奖励和医生反馈量化结果的加权和,诊断风格匹配奖励为获取的医疗诊断模型的第二诊断风格向量与第一诊断风格向量的匹配度。本申请的方法,能够为医生和病人提供针对性的医疗诊断建议。
技术关键词
医疗诊断模型
医疗诊断方法
强化学习算法
风格
长短期记忆网络
策略
表达式
方程
医疗诊断系统
智能医疗技术
执行存储器存储
分析单元
实时数据
计算机设备
超参数
可读存储介质
人类
系统为您推荐了相关专利信息
融合决策方法
融合特征
深度学习模型
高层次
表达式
LightGBM模型
时序监控
学习算法
LSTM模型
节点