摘要
本发明涉及医疗信息处理领域,公开了基于互联网医院医疗对话和病历的强化学习与协同系统,完整对话链获取模块,用于获取每轮“患者输入‑大模型回复‑医生修改”的完整对话链;反馈格式构建模块,基于完整对话链,构建结构化反馈格式,作为强化学习的训练样本,所述结构化反馈格式包括输入内容,原始回复,医生编辑内容,编辑行为标签,语义差异分;强化学习优化模块,用于在已有监督微调模型基础上,引入强化学习算法PPO,基于所述训练样本,执行面向医疗对话系统的强化学习优化。本发明的方法可以解决现有医疗问诊对话系统中存在的响应缺乏推理透明性、模型不可持续优化、医生反馈未被利用、系统请求压力不可控等问题。
技术关键词
互联网医院
协同系统
强化学习算法
病历
语义
对话系统
编辑
医学知识库
格式
消息
一致性检测
逻辑
患者
多轮对话
大语言模型
计时器
意图识别
队列
模块
系统为您推荐了相关专利信息
同步控制方法
逆变器并网系统
谐波
强化学习算法
决策
摘要
报告生成方法
人工智能技术
报告生成装置
语义
推广系统
多源异构数据融合
策略
深度Q网络
算法模型
位置定位导航方法
血管外科手术
生理特征数据
疾病特征
影像
神经网络预测模型
状态判断方法
矩阵
融合特征
指标