摘要
本申请公开基于长思维链的问诊模型训练方法和装置,涉及大模型领域,通过模型的策略网络分析提取语义信息,结合历史记忆库中的上下文信息生成初始步骤决策;将初始步骤决策送入推理路径生成器,推理生成初诊病源和中间诊断步骤;将初诊病源和中间诊断步骤送入验证模块,根据病例诊断报告与医学知识库进行病理逻辑验证,反馈验证结果;推理路径生成器基于反馈结果、初诊病源和中间诊断步骤更新历史记忆库;策略网络基于用户反馈输入以及更新后历史记忆库中的上下文信息继续推理,最终输出问诊结果。该方案在长思维链推理框架中引入强化学习、自适应回溯与记忆增强等技术手段,使大型语言模型在医疗问答与辅助诊断场景下实现了多方面的综合提升。
技术关键词
模型训练方法
医学知识库
记忆
网络分析
策略
逻辑
决策
模块
模型训练装置
计算机设备
可读存储介质
语义
生成用户
报告
答案
程序
处理器
指令
校正
系统为您推荐了相关专利信息
数据流负载分担
转发策略
端口
流量调度装置
流量调度方法
梅尔频率倒谱系数
融合声学特征
声音识别方法
深度学习特征
语音特征
储能系统控制方法
台区变压器
负荷预测模型
功率因数
风险预测模型