摘要
本发明涉及一种基于强化反馈的医疗交互式大模型训练方法,涉及医疗交互领域,所述方法包括:基于输入数据序列和输出数据序列建立医疗交互式大模型;在完成一次医疗交互后,根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明,针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题,通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构,完善医疗交互式大模型的结构,同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数,从而解决了上述技术问题。
技术关键词
医疗交互
深度神经网络架构
关键词
字符
模型训练系统
数值
模型训练方法
序列
数据
关系
存储器件
显示器件
生理
手术
参数
疾病
药物
患者
动态
系统为您推荐了相关专利信息
视频字幕提取
执行光学字符识别
文本
图像增强单元
特征提取单元
图像处理模块
匹配模块
图像特征提取
文本
输出模块