基于强化反馈的医疗交互式大模型训练方法与系统

正文

推荐专利

申请号：CN202510964052

申请日期：2025-07-14

公开号：CN120809166A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及一种基于强化反馈的医疗交互式大模型训练方法，涉及医疗交互领域，所述方法包括：基于输入数据序列和输出数据序列建立医疗交互式大模型；在完成一次医疗交互后，根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明，针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题，通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构，完善医疗交互式大模型的结构，同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数，从而解决了上述技术问题。

技术关键词

医疗交互深度神经网络架构关键词字符模型训练系统数值模型训练方法序列数据关系存储器件显示器件生理手术参数疾病药物患者动态

系统为您推荐了相关专利信息

一种用于视频字幕提取的丢字补偿处理装置和方法

视频字幕提取执行光学字符识别文本图像增强单元特征提取单元

深度链接生成的方法、装置、设备、存储介质及程序产品

关键词标识列表终端生成配置信息

多模态知识匹配系统

图像处理模块匹配模块图像特征提取文本输出模块

应用评分的确定方法、装置、程序产品以及电子设备

文本标签关键词频率语义分割网络

一种针对地产业务的业务数据确定方法及装置

回溯算法房间视频识别算法训练特征

基于强化反馈的医疗交互式大模型训练方法与系统

站点导航

APP 下载