摘要
本发明实施例涉及一种医疗大语言模型的联邦学习系统,所述系统包括:知识图谱、中心网络和多个机构网络;中心网络用于配置全局的特征映射规则、对基座大语言模型进行首次预训练、每生成一版中心模型参数就将生成并下发对应的版本号+下发模型参数+微调层编号、按均值方式对机构模型参数进行聚合、基于聚合参数生成新版中心模型参数;机构网络则用于在每收到一组版本号+下发模型参数+微调层编号就进行一次本地训练并将训练后的机构模型参数向中心网络上发。通过本发明可以在医疗数据不共享的条件下对医疗大语言模型的泛化能力进行持续性提升。
技术关键词
大语言模型
投影模型
联邦学习系统
生成对抗网络
编码向量
分词
参数
文本特征向量
优化器
文本分类模型
索引
序列
中心服务器
标签
术语
基座
模型库
BERT模型
节点
系统为您推荐了相关专利信息
大语言模型
文本生成方法
TextRank算法
分割算法
记忆机制
轴承故障诊断方法
拉普拉斯滤波方法
样本
多级残差网络
工况
自然语言文本
大语言模型
插件
提示方法
非暂态计算机可读存储介质
融合特征
诊疗数据处理方法
模态特征
特征提取网络
多模态