摘要
本发明属于人工智能的技术领域,更具体地,涉及一种多矩阵聚合多维特征的医疗大模型迁移训练方法。所述方法包括所述方法包括:收集专业医学数据,构建专业医学数据集;联邦迁移训练预训练大模型,为其注入具体专业医疗知识,具体包括:对于预训练的Baichuan大模型,初始化低秩矩阵,并量化低秩矩阵和权重;将量化后的低秩矩阵适配到Baichuan大模型的线性层和注意力层;通过多轮次的高效迁移训练从专业医学数据集中提取原始知识、低秩知识以及全局复杂知识三种不同维度的知识;将提取到的三种不同维度的知识进行融合并进行权重聚合。本发明解决了现有训练方法需要大量高质数据和计算资源,在要求更为严格的具体医学场景下表现不佳的问题。
技术关键词
矩阵
专业
注意力
服务器节点
隐私保护算法
医学知识图谱
预训练语言模型
保护患者隐私
格式
分词
深度学习框架
代表
多层次
诊疗数据
线性
诊所
键值
系统为您推荐了相关专利信息
文本生成方法
文本生成装置
条目
专业知识库
办公智能化技术
图像分割方法
图像分割模型
视觉
图像分割系统
形态学方法