摘要
本发明涉及基于医疗多模态数据的大模型训练方法、系统,属医疗数据处理领域。本发明包括:对选择的预训练大语言模型的注意力机制和前馈神经网络部分进行冻结,嵌入层和归一化层进行重新训练;对多模态数据使用模态编码器进行编码;在各模态编码器的输出后增加投影层,将不同模态的特征映射到相同的特征空间,对将不同模态的特征进行对齐,再进行拼接,形成一个统一的多模态表示向量;设计多任务输出结构,用于对围手术期中的不同任务需求进行处理;采用联合训练策略,对预训练大语言模型在多模态数据和多任务需求下进行优化。本发明能更有效地处理多模态异构数据,并在医疗场景下提供更高效、更准确的预测、生成和分类效果。
技术关键词
大语言模型
模型训练方法
多模态
数据编码器
前馈神经网络
注意力机制
多任务
非暂态计算机可读存储介质
大规模语料库
文本
模态特征
模型训练系统
时序
表格
处理器
医疗场景
计算机程序产品
系统为您推荐了相关专利信息
儿童图书
语义分析方法
多模态
文本
非易失性存储介质
阻尼减震装置
信号
无人机
滑动窗口技术
可视化界面
机器人安装系统
动作控制模块
多模态
消防设备
图纸
启发式规则
大语言模型
启发式方法
受限
静态特征