摘要
持续学习增强的地质领域大语言模型,通过专业数据集的构建、领域知识增强的继续预训练以及参数高效微调的方法,显著提升了模型在地质领域下游任务上的表现。通过TG‑MoLE架构,创新性地引入了跨组与组内路由协作机制,通过动态调整的软性路由策略优化专家权重分配,从而提升模型的专家协作能力和任务适应性,能够更有效地缓解灾难性遗忘问题,同时提升地质下游任务上的表现。
技术关键词
大语言模型
路由器
指令
分阶段
专业
数据
批量
样本
矩阵
书籍
参数
在线
策略
机制
编码
基座
动态
定义
资源
系统为您推荐了相关专利信息
编码向量
标签
事件提取方法
文本特征向量
大语言模型
病理切片图像
深度学习模型
肺癌病理
智能判断方法
专家知识库
电解液配方
大语言模型
锂电池电解液
化学反应动力学
路易斯碱