摘要
本说明书实施例提供一种适用于大语言模型的数据处理方法及装置,在模型架构上,对代替前馈网络的常规的混合专家模型架构中的各个第一专家网络进行分组,并为得到的各个专家组增设一个第二专家网络。在进行数据处理过程中,第二专家组的激活条件依赖于相应专家组内的第一专家组是否被激活。在相应专家组内的任意第一专家组被激活的情况下,相应的第二专家组被激活。如此,可以为各种业务场景数据提供差异化、自适应的特征数据处理,提高大语言模型各种场景的适应能力。
技术关键词
网络
大语言模型
数据处理方法
处理单元
信息处理
令牌
数据处理装置
文本
计算机
可读存储介质
音频
存储器
处理器
场景
时间段
图像
系统为您推荐了相关专利信息
环卫管理系统
垃圾容器
分类垃圾处理
可视化界面
图片
数据特征提取
时序特征
监测方法
流量异常监测
网络