适用于大语言模型的数据处理方法及装置

AITNT
正文
推荐专利
适用于大语言模型的数据处理方法及装置
申请号:CN202511062993
申请日期:2025-07-30
公开号:CN120893475A
公开日期:2025-11-04
类型:发明专利
摘要
本说明书实施例提供一种适用于大语言模型的数据处理方法及装置,在模型架构上,对代替前馈网络的常规的混合专家模型架构中的各个第一专家网络进行分组,并为得到的各个专家组增设一个第二专家网络。在进行数据处理过程中,第二专家组的激活条件依赖于相应专家组内的第一专家组是否被激活。在相应专家组内的任意第一专家组被激活的情况下,相应的第二专家组被激活。如此,可以为各种业务场景数据提供差异化、自适应的特征数据处理,提高大语言模型各种场景的适应能力。
技术关键词
网络 大语言模型 数据处理方法 处理单元 信息处理 令牌 数据处理装置 文本 计算机 可读存储介质 音频 存储器 处理器 场景 时间段 图像
系统为您推荐了相关专利信息
1
一种认知启发自适应图表示方法
结点 动态 训练判别模型 消息传递算法 概率主题
2
一种基于云计算的垃圾分类处理方法及其装置
环卫管理系统 垃圾容器 分类垃圾处理 可视化界面 图片
3
一种基于正则表达的应用领域知识库的构建方法及装置
大语言模型 答案 关键词 意图识别模型 主题
4
基于语义关系图网络的多轮图文对话回复生成方法及系统
对话回复生成方法 图片 图文 注意力 文本
5
一种基于卷积网络的异常流量监测方法及系统
数据特征提取 时序特征 监测方法 流量异常监测 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号