摘要
本公开提供了一种基于深度学习模型的数据处理方法、设备及介质,涉及人工智能技术领域,尤其涉及深度学习、大模型等计算领域。具体实现方案为:深度学习模型包括专家网络层,专家网络层包括多个专家网络;处理器将表征一个词元的输入特征切分为分别与多个专家网络对应的多个子特征;根据多个子特征各自的评估值,处理器从多个子特征中确定至少一个目标子特征;其中,评估值表征子特征相对于输入特征的重要性;根据至少一个目标子特征,以及多个专家网络中对应于至少一个目标子特征的至少一个目标专家网络的网络参数,处理器执行模型训练任务或模型推理任务,得到处理结果。
技术关键词
深度学习模型
数据处理方法
前馈神经网络
人工智能技术
缩放参数
计算机程序产品
注意力
处理器通信
指令
可读存储介质
上采样
存储器
矩阵
序列
电子设备
系统为您推荐了相关专利信息
钢结构厂房
机器学习算法模型
钢结构构件
人工智能技术
节点
监测数据处理方法
有机体
小波阈值去噪方法
机组
高频信号分量
语言模型训练方法
大语言模型
图谱
前馈神经网络
标记
光电容积脉搏波
预警系统
信号处理模块
信号采集模块
穿戴式设备