密集语言模型稀疏升级方法及稀疏语言模型文本处理方法

正文

推荐专利

申请号：CN202411937914

申请日期：2024-12-26

公开号：CN119940533A

公开日期：2025-05-06

类型：发明专利

摘要

本发明涉及一种密集语言模型稀疏升级方法及稀疏语言模型文本处理方法，属于人工智能技术领域。本发明通过利用任务表征和上下文表征来初始化路由网络的权重，实现在不增加计算成本的前提下将密集语言模型高效转化为稀疏激活模型，不仅提高了模型的计算效率，还赋予了各个专家网络针对不同任务的专业化处理能力，在保持计算资源消耗基本不变的前提下，显著提升模型在复杂推理、多任务处理等方面的性能表现。

技术关键词

文本处理方法上下文特征生成特征向量升级方法注意力数据训练场景人工智能技术网络特征聚类方法多任务参数阶段策略矩阵代表

系统为您推荐了相关专利信息

一种轨旁设备控制模块的远程升级方法、装置和电子设备

轨旁设备远程升级方法控制模块软件版本信息明文

基于多元特征编码与双层卷积的时序知识图谱补全方法

知识图谱补全方法实体时序交互特征矩阵

一种基于改进YOLOv8n的光伏电池电致发光缺陷图像检测方法

图像检测方法光伏电池注意力机制移动设备数据

一种基于因果解耦网络的PPG信号降噪与重构方法

多层感知机信号降噪重构方法信号预处理模块注意力机制

一种基于北斗定位的智慧城市数据处理方法

分布式计算平台数据完整性验证 ARIMA模型预测误差前馈神经网络

密集语言模型稀疏升级方法及稀疏语言模型文本处理方法

站点导航

APP 下载