基于大模型的文本处理及大模型压缩方法和装置

正文

推荐专利

申请号：CN202510735386

申请日期：2025-06-03

公开号：CN120874936A

公开日期：2025-10-31

类型：发明专利

摘要

本公开提供了基于大模型的文本处理及大模型压缩方法和装置，涉及深度学习、大模型以及自然语言处理等人工智能领域。所述基于大模型的文本处理方法可包括：获取输入文本对应的词元序列；针对词元序列中的各词元，分别进行以下处理：响应于确定需要利用目标大模型中的融合层对该词元进行处理，通过至少两次执行融合层中的推理计算，生成该词元对应的目标处理结果，目标大模型为对待压缩大模型进行模型压缩后得到的，模型压缩包括将待压缩大模型中的Lm个依次相邻的层融合为所述融合层，Lm为大于1的正整数，且Lm小于L，L表示待压缩大模型中包括的层数。

技术关键词

矩阵模型压缩方法参数文本处理方法饱和度模块注意力文本处理装置序列语义元素指令多层感知机计算机程序产品处理器通信自然语言

系统为您推荐了相关专利信息

一种变电站多层级电力负荷预测方法及系统

变电站电力负荷预测方法长短期记忆网络神经网络模型负荷历史数据

两步法各向异性高斯喷溅方法及装置

相机模型物体探测器关系辐射成像技术

一种高效的隐私保护语义搜索方法

语义搜索方法节点云服务器 LDA模型查询关键词

一种基于深度学习的眼部OCT图像分析方法及系统

激光白内障手术相干断层扫描角膜曲率半径多角度白内障图像

一种星基增强系统格网电离层垂直误差预测方法及装置

误差预测方法空间特征提取格网特征提取模块网点特征

基于大模型的文本处理及大模型压缩方法和装置

站点导航

APP 下载