基于大模型的文本处理及大模型压缩方法和装置

AITNT
正文
推荐专利
基于大模型的文本处理及大模型压缩方法和装置
申请号:CN202510735386
申请日期:2025-06-03
公开号:CN120874936A
公开日期:2025-10-31
类型:发明专利
摘要
本公开提供了基于大模型的文本处理及大模型压缩方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。所述基于大模型的文本处理方法可包括:获取输入文本对应的词元序列;针对词元序列中的各词元,分别进行以下处理:响应于确定需要利用目标大模型中的融合层对该词元进行处理,通过至少两次执行融合层中的推理计算,生成该词元对应的目标处理结果,目标大模型为对待压缩大模型进行模型压缩后得到的,模型压缩包括将待压缩大模型中的Lm个依次相邻的层融合为所述融合层,Lm为大于1的正整数,且Lm小于L,L表示待压缩大模型中包括的层数。
技术关键词
矩阵 模型压缩方法 参数 文本处理方法 饱和度 模块 注意力 文本处理装置 序列 语义 元素 指令 多层感知机 计算机程序产品 处理器通信 自然语言
系统为您推荐了相关专利信息
1
一种变电站多层级电力负荷预测方法及系统
变电站 电力负荷预测方法 长短期记忆网络 神经网络模型 负荷历史数据
2
两步法各向异性高斯喷溅方法及装置
相机模型 物体 探测器 关系 辐射成像技术
3
一种高效的隐私保护语义搜索方法
语义搜索方法 节点 云服务器 LDA模型 查询关键词
4
一种基于深度学习的眼部OCT图像分析方法及系统
激光白内障手术 相干断层扫描 角膜曲率半径 多角度 白内障图像
5
一种星基增强系统格网电离层垂直误差预测方法及装置
误差预测方法 空间特征提取 格网 特征提取模块 网点特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号