利用连续剪枝函数进行2:4稀疏预训练的方法和装置

AITNT
正文
推荐专利
利用连续剪枝函数进行2:4稀疏预训练的方法和装置
申请号:CN202411114179
申请日期:2024-08-14
公开号:CN119227766A
公开日期:2024-12-31
类型:发明专利
摘要
本发明提供一种利用连续剪枝函数进行2:4稀疏预训练的方法和装置,涉及深度学习技术领域,所述方法包括:获取目标模型的原始权重;其中,所述目标模型为带有线性层的深度神经网络或大模型;基于所述原始权重,在所述目标模型正向传播前执行固定比例的剪枝操作,得到稀疏权重;将预先获取的训练数据输入至所述目标模型中,按照所述稀疏权重和所述目标模型的层次结构进行逐层计算,得到输出结果;其中,所述训练数据包括文本数据、图像数据或视频数据。通过本发明提供的方法,在模型进行正向传播前进行剪枝操作,得到稀疏权重,使用稀疏权重完成正向传播,在优化模型的同时保持较高的精度。
技术关键词
深度神经网络 非暂态计算机可读存储介质 数据 分块 深度学习技术 处理器 计算机程序产品 文本 因子 视频 线性 图像 存储器 元素 电子设备 模块 符号 精度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号