自然语言模型的剪枝处理方法、系统和电子设备

AITNT
正文
推荐专利
自然语言模型的剪枝处理方法、系统和电子设备
申请号:CN202410842278
申请日期:2024-06-27
公开号:CN118445400B
公开日期:2024-08-30
类型:发明专利
摘要
本发明提供一种自然语言模型的剪枝处理方法、系统和电子设备,基于获得的各个训练数据并基于自然语言模型,获得对应的输入构造数据及对应的标签数据,标签数据表征多头注意力运算模块中各个头部的权重。利用输入构造数据及标签数据对构建的剪枝小模型进行训练,将剪枝小模型的模型参数与自然语言模型的模型参数进行合并,得到具备剪枝功能的自然语言模型,其中,该模型中包含的剪枝小模型的模型参数可用于对待处理数据进行处理时,对自然语言模型中的多个头部进行剪枝处理。该方案中,优化后的自然语言模型中剪枝小模型部分能够根据每次的不同输入自适应找到最优的头部,推理效果更好、鲁棒性更强。
技术关键词
自然语言模型 剪枝功能 数据 注意力 模块 标签 参数 电子设备 多层感知机 处理器 文本 鲁棒性 指令
系统为您推荐了相关专利信息
1
三维数字化车间管理系统及电子设备
三维模型 数据处理单元 策略 模具 效能
2
网络入侵检测模型训练方法、装置、服务器、网关、可读存储介质和程序产品
网络入侵检测模型 网关 模型更新 服务器 数据
3
基于无损压缩算法的数据存储方法
无损压缩算法 数据存储方法 数据分析工具 复杂度 编码
4
基于空间对齐与特征耦合的矿井提升机钢丝绳缺陷检测方法
矿井提升机钢丝绳 缺陷检测方法 耦合特征 检测网络模型 融合注意力机制
5
一种糖尿病足溃疡患者非负重运动康复锻炼决策支持系统
糖尿病足溃疡 决策支持系统 患者 个性化教育 分层算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号