轻量化自然语言处理大模型训练方法

AITNT
正文
推荐专利
轻量化自然语言处理大模型训练方法
申请号:CN202510355279
申请日期:2025-03-25
公开号:CN119862925B
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了轻量化自然语言处理大模型训练方法;包括如下步骤,获得处理语言数据;得到已标注的增强数据集;通过语义复杂度动态激活子网络的稀疏化机制,计算得到激活掩码;通过激活掩码的参数敏感度生成量化位宽;对混合精度量化策略进行交叉反馈调节;对训练的学生模型进行评估。本申请通过动态稀疏激活、混合精度量化及协同优化,解决了大模型轻量化中的静态策略僵化、量化精度损失、知识迁移低效等核心问题;动态稀疏激活替代传统静态剪枝,减少语义损失;为了实现对增强数据集进行优化的特征提取,采用融合优化特征;混合精度量化有效的实现对计算的复杂程度进行降低。
技术关键词
模型训练方法 数据 上下文特征 融合特征 语义 学生 文本 字符 复杂度 参数 自然语言模型 教师 标签 动态门控 策略 特征提取器 精度 主题
系统为您推荐了相关专利信息
1
老年人居家安全健康智能管理系统
健康智能管理系统 老年人居家 健康管理服务器 时序 关键帧
2
一种基于大模型的校园防欺凌系统
生理反应 李雅普诺夫指数 多模态 方程 信号采集模块
3
一种基于异构算力的资源统一管理方法及其系统
资源统一管理方法 效能曲线 异构 数据依赖关系 网络抖动
4
一种万用表校准检测方法、设备、产品及存储介质
校准检测设备 万用表 万能表 测量误差数据 校正
5
一种导波损伤监测信号的载荷补偿方法
补偿方法 基线 信号 回溯算法 载荷
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号