轻量化自然语言处理大模型训练方法

正文

推荐专利

轻量化自然语言处理大模型训练方法

申请号：CN202510355279

申请日期：2025-03-25

公开号：CN119862925B

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开了轻量化自然语言处理大模型训练方法；包括如下步骤，获得处理语言数据；得到已标注的增强数据集；通过语义复杂度动态激活子网络的稀疏化机制，计算得到激活掩码；通过激活掩码的参数敏感度生成量化位宽；对混合精度量化策略进行交叉反馈调节；对训练的学生模型进行评估。本申请通过动态稀疏激活、混合精度量化及协同优化，解决了大模型轻量化中的静态策略僵化、量化精度损失、知识迁移低效等核心问题；动态稀疏激活替代传统静态剪枝，减少语义损失；为了实现对增强数据集进行优化的特征提取，采用融合优化特征；混合精度量化有效的实现对计算的复杂程度进行降低。

技术关键词

模型训练方法数据上下文特征融合特征语义学生文本字符复杂度参数自然语言模型教师标签动态门控策略特征提取器精度主题

系统为您推荐了相关专利信息

老年人居家安全健康智能管理系统

健康智能管理系统老年人居家健康管理服务器时序关键帧

一种基于大模型的校园防欺凌系统

生理反应李雅普诺夫指数多模态方程信号采集模块

一种基于异构算力的资源统一管理方法及其系统

资源统一管理方法效能曲线异构数据依赖关系网络抖动

一种万用表校准检测方法、设备、产品及存储介质

校准检测设备万用表万能表测量误差数据校正

一种导波损伤监测信号的载荷补偿方法

补偿方法基线信号回溯算法载荷

轻量化自然语言处理大模型训练方法

站点导航

APP 下载