摘要
本申请提供一种训练感知大模型二值化方法、系统以及在线推理方法,二值化方法包括:采用交替的方式,初始化大语言模型的二值化参数;对完成初始化的所述大语言模型,进行逐层对齐训练;启动大语言模型的端到端训练,使所有二值化参数在统一损失函数下进行协同优化;对完成统一协同优化的所述大语言模型,实施基于层重要性的二值化阶数分配策略,达到最终的大语言模型,用于下游任务。本申请能够在保持精度的同时,显著降低模型体积与计算复杂度,适用于边缘设备部署和大规模在线推理等多种实际场景。
技术关键词
大语言模型
二值化方法
参数
推理方法
二值化系统
策略
文本
精度
在线
处理器
优化器
可读存储介质
指令
模块
存储器
复杂度
序列
程序
度量
计算机
系统为您推荐了相关专利信息
系统优化方法
联邦学习系统
遗传算法
客户端
分类准确率
燃煤电厂碳排放
神经网络模型
LSTM模型
指标
超参数
风险预测系统
逻辑回归模型
基线
人口统计信息
变量