一种训练感知大模型二值化方法、系统以及在线推理方法

正文

推荐专利

申请号：CN202510673122

申请日期：2025-05-23

公开号：CN120509489A

公开日期：2025-08-19

类型：发明专利

摘要

本申请提供一种训练感知大模型二值化方法、系统以及在线推理方法，二值化方法包括：采用交替的方式，初始化大语言模型的二值化参数；对完成初始化的所述大语言模型，进行逐层对齐训练；启动大语言模型的端到端训练，使所有二值化参数在统一损失函数下进行协同优化；对完成统一协同优化的所述大语言模型，实施基于层重要性的二值化阶数分配策略，达到最终的大语言模型，用于下游任务。本申请能够在保持精度的同时，显著降低模型体积与计算复杂度，适用于边缘设备部署和大规模在线推理等多种实际场景。

技术关键词

大语言模型二值化方法参数推理方法二值化系统策略文本精度在线处理器优化器可读存储介质指令模块存储器复杂度序列程序度量计算机

系统为您推荐了相关专利信息

资源消耗异常预警方法和装置、电子设备及存储介质

资源消耗预测实时数据预警方法数值波动特征

一种基于遗传算法的联邦学习系统优化方法、设备、介质及产品

系统优化方法联邦学习系统遗传算法客户端分类准确率

基于大语言模型智能体的数字人学生驱动方法

学生驱动方法大语言模型教师知识点

一种基于IPSO-LSTM模型的燃煤电厂碳排放预测的方法

燃煤电厂碳排放神经网络模型 LSTM模型指标超参数

基于基线氨基酸的代谢综合征发病风险预测系统及方法

风险预测系统逻辑回归模型基线人口统计信息变量

一种训练感知大模型二值化方法、系统以及在线推理方法

站点导航

APP 下载