一种训练感知大模型二值化方法、系统以及在线推理方法

AITNT
正文
推荐专利
一种训练感知大模型二值化方法、系统以及在线推理方法
申请号:CN202510673122
申请日期:2025-05-23
公开号:CN120509489A
公开日期:2025-08-19
类型:发明专利
摘要
本申请提供一种训练感知大模型二值化方法、系统以及在线推理方法,二值化方法包括:采用交替的方式,初始化大语言模型的二值化参数;对完成初始化的所述大语言模型,进行逐层对齐训练;启动大语言模型的端到端训练,使所有二值化参数在统一损失函数下进行协同优化;对完成统一协同优化的所述大语言模型,实施基于层重要性的二值化阶数分配策略,达到最终的大语言模型,用于下游任务。本申请能够在保持精度的同时,显著降低模型体积与计算复杂度,适用于边缘设备部署和大规模在线推理等多种实际场景。
技术关键词
大语言模型 二值化方法 参数 推理方法 二值化系统 策略 文本 精度 在线 处理器 优化器 可读存储介质 指令 模块 存储器 复杂度 序列 程序 度量 计算机
系统为您推荐了相关专利信息
1
资源消耗异常预警方法和装置、电子设备及存储介质
资源消耗预测 实时数据 预警方法 数值 波动特征
2
一种基于遗传算法的联邦学习系统优化方法、设备、介质及产品
系统优化方法 联邦学习系统 遗传算法 客户端 分类准确率
3
基于大语言模型智能体的数字人学生驱动方法
学生 驱动方法 大语言模型 教师 知识点
4
一种基于IPSO-LSTM模型的燃煤电厂碳排放预测的方法
燃煤电厂碳排放 神经网络模型 LSTM模型 指标 超参数
5
基于基线氨基酸的代谢综合征发病风险预测系统及方法
风险预测系统 逻辑回归模型 基线 人口统计信息 变量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号