基于蒸馏的端侧大模型的量化方法、系统、装置及介质

AITNT
正文
推荐专利
基于蒸馏的端侧大模型的量化方法、系统、装置及介质
申请号:CN202510294818
申请日期:2025-03-13
公开号:CN120216991A
公开日期:2025-06-27
类型:发明专利
摘要
本发明属于人工智能技术领域,涉及一种基于蒸馏的端侧大模型的量化方法、系统、装置及介质,所述量化方法包括:1)通过权重量化和激活量化对由N层transformer结构层构成的目标大模型M进行模拟量化,以得到模拟量化的大模型2)基于所述目标大模型M和模拟量化的大模型对所述模拟量化的大模型的每层transformer结构层进行逐层蒸馏,以得到初步量化的大模型3)基于所述目标大模型M和初步量化的大模型对所述初步量化的大模型进行端对端的量化参数优化训练,以得到最终量化的大模型其通过逐层蒸馏和基于自蒸馏的端对端量化参数优化训练,避免了大模型量化需要大量算力的问题,具有可靠性、扩展性和易用性。
技术关键词
蒸馏 量化系统 参数 人工智能技术 因子 处理器 计算误差 可读存储介质 程序 模块 存储器 计算机
系统为您推荐了相关专利信息
1
一种芯片颗粒的自动化测试方法、系统和设备及计算机可读存储介质
电学特性参数 自动化测试方法 自动化测试设备 指数 波动特征
2
面向能源工业元宇宙的故障仿真推演实现方法及系统
工业设备 节点 数字孪生体 无线网络传输 蒙特卡洛树搜索
3
一种用于流域探测的高-多光谱图像深度鲁棒融合方法
数据 融合方法 条带 剥离模块 高光谱遥感图像
4
一种用于化工园区环境监测与污染溯源的方法和装置
XGBoost模型 物联网传感器网络 云端服务器 中央控制平台 轨迹模型
5
基于自监督的小样本目标检测方法、装置、设备及介质
样本 监督学习算法 数据 图像 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号