一种面向交通场景的大模型高效微调与自适应量化方法

正文

推荐专利

申请号：CN202510704076

申请日期：2025-05-29

公开号：CN120597968A

公开日期：2025-09-05

类型：发明专利

摘要

本发明提供了一种面向交通场景的大模型高效微调与自适应量化方法，属于智能交通技术领域，首先采用LoRA方法冻结预训练大模型的主干权重，并对其注意力模块权重进行低秩分解；再对权重矩阵及其分解矩阵进行多策略量化处理，包括INT4、FP4与NF4等量化方法；通过动态能量模型剔除异常偏大值，并构建分块概率密度分布函数以提高量化精度；最后，基于KL散度最小化准则自适应选择最匹配的量化方案，实现对模型的4‑bit压缩。该方法可广泛应用于文本生成代码交通控制系统中的模型优化任务，在保障指令生成准确率的同时显著降低计算负载，具备良好的实时性、可移植性与系统实用价值。

技术关键词

面向交通场景矩阵分块交通仿真平台交通控制系统智能交通技术动态生成代码注意力多策略数据格式指令语义方程文本指数模块数值

系统为您推荐了相关专利信息

一种基于数模混合驱动的工业烟气影像质量评估方法

视觉显著性检测影像注意力机制特征提取模块卷积神经网络模块

基于结构重量约束的飞机机翼肋板数控加工方法

飞机机翼三维激光扫描仪加工余量肋板数据

一种基于线性化的飞机传感器测量误差传递算法

飞机传感器传感器测量误差力矩升力方程

大语言模型的训练方法、推理方法、装置及设备

大语言模型注意力机制文本分块模块

基于空间域动态标签的影像数据防伪方法及设备

数据防伪方法影像加密国密算法动态

一种面向交通场景的大模型高效微调与自适应量化方法

站点导航

APP 下载