面向边缘计算的轻量级大模型压缩与部署方法

AITNT
正文
推荐专利
面向边缘计算的轻量级大模型压缩与部署方法
申请号:CN202510510353
申请日期:2025-04-23
公开号:CN120633724A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供面向边缘计算的轻量级大模型压缩与部署方法,涉及大模型进行压缩与部署的技术领域,包括自适应大模型压缩算法和基于边缘自治的分布式部署架构,用于在边缘设备上实现大模型的高效压缩与部署,自适应大模型压缩算法的资源与任务感知模块在边缘设备上实时监测硬件资源和获取当前任务信息,为压缩策略制定提供依据,自适应动态剪枝策略能依据任务需求和设备资源精准调整剪枝阈值,在压缩模型的同时最大程度保留关键信息,例如在医学影像识别任务中,传统剪枝方法可能使模型对微小病灶的识别准确率从90%降至70%,而本发明的剪枝策略能将准确率稳定保持在85%以上,压缩率可达40%,有效提升了模型在有限资源下的可用性。
技术关键词
模型压缩 压缩算法 分布式任务调度 动态剪枝 医学影像识别 量化误差 资源 性能优化方法 比特数 剪枝方法 剪枝策略 精度 提升系统 监控设备 机制 模块 集群 云端 内存
系统为您推荐了相关专利信息
1
一种网络交易监管平台
交易监管平台 异常事件 数据处理模块 监测模块 分析交易数据
2
一种便于智能抄表的电能计量箱及抄表方法
电能计量箱 异构多核处理器 通信控制单元 传感器阵列 解密引擎
3
一种钻孔-注浆一体化的水下机器人
水下机器人 框架结构 机器人主体 深海高压环境 钻孔
4
一种无人机视角下的轻量化目标检测方法
视角 通道剪枝 卷积神经网络训练 蒸馏 压缩算法
5
基于业数融合的多维度报表自动生成方法
报表自动生成方法 指标 节点 字段 语义结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号