一种基于趋同性响应的大模型量化方法及相关系统

AITNT
正文
推荐专利
一种基于趋同性响应的大模型量化方法及相关系统
申请号:CN202510026263
申请日期:2025-01-08
公开号:CN119940573A
公开日期:2025-05-06
类型:发明专利
摘要
本发明属于人工智能技术领域,公开了一种基于趋同性响应的大模型量化方法及相关系统,本发明通过对大模型的各个层与通道进行权重压缩和量化,可以显著减少模型的存储需求和计算负担。这有助于将原本需要大量计算资源的模型,转变为适应资源受限设备(如边缘设备或移动设备)的较小模型,降低其对硬件资源的依赖。压缩后的模型通常包含较少的参数和操作,推理过程变得更加高效,从而加速了模型的响应速度。对于在端、边等实时场景中应用的任务,这种速度的提升至关重要。量化后模型的参数精度通常降低,这大大减少了模型所需的存储空间。在资源有限的设备中,这能有效节省内存和存储空间。
技术关键词
通道 量化系统 大语言模型 数据 参数 资源受限设备 人工智能技术 模块 处理器 幅值 移动设备 存储器 样本 电子设备 内存 负担 场景 精度 速度
系统为您推荐了相关专利信息
1
一种故障预测模型训练方法、故障预测方法以及装置
时序特征 通信网络 时间段 长短期记忆网络 全局优化算法
2
一种残余应力确定方法、装置、设备、介质及程序
基准 方位角 齿轮 应力 齿根
3
一种睡眠辅助方法及系统
睡眠辅助方法 薄膜压电传感器 人体生理信号 电信号 睡眠辅助系统
4
一种基于工业互联网的跨平台数据协同优化系统
产品生产线 协同优化系统 工业互联网 跨平台数据 任务分配模型
5
集成IO-Link主站收发芯片的交换机和交换系统
主控芯片 端口 SPI控制器 交换系统 串行接口协议
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号