向量量化大语言模型的算子融合机制分配方法与系统

正文

推荐专利

申请号：CN202411635336

申请日期：2024-11-15

公开号：CN119668894B

公开日期：2025-10-10

类型：发明专利

摘要

本发明提供一种向量量化大语言模型的算子融合机制分配方法与系统，所述方法包括以下步骤：获取布局数据，其中，布局数据包括解量化数据布局以及计算内核所需布局；基于布局数据计算得到数据混洗次数，并基于数据混洗次数与预设阈值进行比较，以动态响应决策机制，当数据混洗次数小于预设阈值，则采用第一决策机制，第一决策机制至少包括寄存器级别算子融合机制；当数据混洗次数大于或者等于预设阈值，则采用第二决策机制，第二决策机制至少包括共享内存级别算子融合机制。本发明的向量量化大语言模型的算子融合机制分配方法与系统，解决了数据在共享内存和寄存器之间频繁传输导致的带宽瓶颈和延迟问题，从而实现了更高效的解量化与计算融合。

技术关键词

大语言模型布局机制数据决策内核电子设备存储计算机程序分配系统动态存储器处理器离线可读存储介质模块接口瓶颈

系统为您推荐了相关专利信息

极耳超声波焊接质量在线监控方法

在线监控方法超声波焊接强度焊接接头信号夹具

重症患者肠内营养腹泻风险预测模型系统

风险预测模型肠道菌群丰度白蛋白特征提取模块特征值

一种用于高压电选机的自动化温度控制方法及系统

自动化温度控制高压电选机智能温控仪表料仓调压模块

一种超临界CO2注入诱发盖层节理断层失稳试验方法

超临界 CO2地质封存岩石微观结构 X射线衍射分析高压泵

基于改进YOLOv10算法的无人机交通实时目标检测方法、设备及存储介质

无人机高层语义特征图像拍摄数据交通重构

向量量化大语言模型的算子融合机制分配方法与系统

站点导航

APP 下载