向量量化大语言模型的算子融合机制分配方法与系统

AITNT
正文
推荐专利
向量量化大语言模型的算子融合机制分配方法与系统
申请号:CN202411635336
申请日期:2024-11-15
公开号:CN119668894B
公开日期:2025-10-10
类型:发明专利
摘要
本发明提供一种向量量化大语言模型的算子融合机制分配方法与系统,所述方法包括以下步骤:获取布局数据,其中,布局数据包括解量化数据布局以及计算内核所需布局;基于布局数据计算得到数据混洗次数,并基于数据混洗次数与预设阈值进行比较,以动态响应决策机制,当数据混洗次数小于预设阈值,则采用第一决策机制,第一决策机制至少包括寄存器级别算子融合机制;当数据混洗次数大于或者等于预设阈值,则采用第二决策机制,第二决策机制至少包括共享内存级别算子融合机制。本发明的向量量化大语言模型的算子融合机制分配方法与系统,解决了数据在共享内存和寄存器之间频繁传输导致的带宽瓶颈和延迟问题,从而实现了更高效的解量化与计算融合。
技术关键词
大语言模型 布局 机制 数据 决策 内核 电子设备 存储计算机程序 分配系统 动态 存储器 处理器 离线 可读存储介质 模块 接口 瓶颈
系统为您推荐了相关专利信息
1
极耳超声波焊接质量在线监控方法
在线监控方法 超声波焊接强度 焊接接头 信号 夹具
2
重症患者肠内营养腹泻风险预测模型系统
风险预测模型 肠道菌群丰度 白蛋白 特征提取模块 特征值
3
一种用于高压电选机的自动化温度控制方法及系统
自动化温度控制 高压电选机 智能温控仪表 料仓 调压模块
4
一种超临界CO2注入诱发盖层节理断层失稳试验方法
超临界 CO2地质封存 岩石微观结构 X射线衍射分析 高压泵
5
基于改进YOLOv10算法的无人机交通实时目标检测方法、设备及存储介质
无人机 高层语义特征 图像拍摄数据 交通 重构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号