一种加速大模型推理任务的异构智能算力优化管理调度系统

AITNT
正文
推荐专利
一种加速大模型推理任务的异构智能算力优化管理调度系统
申请号:CN202510849880
申请日期:2025-06-24
公开号:CN120743517A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种加速大模型推理任务的异构智能算力优化管理调度系统,涉及算力优化管理调度技术领域,本发明通过异构算子级调度重构算力管理范式,动态尺寸块划分与梯度突变检测协同作用,将长序列场景下显存碎片化问题转化为可控的块迁移任务,突破传统显存交换机制的性能瓶颈;基于硬件能力指纹库的算子级调度策略,使位置编码等计算密集型任务精准匹配向量指令集硬件,消除黑盒调度带来的资源错配损耗;整数化路由与计数排序算法重构专家选择流程,在指令集受限节点实现近无损推理,激活老旧算力池的潜在价值。
技术关键词
管理调度系统 异构 块尺寸 节点 管理调度技术 序列 排序算法 动态 基准块 因子 分析器 键值 索引 原子写 集群 密度 指纹 编码 内存
系统为您推荐了相关专利信息
1
虚假数据注入攻击检测方法和装置、系统、存储介质
攻击检测方法 攻击检测装置 检测模型训练 数据中心 节点
2
一种超低空洞率的甲酸锡膏及其制备方法和应用
异构十三醇聚氧乙烯醚 表面活性剂 乙烯基己内酰胺 锡膏 助焊剂
3
基于层次对比学习和逐步正交多模态融合的代谢物-疾病关联预测方法
疾病关联预测方法 多模态 信息熵 K近邻算法 高斯核函数
4
一种基于云原生架构管理Redis的方法和系统
集群 管理工具 插件 文件夹 节点
5
一种混合现实的交互方法及系统
虚拟对象 锚点 坐标系 交互方法 服务器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号