基于资源动态调配的信创环境大语言模型的高效适配方法

AITNT
正文
推荐专利
基于资源动态调配的信创环境大语言模型的高效适配方法
申请号:CN202510433676
申请日期:2025-04-08
公开号:CN120295793A
公开日期:2025-07-11
类型:发明专利
摘要
本申请涉及资源调配技术领域,具体涉及基于资源动态调配的信创环境大语言模型的高效适配方法,该方法包括:实时获取各硬件的显存余量、有效算力、各硬件与其余硬件进行数据传输时所能提供的最大数据传输速率,大语言模型中各层的梯度张量,以及各层任务的总耗时与从当前时刻到完成的预估时长;实时评估各硬件的剩余资源,并通过各层的损失值和梯度张量的变化情况,以及各硬件的实时显存余量在显存总量中的占比,对各层的预设基准秩进行更新,得到大语言模型中各层的秩;通过实时所述预估时长与所述总耗时,对各层的秩进行调整;对各层任务分配硬件。本申请通过对智能芯片硬件进行剩余资源评估和秩的动态调整,实现资源的动态调配。
技术关键词
高效适配方法 大语言模型 动态 资源调配技术 集群 基准 智能芯片 理论 总量 数据 计算方法 因子 表达式 指数
系统为您推荐了相关专利信息
1
一种灌区洪水风险预测系统及方法
风险预测系统 水文设备 风险预测模型 空间注意力模型 交互式可视化
2
一种物联网平台的多层安全防护方法及系统
编码向量 异常流量 防护方法 时序 队列
3
一种基于深度学习的电力信息动态识别方法
动态识别方法 电力 数值 模型算法 动态识别技术
4
短信文本处理方法及短信文本接收方法
短信 文本处理方法 通信卡 语义依存分析 文本分类模型
5
一种大语言模型推理错误修正方法、装置、设备及介质
错误修正方法 大语言模型 推理系统 文本 有向无环图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号