摘要
本公开提供一种用于大模型的资源处理方法、装置、电子设备与可读存储介质,涉及大模型、深度学习等人工智能技术领域。其中,用于大模型的资源处理方法包括:确定大模型对应当前时刻的目标流量;根据所述当前时刻,获取流量阈值与流量负载值;响应于确定所述目标流量大于所述流量阈值,根据所述目标流量、所述流量负载值、第一类型资源与已生效第二类型资源,得到目标第二类型资源;根据所述目标第二类型资源,执行资源获取操作或者资源释放操作。本公开能够在确保大模型稳定运行的前提下,实现对大模型所使用的资源进行自适应调节的目的,从而降低大模型的资源使用成本。
技术关键词
资源
流量变化曲线
电子设备
人工智能技术
计算机程序产品
冗余
处理器通信
指令
可读存储介质
处理单元
存储器