摘要
本申请公开了一种智能自适应AI大模型动态激活与调度方法、设备及存储介质,涉及数据处理技术领域,包括:通过所述请求路由器接收外部请求,根据所述大模型激活器的通路状态,确定所述外部请求的路由方向;若所述大模型激活器的通路状态为开启,则将所述外部请求路由到所述大模型激活器,并通过所述大模型激活器缓存所述外部请求;基于所述大模型激活器中缓存的所述外部请求的数量,触发所述自动伸缩器调整大模型服务实例数量;通过流量分发算法,将所述大模型激活器中缓存的所述外部请求分发给各所述大模型服务实例进行处理。本申请实现了提高AI大模型服务的资源利用效率的技术效果。
技术关键词
自动伸缩器
动态
路由器
队列
算法
调度设备
数据处理技术
处理器
服务器
可读存储介质
存储器
标记
序列
平台
信号
计算机
资源
基础
系统为您推荐了相关专利信息
稳定匹配算法
答案
皮尔逊相关系数
场景
沙普利算法
发电机
功率
深度强化学习算法
指令组
灵敏度计算方法
设备故障预警方法
协方差矩阵
信号
电机转动惯量
高斯分布模型