摘要
本申请公开了一种基于AIGC的分布式算力调度方法及其系统,涉及算力调度领域,首先实时获取GPU指标流、请求指标流,并对其进行时间序列对齐和特征工程,同时对业务意图文本进行语义特征提取,将上述处理后的特征融合为向量化系统状态输入至生成式AI调度代理来预测未来的模型需求,输出模型需求预测JSON。随后,规划器模块依据此预测和当前缓存状态,生成优化的缓存行动计划,指导调度执行器预先加载或智能置换模型。最终,请求路由器在接收到新请求时,能够查询更新后的缓存状态,直接将请求分发至已加载目标模型的GPU节点,从而显著降低冷启动延迟,提升算力资源利用效率和用户体验。
技术关键词
时序特征
算力调度方法
指标
量化系统
语义特征提取
意图
文本
信息熵
特征工程
特征值
节点
路由器
规划
编码
列表
执行器
数据获取模块
分发模块
系统为您推荐了相关专利信息
聚乳酸复合材料
复合地膜
断裂延伸率
降解预测方法
纤维素纳米晶体
低压配电柜
感知特征
机器视觉平台
监测方法
视觉特征
核回归模型
精确测量方法
成分含量
反射率差异
样本
调控系统
数字孪生模型
传感模块
控制模块
器官培养方法