基于AIGC的分布式算力调度方法及其系统

AITNT
正文
推荐专利
基于AIGC的分布式算力调度方法及其系统
申请号:CN202511006133
申请日期:2025-07-22
公开号:CN120508404B
公开日期:2025-09-19
类型:发明专利
摘要
本申请公开了一种基于AIGC的分布式算力调度方法及其系统,涉及算力调度领域,首先实时获取GPU指标流、请求指标流,并对其进行时间序列对齐和特征工程,同时对业务意图文本进行语义特征提取,将上述处理后的特征融合为向量化系统状态输入至生成式AI调度代理来预测未来的模型需求,输出模型需求预测JSON。随后,规划器模块依据此预测和当前缓存状态,生成优化的缓存行动计划,指导调度执行器预先加载或智能置换模型。最终,请求路由器在接收到新请求时,能够查询更新后的缓存状态,直接将请求分发至已加载目标模型的GPU节点,从而显著降低冷启动延迟,提升算力资源利用效率和用户体验。
技术关键词
时序特征 算力调度方法 指标 量化系统 语义特征提取 意图 文本 信息熵 特征工程 特征值 节点 路由器 规划 编码 列表 执行器 数据获取模块 分发模块
系统为您推荐了相关专利信息
1
一种基于p-范数算法的PLA基复合地膜使用寿命预测方法、系统和存储介质
聚乳酸复合材料 复合地膜 断裂延伸率 降解预测方法 纤维素纳米晶体
2
低压配电柜生产过程的实时质量监测方法及系统
低压配电柜 感知特征 机器视觉平台 监测方法 视觉特征
3
一种钼铁合金的成分含量精确测量方法及系统
核回归模型 精确测量方法 成分含量 反射率差异 样本
4
一种类器官培养的自适应调控系统及方法
调控系统 数字孪生模型 传感模块 控制模块 器官培养方法
5
一种计算机目标检测数据集质量评估方法和系统
评价指标算法 样本 矩阵 数据完整性校验 评价器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号