摘要
本发明公开了一种针对深度学习算法的动态调用多模型的方法及服务架构,方法包括客户端通过标准AP I接口向调度服务发送请求;调度服务接收到请求后,解析提取请求的关键信息生成任务队列并选择Server服务器;调度服务实时获取Agent服务提供的状态数据,根据Server服务器的负载情况进行任务分配;调度服务将选定的任务信息存入数据库,并在任务状态表中标记“待处理”状态;Server服务器收到调度任务后,调用模型管理服务加载指定的推理模型;S6、当推理任务执行完毕后,推理服务池将结果通过回调机制通知调度服务。优点是:提高深度学习任务的处理能力和效率,通过动态调用多个模型来满足不同任务的需求,同时优化资源使用和保证系统的可扩展性。
技术关键词
深度学习算法
多模型
服务器
回调机制
队列
客户端
故障检测机制
任务调度策略
数据
负载均衡算法
远程仓库
机器学习模型
心跳机制
动态更新
通知
保证系统
资源分配
系统为您推荐了相关专利信息
芯片测试方法
自定义指令
仿真器
缓存机制
芯片测试装置
双通道传输系统
网关服务器
拥塞控制算法
网络
终端
移动边缘计算环境
设备身份认证
密钥协商方法
分布式学习
云服务器
存储容量参数
SCP协议
签名模块
文件传输协议
签名方法
开发工具包
问答方法
大语言模型
项目
生成服务器