一种针对深度学习算法的动态调用多模型的方法及服务架构

正文

推荐专利

申请号：CN202411820702

申请日期：2024-12-11

公开号：CN119645607A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了一种针对深度学习算法的动态调用多模型的方法及服务架构，方法包括客户端通过标准AP I接口向调度服务发送请求；调度服务接收到请求后，解析提取请求的关键信息生成任务队列并选择Server服务器；调度服务实时获取Agent服务提供的状态数据，根据Server服务器的负载情况进行任务分配；调度服务将选定的任务信息存入数据库，并在任务状态表中标记“待处理”状态；Server服务器收到调度任务后，调用模型管理服务加载指定的推理模型；S6、当推理任务执行完毕后，推理服务池将结果通过回调机制通知调度服务。优点是：提高深度学习任务的处理能力和效率，通过动态调用多个模型来满足不同任务的需求，同时优化资源使用和保证系统的可扩展性。

技术关键词

深度学习算法多模型服务器回调机制队列客户端故障检测机制任务调度策略数据负载均衡算法远程仓库机器学习模型心跳机制动态更新通知保证系统资源分配

系统为您推荐了相关专利信息

芯片测试方法及相关装置

芯片测试方法自定义指令仿真器缓存机制芯片测试装置

一种5G网络双通道传输系统

双通道传输系统网关服务器拥塞控制算法网络终端

面向基于分布式学习的移动边缘计算环境下群组设备身份认证与密钥协商方法及系统

移动边缘计算环境设备身份认证密钥协商方法分布式学习云服务器

一种基于CPE程序小文件的一键自动签名方法及系统

存储容量参数 SCP协议签名模块文件传输协议签名方法

一种基于大语言模型的咨询问答方法、系统、设备及介质

开发工具包问答方法大语言模型项目生成服务器

一种针对深度学习算法的动态调用多模型的方法及服务架构

站点导航

APP 下载