摘要
本申请公开了一种请求处理方法,所述方法包括:响应于接收到第一客户端发送的推理请求,获取与目标模型对应的映射实例表,其中,所述推理请求用于请求所述目标模型执行推理任务,所述映射实例表包括所述目标模型与至少一个第一候选服务实例的对应关系;从所述映射实例表中选择目标服务实例,并将所述推理请求转发至所述目标服务实例;响应于接收到所述目标服务实例针对所述推理请求返回的推理结果,将所述推理结果发送至所述第一客户端。
技术关键词
服务端
注册中心
通知
客户端
指数
模型更新
关系
压力
系统为您推荐了相关专利信息
分数阶神经网络
教学质量评价模型
样本
教学质量评价方法
数据
贪婪算法
深度学习框架
长短期记忆网络
门控循环单元
数据
大规模分布式光伏
深度强化学习模型
调峰方法
变压器
多时间尺度