摘要
本发明公开了一种云计算环境中负载均衡方法及系统,涉及云计算技术领域,方法包括:接收目标用户的服务请求,获取目标用户的用户画像信息,根据用户画像信息确定与服务请求对应的目标模型,获取当前服务池中各节点的模型部署信息及当前负载值,根据用户画像信息、模型部署信息及对应的当前负载值计算服务请求与各节点的匹配度评分,根据匹配度评分确定目标节点,若目标节点的匹配度评分高于预设评分阈值,则将服务请求调度至目标节点,否则,在当前服务池部署目标模型,并将服务请求调度至当前服务池中的兼容节点;其有益效果为:可以提高服务请求调度精准性、优化资源利用率以及增强模型不可用场景下的服务连续性。
技术关键词
云计算环境
均衡方法
节点
计算机可执行指令
语义向量
优化资源利用率
画像特征
错误率
计算机存储介质
均衡系统
云计算技术
时延
处理器
模块
多标签
因子
存储器
系统为您推荐了相关专利信息
模型训练方法
模型压缩
模型训练系统
分布式数据集
数据访问速度
机械故障诊断
实体抽取方法
命名实体识别模型
图谱
文本
双层规划方法
负荷
储能设备
充放电功率
分层聚类算法
固化土强度
深度学习神经网络模型
神经网络架构
样本
节点数