摘要
本申请公开了一种大语言模型的访问方法、设备及介质,包括:当接收到目标调用方的访问请求时,确定所述目标调用方对应的需求功能信息;获取用于提供大语言模型服务的各服务集群的集群信息,其中,所述集群信息包括性能信息和并发支持信息;在各所述服务集群中,选取出所述性能信息与所述需求功能信息匹配的、且所述并发支持信息与所述访问请求的数量匹配的目标服务集群;将所述访问请求转发至所述目标服务集群,并在所述目标服务集群返回针对所述访问请求的访问结果时,将所述访问结果转发给所述目标调用方。这样,在满足功能需求的同时,能够保障使用大语言模型的稳定性。
技术关键词
服务集群
大语言模型
鉴权信息
内存
处理器
队列
可读存储介质
消息
存储器
电子设备
计算机
资源
系统为您推荐了相关专利信息
数据语义信息
网络攻击预测方法
面向网络攻击
大语言模型
动态时间窗口
特征值
企业数据管理方法
企业数据管理系统
大数据
输入神经网络模型