用于AI大模型调用的流量限制方法、装置、设备及介质

正文

推荐专利

申请号：CN202510830879

申请日期：2025-06-20

公开号：CN120455379A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种用于AI大模型调用的流量限制方法、装置、设备及介质，该方法包括：网关服务器在接收目标调用请求后，通过客户端标识和应用标识构建目标查询键名；若未缓存匹配的分布式限流器，则获取请求的目标调用等级；查询模型服务器维护的环形缓冲区，获取当前流量限制区段下该调用等级的剩余流量值，其中环形缓冲区按标准时长划分时间单元并映射请求队列，队列存储各等级调用请求；最后基于流量限制区段和剩余流量值构建目标分布式限流器，并转发请求至模型服务器。本发明通过动态计算剩余流量和智能构建限流器，实现了高精度、多等级自适应的流量控制，有效平衡大模型服务的资源分配与请求公平性，同时保障了系统的高效稳定运行。

技术关键词

分布式限流环形缓冲区查询模型网关服务器流量计数器建立映射关系标识客户端队列可读存储介质计算机数值电子设备处理器通信限流器资源分配识别模块时效性

系统为您推荐了相关专利信息

基于无锁队列的网络传输方法

网络传输方法无锁队列环形缓冲区网卡元素

一种光模块和光模块配置方法

网络协议栈接口模块模块配置方法硬件抽象层电路板设备

基于线路磁场变量特征的配网线路设施缺陷的检测方法

线路注意力设施状态保存机制磁场传感单元

无服务计算系统事件采集与溯源图压缩方法及系统

环形缓冲区 RDMA技术深度神经网络模型内核节点

一种大模型训练挂起和降速场景下故障定位方法

故障定位方法子模块数据采集模块数据分析模型数据分析模块

用于AI大模型调用的流量限制方法、装置、设备及介质

站点导航

APP 下载