用于AI大模型调用的流量限制方法、装置、设备及介质

AITNT
正文
推荐专利
用于AI大模型调用的流量限制方法、装置、设备及介质
申请号:CN202510830879
申请日期:2025-06-20
公开号:CN120455379A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开了一种用于AI大模型调用的流量限制方法、装置、设备及介质,该方法包括:网关服务器在接收目标调用请求后,通过客户端标识和应用标识构建目标查询键名;若未缓存匹配的分布式限流器,则获取请求的目标调用等级;查询模型服务器维护的环形缓冲区,获取当前流量限制区段下该调用等级的剩余流量值,其中环形缓冲区按标准时长划分时间单元并映射请求队列,队列存储各等级调用请求;最后基于流量限制区段和剩余流量值构建目标分布式限流器,并转发请求至模型服务器。本发明通过动态计算剩余流量和智能构建限流器,实现了高精度、多等级自适应的流量控制,有效平衡大模型服务的资源分配与请求公平性,同时保障了系统的高效稳定运行。
技术关键词
分布式限流 环形缓冲区 查询模型 网关服务器 流量计数器 建立映射关系 标识 客户端 队列 可读存储介质 计算机 数值 电子设备 处理器通信 限流器 资源分配 识别模块 时效性
系统为您推荐了相关专利信息
1
基于无锁队列的网络传输方法
网络传输方法 无锁队列 环形缓冲区 网卡 元素
2
一种光模块和光模块配置方法
网络协议栈 接口模块 模块配置方法 硬件抽象层 电路板设备
3
基于线路磁场变量特征的配网线路设施缺陷的检测方法
线路 注意力 设施 状态保存机制 磁场传感单元
4
无服务计算系统事件采集与溯源图压缩方法及系统
环形缓冲区 RDMA技术 深度神经网络模型 内核 节点
5
一种大模型训练挂起和降速场景下故障定位方法
故障定位方法 子模块 数据采集模块 数据分析模型 数据分析模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号