大模型推理集群的推理性能数据获取方法、装置及设备

AITNT
正文
推荐专利
大模型推理集群的推理性能数据获取方法、装置及设备
申请号:CN202510233863
申请日期:2025-02-28
公开号:CN119718878A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种大模型推理集群的推理性能数据获取方法、装置及设备,涉及人工智能技术领域,包括:在存在推理请求的情况下,针对目标大模型推理集群中每个计算节点,确定推理请求发起位置、推理请求完成回复位置、首个token返回的位置和推理总时长;根据所获取的推理请求发起位置的请求发起数量、推理请求完成回复位置在单位时间内的吞吐量、首个token的处理时长和每个token的处理时长,得到推理性能数据。由此,通过统计每个计算节点的请求发起数量、吞吐量和时延,可以得到集群所有计算节点的推理性能信息,解决了集群推理性能数据难以准确获取的问题,达到了高效、精准地监控和管理大模型推理集群性能的技术效果。
技术关键词
数据获取方法 时间序列数据库 集群 节点 统计特征 时延 数据获取装置 可读存储介质 存储计算机程序 人工智能技术 计算机程序产品 分层 处理器 异常点 频率 规模 面板 周期
系统为您推荐了相关专利信息
1
一种基于数据融合的涡轮叶片振动疲劳监测方法及系统
疲劳监测方法 涡轮叶片 LSTM模型 特征向量机 疲劳状态监测
2
一种GPGPU的安全调用方法、装置、设备及介质
加密算法 明文 指令 解密算法 调度算法
3
基于大数据文件集群的文件模糊拷贝方法及系统
分布式计算框架 任务调度器 分布式文件系统 状态转换概率 节点
4
基于联邦学习的分布式节点级预测方法及存储介质
节点 模型更新 网络拓扑结构 非临时性存储介质 加权平均策略
5
倾斜摄影模型的加载渲染方法及装置
倾斜摄影模型 层级 渲染方法 场景 物体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号