大语言模型推理吞吐量测试的方法、装置及程序产品

AITNT
正文
推荐专利
大语言模型推理吞吐量测试的方法、装置及程序产品
申请号:CN202510058818
申请日期:2025-01-14
公开号:CN120045896A
公开日期:2025-05-27
类型:发明专利
摘要
本申请涉及一种大语言模型推理吞吐量测试的方法、装置及程序产品,其中该方法包括:基于精度评测的数据集对待测试框架进行推理评测;记录所述推理评测中每个请求信息;分别计算每个时刻处于预填充阶段和解码阶段的请求均值;建立所述请求均值与吞吐量的函数,生成吞吐量预测模型。通过采用真实的精度评测的数据集来进行推理评测,同时通过吞吐量与输入输出长度的关系进行拟合,减少推理实用与测量吞吐量的偏差。将精度评测和吞吐量测量同时完成,减少额外的计算量。
技术关键词
大语言模型 非易失性计算机可读存储介质 计算机程序指令 阶段 精度 处理器 解码 数据 计算机程序产品 模块 框架 样本 服务器 存储器 偏差 矩阵 关系
系统为您推荐了相关专利信息
1
一种多元时间序列异常检测方法和装置
时间序列异常检测方法 多元时序数据 时序特征 注意力 计算机可读指令
2
基于人工智能的文生艺术字方法、装置、设备及介质
艺术字方法 风格 栅格 大语言模型 生成指令
3
基于机器视觉的金属底框平整度检测方法
平整度检测方法 粗糙度 底框 边缘检测 灰度共生矩阵
4
知识图谱构建方法、电子设备和计算机可读存储介质
三元组 大语言模型 样本 多模态 知识图谱构建方法
5
用于汽车饰品的缺陷检测与处理方法
高精度相机 机械夹爪 汽车饰品 坐标系 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号