一种模型推理性能优化方法、装置、设备和存储介质

AITNT
正文
推荐专利
一种模型推理性能优化方法、装置、设备和存储介质
申请号:CN202510858008
申请日期:2025-06-25
公开号:CN120409704A
公开日期:2025-08-01
类型:发明专利
摘要
本申请公开了一种模型推理性能优化方法、装置、设备和存储介质,包括:响应于接收到推理请求,识别目标推理模型的结构特征,根据结构特征确定目标推理模型的类型,其中推理请求包括请求参数,目标推理模型用于执行推理请求,根据目标推理模型的类型和请求参数确定第一资源分配,获取系统负载数据,根据系统负载数据确定系统负载状态等级,根据第一资源分配和系统负载状态等级确定第二资源分配,根据第二资源分配对推理请求进行计算,得到推理结果,通过该方法,能够优化资源利用率并提升系统吞吐量。
技术关键词
性能优化方法 资源分配 数据 优化资源利用率 性能优化装置 参数 生成哈希值 高带宽 处理器 频率 哈希算法 序列 提升系统 网络 计算机设备 模块 可读存储介质 格式 存储器
系统为您推荐了相关专利信息
1
有向无环泛基因组图上的叠瓦谱隐马尔可夫序列比对方法
序列比对方法 马尔可夫模型 维特比解码 解码算法 队列
2
基于光纤光栅传感和机器学习的精冲装备监测方法及系统
监测方法 支持向量机分类器 阶段 光纤光栅传感器 装备
3
一种基于嵌套阵列的多载波信号的角度和时延估计方法
时延估计方法 载波 波束赋形矩阵 嵌套 阵列
4
基于大模型技术的生物信息分析系统
生物信息分析系统 分类边界 代表 跨模态数据 子模块
5
一种针对终端与服务进行融合的异常行为检测方法和装置
DBSCAN算法 终端 聚类 周期 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号