基于人工智能平台的目标模型的推理加速方法及设备

AITNT
正文
推荐专利
基于人工智能平台的目标模型的推理加速方法及设备
申请号:CN202410834288
申请日期:2024-06-26
公开号:CN118779102A
公开日期:2024-10-15
类型:发明专利
摘要
本发明涉及人工智能、深度学习技术领域,用于通过人工智能平台对深度学习模型、机器学习模型或大语言模型推理时的资源占用情况进行监控,并进行资源调节,以降低了服务器资源负载。本发明提供一种基于人工智能平台的目标模型的推理加速方法及设备,所述方法包括:在所述目标模型的推理过程中,获取所述多个步骤中每个步骤对应的硬件资源占用数据,以及所述每个步骤对应的设定负载阈值;在所述多个步骤中存在至少一个目标步骤的情况下,扩展所述目标步骤对应的实例,所述目标步骤为对应的所述硬件资源占用数据大于对应的所述设定负载阈值的步骤。
技术关键词
人工智能平台 模型剪枝 精度 数据 深度学习技术 内存 机器学习模型 深度学习模型 处理器 容器 存储器 电子设备 资源
系统为您推荐了相关专利信息
1
屏幕检测方法及系统
屏幕检测方法 触控检测设备 服务端 区域数据库 客户端
2
物料推荐方法、装置、设备及计算机存储介质
序列 深度神经网络 矩阵 点击率 元素
3
一种用于风力发电机组的故障检测方法
故障检测方法 检测设备 分析风力发电机组 风力发电机组故障 故障分析模型
4
节能热泵系统的控制方法
节能热泵系统 经济效益评估 舒适度 室内环境参数 能效
5
一种红外绝缘子缺陷检测方法及系统
图像分割模型 数据 绝缘子缺陷 采样模块 上采样
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号