一种基于服务请求密度预测的低能耗神经网络推理方法与装置

正文

推荐专利

申请号：CN202410785986

申请日期：2024-06-18

公开号：CN119003111A

公开日期：2024-11-22

类型：发明专利

摘要

一种基于服务请求密度预测的低能耗神经网络推理方法与装置，所述方法包括以下步骤：S1、神经网络推理服务器根据神经网络运行服务请求密度的潮汐现象，构建推理服务时间段内服务请求密度随时间变化的服务请求密度预测函数组；S2、神经网络推理服务器为神经网络运行有向无环图中每个操作选取不同性能的算子；S3、神经网络推理服务器上的神经网络运行调度程序根据神经网络运行下一个时间的预测服务请求密度，在符合服务要求的延迟条件下为每个操作选择合适性能的算子，最终达到神经网络运行满足延迟要求的同时功耗最低。有益效果是能在满足服务延迟要求的情况下，降低服务器功耗。

技术关键词

神经网络推理推理方法密度动态规划算法服务器生成框架低功耗高性能时间段查找表程序数学效应场景

系统为您推荐了相关专利信息

一种日志采集方法、装置、设备及介质

通用异步收发传输器日志采集方法安全控制模块数据中心数据管理

基于大数据的远程患者跟踪管理方法

跟踪管理方法分布特征大数据自动编码器历史生理数据

基于物联网技术的无人值守方法和系统

联邦学习模型可调谐激光值守方法物联网技术噪声滤波

一种共享用燃气液化气密码表系统及方法

智能燃气表模块后台服务器液化气数据传输模块访问控制模型

增程式发动机的控制方法、装置、混合动力车辆及介质

工作状态参数增程式发动机策略网络模型神经网络模型发电机

一种基于服务请求密度预测的低能耗神经网络推理方法与装置

站点导航

APP 下载