基于混合精度的端边云多级推理方法和装置

AITNT
正文
推荐专利
基于混合精度的端边云多级推理方法和装置
申请号:CN202510924402
申请日期:2025-07-04
公开号:CN120725150A
公开日期:2025-09-30
类型:发明专利
摘要
本发明提供了一种基于混合精度的端边云多级推理方法,包括:量化感知步骤,实时监控推理任务的当前计算需求和当前资源状态,根据所述当前计算需求和所述当前资源状态选择对应的计算精度,所述精算精度包括低精度、中精度、高精度和/或混合精度;混合精度计算步骤,若所述推理任务对应的是所述混合精度,将所述推理任务拆分为多个子任务;流水线并行步骤,根据每个所述子任务的计算需求,将多个所述子任务分配到对应的计算节点进行流水线并行处理。本发明还提供一种基于混合精度的端边云多级推理装置、存储介质及电子设备。借此,本发明能够实现计算精度、计算资源之间的平衡,并能实现多级推理的高效协同处理,降低处理延迟并提升计算吞吐量。
技术关键词
推理方法 精度 系统资源利用率 滑动窗口技术 流水线 子模块 数据 系统吞吐量 推理装置 时间段 节点 电子设备 云服务器 处理器 终端设备 决策 误差 负担
系统为您推荐了相关专利信息
1
基于惯性辅助的北斗高精度时空基准动态补偿系统
动态补偿系统 北斗高精度 精密单点定位 北斗卫星信号 动态误差
2
多级应力加载下结构疲劳寿命的预测方法
鲸鱼优化算法 应力 结构疲劳寿命 因子 位置更新
3
时序数据异常检测方法、装置和设备
变量 样本 重构误差 编码器 模糊推理
4
一种电子海图ENC数据向SENC数据转换的方法
电子海图 海图数据 计数器 键值 序列
5
一种基于跨阶段局部网络的轻量化目标检测方法与装置
检测网络模型 注意力机制 模块 阶段 分支
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号