摘要
本发明公开了一种边云环境下卷积神经网络模型的协同推理方法,包括:将卷积神经网络模型转换为有向无环图,并构建边‑云协同推理系统的目标函数与约束条件,在边‑云协同推理系统执行给定的卷积神经网络模型,获得卷积神经网络模型在异构设备上各层的执行时延以及各层输出数据,对有向无环图合并节点,获得规模优化后的有向无环图;对卷积神经网络模型各层输出数据进行预量化,在规模优化后的有向无环图基础上,根据各层在异构设备上的执行时延以及预量化后的各层输出数据的传输时延,构建预量化后的时延图,计算时延图中源点到汇点的最小割,进行实际模型压缩,获得给定卷积神经网络模型在异构设备上协同推理决策。
技术关键词
卷积神经网络模型
时延
异构设备
推理方法
推理系统
节点
服务器
数据
推送算法
模型压缩
规模
有向无环图
决策
钩子
基础
可读存储介质
动态
云端
计算机
系统为您推荐了相关专利信息
卸载策略
粒子群算法
遗传算法
任务调度策略
云平台
图像识别模型
图片
理赔方法
卷积神经网络模型
识别置信度
辅助诊断方法
阿尔茨海默病
卷积神经网络模型
轻度认知功能障碍
网络节点属性信息