摘要
本发明公开了一种基于国产GPU的人工智能应用部署方法,包括:加载人工智能应用的算法模型,解析并提取算法模型中用到的神经网络算子,并按照原始算法模型中的算子顺序形成计算流图;从OpenCL平台中选择国产GPU设备,基于此GPU设备创建上下文,在上下文上创建命令队列,同时利用缓存区对象为各算子创建kernel对象和内存对象;利用OpenCL编写各算子的并行计算kernel,同时生成这些算子的程序对象和实例化kernel;按照计算流图中的算子前后连接关系,顺序调用kernel,并将kernel运行在国产GPU设备上,从而完成人工智能应用的部署。本发明使得AI应用可高性能部署,且不需要网络传输,延时低。
技术关键词
算法模型
矩阵
对象
卷积算法
树形结构
内存
索引
尺寸
图像
目录
队列
命令
高性能
键值
平台
程序
关系
节点
网络
系统为您推荐了相关专利信息
高精度匹配方法
策略
动态调整机制
特征点
均衡误差
轮廓提取方法
特征点
密度聚类算法
边缘轮廓
核密度估计方法
数据交换方法
数据项
语义匹配算法
石油
映射技术
医学影像分类方法
多层感知器
多尺度特征
投影变换矩阵
分类器
换流器
引入虚拟阻抗
功率解耦控制方法
有功功率
表征系统