摘要
本发明公开了一种代码自动向量化优化方法、设备及介质,属于高性能计算技术领域,用于解决现有的代码自动向量化较为不便,人工操作占比较大,难以支持对不规则的或存在负载依赖关系的代码进行向量化,不利于计算性能的提升以及能耗的降低的技术问题。方法包括:根据并行计算的计算内核,获取计算任务的标量指令图;对标量指令图进行规约转换处理,得到规约指令图;根据指令的高层次组织结构,将规约指令图进行有关映射向量的分组处理,得到分组图;基于硬件的限定向量长度,对分组图中的指令向量进行拆分匹配处理,得到向量匹配分组图;将向量匹配分组图中每组的元素进行执行配置,得到向量操作图。
技术关键词
量化优化方法
元素
节点
指令组
执行算法
非易失性计算机可读存储介质
非易失性计算机存储介质
高层次
高性能计算技术
结构组
存储特征
依赖特征
内核
优化设备
组织
模版
处理器通信
数据
系统为您推荐了相关专利信息
三维人体姿态估计
关键点
三维人体姿态识别
空间特征信息
关节点特征
防淹系统
环境检测传感器
城市轨道交通区间
电力监测装置
运动状态检测
仿真模型
元素
仿真软件
页面展示方法
计算机可读指令
分析管理系统
数据处理单元
数据平台
节点
随机森林模型