摘要
本发明公开了一种基于ARM架构的矩阵计算自适应优化方法及系统,包括:对待处理矩阵数据进行预处理;对预处理后的矩阵数据进行局部活跃度计算和热点区域识别,确定矩阵的长尾分布特征;基于矩阵的长尾分布特征和处理器信息中多级缓存容量参数,计算矩阵的最优分块大小范围,生成非对称分块方案;基于非对称分块方案,建立矩阵特征与最优分块参数的映射关系;基于非对称分块方案和映射关系,计算各分块的计算密度和内存访问模式,生成任务调度方案;基于任务调度方案,在处理器上执行矩阵计算,输出最终计算结果。本发明通过识别矩阵的长尾分布特性,实现自适应分块和异构核心调度,提高矩阵计算在ARM上的性能和能效。
技术关键词
矩阵
内存访问模式
任务调度
数据
分布特征
缓存命中率
热点
参数
精度
分块策略
内存访问策略
分布方差
关系
验证规则
能效
误差模型
处理器指令集
OTSU算法
系统为您推荐了相关专利信息
多模态数据分析
儿童自闭症
评测系统
信号采集模块
电信号
人工智能终端系统
语音交互系统
人工智能语音交互技术
云存储
存储子系统
优化配置方法
智能体模型
指数
农田土壤水分
监测数据处理
多元线性回归模型
时序
儿童
电磁感应线圈
独创性
预警方法
数据分析模型
基坑结构
监测设备
基坑周边