摘要
本发明提供了一种基于强化学习的稀疏矩阵向量乘的程序设计系统,包括:稀疏矩阵表达模块,被配置为:在多个决策阶段中的每个阶段,确定稀疏矩阵对应的阶段表达,各阶段表达包括用于指示稀疏矩阵在当前阶段在计算硬件的层次计算资源中分配信息的层次映射、非零元的绝对位置和相对位置;强化学习模块,被配置为:在第i阶段,利用神经网络从第i‑1阶段的阶段表达中提取阶段特征,根据阶段特征确定第i阶段的策略和预测价值;获取基于蒙特卡洛树搜索算法为该稀疏矩阵维护的搜索树,并基于搜索树、策略和预测价值,确定第i阶段采取的动作;根据所有阶段采取的动作,构建引导稀疏矩阵向量乘在计算硬件上完成计算的程序代码。
技术关键词
阶段
程序设计系统
矩阵
策略
蒙特卡洛树
分配信息
搜索算法
层次化结构
样本
内存
模块
决策
索引
形态
动态
数据
系统为您推荐了相关专利信息
工作管理系统
贝叶斯网络模型
ARIMA模型
监控显示器
隐马尔可夫模型
传输控制方法
路由器
进化方法
拥塞窗口
拥塞控制算法
机械臂运动路径
RGBD图像
多视角
关键点
取景装置
游戏引擎
资源依赖关系
启动优化方法
玩家
机器学习算法