摘要
本申请涉及数据传输技术领域,公开了一种基于CXL的优化张量传输方法、设备以及存储介质,该方法包括将人工智能加速器的部分全局内存划分为CPU主机侧对应的一致性缓存区域,并通过CXL实现映射,其余张量则被分配到人工智能加速器侧对应的非一致性内存区域;在对CPU进行数据请求时,若所需缓存行无效,则向一致性缓存区域发起访存请求。本公开通过在人工智能加速器侧挂载一致性缓存区域减轻CPU侧的存储负担,同时基于更新的CXL策略,无需设计大容量的探听滤波器或一致性目录,提高了深度学习训练效率同时降低了成本,并在CXL层引入整合器和分解器,降低CXL通信流量,提高通信效率,降低了成本。
技术关键词
人工智能加速器
缓存行状态
分解器
主机
传输方法
信号
深度学习训练
数据更新
外存设备
数据传输技术
参数
内存控制器
计算机
通信效率
处理器通信
指令
可读存储介质
系统为您推荐了相关专利信息
解析器
配置管理工具
图形用户界面
虚拟化技术
场景
监控主机
终端机
电源转化电路
网络通信芯片
降压芯片
USB控制器
数据包传输方法
硬件加速器
无线通信模块
数据包传输装置
图像捕捉单元
六轴机械臂
数据分析单元
移动机器人
车辆识别装置