摘要
本申请涉及一种人工智能加速卡异构集群适配方法、系统和存储介质,其中,该人工智能加速卡异构集群适配方法包括:获取根据训练框架提供的私有关键字注册的统一标准化适配模块;训练框架为异构集群模型的训练框架;在统一标准化适配模块中,通过工厂模式接入各异构加速卡的硬件层软件栈;通过插件形式扩展训练框架的计算任务分发机制,以使训练框架自主寻优目标异构加速卡;根据统一标准化适配模块所在的运行环境进行条件编译,以接入目标异构加速卡并用于训练框架自主寻优;根据统一测试模块验证统一标准化适配模块与各目标异构加速卡的适配状态,解决了人工智能加速卡异构集群适配开发成本大和无法自主寻优的问题。
技术关键词
异构加速卡
人工智能加速卡
框架
插件形式
关键字
集群
测试模块
机制
软件
接口
适配系统
标识符
推荐算法
扩展模块
模式
可读存储介质