加速卡部署方法、装置、设备、存储介质和程序产品

AITNT
正文
推荐专利
加速卡部署方法、装置、设备、存储介质和程序产品
申请号:CN202510897024
申请日期:2025-06-30
公开号:CN120407200B
公开日期:2025-09-16
类型:发明专利
摘要
本申请公开了加速卡部署方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域,本申请的方法中,一方面,基于目标模型运行过程中的存储占用量,确定运行目标模型所需的加速卡数量,这样,可以保证加速卡的存储容量之和与目标模型的存储占用量相匹配。另一方面,依据加速卡数量,构建多个加速卡拓扑架构,并基于各个加速卡拓扑架构运行目标模型时的模型性能指标,选择模型性能指标符合预设条件的第一加速卡拓扑架构作为部署加速卡的架构参考,这样,在加速卡中运行目标模型时,可以保证目标模型的性能满足期望的性能要求。基于以上两个方面,可以解决相关技术中的模型的硬件资源配置与计算需求不匹配的问题。
技术关键词
加速卡 令牌 非易失性可读存储介质 服务器 中央处理器 注意力机制 序列 键值 硬件资源配置 通信带宽 参数 冗余 存储计算机程序 人工智能技术 计算机程序产品 模块 电子设备
系统为您推荐了相关专利信息
1
面向行业标准文档的深度语义实体与关系自动抽取方法
语义实体 异构 多模态 关系 生成训练数据
2
基于混合现实游泳穿戴设备的游泳教学辅助系统、方法
头戴显示设备 陀螺仪 游泳教学辅助系统 游泳穿戴设备 泳裤
3
一种工业硅高效智能出炉的控制方法
机器学习模型 多模态传感器 闭环控制系统 数据采集层 工业硅冶炼技术
4
一种基于联邦学习的火力发电厂安全监测方法
监测方法 样本 空洞 多层感知机 高低压加热器
5
一种基于空间域和频率域特征注意力的医学图像分割方法
医学图像分割模型 医学图像分割方法 注意力 加权损失函数 解码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号