基于智能计算中心的算力部署大语言模型的方法及装置

AITNT
正文
推荐专利
基于智能计算中心的算力部署大语言模型的方法及装置
申请号:CN202411570043
申请日期:2024-11-05
公开号:CN119449830A
公开日期:2025-02-14
类型:发明专利
摘要
本发明提供一种基于智能计算中心的算力部署大语言模型的方法及装置,其中方法应用于智能计算中心的VCluster集群,包括:步骤S1:获取预设的配置文件,所述配置文件包括:目标大语言模型的名称、私有云平台的网络地址;步骤S2:根据所述目标大语言模型的名称,获取封装于NVIDIA NIM服务的所述目标大语言模型的封装文件,并且,按照所述私有云平台的网络地址,将所述封装文件传递并存储至所述私有云平台;步骤S3:根据所述封装文件,将所述目标大模型部署至所述私有云平台。本发明部署目标大模型具备高安全性,并且,部署效率高。
技术关键词
私有云平台 大语言模型 计算中心 集群 命令行工具 处理器 可读存储介质 镜像仓库 指令 计算机程序产品 存储器 电子设备 模块 许可 接口
系统为您推荐了相关专利信息
1
用户交互方法、系统、车辆、设备及存储介质
店铺 大语言模型 交互方法 结构化查询语句 画像特征
2
基于OMNeT++的巨星座仿真系统及方法
子模块 权重模型 能量消耗 仿真系统 动态
3
一种异构航天器集群通信网络生成与拓扑优化方法
航天器集群 拓扑优化方法 集群通信网络 Prim算法 生成树
4
一种群智演化动力学涌现点定位及感知识别方法
演化动力学 感知识别方法 交互网络 网络结构 方程
5
文本翻译方法、系统、装置、设备以及存储介质
术语 文本翻译方法 文本翻译系统 光学字符识别技术 翻译装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号