摘要
本申请提供了一种大模型运行方法、系统、设备及存储介质,其中,该方法包括:模型服务根据用户输入的模型信息以及模型服务所在服务器的架构,生成模型注册信息,并将模型注册信息发送给容器引擎;容器引擎根据模型注册信息,从文件仓库中获取模型注册信息对应的模型文件,并基于模型文件生成模型注册信息对应的镜像文件,并将镜像文件发送给模型服务;模型服务根据镜像文件触发目标容器运行,目标容器运行时,生成目标容器的运行链接;模型服务获取运行链接,并根据用户的指令触发运行链接所执行的目标大模型运行。本申请能够实现目标大模型的自动化部署以及运行,减少了手动安装和配置的工作量。
技术关键词
模型运行方法
容器
组件仓库
图形用户界面
机器可读指令
服务器
镜像
可读存储介质
脚本
处理器
电子设备
存储器
计算机
工作量
关系
数据