摘要
本发明公开了一种面向企业场景的AI大模型部署方法及系统。其中方法包括:S1、获取目标企业场景的业务数据集,预处理业务数据集生成业务场景需求集;S2、根据业务场景需求集获取多组私有数据集,构建业务场景需求集与多组私有数据的映射;S3、将多组私有数据集写入预设大模型库中的各大模型中;S4、获取目标企业场景的硬件数据集,根据硬件数据生成多组硬件容器,且各硬件容器均设置对应大模型的硬件接口;S5、根据业务数据集,生成多个模拟业务请求至预设大模型库,接收各大模型的模拟响应;S6、根据模拟业务请求和模拟响应,确定当前业务数据集的部署方案。本方法适配企业的未来业务场景,保障模型运行性能,降低企业部署成本。
技术关键词
模型部署方法
场景
序列
模型库
企业
实时业务
生成业务
容器
样本
数据获取模块
数据处理模块
低延迟
动态
接口
高频率
资源
服务器
系统为您推荐了相关专利信息
可视化系统
数据接口模块
实时数据采集
可视化参数
分层规则
企业业务系统
生成模板
报表
企业资源计划系统
配置管理数据库