一种私有化大语言模型生态服务的高效部署方法及系统

正文

推荐专利

申请号：CN202411584177

申请日期：2024-11-07

公开号：CN119440849A

公开日期：2025-02-14

类型：发明专利

摘要

本发明涉及一种私有化大语言模型生态服务的高效部署方法及系统，包括评估模块、指标采集器、监控模块、vLLM框架、模型集群服务模块和请求分发模块。评估模块对系统在不同硬件平台下的性能进行量化评估；指标采集器实时采集服务器集群性能指标、集群资源状态与负载信息；监控模块对服务器集群进行监控；vLLM框架动态分配计算资源，实现对多模态服务器集群的管理，并通过PM2进行统一管理和调度实现多模型高效并行处理任务；模型集群服务模块启动vLLM框架，将不同的大模型实例封装在Docker容器中；请求分发模块根据指标采集器实时反馈的集群资源状态与负载信息自适应地分发外部请求。实现了智能化请求分发与动态负载均衡，多模态大语言模型的集成与高效管理。

技术关键词

大语言模型服务器集群高效部署系统分发模块采集器监控模块任务调度管理前馈神经网络文本解码器编码器模型训练模块注意力指标生态框架

一种私有化大语言模型生态服务的高效部署方法及系统

站点导航

APP 下载