MaaS平台大模型推理参数自动优化加速方法

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
MaaS平台大模型推理参数自动优化加速方法
申请号:CN202511445622
申请日期:2025-10-11
公开号:CN120950083A
公开日期:2025-11-14
类型:发明专利
摘要
本发明提供了MaaS平台大模型推理参数自动优化加速方法,包括通过检测硬件配置、构建标准化容器环境并准备压测数据;采用智能搜索算法遍历多维参数空间,通过压测和性能评分公式自动发现特定硬件和模型组合的最优推理参数;将各种硬件型号和模型版本对应的最优参数组合持久化存储到结构化数据库,形成可复用的参数知识库;在模型部署时自动识别当前硬件环境,从参数库中智能匹配并加载对应的最优参数配置,实现零配置优化部署。本发明通过参数组合可行性验证机制,能够及时发现并排除会导致系统错误或内存溢出的参数组合,确保最终选定的参数既能提升性能,又能保证系统的稳定运行。
技术关键词
优化加速方法 参数 设备架构 智能搜索算法 图形处理器卡 系统管理接口 标准化容器 搜索规则 平台 哈希查找算法 调度器 拓扑结构信息 时延 命令 动态剪枝 资源监控 错误日志 脚本 验证机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号