清华创业团队打造！国内首个专注AI推理Serverless GPU平台

AI技术研报 2025-05-28 15:09

+7185 阅读

你有没有遇到过这样的算力困境：买了 GPU，用不了几次就闲置烧钱，偶尔想用的时候却一卡难求？

现在，国内终于有了自己的 RunPod—— 共绩云 AI 推理 Serverless 平台，不仅支持极简快速部署，而且超级低价 ——RTX 4090 最高只要 1.68 元/小时，还能按毫秒计费、自动扩容，真正做到了 “随用随租”。

这款来自清华系创业团队产品，似乎正在悄悄重塑 AI 推理的游戏规则。而现在，你也可以参与其中并享受优惠！

在 1.68 元/小时的 RTX 4090 基础上，即日起至 6 月 18 日，新用户注册并充值，将额外获得 20% 积分！另外，用户还可以通过邀请码为自己和朋友赚取更多积分（各得 50 元积分）。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

官网链接：suanli.cn

下面我们就来看看为什么你应该将以上链接复制到浏览器，然后打开并注册使用！另外，你还将了解共绩算力究竟是如何打造出了中国版的 RunPod。

下面，就来看看这个清华创业团队的技术创新和模式创新吧！

当前 AI 推理算力市场存在结构性问题

随着 AI 应用的落地增长，推理算力的需求持续提升。然而，当下国内的算力服务市场存在结构性问题，使得推理计算成本居高不下，成为制约 AI 应用大规模落地的 “隐形瓶颈”。

服务僵化，弹性不足：流量高峰时，GPU 一卡难求，应用卡顿，用户流失；流量低谷时，预购算力大量闲置，白白烧钱。刚性供给与弹性需求之间的矛盾，直接影响了 AI 应用的效率和用户体验。
模式传统，阻碍增长：多数厂商要求长租，高昂的固定投入让创业公司望而却步，阻碍业务快速迭代和试错。
管理繁琐 & 效率低下：跨平台资源调度、复杂环境配置、持续运维投入…… 大量工程师的精力被基础设施 “绑架”，无法专注于产品创新。
供需错配，一卡难求：算力资源建设粗放，精细化运营缺失，算力供需严重不匹配，一方面有大量闲置算力资源未能被有效利用，另一方面，短租高性能 GPU 却 “一卡难求”。

这些问题共同构成了 AI 算力市场的 “弹性、稳定、低价” 不可能三角。在现有模式下，企业往往只能在这三者中选择其二，难以兼得。例如，追求极致弹性可能牺牲稳定性或增加成本；追求稳定和低价则可能失去弹性。这种困境成为 AI 开发者普遍面临的巨大挑战。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

多数云平台提供的三类服务：整租（低价 & 稳定）、按量租（高价 & 稳定）、抢占式 SPOT 实例（低价 & 弹性）

传统 GPU 整租模式，其设计初衷更多是为了满足持续、高负载的 AI 训练任务。然而，AI 推理的特点是请求量波动大、突发性强、单次请求耗时短。这种模式与 AI 推理的实际需求存在根本性的不匹配。当流量稀疏时，大量预购的 GPU 闲置，产生高昂的 “空闲成本”；当流量激增时，又因扩容慢而导致用户排队或服务中断。这使得 AI 应用的成本居高不下，商业模式难以闭环，从而阻碍了 AI 应用的广泛部署和创新。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

刚性供给与弹性需求之间的矛盾，直接影响了 AI 应用成本和用户体验

Serverless GPU：重塑 AI 应用部署范式

Serverless 计算是一种云原生开发模型，它将底层服务器的管理和维护工作完全抽象化，由云服务提供商负责。开发者只需将代码打包成容器或函数，即可部署应用。其核心优势在于：按需付费（闲置不收费）、自动伸缩（根据需求弹性扩缩容）、以及极大地简化运维。

将 GPU 能力与 Serverless 模式结合，意味着 AI 开发者可以按需调用强大的 GPU 算力，无需预先购买和维护昂贵的硬件，也无需担心资源闲置。特别适用于 AI 推理这种计算密集型、但请求量不稳定的工作负载，能够大幅缩短处理时间，优化成本。这种模式也适用于实时和批量推理、3D 渲染、大数据分析等典型用例。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

Serverless 架构工作机制示意

全球 Serverless GPU 市场正在蓬勃发展。在 AI 算力服务领域，国外已有先行者，如 RunPod，其 Serverless 产品提供了按时计费、零出入网费、支持多种 GPU 型号、容器化部署、闪电般冷启动等优势。主要服务于 AI 训练和推理工作负载。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

Runpod.io

但同时，国内却缺少专注于 Serverless GPU 服务的平台，少数提供 Serverless GPU 服务的平台往往资源极少（因为压货成本过高），难以实现快速稳定的扩缩，使得多数本土应用难以进行大批量的 Serverless 部署，制约了 AI 应用的增长。

共绩算力：专注 Serverless GPU 推理服务

在这一行业痛点日益凸显之际，“共绩算力”（suanli.cn）应运而生。专注提供 Serverless GPU 推理服务，打破行业 “不可能三角”，实现真正的弹性&稳定&低价，让 AI 开发者不受算力制约，专注于产品本身，创造无限可能。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

为支撑 AI 应用的快速部署，共绩算力平台为 AI 推理服务部署打造了极简流程，为 AI 开发者带来了多重核心价值，真正实现以下特性：

极致弹性，随时扩缩

随流量快速扩缩容：流量激增时秒级扩容，流量回落时缩容归零，告别浪费与排队。

毫秒级按量计费：AI 模型推理有请求才付费，没请求不花钱，彻底告别空闲成本。

部署极简，无缝迁移

Docker 容器化：五步部署，一键托管，快速上云，实现真正 “零运维”。

兼容各类平台：提供预制镜像与 7x24h 免费技术支持，可顺滑迁移。

资源管饱，价格最优

独家调度网络：整合全国算力，提供万卡资源。

保障充足低价：全网最实惠的算力（4090 单卡 1.68 元 /h，按量计费）。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

部署教程：实测两分钟内完成部署。（手机也可操作）

支撑这一 “弹性、稳定、低价” 算力服务的，是共绩科技自研的闲时算力调度平台。目前该平台已经调度整合了来自包括金山云、火山引擎在内的 26 家智算平台的算力资源，超越了单一云厂商的资源边界，使得不可能三角变成可能，平台不仅提供了 Serverless 的按需付费特性，更通过资源整合扩大了可用算力池，解决了 “供需错配” 这一结构性问题。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

共绩科技团队拥有深厚的学术和技术背景，核心成员来自清华大学、北京大学以及 Intel、字节跳动、阿里等知名企业。团队在分布式资源调度领域深耕多年，目前已承建青海省、河北省省级算力调度平台，具备极强的工程落地能力，suanli.cn 已累计服务 90 余家人工智能企业。曾获 2024 年互联网 + 亚军（金奖，创业组冠军），并已获得奇绩创坛、水木创投等知名机构的投资。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台

全网低价，助力 AI 创新

共绩云 AI 推理 Serverless 平台

上线优惠活动

🔥 NVIDIA RTX 4090 单卡推理，价格最高 1.68 元 / 小时！

🚀 即日起至 6 月 18 日，新用户注册并充值，额外赠送 20% 积分！

💰 邀请好友，通过您的邀请码成功拉新，您和被邀请人各得 50 元积分！

参与方式：活动期间，通过共绩科技官方网站登录用户后台，选择在线充值即可自动参与并获得赠送金额。具体活动细则以官网届时公布为准。

想要开启您的 AI 推理新纪元，让算力不再是您创新的瓶颈？

👉立即访问：suanli.cn

文章来自于“机器之心”，作者“共绩算力”。

清华创业团队打造！国内首个专注AI推理Serverless GPU平台