国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选

AITNT
未登录
正文
资源拓展
国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选
2026-04-01 10:49

国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


我自己用 Coding Plan 也有一段时间了,最开始只是为了省点 API 钱,后来各家陆续推出固定月费套餐,我发现选起来比想象中复杂。Codex、Claude Code、Cline、OpenClaw 这些工具让开发者越来越习惯用自然语言驱动代码生成和任务执行,但高频调用带来的 API 成本也成了一笔固定开销。为此,国内主流大模型厂商纷纷推出了面向开发者的固定月费套餐,业内统称为 Coding Plan。


这类套餐的本质是用一笔可预期的月费,换取远高于按量付费的调用额度。但各家在模型规模、开源策略、模态支持、计费方式和限额透明度上差异明显。这篇文章是我基于厂商官网和公开文档,对 MiniMax、智谱 GLM、阶跃星辰和 Kimi 四家方案做的一次系统梳理,方便我自己后续回看,也分享给你参考。


一、MiniMax Token Plan


MiniMax 在 2026 年 3 月将 Coding Plan 升级为 Token Plan,把文本、语音、图像、视频等能力打包进同一订阅。


模型与开源情况


MiniMax Token Plan 的核心模型是 MiniMax-M2.7,官方未公开其具体总参数量,M2 系列采用 MoE 架构。开源方面,MiniMax-M2(230B 总参数 / 10B 激活参数)和 MiniMax-M2.5(229B 总参数)均已开源,遵循 MIT License;而 MiniMax-M2.7 目前保持闭源,仅通过 API 提供服务。


开源地址如下:


  • MiniMax-M2 GitHub[1]
  • MiniMax-M2 Hugging Face[2]


模态支持上,M2.7 是文本单模态模型。套餐中提到的图像理解、语音合成、视频生成等能力,是通过平台集成的其他多模态 API 实现,而非 M2.7 模型本身具备多模态输入能力。


套餐档位


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


计费方式上,文本模型按请求次数计费,每 5 小时滚动重置,周限额约为每 5 小时限额的 10 倍。这种计费方式额度透明,不需要额外折算。API 参考价为输入未命中缓存 2.1 元/百万 tokens,命中缓存 0.42 元/百万 tokens,输出 8.4 元/百万 tokens。


MiniMax 的入门价最低(¥29),计费单位简单直接。如果你更看重额度透明度和低门槛尝鲜,这是目前友好的选择之一。


来源:MiniMax 开放平台定价[3]


二、智谱 GLM Coding Plan


智谱是国内最早推出 Coding Plan 的厂商之一,主打自研 GLM 系列模型。


模型与开源情况


智谱 GLM Coding Plan 的核心模型包括 GLM-4.7(355B 总参数,MoE 架构)、GLM-5.1、GLM-5-Turbo 和 GLM-5。其中 GLM-4.7 为 355B 总参数;GLM-5 为 744B 总参数 / 40B 激活参数;GLM-5.1 与 GLM-5 同架构,是后训练升级版本。开源方面,GLM-4.5、GLM-4.7 和 GLM-5 均已开源(MIT License);GLM-5.1 截至 2026 年 3 月 30 日尚未开源,但智谱官方已确认将遵循 MIT License 开源,具体日期未公布。


开源地址如下:


  • GLM-5 GitHub[4]
  • GLM-5 Hugging Face[5]
  • GLM-4.5 GitHub[6]


模态支持上,GLM-4.7 及以下是文本模型。套餐中包含的视觉理解、联网搜索、网页读取等 MCP 工具,是通过平台集成的额外服务实现。


套餐档位


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


计费方式按 prompts 计费。官方说明一次 prompt 约对应 15-20 次模型调用,每月可用额度按 API 定价折算,约为月订阅费的 15-30 倍。GLM-5 系列作为旗舰模型,调用时会按倍数消耗额度:高峰期(每日 14:00-18:00)按 3 倍抵扣,非高峰期按 2 倍抵扣。截至 2026 年 4 月底的限时福利是,GLM-5.1 和 GLM-5-Turbo 在非高峰期按 1 倍抵扣。


价格方面,2026 年 2 月 12 日起智谱对 GLM Coding Plan 涨价并取消首购优惠,Lite 从 ¥40 涨至 ¥49,Max 涨至 ¥469,2 月 12 日前订阅的老用户仍保留原价格和额度。


智谱的关键特点是工具适配数量最多(20+ 款),自带 MCP 工具链。但计费单位是 prompts,需要折算成实际请求次数,额度透明度不如按请求次数计费的方案。


MCP 额度限制


  • Lite 套餐:联网搜索 / 网页读取 / 开源仓库 MCP 每月合计 100 次
  • Pro 套餐:每月合计 1000 次
  • Max 套餐:每月合计 4000 次


OpenClaw 使用策略上,套餐支持 OpenClaw,但采用次级调度与尽力交付策略。Coding Agent 任务享有资源抢占优先权,高负载下 OpenClaw 任务将自动触发动态排队、限流等公平使用策略。


来源:智谱 GLM Coding Plan 官网[7]、智谱开放平台文档[8]


三、阶跃星辰 Step Plan


阶跃星辰在 2026 年 3 月 23 日正式推出 Step Plan,主打 Agent场景,速度实测非常快,在OpenClaw 和 AI Coding 场景表现也不错。


模型与开源情况


阶跃星辰 Step Plan 的核心模型是 Step 3.5 Flash,参数规模为 196B 总参数、11B 激活参数,采用 MoE 架构。该模型已开源,阶跃星辰开源了 Step 3.5 Flash 的 Base 和 Midtrain 权重,以及官方同款训练框架 Steptron。开源地址为 Step 3.5 Flash Hugging Face[9]。模态支持上,当前 Step Plan 仅支持 step-3.5-flash,属于文本单模态模型,多模态能力将在后续更新中逐步扩展。


套餐档位


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


计费方式按 Prompt 计费,1 Prompt 约等于 15-20 次标准模型调用。官方宣称同档价位下,实际模型调用次数可达竞品的 2 倍以上。


阶跃星辰 Step Plan 的关键特点包括:全档位标配高速推理,不设普通版与极速版之分;模型开源,开发者可以下载权重进行本地部署或二次研究;兼容 Claude Code、OpenClaw、Cline、RooCode 等 9 款主流工具;有独立的 Base URL(https://api.stepfun.com/step_plan/v1),与普通 API 地址不同。


来源:阶跃星辰 Step Plan 官方文档[10]


四、Kimi 登月计划 / Kimi Code


月之暗面的 Kimi Code 采用 Token 计量模式,额度设计与缓存机制强相关。


模型与开源情况


Kimi Code 的核心模型是 Kimi K2.5,参数规模为 1T 总参数,采用 MoE 架构,是目前国内公开参数规模最大的模型之一。K2.5 模型权重已开源。模态支持上,K2.5 支持文本和图像输入,是国内 Coding Plan 中少数具备原生视觉理解能力的模型。


套餐档位


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


计费方式按 uncached input + output tokens 计量,缓存命中的部分不计入限额。在典型的 Vibe Coding 场景中,input tokens 占总量的 99.5% 左右,其中缓存命中部分约占 90%-95%。实际可用请求数与缓存命中率强相关。API 参考价为输入未命中缓存 4 元/百万 tokens,命中缓存 0.7 元/百万 tokens,输出 21 元/百万 tokens。


Kimi 的关键特点是原生多模态能力最强,支持截图输入进行视觉编程;参数规模最大(1T);Allegretto 档支持 Agent 集群(多 Agent 并行)。但计费方式最复杂,额度受缓存命中率影响大,透明度较低。


来源:Kimi Code 会员权益指南[11]、Coding Plan 汇总参考[12]


五、横向对比一览


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


六、关于选购建议的说明


需要说明的是,目前我实际购买并长期使用的只有 Kimi K2.5 的 Coding Plan,其他三家(MiniMax、智谱 GLM、阶跃星辰)的方案尚未深度体验。因此本文不做具体的选购推荐,只把各家的官方参数、计费规则和特点摆出来,方便你根据自己的使用习惯和预算做判断。如果你已经用过其中某一家,也欢迎在评论区分享实际体验。


七、注意事项


各家 Coding Plan 的计费单位差异很大,MiniMax 按请求次数计费,智谱和阶跃按 Prompt 计费(需要折算成 15-20 次调用),Kimi 则按 uncached tokens 计费。选择前建议先估算自己的使用模式与计费单位的匹配度,避免买完后发现额度消耗比预期快。


Kimi 的额度与缓存机制强挂钩。如果上下文重复率低,uncached tokens 会快速消耗额度,实际可用次数可能远低于理论值。智谱的 GLM-5 系列在高峰期按 3 倍抵扣,使用旗舰模型时需留意额度消耗速度,非高峰期则相对划算。


开源不等于免费商用。阶跃和 Kimi 的模型权重虽然开源,但本地部署仍需考虑硬件成本。阶跃的 Step 3.5 Flash BF16 版本需要约 642GB 显存,FP8 版本需要约 326GB,普通开发者很难在本地跑起来。


阶跃星辰 Step Plan 有独立的 Base URL(https://api.stepfun.com/step_plan/v1),与普通 API 地址不同,在配置 Claude Code、Cline 等工具时需要注意区分。智谱的 MCP 服务有月度上限,Lite、Pro、Max 套餐的联网搜索、网页读取、开源仓库 MCP 分别有 100、1000、4000 次的月度合计上限,不是无限使用。此外,智谱 GLM Coding Plan 虽然支持 OpenClaw,但高负载时会触发排队和限流,Coding Agent 任务优先级更高,OpenClaw 任务可能需要等待。


八、限时薅羊毛


如果你还在犹豫从哪家开始尝鲜,阶跃星辰目前有一个不错的限时窗口:Step Plan 开发者社区四个档次都在打半折,Flash Mini 只要 ¥25/月,Flash Plus ¥49/月,Flash Pro ¥99/月,Flash Max ¥349/月。对于想低成本体验高速推理 + 开源模型背书的开发者来说,这个入门门槛已经相当低了。


国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选


引用链接

[1]MiniMax-M2 GitHub: https://github.com/MiniMax-AI/MiniMax-M2

[2]MiniMax-M2 Hugging Face: https://huggingface.co/MiniMaxAI/MiniMax-M2

[3]MiniMax 开放平台定价: https://www.minimaxi.com/pricing

[4]GLM-5 GitHub: https://github.com/zai-org/GLM-5

[5]GLM-5 Hugging Face: https://huggingface.co/zai-org/GLM-5

[6]GLM-4.5 GitHub: https://github.com/zai-org/GLM-4.5

[7]智谱 GLM Coding Plan 官网: https://www.bigmodel.cn/glm-coding

[8]智谱开放平台文档: https://docs.bigmodel.cn/cn/coding-plan/overview

[9]Step 3.5 Flash Hugging Face: https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base

[10]阶跃星辰 Step Plan 官方文档: https://platform.stepfun.com/docs/zh/step-plan/overview

[11]Kimi Code 会员权益指南: https://www.kimi.com/code/docs/

[12]Coding Plan 汇总参考: https://jia.je/kb/software/coding_plan.html


文章来自于“筱可AI”,作者“筱可AI”。

1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
IOS下载
安卓下载
微信群