日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

正文

资源拓展

2025-01-20 16:46

如果2023年给大模型的关键词是席卷，那么在2024，这个关键词应该是渗透。

最常用的软件、手机PC本身、甚至厨卫/电源开源，都在被AI重塑。

主观感受中，这一年，AI更加强大，以前所未有的速度嵌入各行各业。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

真实的客观世界里，千行百业到底发生了哪些变化？变化之下，谁推动促成了这一切发生？全新的大模型产业，哪些模式/架构已经确定？

以下是来自量子位的市场观察。

二三季度增长明显，十大场景率先落地

大模型应用落地绕不开云计算。

因此，云计算市场的数据变化，一定程度上能反映出大模型渗透千行百业的情况。

比如在大洋彼岸，美国三大云厂商亚马逊、微软、谷歌的营收增速悄悄来到近两年高点。

AWS的AI业务在2024年三季度达到了数十亿美元，年增长超过100%；微软Azure营收增速为33%，财报电话会中透露，其中12个百分点由AI业务带动。

对应国内情况亦是如此。

根据IDC最新发布的《中国公有云服务市场（2024上半年）跟踪》报告显示，2024上半年，中国公有云服务整体市场规模（IaaS/PaaS/SaaS）为210.8亿美元（约合1518.3亿元人民币）。

国内公有云市场从二季度开始反弹，AI大模型和智能算力服务成为助力公有云市场回暖的最主要因素。

《中国智算服务市场（2024上半年）跟踪》报告中，2024上半年中国智算服务整体市场同比增长79.6%，市场规模达到146.1亿元人民币。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

其中，智算集成服务市场同比增长168.4%，市场规模达57.0亿元人民币；GenAI IaaS市场同比增长203.6%，市场规模达52.0亿元人民币；Other AI IaaS市场同比缩减13.7%，市场规模达37.1亿元人民币。

在AI IaaS市场，客户需求向GenAI转移，云巨头快速调整引发市场变局，2024上半年GenAI IaaS前三甲分别是阿里巴巴、火山引擎和商汤科技。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

更细分的MaaS市场，IDC数据显示2024上半年中国MaaS的规模已达2.5亿元人民币，中国AI大模型解决方案市场的规模为13.8亿元人民币。

二者2024-2028年的年均复合增长率分别为64.8%和56.2%。预计2028年，中国MaaS市场总规模达到38亿元人民币，中国AI大模型解决方案市场总规模达到211亿元人民币。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

市场需求暴涨，并在下半年集中爆发。

IDC数据显示，2024年6月中国生成式AI日均tokens处理规模达2180亿（除去自有业务和其生成式AI应用使用），预计11月可到11200亿规模，1年之间暴涨320倍。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

再从落地领域来看，过去一年大模型应用可谓是百花齐放，快速渗透到生产生活的方方面面。

量子位智库发布的《大模型落地与前沿趋势研究报告》中显示，大模型项目在教科、通信、能源、政府、金融等行业落地较多，全行业在今年第二、第三季度增长明显。

其中落地项目数量最多的领域是教科，公开披露的落地金额最多的是政务。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

IDC研究分析总结大模型十大核心能力和十大应用领域，梳理出了AI大模型落地应用场景全景图，覆盖金融、互联网、零售消费、医药健康、智能终端、游戏、企业服务、文化娱乐、教育科研、汽车。

落地成熟度按照L1-L4分级，目前进展最快的细分赛道达到L3级，包括智能客服、新闻撰稿、论文助手/总结、企业知识问答、对话陪聊等，集中在信息处理场景。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

这与云厂商分享的数据相呼应。火山引擎Force冬季大会上表示，近3个月豆包大模型在信息处理场景的调用量增长了39倍，客服与销售场景增长16倍，硬件终端场景增长13倍、AI工具场景增长9倍，学习教育等场景也有大幅增长。

整体市场结构上，目前B端和G端客户依旧是绝对主力，且短期不会改变。但长期随技术进步和行业发展，市场化需求的份额将逐渐增加。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

总结来看，2024年是大模型应用加速走向落地的一年。各行各业开始更为主动进行以大模型为核心的智能化转型升级。

IDC全球调研数据显示，37.7%受访企业正在重点投资AI大模型，并预计在未来三年内引入AI软件及相关培训和服务。

这种主动性一方面源自政策驱动、市场需求，另一方面更关键的影响因素在于，大模型应用落地业务的商业模式日渐清晰成熟。

MaaS成为产业落地风向标

梳理来看，目前市面上浮现出的大模型应用落地模式主要有三种：

模型服务（MaaS）应用开发部署平台智能体开发平台

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

这三种模式基本可以覆盖当下大模型应用落地的主要需求。

在具体业务构建上，通常云厂商会构建一个通用服务平台，对外提供MaaS和应用开发服务，在MaaS平台之上还会进一步提供专门的AI应用/智能体开发产品，具体架构可以参考火山引擎的布局。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

目前国内头部云厂商均已在如上三个方面完成布局。

在这之中，MaaS成为大模型产业落地风向标，是当下最重要的商业模式；应用开发部署平台上，模型API价格战会长期继续，但在贡献营收上有难度；AI应用/智能体开发平台是新趋势，可以进一步释放大模型潜力，不过目前产品形态仍旧需要市场进一步验证。

为啥这么说？

首先大模型应用落地，场景玩家们走得更快，这带动MaaS市场需求。

大模型趋势到来后，国内率先打响“百模大战”。在这之中，最引人注目的是基础模型之间的角逐，很快形成了五小虎+BAT+字节的核心格局。

从商业化落地角度来看，进展最明显的却不在大模型玩家侧，而是场景玩家。

比如飞书、金山办公、美图秀秀等，因为有着更直接明确的业务升级需求，所以在和AI的结合上进展迅速，并且AI带来的增长也很快对外显化。

泛化到整体市场中来看，大模型应用落地仍旧有海量垂直领域玩家尚未被挖掘。他们往往具备丰富的领域内数据，在政策引导以及技术趋势下，智能化转型需求会愈加强烈，但通用模型并不适用于这类玩家，因此数据整理、模型微调、推理都将会成为他们所需的大模型服务方式，而这些都包含在MaaS之中。

进一步结合当前需求方画像，金融、政企、企服等领域依旧以大中型B端、G端客户为主。他们的需求往往更明确，也更容易贡献实质性的营收，成为推动大模型应用落地的主要力量。

对于供给方而言，大模型重构云计算，MaaS成为新的基础服务。在已有云平台基础上，将大模型进一步融合，为广大企业降低入局大模型的门槛、提高生产创造效率，也是更加清晰的商业模式。

参考此前火山引擎披露的信息，在2023年，国内70%的大模型企业，都使用了火山引擎的算力服务；而在2024年，MaaS将是下一个战场。

量子位智库预测，2027年MaaS市场规模占比将提升到47%，成为AIGC产业的主流商业模式。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

其次，云厂商“热衷于”价格战背后，其核心目的在于推动大模型快进到“价值创造阶段”，这使得当下在国内，大模型API不会是主要的营收来源。

得益于自身在底层基础设施上的优势，火山引擎通过算法、软件、工程和硬件结合的方案能够实现更低的价格，来挖掘有AIGC需求的客户。

这种思路是将目光锁定在更长期的未来，如果坚信AI可以对很多行业产生影响，那么率先挖掘出意向用户，就是抢先占领市场。

具体做法包括：使用更好模型结构，实现更低成本完成更复杂推理；工程上，由于不同业务负载存在波峰和波谷，通过规模化调整，可把成本降低几倍；软硬件结合上，不同推理过程对于芯片的带宽和算力要求不同，将这个过程分离放到不同的池化资源去处理，实现降本；再加上对库存和供应链的管理，综合起来每一个环节都有数倍效率提升。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

对于需求侧而言，大模型API用户多数为中小企业、开发者，他们目前对于大模型很多还处于观望状态。一方面，大模型应用落地的成本依旧让人望而却步，另一方面，企业是否引入AI大模型、如何引入大模型是一个复杂的决策过程，企业需要思考如何引入大模型才能真正产生价值。

这也解释了云计算厂商为何愿意在当下让利，也就是为何大模型API现阶段无法贡献主要营收。

最后，AI应用/智能体开发平台是2024年的新趋势，有望撬动更广阔大模型市场。

2024年，云厂商将目光集中在降低AI应用开发门槛上，为此推出了一系列产品，包括扣子、HiAgent、文心Agent Builder、腾讯元器等。

他们的特点很突出：低代码/零代码开发、几分钟内以拖拉拽方式快速搭建定制化智能体。面向的人群为业务人员、产品经理以及更多对AIGC应用感兴趣的人群。开发模式通常为提示词工程、插件搭建、RAG、应用编排等。

从底层逻辑来看，这种极低门槛的开发模式，能更大程度释放大模型应用潜力，让大模型浪潮更快渗透到各类场景中去。

不过由于这类商业模式尚处于发展早期，短时间内用户规模较小，更大的爆发点应该在未来1-2年。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

大模型应用落地商业模式逐渐清晰，一方面推动这波技术浪潮更快速前进，另一方面也将重塑云计算竞争格局、玩家弯道超车的机会开始浮现。

比如IDC统计的GenAI IaaS市场格局中，火山引擎和商汤的身位都格外靠前。尤其是火山引擎，今年豆包全家桶发布后，火山引擎在MaaS、AI应用/Agent开发平台上的布局更加旗帜鲜明。据披露数据，豆包通用模型的日均tokens使用量超过4万亿，较首次发布时增长了33倍。

快速增长背后也为MaaS以及大模型应用落地发展，提供参考。

MaaS竞争，核心看什么？

结合国内外大模型应用落地趋势分析，大致有四个关键点：

模型能力领先程度底层计算能力生态能力、渠道能力持续性高资源投入

首先，模型能力决定产品天花板，也从根本上决定用户是否愿意买单。以OpenAI和Anthropic的对比为例，随着Claude模型能力一再提升，Anthropic的营收相对份额增长。

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

其次，支撑海量大模型应用落地业务的底层基础设施，也成为MaaS竞争的关键保障因素。

按照市场预估，未来几年后日均tokens消耗量可以达到百万亿级别，这所对应的推理需求等于56万亿TFLOPS，与之对应的将是百万块GPU算力支持。

谁能构建更强大的算力基础设施、谁能维护好巨型算力集群的高效运转，谁就能在MaaS市场中更具有竞争力。

第三，生态能力和渠道能力已构成云厂商在MaaS市场中的核心竞争优势。

全面的业务生态为大模型应用落地提供了天生的试炼场，长期积累的销售渠道能更好让大模型触达落地，同时也可以让大模型和云产品交叉销售，推进落地。

最后，大模型时代唯有持续性的投入才能开发出更有竞争力的通用模型。同时，互联网时代的护城河在大模型时代不复存在，相比于软件，大模型的能力还在剧烈变化且暂时没有看到上限，因此在大模型应用落地竞争中，长期大量资本投入是必然。

在这些因素影响下，新的云计算格局正在加速形成。

谁家的模型更好用？谁的AI Infra能力更强悍？谁能挖掘触达到更多场景？谁能更长期投入并建立健康的商业模式闭环？谁就能重塑新格局。

这必然是一个漫长周期。毕竟基础大模型的上限还是未知。不过可以确定的是，当下MaaS模式能扛起大模型商业变现的大旗，国内市场百家争鸣下，大模型应用落地将会更快速推进。

与此同时，衡量评判大模型商用市场的核心指标也正在浮出水面——

Tokens调用量何以关键？将在本系列文章下一篇中详细解读，敬请期待。

文章来自微信公众号 “ 量子位 ”，作者 “ 明敏 ”

日均tokens涨320倍，MaaS主导产业模式，火山引擎从GenAI领跑到MaaS加速

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址：https://github.com/n8n-io/n8n

在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。

项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file

【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。

项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。

项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目

项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。

项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。

项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。

项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载

安卓下载

微信群