日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速

搜索
AI-TNT
正文
资源拓展
日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速
2025-01-20 16:46

如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透


最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。


主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。


日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速


真实的客观世界里,千行百业到底发生了哪些变化?变化之下,谁推动促成了这一切发生?全新的大模型产业,哪些模式/架构已经确定?


以下是来自量子位的市场观察。


二三季度增长明显,十大场景率先落地


大模型应用落地绕不开云计算。


因此,云计算市场的数据变化,一定程度上能反映出大模型渗透千行百业的情况。


比如在大洋彼岸,美国三大云厂商亚马逊、微软、谷歌的营收增速悄悄来到近两年高点


AWS的AI业务在2024年三季度达到了数十亿美元,年增长超过100%;微软Azure营收增速为33%,财报电话会中透露,其中12个百分点由AI业务带动。


对应国内情况亦是如此


根据IDC最新发布的《中国公有云服务市场(2024上半年)跟踪》报告显示,2024上半年,中国公有云服务整体市场规模(IaaS/PaaS/SaaS)为210.8亿美元(约合1518.3亿元人民币)。


国内公有云市场从二季度开始反弹,AI大模型和智能算力服务成为助力公有云市场回暖的最主要因素


《中国智算服务市场(2024上半年)跟踪》报告中,2024上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



其中,智算集成服务市场同比增长168.4%,市场规模达57.0亿元人民币;GenAI IaaS市场同比增长203.6%,市场规模达52.0亿元人民币;Other AI IaaS市场同比缩减13.7%,市场规模达37.1亿元人民币。


在AI IaaS市场,客户需求向GenAI转移,云巨头快速调整引发市场变局,2024上半年GenAI IaaS前三甲分别是阿里巴巴、火山引擎和商汤科技。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速




更细分的MaaS市场,IDC数据显示2024上半年中国MaaS的规模已达2.5亿元人民币,中国AI大模型解决方案市场的规模为13.8亿元人民币。


二者2024-2028年的年均复合增长率分别为64.8%和56.2%。预计2028年,中国MaaS市场总规模达到38亿元人民币,中国AI大模型解决方案市场总规模达到211亿元人民币



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



市场需求暴涨,并在下半年集中爆发。


IDC数据显示,2024年6月中国生成式AI日均tokens处理规模达2180亿(除去自有业务和其生成式AI应用使用),预计11月可到11200亿规模,1年之间暴涨320倍



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



再从落地领域来看,过去一年大模型应用可谓是百花齐放,快速渗透到生产生活的方方面面。


量子位智库发布的《大模型落地与前沿趋势研究报告》中显示,大模型项目在教科、通信、能源、政府、金融等行业落地较多,全行业在今年第二、第三季度增长明显。


其中落地项目数量最多的领域是教科,公开披露的落地金额最多的是政务。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



IDC研究分析总结大模型十大核心能力和十大应用领域,梳理出了AI大模型落地应用场景全景图,覆盖金融、互联网、零售消费、医药健康、智能终端、游 戏、企业服务、文化娱乐、教育科研、汽车。


落地成熟度按照L1-L4分级,目前进展最快的细分赛道达到L3级,包括智能客服、新闻撰稿、论文助手/总结、企业知识问答、对话陪聊等,集中在信息处理场景。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



这与云厂商分享的数据相呼应。火山引擎Force冬季大会上表示,近3个月豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍、AI工具场景增长9倍,学习教育等场景也有大幅增长。


整体市场结构上,目前B端和G端客户依旧是绝对主力,且短期不会改变。但长期随技术进步和行业发展,市场化需求的份额将逐渐增加。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



总结来看,2024年是大模型应用加速走向落地的一年。各行各业开始更为主动进行以大模型为核心的智能化转型升级。


IDC全球调研数据显示,37.7%受访企业正在重点投资AI大模型,并预计在未来三年内引入AI软件及相关培训和服务。


这种主动性一方面源自政策驱动、市场需求,另一方面更关键的影响因素在于,大模型应用落地业务的商业模式日渐清晰成熟。


MaaS成为产业落地风向标


梳理来看,目前市面上浮现出的大模型应用落地模式主要有三种:


  • 模型服务(MaaS)应用开发部署平台智能体开发平台


日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速


这三种模式基本可以覆盖当下大模型应用落地的主要需求。


在具体业务构建上,通常云厂商会构建一个通用服务平台,对外提供MaaS和应用开发服务,在MaaS平台之上还会进一步提供专门的AI应用/智能体开发产品,具体架构可以参考火山引擎的布局。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



目前国内头部云厂商均已在如上三个方面完成布局。


在这之中,MaaS成为大模型产业落地风向标,是当下最重要的商业模式;应用开发部署平台上,模型API价格战会长期继续,但在贡献营收上有难度;AI应用/智能体开发平台是新趋势,可以进一步释放大模型潜力,不过目前产品形态仍旧需要市场进一步验证。

为啥这么说?


首先大模型应用落地,场景玩家们走得更快,这带动MaaS市场需求。


大模型趋势到来后,国内率先打响“百模大战”。在这之中,最引人注目的是基础模型之间的角逐,很快形成了五小虎+BAT+字节的核心格局。


从商业化落地角度来看,进展最明显的却不在大模型玩家侧,而是场景玩家


比如飞书、金山办公、美图秀秀等,因为有着更直接明确的业务升级需求,所以在和AI的结合上进展迅速,并且AI带来的增长也很快对外显化。


泛化到整体市场中来看,大模型应用落地仍旧有海量垂直领域玩家尚未被挖掘。他们往往具备丰富的领域内数据,在政策引导以及技术趋势下,智能化转型需求会愈加强烈,但通用模型并不适用于这类玩家,因此数据整理、模型微调、推理都将会成为他们所需的大模型服务方式,而这些都包含在MaaS之中。


进一步结合当前需求方画像,金融、政企、企服等领域依旧以大中型B端、G端客户为主。他们的需求往往更明确,也更容易贡献实质性的营收,成为推动大模型应用落地的主要力量。


对于供给方而言,大模型重构云计算,MaaS成为新的基础服务。在已有云平台基础上,将大模型进一步融合,为广大企业降低入局大模型的门槛、提高生产创造效率,也是更加清晰的商业模式。


参考此前火山引擎披露的信息,在2023年,国内70%的大模型企业,都使用了火山引擎的算力服务;而在2024年,MaaS将是下一个战场


量子位智库预测,2027年MaaS市场规模占比将提升到47%,成为AIGC产业的主流商业模式。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



其次,云厂商“热衷于”价格战背后,其核心目的在于推动大模型快进到“价值创造阶段”,这使得当下在国内,大模型API不会是主要的营收来源。


得益于自身在底层基础设施上的优势,火山引擎通过算法、软件、工程和硬件结合的方案能够实现更低的价格,来挖掘有AIGC需求的客户。


这种思路是将目光锁定在更长期的未来,如果坚信AI可以对很多行业产生影响,那么率先挖掘出意向用户,就是抢先占领市场。


具体做法包括:使用更好模型结构,实现更低成本完成更复杂推理;工程上,由于不同业务负载存在波峰和波谷,通过规模化调整,可把成本降低几倍;软硬件结合上,不同推理过程对于芯片的带宽和算力要求不同,将这个过程分离放到不同的池化资源去处理,实现降本;再加上对库存和供应链的管理,综合起来每一个环节都有数倍效率提升。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



对于需求侧而言,大模型API用户多数为中小企业、开发者,他们目前对于大模型很多还处于观望状态。一方面,大模型应用落地的成本依旧让人望而却步,另一方面,企业是否引入AI大模型、如何引入大模型是一个复杂的决策过程,企业需要思考如何引入大模型才能真正产生价值。


这也解释了云计算厂商为何愿意在当下让利,也就是为何大模型API现阶段无法贡献主要营收。


最后,AI应用/智能体开发平台是2024年的新趋势,有望撬动更广阔大模型市场。


2024年,云厂商将目光集中在降低AI应用开发门槛上,为此推出了一系列产品,包括扣子、HiAgent、文心Agent Builder、腾讯元器等。


他们的特点很突出:低代码/零代码开发、几分钟内以拖拉拽方式快速搭建定制化智能体。面向的人群为业务人员、产品经理以及更多对AIGC应用感兴趣的人群。开发模式通常为提示词工程、插件搭建、RAG、应用编排等。

从底层逻辑来看,这种极低门槛的开发模式,能更大程度释放大模型应用潜力,让大模型浪潮更快渗透到各类场景中去。


不过由于这类商业模式尚处于发展早期,短时间内用户规模较小,更大的爆发点应该在未来1-2年。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速


大模型应用落地商业模式逐渐清晰,一方面推动这波技术浪潮更快速前进,另一方面也将重塑云计算竞争格局、玩家弯道超车的机会开始浮现。


比如IDC统计的GenAI IaaS市场格局中,火山引擎和商汤的身位都格外靠前。尤其是火山引擎,今年豆包全家桶发布后,火山引擎在MaaS、AI应用/Agent开发平台上的布局更加旗帜鲜明。据披露数据,豆包通用模型的日均tokens使用量超过4万亿,较首次发布时增长了33倍。

快速增长背后也为MaaS以及大模型应用落地发展,提供参考。


MaaS竞争,核心看什么?


结合国内外大模型应用落地趋势分析,大致有四个关键点:


  • 模型能力领先程度底层计算能力生态能力、渠道能力持续性高资源投入


首先,模型能力决定产品天花板,也从根本上决定用户是否愿意买单。以OpenAI和Anthropic的对比为例,随着Claude模型能力一再提升,Anthropic的营收相对份额增长。



日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速



其次,支撑海量大模型应用落地业务的底层基础设施,也成为MaaS竞争的关键保障因素。


按照市场预估,未来几年后日均tokens消耗量可以达到百万亿级别,这所对应的推理需求等于56万亿TFLOPS,与之对应的将是百万块GPU算力支持。


谁能构建更强大的算力基础设施、谁能维护好巨型算力集群的高效运转,谁就能在MaaS市场中更具有竞争力。


第三,生态能力和渠道能力已构成云厂商在MaaS市场中的核心竞争优势。


全面的业务生态为大模型应用落地提供了天生的试炼场,长期积累的销售渠道能更好让大模型触达落地,同时也可以让大模型和云产品交叉销售,推进落地。


最后,大模型时代唯有持续性的投入才能开发出更有竞争力的通用模型。同时,互联网时代的护城河在大模型时代不复存在,相比于软件,大模型的能力还在剧烈变化且暂时没有看到上限,因此在大模型应用落地竞争中,长期大量资本投入是必然。

在这些因素影响下,新的云计算格局正在加速形成。


谁家的模型更好用?谁的AI Infra能力更强悍?谁能挖掘触达到更多场景?谁能更长期投入并建立健康的商业模式闭环?谁就能重塑新格局。


这必然是一个漫长周期。毕竟基础大模型的上限还是未知。不过可以确定的是,当下MaaS模式能扛起大模型商业变现的大旗,国内市场百家争鸣下,大模型应用落地将会更快速推进。

与此同时,衡量评判大模型商用市场的核心指标也正在浮出水面——


Tokens调用量何以关键?将在本系列文章下一篇中详细解读,敬请期待。



文章来自微信公众号 “ 量子位 ”,作者 “ 明敏 ”


日均tokens涨320倍,MaaS主导产业模式,火山引擎从GenAI领跑到MaaS加速

1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载
安卓下载
微信群
沪ICP备2023015588号