如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透。
最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。
主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。
真实的客观世界里,千行百业到底发生了哪些变化?变化之下,谁推动促成了这一切发生?全新的大模型产业,哪些模式/架构已经确定?
以下是来自量子位的市场观察。
大模型应用落地绕不开云计算。
因此,云计算市场的数据变化,一定程度上能反映出大模型渗透千行百业的情况。
比如在大洋彼岸,美国三大云厂商亚马逊、微软、谷歌的营收增速悄悄来到近两年高点。
AWS的AI业务在2024年三季度达到了数十亿美元,年增长超过100%;微软Azure营收增速为33%,财报电话会中透露,其中12个百分点由AI业务带动。
对应国内情况亦是如此。
根据IDC最新发布的《中国公有云服务市场(2024上半年)跟踪》报告显示,2024上半年,中国公有云服务整体市场规模(IaaS/PaaS/SaaS)为210.8亿美元(约合1518.3亿元人民币)。
国内公有云市场从二季度开始反弹,AI大模型和智能算力服务成为助力公有云市场回暖的最主要因素。
《中国智算服务市场(2024上半年)跟踪》报告中,2024上半年中国智算服务整体市场同比增长79.6%,市场规模达到146.1亿元人民币。
其中,智算集成服务市场同比增长168.4%,市场规模达57.0亿元人民币;GenAI IaaS市场同比增长203.6%,市场规模达52.0亿元人民币;Other AI IaaS市场同比缩减13.7%,市场规模达37.1亿元人民币。
在AI IaaS市场,客户需求向GenAI转移,云巨头快速调整引发市场变局,2024上半年GenAI IaaS前三甲分别是阿里巴巴、火山引擎和商汤科技。
更细分的MaaS市场,IDC数据显示2024上半年中国MaaS的规模已达2.5亿元人民币,中国AI大模型解决方案市场的规模为13.8亿元人民币。
二者2024-2028年的年均复合增长率分别为64.8%和56.2%。预计2028年,中国MaaS市场总规模达到38亿元人民币,中国AI大模型解决方案市场总规模达到211亿元人民币。
市场需求暴涨,并在下半年集中爆发。
IDC数据显示,2024年6月中国生成式AI日均tokens处理规模达2180亿(除去自有业务和其生成式AI应用使用),预计11月可到11200亿规模,1年之间暴涨320倍。
再从落地领域来看,过去一年大模型应用可谓是百花齐放,快速渗透到生产生活的方方面面。
量子位智库发布的《大模型落地与前沿趋势研究报告》中显示,大模型项目在教科、通信、能源、政府、金融等行业落地较多,全行业在今年第二、第三季度增长明显。
其中落地项目数量最多的领域是教科,公开披露的落地金额最多的是政务。
IDC研究分析总结大模型十大核心能力和十大应用领域,梳理出了AI大模型落地应用场景全景图,覆盖金融、互联网、零售消费、医药健康、智能终端、游 戏、企业服务、文化娱乐、教育科研、汽车。
落地成熟度按照L1-L4分级,目前进展最快的细分赛道达到L3级,包括智能客服、新闻撰稿、论文助手/总结、企业知识问答、对话陪聊等,集中在信息处理场景。
这与云厂商分享的数据相呼应。火山引擎Force冬季大会上表示,近3个月豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍、AI工具场景增长9倍,学习教育等场景也有大幅增长。
整体市场结构上,目前B端和G端客户依旧是绝对主力,且短期不会改变。但长期随技术进步和行业发展,市场化需求的份额将逐渐增加。
总结来看,2024年是大模型应用加速走向落地的一年。各行各业开始更为主动进行以大模型为核心的智能化转型升级。
IDC全球调研数据显示,37.7%受访企业正在重点投资AI大模型,并预计在未来三年内引入AI软件及相关培训和服务。
这种主动性一方面源自政策驱动、市场需求,另一方面更关键的影响因素在于,大模型应用落地业务的商业模式日渐清晰成熟。
梳理来看,目前市面上浮现出的大模型应用落地模式主要有三种:
这三种模式基本可以覆盖当下大模型应用落地的主要需求。
在具体业务构建上,通常云厂商会构建一个通用服务平台,对外提供MaaS和应用开发服务,在MaaS平台之上还会进一步提供专门的AI应用/智能体开发产品,具体架构可以参考火山引擎的布局。
目前国内头部云厂商均已在如上三个方面完成布局。
在这之中,MaaS成为大模型产业落地风向标,是当下最重要的商业模式;应用开发部署平台上,模型API价格战会长期继续,但在贡献营收上有难度;AI应用/智能体开发平台是新趋势,可以进一步释放大模型潜力,不过目前产品形态仍旧需要市场进一步验证。
为啥这么说?
首先大模型应用落地,场景玩家们走得更快,这带动MaaS市场需求。
大模型趋势到来后,国内率先打响“百模大战”。在这之中,最引人注目的是基础模型之间的角逐,很快形成了五小虎+BAT+字节的核心格局。
从商业化落地角度来看,进展最明显的却不在大模型玩家侧,而是场景玩家。
比如飞书、金山办公、美图秀秀等,因为有着更直接明确的业务升级需求,所以在和AI的结合上进展迅速,并且AI带来的增长也很快对外显化。
泛化到整体市场中来看,大模型应用落地仍旧有海量垂直领域玩家尚未被挖掘。他们往往具备丰富的领域内数据,在政策引导以及技术趋势下,智能化转型需求会愈加强烈,但通用模型并不适用于这类玩家,因此数据整理、模型微调、推理都将会成为他们所需的大模型服务方式,而这些都包含在MaaS之中。
进一步结合当前需求方画像,金融、政企、企服等领域依旧以大中型B端、G端客户为主。他们的需求往往更明确,也更容易贡献实质性的营收,成为推动大模型应用落地的主要力量。
对于供给方而言,大模型重构云计算,MaaS成为新的基础服务。在已有云平台基础上,将大模型进一步融合,为广大企业降低入局大模型的门槛、提高生产创造效率,也是更加清晰的商业模式。
参考此前火山引擎披露的信息,在2023年,国内70%的大模型企业,都使用了火山引擎的算力服务;而在2024年,MaaS将是下一个战场。
量子位智库预测,2027年MaaS市场规模占比将提升到47%,成为AIGC产业的主流商业模式。
其次,云厂商“热衷于”价格战背后,其核心目的在于推动大模型快进到“价值创造阶段”,这使得当下在国内,大模型API不会是主要的营收来源。
得益于自身在底层基础设施上的优势,火山引擎通过算法、软件、工程和硬件结合的方案能够实现更低的价格,来挖掘有AIGC需求的客户。
这种思路是将目光锁定在更长期的未来,如果坚信AI可以对很多行业产生影响,那么率先挖掘出意向用户,就是抢先占领市场。
具体做法包括:使用更好模型结构,实现更低成本完成更复杂推理;工程上,由于不同业务负载存在波峰和波谷,通过规模化调整,可把成本降低几倍;软硬件结合上,不同推理过程对于芯片的带宽和算力要求不同,将这个过程分离放到不同的池化资源去处理,实现降本;再加上对库存和供应链的管理,综合起来每一个环节都有数倍效率提升。
对于需求侧而言,大模型API用户多数为中小企业、开发者,他们目前对于大模型很多还处于观望状态。一方面,大模型应用落地的成本依旧让人望而却步,另一方面,企业是否引入AI大模型、如何引入大模型是一个复杂的决策过程,企业需要思考如何引入大模型才能真正产生价值。
这也解释了云计算厂商为何愿意在当下让利,也就是为何大模型API现阶段无法贡献主要营收。
最后,AI应用/智能体开发平台是2024年的新趋势,有望撬动更广阔大模型市场。
2024年,云厂商将目光集中在降低AI应用开发门槛上,为此推出了一系列产品,包括扣子、HiAgent、文心Agent Builder、腾讯元器等。
他们的特点很突出:低代码/零代码开发、几分钟内以拖拉拽方式快速搭建定制化智能体。面向的人群为业务人员、产品经理以及更多对AIGC应用感兴趣的人群。开发模式通常为提示词工程、插件搭建、RAG、应用编排等。
从底层逻辑来看,这种极低门槛的开发模式,能更大程度释放大模型应用潜力,让大模型浪潮更快渗透到各类场景中去。
不过由于这类商业模式尚处于发展早期,短时间内用户规模较小,更大的爆发点应该在未来1-2年。
大模型应用落地商业模式逐渐清晰,一方面推动这波技术浪潮更快速前进,另一方面也将重塑云计算竞争格局、玩家弯道超车的机会开始浮现。
比如IDC统计的GenAI IaaS市场格局中,火山引擎和商汤的身位都格外靠前。尤其是火山引擎,今年豆包全家桶发布后,火山引擎在MaaS、AI应用/Agent开发平台上的布局更加旗帜鲜明。据披露数据,豆包通用模型的日均tokens使用量超过4万亿,较首次发布时增长了33倍。
快速增长背后也为MaaS以及大模型应用落地发展,提供参考。
结合国内外大模型应用落地趋势分析,大致有四个关键点:
首先,模型能力决定产品天花板,也从根本上决定用户是否愿意买单。以OpenAI和Anthropic的对比为例,随着Claude模型能力一再提升,Anthropic的营收相对份额增长。
其次,支撑海量大模型应用落地业务的底层基础设施,也成为MaaS竞争的关键保障因素。
按照市场预估,未来几年后日均tokens消耗量可以达到百万亿级别,这所对应的推理需求等于56万亿TFLOPS,与之对应的将是百万块GPU算力支持。
谁能构建更强大的算力基础设施、谁能维护好巨型算力集群的高效运转,谁就能在MaaS市场中更具有竞争力。
第三,生态能力和渠道能力已构成云厂商在MaaS市场中的核心竞争优势。
全面的业务生态为大模型应用落地提供了天生的试炼场,长期积累的销售渠道能更好让大模型触达落地,同时也可以让大模型和云产品交叉销售,推进落地。
最后,大模型时代唯有持续性的投入才能开发出更有竞争力的通用模型。同时,互联网时代的护城河在大模型时代不复存在,相比于软件,大模型的能力还在剧烈变化且暂时没有看到上限,因此在大模型应用落地竞争中,长期大量资本投入是必然。
在这些因素影响下,新的云计算格局正在加速形成。
谁家的模型更好用?谁的AI Infra能力更强悍?谁能挖掘触达到更多场景?谁能更长期投入并建立健康的商业模式闭环?谁就能重塑新格局。
这必然是一个漫长周期。毕竟基础大模型的上限还是未知。不过可以确定的是,当下MaaS模式能扛起大模型商业变现的大旗,国内市场百家争鸣下,大模型应用落地将会更快速推进。
与此同时,衡量评判大模型商用市场的核心指标也正在浮出水面——
Tokens调用量何以关键?将在本系列文章下一篇中详细解读,敬请期待。
文章来自微信公众号 “ 量子位 ”,作者 “ 明敏 ”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0