上周,北京的 WRC 世界机器人大会史无前例的火爆。
维他动力半年内融资 3 亿人民币,带着新产品首次亮相,因其独特性成为了全场最多人排队的展位之一。
维他动力的联合创始人赵哲伦(哲伦班长)很兴奋,他认为:
最多十年,中国的机器人大会也许就可以类比当年的伦敦世博会——1851 年的伦敦世博会是第一届世界博览会,在长达 5 个月的展览期内,吸引超过 600 万参观者,展品中也包括引擎、纺织机械等现代工业的标志性创造。
本期节目,我们邀请赵哲伦和我们分享他在世界机器人大会上的见闻,也和我们梳理自波士顿动力发布第一款机器狗至今,机器人行业的的演进与关键技术,以及,他参与创办的维他动力,如何做出第一款摆脱遥控器的机器狗:他们如何做技术路线选择,如何看待今年的目标。
此外,哲伦也和我们讲述了他为什么会离开理想汽车去创业,机器人对孩子的启蒙、机器人文化以及他对未来机器人行业发展前景的预测。
微信收听播客:
小宇宙收听播客:
👦🏻 Koji
大家好,本周「十字路口」的嘉宾是哲伦班长。哲伦是机器人公司维他动力的联合创始人。维他动力非常受人瞩目,在半年之内累计完成了 3 亿人民币的融资。在刚刚结束的 WRC 世界机器人大会上,维他动力带着首款机器狗首次亮相,成为全场最热闹的展台之一。哲伦可能是我们开播以来粉丝最多的创始人嘉宾。哲伦,请先和大家打个招呼,然后我们从快问快答开始今天的节目。
👦🏻 哲伦
Hello,「十字路口」的听众们,大家好,很高兴能加入这个播客。我之前也做过一段时间媒体,所以有一定的粉丝基础。原来在 Tesla 和中国智能电动车的早期,现在在做一家机器人公司,今天很高兴能聊聊机器人。
👦🏻 Koji
好的,那我们来快问快答。你的年龄?
👦🏻 哲伦
我今年 31 岁。
👦🏻 Koji
维他动力创业几年了?
👦🏻 哲伦
其实只有 9 个月。
👦🏻 Koji
在维他动力创业之前,你做过什么?
👦🏻 哲伦
我是 Tesla 中国的早期员工,然后成立了 42 号车库,做了两年多的“哲伦班长”,后来加入理想汽车,负责智能驾驶产品,一干就是五年。从去年年底开始创业,做国内首家消费级具身智能公司,希望能研发人人都能用、能带进家的机器人。
👦🏻 Koji
你的 MBTI 和星座?
👦🏻 哲伦
我的 MBTI 是 ENFJ,就是那个“大宝剑”,星座是狮子座,8 月份的。
👦🏻 Koji
目前维他动力的收入和利润方便透露吗?
👦🏻 哲伦
因为第一款产品要到年底正式上市,目前还没有收入。
👦🏻 Koji
最新的融资和估值情况呢?
👦🏻 哲伦
截止到今年 5 月份,我们完成了三轮融资,总计约有 3 亿。目前还在进行新一轮融资,估值尚未对外透露。
👦🏻 Koji
团队规模呢?
👦🏻 哲伦
我们招人速度挺快的。从去年 12 月正式成立开始慢慢组建团队,目前我们有硬件、系统、软件和 AI,以及产品和 marketing 同学,加起来大概六七十人。
👦🏻 Koji
哲伦,你刚参加完 WRC,对吧?这也是维他动力第一次去 WRC,你整体有什么感受?
👦🏻 哲伦
感受还挺深刻的。我很看重 WRC。为什么呢?因为去年大概 8 月份,我开始研究国内机器人行业的现状,也动了创业的念头。当时很多企业的动向、行业专家和领导对趋势的判断,我都是从去年的 WRC 资料和媒体报道里获取的。所以我认为 WRC 是目前国内机器人领域最重要的会议之一,很多认知和共识在这里产生。
所以从去年年底创业开始,我就特别看重 WRC。今年二三月份,我就和我们 CEO 余轶南沟通,我说 WRC 是我们「上牌桌」的机会,必须重视,并设置为产品的重要节点,做一些对外曝光。
我们前期准备很充分,带了三四十位研发同学提前两天到现场。WRC 是 8 月 8 日开始,我们 6 号就到了。8 月 7 日我们还在现场举办了 workshop,是唯一一家在开展前一天召集 20 多家媒体开 workshop 的公司。边上还在装修,我们就拉着大家讲 PPT、体验产品,因为那是唯一能让媒体相对自由体验我们产品的时间窗口。后来人实在太多了。
事实证明我们判断对了。今年 WRC 空前火热。原本我计划在最后两天(周一、周二)能稍微逛一逛,但结果一直忙到最后一天中午才抽空去周边几个馆看了看。大会真的非常热闹,家长带孩子的、行业内的、政府的、投资圈的,还有海外的观众,都很踊跃。我觉得是一个非常棒的会议。
互动圆台:孩子们热烈地呼唤“大头”
👦🏻 Koji
我记得你之前跟我讲过,你感觉十年之后 WRC 会像当年的伦敦世博会一样。
👦🏻 哲伦
这个感受大概是在 WRC 第二天(8 月 9 日)产生的。8 月 8 日第一天是专业观众日,我就发现有一些海外媒体过来了。我以前参加车展至少十年以上,无论是上海还是北京的车展,每次都有很多欧洲、日本、韩国的人来,他们来看主要是因为中国的电动车技术和供应链不错,想看看能不能带回去用,或者找合作方式。那种感觉是他们依然是行业的“owner”,只是觉得中国这里有些东西他们可以利用。
这次完全不同。虽然美国人不算多(主要是一些美国华人),但日韩来的非常多,中东和东南亚的观众也不少。他们是纯粹来学习的,想看看中国机器人发展到什么程度,有什么可以拿回去用、去卖。我觉得虽然海外观众总量还不算多,但已经有这个趋势了。最多五到十年,中国的机器人产业和这个会议就会成为全球关注的焦点。十年之内,中国的机器人大会很可能会成为全球最高水平的代表,大家都会来看中国机器人发展到什么程度。
我把它类比成 150 多年前(1851 年)的伦敦世博会,或者再往前一些的美国 CES,会有类似的影响力。
👩🏻 Ronghui
而且伦敦世博会上展出的产品里还包括蒸汽机和纺织机。
👦🏻 哲伦
对,那些就是那个时代发展的源头,提供了能源和驱动方式。今天我试着归纳机器人意味着什么:我认为机器人提供的是一种空间移动方式。无论是灵巧手、机械臂、双足还是四足,本质上都是把机械从空间中的 A 点移动到 B 点。这种有序、多维的组合过程让它能为人类产生完全确定性的价值。它能作用在任何场景和地方,迸发出广泛的价值。
👩🏻 Ronghui
我觉得你这个类比很有意思,也许像你说的 5 年或 10 年之后,这样的活动展出的一些产品,能类比于当年的那些推动工业革命的产品。
👦🏻 哲伦
会有。昨天(展会结束后第一天)上午,一个熟悉美国的朋友大卫打电话给我,说他把我们的视频给美国的朋友看了,问我能不能带两台过去。在美国,这种能自主移动的产品和中国的价值点不一样。美国的 house 更大,独居和年长人群更多,这些情况都会带来额外价值。
外国友人表示什么时候可以带 Vbot 回他们国家
👦🏻 Koji
说到这里正好可以问一下,从 Boston Dynamics 发布第一只机器狗到现在也快十年了。从外部用户看来,好像没有质的变化,长得差不多,也没找到大规模商用场景。但从行业内来看,你发现有哪些进步或突破吗?包括你刚才提到,你们做出了第一个不需要遥控器的四足机器人。能不能给我们做一个行业演进和格局的科普?
👦🏻 哲伦
如果我来划分,其实机器狗和人形机器人基本相似,但机器狗相对更成熟一些。我觉得它们可以分成三个阶段。
第一个阶段是以 Boston Dynamics 为主导的,属于机器人控制论阶段。它通过传统编程和规则算法,让人类通过编程操控四足和机械臂。虽然是遥控操作,但可以控制四足行动。比如你用遥控器控制它前后移动,但保持平衡的逻辑,以及 12 个电机之间的作用关系,都是它内部的计算逻辑。这个逻辑是 Boston 做得比较成熟的,但成本非常高。当时的电机驱动方式包括液压,成本也很高。所以 Boston 的机器狗 Spot 是一台非常昂贵的机器,但在机器人控制论里非常优秀。这是机器狗的第一阶段。
第二阶段以宇树(Unitree)为代表。它利用中国供应链和精巧设计,使机器狗实现了一定程度的降本。比如 Unitree Go2 卖得比较多,主要是卖给学校科研做二次开发。科研版本价格接近 10 万元,虽然仍然昂贵,但比当年学校购买 Boston Spot 已经便宜很多了。再加上 AI 的发展,到 2022~2023 年大家发现让四足运动和保持平衡完全可以用强化学习来实现。所以当时很多人从规则式方法切换到强化学习。今天像宇树的很多步态就是通过强化学习训练的,更稳定。过去 Boston 的传统控制方式需要在不同地形切换不同规则,比如平地步态、台阶步态、低功耗步态。但强化学习让它具备全地形适应能力,可以自动切换步态。这一代技术框架和今天的外骨骼几乎一致,也是物理层面的感知与自动切换。但在这个阶段,我们依然称之为“盲走”,步态切换和视觉无关,只是物理情况发生变化就切换。遥控器仍然控制它往哪里走。我们很幸运能站在巨人的肩膀上,尝试把它做成更好的产品。
在我们看来,现在有三个技术已经比较成熟:
第一是四足机器狗本体技术,已经很成熟,很多视频里它能上山下水,全地形能力超过人类运动员。
第二是自动驾驶。我们做了近十年自动驾驶,发现自主移动其实是从高速交通环境到低速复杂生活场景的迁移。虽然速度降低,但场景更复杂,不可规则。我们在 WRC 的现场尝试让机器人自己行走,但人太多、太拥挤,它甚至连人都挤不过,就像上海地铁晚高峰一样。
第三是大模型技术带来自然交互。我们现在的机器人不需要遥控器,而是通过自然语言沟通,让它跟随、帮忙拿东西、帮你跟拍。这一层体验解放了双手,也让它真正能帮助人。
所以我们认为现在进入了第三代。四足机器人本体技术、自动驾驶技术和大模型技术走到十字路口,汇在一起,构成了第三代机器狗的机会。
大头的丰富背部配件
👦🏻 Koji
这个第三代就是用大模型加自动驾驶,再加基于过去的四足机器人的基础,这是行业的共识吗?不管从 Boston Dynamics 到宇树再到其他主要的玩家,大家有这样的共识吗?是在往这个方向一起做?
👦🏻 哲伦
如果我们今天这么去聊的话,我觉得大部分人应该有共识,但大家好像没有以这样的方式去拆解和认真讨论过。事实上今天机器人这一波大家觉得非常火热,其实就是两个原因:一是机器人本体变得成熟了,二是大家看到 AI 的发展有机会把空间解算做得更好。所以是这两件事结合起来,大家看到的机会。
👦🏻 Koji
明白,因为我在 WRC 第一天看到王兴兴发表了很多暴论,其中一个是他认为 VLA 架构相对傻瓜式。而你们其实用的是 VLA,所以我好奇你怎么看?因为他质疑 VLA 路线,觉得数据量在具身智能领域不足,VLA 模型本身也不够好,他有他的论据。你怎么看?
👦🏻 哲伦
我有两个角度。
第一个是我们做机器人,肯定希望机器人自主地带来价值和服务。确实 VLA 架构的数据来源比较低效。虽然在车上可以有很好的数据闭环,但在机器人上的采集相对低效。所以即便 VLA 不够好,有泛化性的问题,但整个行业里也还没有更好的方案。我们选择 VLA 是因为它是目前相对最好的方案。
第二个是机器人有下肢和上肢,分别对应自主移动和自主操作。今天我们还没有马上去做上肢(自主操作)的一个核心原因,就是我们觉得下肢(自主移动)这条线由于过去自动驾驶的积累,研发范式更成熟 ——比如数据如何采集,如何泛化,如何通过事件模型举一反三,都更成熟,因此也有更多的数据基础使得自主移动更可能跑通。上肢(自主操作)的研发范式还不高效。这也是为什么我们先选择四足切入的原因。
👦🏻 Koji
对,这个我也好奇 ——因为你们要做整个机器人的行业,那为什么一开始做机器狗,而不是人形机器人?没有一上来就挑战最困难的命题。你们是出于什么考虑?
👦🏻 哲伦
确实会有这样的观感,觉得机器人很酷,机器狗好像比机器人容易一截。我觉得我们考虑得比较清晰:在创业 0 到 1 阶段,我们首先必须做产品,交付产品,机器狗是更容易交付的。
我希望在你们的 AI Hacker House,未来可以有一只我们的机器狗。
👦🏻 Koji
非常欢迎,甚至欢迎放过来一群机器狗。
👦🏻 哲伦
你们门口正好有个公园可以遛,哈哈哈。因为 Koji 你也做产品,你会知道,当你有真正的用户之后,才能促进整个事情的闭环,血液才是通畅的。所以我们希望能做出产品来,deliver 出去。所以必须选择一个技术和产品方向,它确实比较容易落地。这里有几点:
一是选择相对成熟的本体;
二是 AI 的范式,包括数据和模型,是一定程度可行的。
虽然历史上没人做出来,但我们认为有可行路径。今天本体上最成熟的就是四足。四足是最成熟的一类机器形态,其次可能是机械臂,但两足和灵巧手就不成熟。本体不成熟意味着做 demo 没问题,但放到 AI Hacker House 里随便用就会出问题,这就是区别。所以我们要选成熟的本体。然后在 AI 路径上选择相对可行的自主移动。我们认为这是能做到的功能。
所以我们选择四足切入。但从机器人能力构建上,我们是大全套的。我在 WRC 上展示了几乎全部硬件,做了拆解图。
无论感知单元、交互单元还是执行单元,包括 AI 的大脑、小脑,控制器、芯片、电力系统、能源系统,这些和人形唯一的区别就是执行单元,是 10 个电机、20 个电机还是 30 个电机的区别。其他链路一致,从感知到思考再到能源供给,都是一致的,只是切换肢体的问题。所以我们定义公司以 AI 为核心,认为四足是最合适的切入产品。以最具身智能、最前沿 AI 的方式做,帮助组织跑通能力和商业闭环。当上肢操作能力、人形整体有机会时,我们的组织已经做好准备。这是核心的思考。
👩🏻 Ronghui
我看晚点对余轶南的采访,他讲了你们很多想法。和普通机器人公司确实差别挺大。有几个点挺有意思,比如在创业之前,他看了很多机器人公司,全是做 toB 的,而你们一上来就是做 toC 产品,这块是怎么考虑的?
👦🏻 哲伦
我们创始团队有两个核心基因。
第一,我和余轶南都认为必须交付产品,最终要服务用户,这样才有机会打到技术上限。今天很多技术能力很强的公司,产品都是直接服务用户的。销售渠道可以是 toB 或 toC,但产品必须面向用户,这样才能具备最强的技术能力。这是我们坚持要交付产品的原因。
第二,与余轶南相关性更强。他是国内第一代做 AI 的科学,经历过多轮 AI 大周期,包括上一波 AI 热潮(所谓 “AI 四小龙” 那一代)。最后潮水退去时,地平线是少数浮在水面上的公司之一,真正创造了价值和能力。所以他看问题时会思考链路中的“链主”,要处在什么位置。在很多 toB 生意里,链主是 B 端客户,企业核心能力往往变成渠道和商务,而技术不是最重要的。技术可以通过买或搬运来解决。
但我们不希望成为只做生意、只追求营收或讲故事的公司。余轶南在技术上有真正的追求,他希望公司在技术上能达到上限,组建行业里最强的技术团队,持续做产品。只有 toC 业务才有这样的可能。所以从长期来看,我们选择了这个赛道。
我们还认为,一旦公司前期从 0 到 1 做的是 toB,就很难再转 toC。组织的范式、研发方法会被限定下来,切换困难。所以我们在开头就选择了 toC 的道路。
👩🏻 Ronghui
而且你们一开始就选了聚焦在生活状态比较收敛的家庭用户,这一块你们是怎么想的?你要怎么让机器狗进家庭?
👦🏻 哲伦
要解决的问题确实很多。我前面说选择机器狗的核心是三点技术成熟。但从技术到产品化、商业化,还有两道门槛。第一是产品化,怎么用好技术产生强的用户价值?这是我们面向家庭和个人的思考:机器狗到底能做什么?
我们在今年 2 月份大概做了很多调研,人工去找小红书、微博、视频号、闲鱼上所有买过四足机器狗的用户,联系他们。既有普通调研,也有深度调研,一两小时的电话。发现过去四足狗确实有市场,但多是尝鲜,也容易吃亏。虽然有人买,但 NPS(用户推荐)很低。核心问题是需要遥控、续航低、噪音大、容易坏。
所以我们要扎实解决这些问题。同时用户也会提出价值点。大家看很多视频时,包括博主演绎未来生活场景:有小助手帮拿东西,自动取快递外卖,这是价值。所以我们要往这方向走。
我们一是要完成好的产品化。比如质量问题,过去四足的退货率挺高。今年 3 月我们就参观了石头科技工厂,学习他们怎么做质量管理。我们也要扎实做好质量,同时考虑商业化,以合理价格卖给消费者。
👦🏻 Koji
那现在你们公司的 OKR 里,商业化排第几?
👦🏻 哲伦
如果说今年全年 OKR,最核心的是出货量,这是牵引公司的最重要指标,还有 NPS。我们并不唯一追求量,因为第一代产品不是以量论的。用户买了觉得不错,这是我们更追求的:NPS(用户推荐)。
👦🏻 Koji
所以还是要 toC 卖掉。我自己在小红书、天猫搜机器狗关键词,发现多数是买回去做玩具,甚至给小孩做玩具。在天猫上宇树也好,还有一个销量显示一千、三千的,主打功能都是给小孩玩。你们怎么看?会把这个当成第一个卖点或使用场景推广吗?
👦🏻 哲伦
这是一个行业问题。如果定位玩具,除非做成潮玩,要有艺术家来做好“潮”的部分。如果只是玩具,它的定价和量级一定受限,用户诉求就是好玩。但这样一来,它用不了好的技术,养不活背后做 AI 的团队,商业上不成立。所以我们不希望它只是玩具。我们希望它既有趣,也有用。我们希望把两者都做到。
一个核心区别是我们机器狗可能是目前真正能带出门的。过去一些玩具由于没有四足的移动能力,电机扭矩不够、腿不够长,带不出门。宇树 Go2 虽然可以带出门,但需要遥控推着走,体验不好,孩子要玩你就得一直拿着,和玩遥控车一样。我们要解决自主移动问题。
再往上一层,我们在 WRC 展示过多功能背板,把机器狗作为通用移动平台。它能走到人能到的地方,上面设备能用我的电力和算力,我也提供固定设备的能力。所以可以放影像设备、机械臂、储物设备,甚至投影仪和小冰箱。它可以成为非常棒的户外功能平台。
大头的丰富背部配件
👩🏻 Ronghui
我在想,以前很多尝试这个领域的人,他们没有选择,是不是因为这个领域里面有一些很难的问题要解决?
👦🏻 哲伦
挺难的。过去无论是做四足还是人形,它们都是靠遥控器控制。你要进入家庭场景,就意味着必须抛掉遥控器,这在过去不成立,就得依赖自动驾驶和 AI 的基础能力。对我们来说选择也比较难,因为选四足相比人形,在估值和融资上更困难。如果完全从估值和融资角度考虑,我们这样的团队能丢掉遥控器,更好的方式是讲更大的故事来获得融资。所以这也是很多人没选择这个赛道的原因:你得放弃更容易的融资机会,去做更落地的事情,这背后就变成少数人的选择。
👩🏻 Ronghui
你们选了一个少见有先驱者、参考样本少的领域,过程中会不会遇到一些没预期到的挑战?
👦🏻 哲伦
确实挺大挺难的。因为我们要做产品,所以我在 WRC 展会上不断强调:我们得软硬件都自己做。虽然摄像头、激光雷达、电芯这些零部件不可能自己造,但硬件本体、系统架构、系统链路,包括机械结构和外观,都是我们自己做。这就意味着我们得补上机器人硬件的课,保证本体能被很好地控制。
今年 4 月之前,我们公司内部有两条线同时在做:AI 团队用宇树的四足做二次开发,让算法先跑起来;硬件团队搭建自己的硬件本体,设计电机结构和四足架构。到 4 月 28 日左右,第一代硬件出来了,我们叫 A Sample。5 月份开始用这个 A Sample 做软硬结合。结果 AI 团队在宇树本体上调试成熟的算法,放到我们自己的本体上却完全跑不起来,就必须解决软硬件之间的 gap。
宇树在硬件上的水平确实是全球顶尖,甚至可能是第一,所以我们必须跨过这道坎。我们的创始团队背景更舒适的是做 AI,而硬件本体是另一套范式,所以很多团队选择用别人的本体做开发。但我们把两拨人都放在公司里,在一个项目里协作,这带来 AI 推进受硬件迭代制约、硬件迭代也被 AI 需求牵制,两边交错影响,给整体进度带来很大挑战。
到今天为止我们也只能说解决了 80-90%,WRC 之后还在处理这个问题,目标是让硬件更稳定,AI 能更好地开发。我相信今年上市前一定会彻底解决。一旦解决,这种价值是巨大的,因为之后做更复杂形态时,我们也能用同样的方法。四足虽然是 mini bot,但五脏俱全。等我们做更大型的形态时,也能走通。
Vbot 团队
👦🏻 Koji
你刚提到宇树的机器狗本体做到全球顶尖甚至第一,那在宇树内部你了解到他们怎么看接下来的发展方向吗?
👦🏻 哲伦
目前机器人有两条发展路径:一是本体控制能力强后,做关节更多、自由度更高的本体,这是一条延伸的线;二是有了好的本体后,把它完全自主化,用 AI 驱动。
目前来看,宇树在走第一条线,本体做得越来越扎实。能做好四足,再做好人形,再迭代出更复杂、更便宜的人形或更强的四足,这是他们的强项,也是王兴兴和宇树的优势。
但要做对用户有价值的产品,第二条线必须要走:从环境感知到信息理解,再到规划决策和控制,这条 AI 的路径是挑战,也是我们和宇树面临的挑战。而掌握这部分认知的人,现在主要还不在宇树公司。
👩🏻 Ronghui
那他们在哪里?
👦🏻 哲伦
他们在自动驾驶团队和 AI 团队里。
👩🏻 Ronghui
感觉听起来这是新一代 physical AI 公司的共同挑战。
👦🏻 哲伦
没错。今天对很多 AI 公司来说,挑战反而是做机器人。本质上两边都有挑战。组织上,AI 团队得兼容硬件的人,硬件的人得兼容 AI 的人,最终才能形成一个完整的组织。
👦🏻 Koji
你在理想做产品经理应该挺开心的,李想本人也很信任你。我在北京 I8 发布会上看到一个 20 分钟的影片,是你和想哥的对谈。我在想,想哥得多喜欢一个产品经理才会在发布会上放这么长的对谈。所以你当时为什么离开理想出来创办维他动力?
👦🏻 哲伦
最核心的是,我在理想汽车做自动驾驶时就看到机会。这两年智驾竞争激烈,去年卷端到端,今年在做 VLA。其实去年做端到端的时候,我就看到了做机器人的可能性。原因在于它具备空间移动的能力。车是一种空间移动,虽然是平面移动,但也需要理解环境来控制。机械臂、机械组、四足、双足、灵巧手,本质上都相似。我看到了这种研发范式在机器人上的可能性。当然,这也离不开 Tesla 在牵引这件事,所以我心里很痒。
另一个层面是智能驾驶。我非常喜欢智能驾驶,希望它有一天能做到 L4。做到 L4 确实会给生活带来巨大变化,这是过去十年我坚信的。但我也看到它落地时存在很大的沟壑。这不是简单靠堆叠就能解决的。
在 physical AI 领域我认为有两条线:一条是场景复杂度,另一条是容错率。开车在场景复杂性上并不难,它是比较有规则的事情,人学两周到一个月就能开车。AI 甚至能解决人类几年都学不会的复杂问题。但在容错上,AI 不太擅长。自动驾驶是我能想到容错要求最高的产品之一,犯错的失效成本极高。所以我觉得 L4 还有很大的沟壑。L4 有沟壑意味着它本身不是一个独立的经营单元,而是汽车竞争的一部分。过去行业里出现过很多智驾营销概念,实际上它不是独立业务,而是卖车需要什么样的智驾,就发展什么样的智驾。
我不想在看到机器人机会时,还在做一个无法成为独立经营单元的东西。所以我特别想做机器人。其实从 2024 年开始,我就一直很想做机器人,只是没对外说。当时还跟理想里比我更有经验的人沟通过,我说如果有机器人业务,一定要叫上我。后来机会来自余轶南跟我的沟通,所以我毅然决然地去做机器人。我甚至觉得机器人成熟到一定程度后,反过来也可能推动 L4。这些是相通的。但前提是需要一个以 physical AI 为核心的东西,先自己商业化落地,这对我非常重要。
👦🏻 Koji
有意思,那现在你创业的感受和当时在理想跟着想哥工作的感受有哪些不一样?
👦🏻 哲伦
跟想哥工作的时候挺奇妙的。在理想时,有一个特别厉害的大哥,他做决策都会把背后的思考讲清楚,你会觉得很有道理,也能一直学习和成长,有很强的依靠感。离开理想后就没有这样的依靠了,很多敏锐的判断都得自己做。但这也是很好的过程,等于检验自己这五年是不是具备了对市场、用户、技术趋势的判断力。以前想哥帮你画好了框架,你做选择题或填空题;现在是一张白卷,要靠自己把它写好。
👦🏻 Koji
那想哥怎么评价你现在做的事?
👦🏻 哲伦
我去年创业前去找他,说了想法。他瞪着大眼睛看着我说:“哲伦,你想清楚了吗?” 那眼神特别认真,我在他办公室,只有我们两个人,我没法回避。那一刻我不能骗自己,如果没想清楚就不能说想好了。我对他说,我确实想干这件事。接着他说:“如果你真的想清楚了,我会支持你。” 这句话让我很感动,我会记一辈子。
去年就是在这样的对话后,我下定决心创业。后来我们也陆续有过沟通,比如在车展上碰到、或者我回理想总部见到他,他依然会在产品、品牌和用户层面给我一些输入,很有帮助。
👩🏻 Ronghui
他给了你什么样的想法?
👦🏻 哲伦
这次在总部,他跟我聊了产品,也认同我现在的方向,至少是一条从用户和产品端务实的方向。如果事情在技术上有可能性和价值,理想汽车在有现金储备并且有 AI 意愿的情况下,一定会做。但今天在人形机器人上其实还没有明显动作。想哥觉得人形还不够成熟,从产品上他知道我遵循理想产品方法论,和理想汽车很多地方是相通的,所以他认同我这个方向。
在理想,真正从 0 到 1,再到 1 到 10,是建立自己品牌的过程。品牌等于“我是谁”,在 C 端尤其重要。怎么和别人沟通你是谁?想哥也分享了从理想 ONE 到理想 L9,再到 i 系列的完整思考。比如理想 ONE 时,理想的品牌就是产品,用户通过产品认识你是谁,所以不需要花哨的包装,最核心的是产品体验。这个思考对我启发很大。
另外,理想里还有很多好朋友,他们在创业过程中也帮了我很多。比如我们这次宣布的合作伙伴:京东、火山引擎、地平线、禾赛、亿纬锂能等,都是行业内非常强的伙伴。尤其是地平线、禾赛、亿纬锂能,它们本身也是理想的好伙伴。这些公司务实,很多是上市公司,与他们合作意味着我们真的要做量产。如果只是做 demo,其实根本不需要这些伙伴。
👩🏻 Ronghui
那你当时创业其实选择很多,为什么加入维他动力?是什么说动了你?
👦🏻 哲伦
创业确实选择很多,但限制也很大,因为投入的不只是钱,最重要的是时间。既然要创业,就要投入很长时间去做,所以合作伙伴非常重要。我自己更偏产品和市场背景,但机器人虽然需要好的产品定义,核心驱动力还是 AI 和工程技术。要做成这件事,我必须要有非常强的技术合伙人。
今天市面上有很多看起来头衔很厉害的人,但真正能成事、你能完全信任的,往往是一起打过仗的兄弟。选择合伙人,本质是把自己的时间交给他。
我和余轶南虽然在不同公司,但有过深度合作。过去理想从 ONE 到 L8,征程 3 和征程 5 平台都是和他们团队一起开发,最后交付的产品是行业标杆。我们之间有革命情谊,我也知道他对技术追求很高,对团队严格,工程能力强,同时做人开放、不死板,对好产品有自己追求。这些都让我觉得他是个很好的互补伙伴。所以这是对人的互相选择。
👦🏻 Koji
我觉得挺有启发的。选创业伙伴,不只是选能力,而是决定把接下来几年生命交给谁,才能不浪费这几年。
👦🏻 哲伦
没错。因为最后的结果必须共同创造,靠我一个人是做不成的。其实我也想过,如果离开理想完全靠自己,可能会去做内容相关的事,因为能完全掌控。但那就是小而美。真正做大事,需要合伙人一起把格局拉大。其实这也是缘分,不是我单方面选择,刚好余轶南也找到了我,他把我往前推了一步,让我有机会做更大的事情。如果只靠自己,我可能完全做不了。
👦🏻 Koji
感觉做你们现在这个产品的产品经理应该挺让人兴奋的吧?毕竟是在定义一个全新的物种、新的产品。在你看到的可能性里,除了玩具和教育场景,你觉得 C 端最有可能跑出来、并且有商业价值的场景会是什么?
👦🏻 哲伦
其实我们创业初期有一两个月的时间就在讨论这个问题,最后梳理出一个大方向:室内和室外两类场景,并且是以十年为维度的终局思考。
我们为什么最初选择做四足?因为在 Autodog这个领域,在室外空间里,四足几乎就是一种“终极形态”。它比两足稳定,比轮式更具通过性,所以我们很坚定地选择了四足。我们认为只要场景在户外,所有衍生出来的能力都可以基于它展开,比如帮你拍照、陪你运动、递东西等等。
但在室内,四足就没那么合适了。它不仅负担重,还很吵,而且容易摔倒,稳定性远不如轮子。所以在家里,轮式结构其实是个很棒的发明。如果再加上机械臂,就能帮助做家务或执行一些具体任务。所以我们对未来家庭机器人的判断是:第一代会是以四足为核心的户外机器人,之后会出现专注室内的产品——轮子加机械臂,专注于帮人真正完成家务。
在设计上,我们也会尽可能做减法:能用轮子的就不用腿,能用一个机械臂的就不用两个,能用夹爪的就不用灵巧手。这样既能简化技术难度,也能降低成本,让用户更容易买到。所以我觉得未来消费者能接触到的机器人,核心上还是会分成两大类:室外四足机器人和室内轮式机械臂机器人。它们可能会先各自发展,然后逐步被整合成更通用的形态。
👦🏻 Koji
我知道 Tesla 选择了一个做法:远程遥控机器人,让它去做事,在过程中积累数据或发现场景。你们怎么看这种路线?
👦🏻 哲伦
Tesla 的背景和创业公司很不同,他们选择的路更适合自己,有几个前提:
第一,Tesla 有自己的工厂,可以无限试错;
第二,Tesla 有无限资金,可以不断大量投入,研发资源是国内创业公司的百倍、千倍;
第三,Tesla 本身需要做更大、更通用的事,这才符合它的估值和品牌。
但这个产品的核心问题是,它实际能创造的价值并不多。我有朋友在做类似的事,更适合高危或不舒适场景,比如工厂喷涂车间。人进去要穿防护服,虽然一天待的时间有限,但工作辛苦,这类场景适合遥控机器人。但这样的场景并不多。
更多情况下,如果你用这种方式,等于纯粹投入资金采集数据。但小公司耗不起,也没法靠这种方式做。所以它能创造的价值有限,也不可持续。它适合 Tesla,但不一定适合创业团队。
👦🏻 Koji
你觉得「找场景」是不是行业里创始人和产品经理们聊得最多的话题吗?因为感觉找不到场景挺让人头疼。
👦🏻 哲伦
现在可能还不是。大家更多在等待或推动技术发展。可能也是因为目前机器人资本市场还比较活跃,所以创业公司都融到了很多钱,并不需要急于商业化。大家讨论的更多是能不能做出新的 demo 或新奇展示,而不是具体商业化场景。但下一步应该会进入商业化讨论。
👦🏻 Koji
有意思。我之前听说过一家美国 VC,叫 Turpentine VC(松节油)。他们名字的由来是:当艺术评论家聚在一起时,讨论的都是商业化;而当艺术家聚在一起时,讨论的是哪里的松节油最便宜,因为那是画画必备的原料。
那说回 WRC,你提到空前的热闹,但有没有让你眼前一亮的东西?不管是产品、功能还是技术?
👦🏻 哲伦
作为从业者,很难被眼前一亮,因为大部分展示都在预期内。但我能看到的是,今年大家的展示比去年更成熟。去年 WRC 的很多机器人会犯低级错误,比如突然摔倒、乱抖动,这意味着硬件还不够成熟。今年这类情况明显减少,说明行业在不断消除下限。虽然没有突破上限,但下限在消失,这是行业蓬勃发展的必经过程。
还有一点让我很有感触——观众。因为这次在北京,又是周末和暑假,所以周六到周二来了特别多孩子。他们对机器人非常感兴趣,充满想法。我们 VBot 展台有根柱子,没法避开,就包起来做成“品牌柱”,让大家在上面签名涂鸦。从 8 月 7 日媒体日开始,就有人签字,后来孩子参与特别多,上面半截是签名,下面全是画画,留下很多创造力和想象力。
这让我很感触。我觉得中国新一代孩子有很好的教育和经济基础,我确实认为机器人文化有机会在中国诞生,就像汽车文化在欧美。今晚我还要去参加机器人运动会的开幕式,作为观众。很多人会觉得奇怪:机器人为什么要跑步、踢足球?但其实大家不用太紧张。当年的汽车也经历过类似过程:为什么要造那么大马力?为什么要 F1?这些在中国没答案,但在欧美有。以前中国没有这样的东西,今天机器人可能就是机会。
我自己感触很深。我从初高中起就会买票去看上海车展,那是我的启蒙。今天看到孩子们也买票来看机器人展,我觉得这是新一代的启蒙。正如当年我看车展后想造车,我相信这些孩子长大后会成为中国机器人行业的中坚。
孩子们自发涂鸦表达喜爱
👩🏻 Ronghui
对,他们以后看到机器人,可能就像我们今天看到车一样普及。
👦🏻 哲伦
是的。我觉得未来会出现非常多形态和垂直品类的机器人。这让我联想到八九十年代的日本和美国,当时电子产品百花齐放:Walkman、Game Boy、数码相机、拓麻歌子、手机,最后被 Steve Jobs 整合成 iPhone,推出智能手机。这个过程很美丽,我相信在机器人行业会再发生一次。
👩🏻 Ronghui
但现在行业很热,你会担心有泡沫吗?
👦🏻 哲伦
不是担心,今天确定性就有泡沫。虽然如此,对行业内的人反而有益。如果没人关注,行业没法发展。有点泡沫反而能促进行业发展。关键是别在泡沫破裂那天,自己处在无法承受的状态。
我们必须保证研发投入和开销保持合理水平。即便泡沫破裂,公司也能健康运行。如果趁着泡沫招太多人、摊子铺太大、开太多产品线,那泡沫破了就很难收场。所以今天你看到维他动力就只做一款产品,看起来很简单,公司也很统一,目前七十多人专注做这一件事。这就是我们对泡沫的回答。
👦🏻 Koji
有些泡沫是肥皂泡,破了就没了;有些泡沫是啤酒泡,最后还是会沉淀下来好喝的啤酒。虽然没有一开始想象的那么多,但还是有的,而且很可能很值钱。
👦🏻 哲伦
对,这比喻挺好。
👩🏻 Ronghui
之前你们的一些采访提到的一些理念,感觉和很多公司不一样,比如说让机器人能不要说话就不要说话,人不应该离电子设备太近。我很好奇,如果综合阐述这款产品背后许多的选择,包括技术成熟度的考量,一些做与不做的理念坚持,商业化权衡,综合这些因素做整体分析,你们是怎么一步步做判断的?
👦🏻 哲伦
前面说的几点,我们现在是在做软硬件的全栈,硬件自己掌握,以 AI 为核心。我们坚持完全自主化的能力,认为单独通过遥控器也能创造价值,但那主要是 for 学校的。所以今天宇树的第一批客户其实是教研机构,我觉得合理,但这不是我们选择的道路。我们坚持做 for 用户的,就是用户能直接用的,我能带回家送给我妈的这样的东西。
另外我们坚持让它有比较好的自然交互能力,但我们认为自然交互能力不等于智能音箱。其实我们本来也有这样的认知,后来看到 Lovot 的创始人林要写的那本《温暖的科技》,他也是这么写的,也让我们得到了一定的支撑。
他的描述是:当对方虽然用语言和你沟通,但你发现他的语言表达并不是如你预期那样,或者他没法完全理解你的时候,你的信任感反而会丢失。但是当他能用一些肢体和语气来传达时,反而能建立很好的信任。这其实就是人和动物之间的关系,我很认同这个观点,所以我们做了不一样的选择。我们现在让它有很好的大语言理解能力,但不让它用说话来反馈,而是更多通过音色和语气来传递。
另外我们坚持让产品尽量 affordable。无论是在零部件的整合上,还是整体外观设计上,我们希望用户能接受。今天机器人出来三万、四万、五万都算便宜,但我们觉得用户难以接受,所以我们尽量让它 affordable。虽然目前还没公布售价,但我们在努力不断整合供应链,降低成本,甚至通过自研来降低成本。
👦🏻 Koji
非常期待看到你们的产品上市。你刚才提到在五年或十年之后,你认为 WRC 很可能会成为像伦敦世博会一样的存在,那可以请你预测一下那时的机器人行业会是什么样的?它会对我们的生活带来哪些具体的变化?
👦🏻 哲伦
我特别喜欢《机器人总动员》电影。我在今年正式创业前又重新看了一遍,觉得它对机器人的想象和未来 5 到 10 年可能会挺像。片子里瓦力是一个收垃圾的机器人,把所有垃圾压成方块。伊娃是在地球上寻找生命。他们回到太空飞船后,飞船里有很多机器人,有的擦地,有的送餐,有的做各种事。我觉得 5 到 10 年后会有非常多特别的机器人出现在各种生活空间里,为人类提供各种服务。有室内的,有户外的。它会让物理世界的幸福指数增加。
我们想让人尽量远离电子或数码信息,是因为今天信息过于爆炸,让人的幸福感下降。我们觉得机器人有机会把物理世界的幸福再拉回来,我对此非常向往 ——未来在各种空间都会有各种机器人,他们能理解你说的东西,帮你做好某项服务。
这就是《机器人总动员》里特别棒的状态,他们不一定是人形,但都很有生命力。比如《汽车总动员》里的角色不是人形,但也很有生命力。我们最早的公司叫 Vita Dynamics,Vita 就是“生命”。我们觉得机器人应该有表达方式、有表情、有语言、有肢体。5 到 10 年后,应该就是这样的景象。
👦🏻 Koji
我们共同期待那一天的到来!也希望到时候让大家喜欢的机器人里有很多来自维他动力。感谢哲伦班长今天来「十字路口」,也期待你改天再来做客。
👦🏻 哲伦
谢谢 Koji,谢谢 Ronghui,聊得很开心,拜拜。
👩🏻 Ronghui
拜拜。
文章来自于微信公众号“十字路口Crossing”,作者是“十字路口”。