图片来源:YouTube
Aman Sanger和其他人共同创办了Cursor,并在第一年将其规模扩大到1亿美元,使其成为增长最快的SaaS公司之一。
在与红杉印度/东南亚——Peak XV管理董事Rajan Anandan的对话中,Aman分享了Cursor的起源和基因。
产品开发与挑战
Rajan Anandan:我想几乎所有人都听说过Cursor。Aman和三位联合创始人——公司有四位联合创始人——他会详细讲这方面,他们在MIT时就创办了这家公司,
或者说,开始了一些后来成立公司的工作。他们都在2022年从MIT毕业。他会谈谈公司的起源故事以及他们是如何准备开始的。
Aman从14岁就开始编程。2019年,我在他纽约的家里见过他,当时他刚在谷歌实习过,但感觉非常无聊——所以我能理解他为什么会创办Cursor。
如今,Cursor有30个人,从2023年开始发布产品,已经创造了1亿美元的收入,它是一家成长非常迅速的公司。
基本来看,Cursor是一个AI编码数据的产品,他会稍后详细讲讲。正如你们所知,编程是一个正在被AI颠覆的领域,竞争非常激烈。
下面,从你们的起源故事开始吧。你们四个人是如何开始的?请和我们讲讲背后的故事。
Aman Sanger:我们四个是在MIT认识的,都有一些机器学习的背景,而且我们都是Copilot的早期用户。
GitHub Copilot大约是在2021年夏天发布的,那时它真的非常惊艳,一发布出来就感觉像是魔法。
这是第一个真正有效的、基于语言模型的产品。之前所有的机器学习系统大多是推荐系统,或者是一些类似自动驾驶和计算机视觉的东西。
但Copilot是真正第一个基于语言模型的产品。第一次使用它时,确实能感受到那种魔力。但过了一年,情况没有太大变化。模型本身开始变得更好了。
Rajan Anandan:产品本身没有变化吗?
Aman Sanger:是的,一年之后唯一的变化是,他们换了一个OpenAI提供的新模型。其他方面完全一样,体验也几乎没变,但底层模型在不断改进。
正如我刚才所说,如果你看看文献上的进展,人们正在用更多的数据来扩展这些模型。鉴于代码领域的数据量非常庞大,我们预计这些模型会变得越来越强。
而且现在看来,编程的未来不会只是更好的“ghost text”和更好的“autocomplete”。
如果语言模型真的足够强大,能够生成90%甚至95%的软件,我们的观点是,你必须重新构思工程师实际构建软件的界面。这里有几个故事可以帮助阐明这一点:
我们遇到了Nat Friedman,他曾是GitHub的CEO,他在GitHub Copilot的创建过程中起到了部分作用。
基本上,微软拥有VS Code和GitHub。Copilot之所以成功,核心原因之一是他们能够对VS Code进行改进,推出了这种新的用户体验,提供了智能文本。
对于那些知道我在说什么的人,或许如果你不写代码,你在Gmail中也见过这种自动完成的智能文本。
这种东西之前并不存在,取而代之的是类似Tab9尝试使用的那种奇怪的IntelliSense bubble。而仅仅更换这一点,就大大提升了使用效果。所以再次回到这个问题:
如果模型变得更好,能够做更多事情,你就必须掌控IDE——现在证明这确实是一个正确的选择。
Rajan Anandan:绝对如此。你们重新构想了整个事物,很多创始人都在思考这个问题。
这些领域的竞争正在变得越来越激烈,你们与模型竞争,与其他很多公司竞争……你们是否曾考虑过,自己即将开始的这个旅程,就是要挑战微软,还是说……
Aman Sanger:是的,我们百分百考虑过这个问题。这也是我们在做这个领域工作时最大的顾虑。因为确实非常痴迷于训练语言模型,并让它们在编程方面更好。
但也一直犹豫:我们想,也许可以构建其他类型的开发者工具。
Rajan Anandan:你们一开始没有做Cursor,对吧?能说说一开始做的是什么吗?
Aman Sanger:的确,我们最初实际是为机械工程师构建工具的。
看到Copilot的成功之后,我们想,嗯,有一点机器人学的背景,而且很多机械工程工作都非常繁琐。能不能为CAD构建一个类似自动完成功能的模型?
但最终,市场上并没有什么适合创始人的契合点。我们并不是真正的机械工程师。
我们不断回到编程的领域:是的,我认为最终还是编程市场的竞争更激烈。但我们有一个理论,那就是你需要掌控接口,你需要掌控IDE。
相对于其他许多资金支持非常强大的初创公司(比如GitHub Copilot),这给了我们极大优势。我认为,专注于用户体验一开始就为我们提供了这个优势。
Rajan Anandan:好的。你们公司才三岁嘛,所以讲讲你们第一年的经历吧。整个公司那时候只有五个人,对吧?
Aman Sanger:对,那时候主要是创始人,只有我们四个。
Rajan Anandan:四个人,你们自己开发了产品并推出了它?
Aman Sanger:是的,大约在2023年1月,我们开始着手开发这个产品。
大概有两三个月的时间,我们在尝试不同的东西,进行各种实验,直到找到合适的方向,然后推出了它,开始的反馈还可以。
我们是和GPT-4一起发布的,所以一开始确实有一些初步的关注,因为它是少数几个搭载GPT-4的产品之一。
但随后热度就消退了,使用量也急剧下降。接下来的整个夏天,增长都非常缓慢。
这确实让人气馁。我们心里最大的疑问是,难道我们太过野心勃勃了吗?作为一个这么小的团队,我们真的能为所有工程师打造一个通用的产品吗?
也许应该更聚焦于某个特定的用例,比如测试或者bug检测之类的吗?
但这个产品最神奇的地方在于,我们自己也是用户,所以我们能非常迅速地进行迭代,并且在那个夏天,我们尝试了各种不同的功能。
然后我们找到了那一组真正有效的核心功能,其中一个就是这种指令式的编辑能力,我们把用户体验做得非常好。
这个功能在Cursor中叫做Command K,因为这就是你调用的实际命令;另一个功能是代码库索引,你可以针对整个代码库提问。
我们将这两个功能整合并推出后,它就开始飞速增长起来了。
Rajan Anandan:所以这两个功能的加入,推动了增长?
Aman Sanger:我认为是。我们还进行了很多其他的实验。而Cursor的大部分工作基本上就是在尝试什么是可能的。
比如,你们在产品中看到的每一项功能,背后可能有10个失败的实验,这些东西没有成功。一个很好的例子是我个人最喜欢的功能,现在叫Cursor Tab。
它最初的名字是Copilot++。当时,Copilot只是一个自动补全工具。
Copilot++的想法是,大部分编程工作不仅仅是找出在光标后面应该写什么,更重要的是修改现有代码。
所以Copilot++最初的设计是,预测你下一个修改的内容,但它并不是想取代Copilot,而是作为对Copilot的一个补充——Copilot负责自动补全,Copilot++负责修改。
我们在夏天尝试过用提示模型进行实验,但完全失败了。直到2024年1月,我们有了足够的用户数据,它才开始起作用。
Rajan Anandan:到2024年1月,你们有多少用户?也就是你们推出大约一年后?
Aman Sanger:大约有30,000个日活跃用户,差不多。有了这些用户,我们获得了一些数据,可以用来训练模型,预测下一个编辑操作。
这就是我们尝试的一个例子。过去我们尝试过两次,想让这个功能成功,但完全失败了。最终在第三次尝试时,让它成功了。
它甚至不是完整的自动补全,只是一个加在Copilot上面的功能。
然而随着时间的推移,我们慢慢改进,现在我认为它在自动补全和预测下一个编辑操作方面都比Copilot要好得多。
Rajan Anandan:你们四人是这个产品的用户,都是非常懂技术的人。你们不断实验,构建你们作为用户所需要的东西。
跟我们多讲一点这个过程吧,让大家更好地理解——因为我觉得你们的工作速度非常快,让人觉得有些疯狂。
Aman Sanger:这可能是我们的一大优势,我们是一个小团队。每个人都在为自己做,因为我们都是工程师。
但我认为其他人在这方面,可能不会像我们一样坚守初心。
所有的工作,实际上在前六个月到一年间,都是在尝试找到新方法来利用、改进这些模型,以便更好地进行编程。
我最喜欢的实验,至今我们还没有完全解决,但已经开始看到一些生机。我们尝试过很多次,你应该能够利用这些模型来检测bug。
目前还不清楚这个功能是否应该用于打字,像是一个语法检查工具;也不清楚它是否应该用在审查过程中,我们尝试过许多不同的版本。
现在我们所有的,有时真的需要大量资源、巨大的计算能力和一个大型团队投入,才能让像这些功能一样的东西发挥作用。
我认为这就是在寻找bug的这个功能上的情况。总之,经过大量尝试,看看什么有效,然后再发布出来。
我们发布这些半成品,而许多竞争对手拒绝这样做。第一版的Copilot++光标标签很糟糕,但一旦你发布出来,看看人们的反应,就能改进很多。
Rajan Anandan:所以你们愿意发布很多东西,然后去掉大部分,只保留有效的部分?
Aman Sanger:没错,我们倾向于尽早发布,只要某个东西对团队显示出有用的迹象。
Rajan Anandan:现在我们来谈谈团队建设。
你们什么时候加入了第一个非创始人成员——从四个创始人到第五个团队成员,或者第一个非创始人团队成员是谁?是什么时候加入的?
能否简单谈一下你们是如何建立团队的?
Aman Sanger:是的,我们的招聘进程很慢。
我们能这样做一段时间,因为我们是四个技术创始人组成的团队,
所以可以在不招聘任何人的情况下,构建大部分早期的产品,直到达到了某个早期的产品市场契合度。
这是非常好的,因为这意味着作为第一次创业的创始人,在没有显著网络的情况下,我们不必在首次招聘时降低标准。
所以这也意味着,当我们开始寻找第一个员工时,我们已经有了一些收入,增长也相当可观,而且有很多用户可以联系。
所以第一个员工其实是一个共同的朋友,或者是我认识的一个朋友。
Rajan Anandan:从MIT毕业的吗?那么在30人中,有多少人来自MIT?
Aman Sanger:差不多一半。
Rajan Anandan:只有一半?其他人来自哪里呢?
Aman Sanger:只是一些学校的混合。这其实说明了产品的一个神奇之处,那就是我们的用户非常适合招聘。这也是我们招聘到第二位员工的原因。
Rajan Anandan:是那个持续给你反馈并且在上面进行实验的超级用户吗?
Aman Sanger:是的,基本上通过分析,找到了评估某些超级活跃用户代码质量的方法,然后我们利用这个方法主动联系了一些高质量的用户。
这个人做出了回应,结果非常好。他是一位出色的工程师。
Rajan Anandan:那么现在我们可以换个话题,谈谈Cursor的底层模型架构。我们知道你们使用前沿模型,但你们也会训练自己的模型。
Aman Sanger:是的。我认为在构建这些产品时,务实非常重要。
很多公司可能在2023年和2024年筹集了大量资金,并且在产品市场适应之前将所有钱都花在了GPU上,但我认为这不正确。
我认为我们尽量使用最适合的工具,而很多时候,这只是调用一个API,
但随着你建立一个足够大的团队,积累足够的专业知识,拥有足够的可用数据来改善这些模型,
我们开始发现,构建自定义模型越来越有影响力,所以这就是我们为tab、Cursor tab以及下一次编辑预测自动补全所做的工作。
Rajan Anandan:所以你们为此有自己的模型?
Aman Sanger:是的,那是我们训练的一个完全自定义的模型。
Rajan Anandan:有多少个自定义模型,能稍微透露一下吗?
Aman Sanger:其实有很多,技术上大约有50个。但真正投入使用的,大概只有10个。
Rajan Anandan:10个自定义模型,然后在前沿领域,你会使用其中的一些,还是就用这些模型?
Aman Sanger:在前沿领域,我们主要坚持使用Sonnet模型,这是主要的模型。
有些人更喜欢其他一些模型,比如推理模型,如o3或o1,还有一些人非常喜欢R1,比如DeepSeek的模型。
不过回到正题,我们使用自定义模型主要是为了低延迟的需求,比如在需要比实验室提供的模型更低的延迟和成本的场景下,
或者是在我们拥有大量数据的领域,这些数据可能与实验室在预训练时接触到的数据有些不同。
Next Data Prediction就是一个很好的例子。
如果你打算预训练这些模型,你会发现你在GitHub上有大量的数据,但你没有提交之间发生的变化,而我们发现这正是一个非常好的数据来源。
然后是一些我们并不特别关注改进的东西,比如我们可以训练更好的嵌入模型,因为实验室里最顶尖的人正在推动推理领域的前沿,而不是嵌入模型的改进。
就这些。
Rajan Anandan:那Cursor的魔力有多少来自自定义模型呢?
Aman Sanger:我认为这个因素被低估了。
很多你在Twitter上看到的内容,是人们在热衷于讨论从零到一的东西,但很多时候你可以仅仅通过使用现成的模型来应付。
真正的魔力在于,当你在更大的代码库中使用这些模型时,它真的能很好地理解内容,预测你接下来要做什么,找到正确的代码片段。
这些都来源于这些自定义模型。
Rajan Anandan:明白了。现在咱们可能会转向一个和Cursor不相关的问题:
你们有什么建议,给那些正在建立本土AI公司(无论是代理型的还是AI应用)的创始人?抱歉,在我问这个问题之前,Cursor的护城河是什么?
你们有考虑过护城河吗,还是其实并没有?
Aman Sanger:有一些方式可以建立黏性。比如,我认为分发是其中之一,我认为目前我们并没有真正建立起长远的护城河。
我们有一些优势,比如相较于其他所有人,除了Copilot之外,我们有分发优势。我们也有数据优势,但这些还不算护城河,因为Copilot的用户更多。
我认为从长远来看,我们可能会有一些潜在的护城河。就像我认为问题在于,我们想要达到一定规模,成为行业的领先者,超越Copilot。
Rajan Anandan:所以会是分发和数据吗?
Aman Sanger:我认为是。然后需要建立粘性,因为Copilot没有做到这一点。
他们的产品缺乏粘性,这也是我们存在的原因,也是我们能够做到如此高的收入,并希望今年超越他们的原因。我认为有方法可以建立粘性。
Rajan Anandan:你能详细说一下吗?你们如何建立粘性?
Aman Sanger:有很多方法可以让模型专注于代码库,特别是当你有成千上万的开发者。
他们在大公司里每天都在使用这个产品,而你能得到他们所有的编辑数据,这就是丰富的数据。
你可能不会用它来改进你其他的模型,当然,是为了其他人,因为企业不会允许你这样做,但你可以用它来改进他们的模型。
基本上会得到这样一个情况:公司使用Cursor的时间越长,Cursor就越能变得更好。
我认为现在把重点放在这个上不太合适,因为增长比粘性更为重要,但我认为这绝对是我们可以做的事情。
Rajan Anandan:跳出Cursor之外,你对那些构建应用AI或agent AI公司创始人的建议是什么?
尤其是在这一点上,你如何建立一个真正特别的东西,是前沿模型做不到的?因为每个人都会进入应用领域。
Aman Sanger:你应该瞄准那些天花板很高的东西。
Rajan Anandan:什么是天花板很高的东西?
Aman Sanger:我举个例子,像写文案这种事情。也许有一个产品,它的收入增长很快,特别擅长写文案,但那并不是一个特别高的天花板。
Rajan Anandan:难度等级?是这个意思吗?
Aman Sanger:是的,就像难度等级一样。它有多接近像ChatGPT之类的东西能做到的程度。ChatGPT发布之后,大多数人可以直接去那里让它写文案。
而对于编程来说,情况会有所不同,我认为每个人都会尝试建立这些agent,软件工程agent,但我认为在很长一段时间里,你仍然需要真正的工程师。
长时间来看,工程师与这些工具搭配使用的生产力要远高于这种AI“同事”。
这是一种天花板非常高的情况,因为我们实际上还有很长的路要走,才能达到这些模型,或使用这些模型的系统真正能够替代最优秀工程师的水平。
Rajan Anandan:这是一个很好的看法,现在我们来谈谈变现。从你们开始的第一笔收入到100百万收入,年化ARR或运营速率,这个是怎么发生的?
你们没有销售人员,对吧?
Aman Sanger:我们设置了一个Stripe账户,然后——
Rajan Anandan:你们设置了一个Stripe,然后,哗,马上就来了?
Aman Sanger:我的意思是,你知道的,感觉并不像——
Rajan Anandan:你们没有销售人员,对吧?我们开始招聘销售人员了——入站、出站、SDRs、BDRs、AEs,都没有,对吧?
Aman Sanger:不,我们是一个多月前才开始招聘销售人员的。
Rajan Anandan:现在你们有多少个销售人员?
Aman Sanger:三个。
Rajan Anandan:但是你们到达1亿收入的时候,没有任何销售人员?
Aman Sanger:没有。那是怎么发生的呢?这就像人们把这些产品告诉他们的朋友一样。
这很有趣,因为开发者工具传统上,大家告诉我们的事情是,开发者工具赚不到钱。
然而,很多独立开发者为此付费了。而且,我认为企业市场会赚更多的钱,方向也的确是朝着这个走的。
它是开发者和团队的结合。但是很多其实是独立开发者在支付。这至少是我们增长的一个大基础。
我认为AI让人们愿意为某些东西付费。就像是一旦你拥有了ChatGPT,人们开始每月付20美元。现在他们就觉得,支付一些AI工具的费用已经是常态了。
Rajan Anandan:这是一个很好的观点,对吧?
Aman Sanger:Copilot也是一样,必须经历这个过程。
就像他们不得不经历一段漫长的过程,无论是几年的时间,去让人们改变他们的想法,去认为,我需要为一个AI工具付费。
然后,当我们开始的时候,这就变成了一种常态。于是,人们就更愿意为Copilot的替代品或Chat GPT的替代品付费,或者是某种更好但价格相同的东西。
Rajan Anandan:当你考虑接下来的三到四年时,现在我不再讨论盈利化问题,但包括盈利化,
看到接下来的三到四年,你们作为一家公司、一个产品、一个企业,目标在哪里?
Aman Sanger:还有很多工作要做,去让软件工程师更高效。Cursor的最终目标是让世界上的任何人都能更轻松地制作软件。
如果你希望让任何人都能非常简单地制作出像Figma这样的高水平产品,我认为这需要很长时间。
而且我不认为最终的形式会是像我开始形成的一个信念那样,AI“同事”可能并不是世界的最佳终极状态。
因为我有真正的同事,他们是非常优秀的工程师,但在试图与他们沟通想法时,你会遇到一些额外负担。
有些东西常常存在于你的脑海中,很难传达出来,然后有一些隐性的信息,你永远无法完全写出来或者传达给他们。
他们给你的东西,大部分是对的,但总是跟你心里想的有些出入。就会有一些来回的讨论,我认为你可以比同事做得更好。
如果你有某种接近即时的东西,并且能够与你即时迭代,我认为很多开发工作将会是这样的。而且,我不知道。我们来看一个软件的例子。
比如,拿Notion来说,很多时候,重要的是你在设计Notion中的每个元素时的品味。比如,点击这个东西时会发生什么?这个东西怎么反应?
并且,足够详细地描述这一切就是编程。我认为它将会看起来非常不同。
Rajan Anandan:基于这个观点,我知道你们四个人有一个强烈的看法,那就是开发者的角色不会消失。
它们会发生变化,因为有一种观点认为,一切都将转向普通代码,比如从提示到代码。
Aman Sanger:会有一些事情是从提示到代码的。有些事情是非常明确的,比如模型会大致知道你想表达的意思。
像是,很多编码可能就是这样。要构建一个简单的CRUD应用,你可以直接从提示到代码,然后进行迭代。
我认为有些事情,可能会涉及到公司有一大堆任务和bug。那时候有一个AI“同事”去处理它们,消化并完成它们,会非常棒。
但我认为也会有一些事情,价值非常高,这完全取决于某个个体的品味。
也许它不会完全像今天的工程师那样,但我认为那将是未来工程学的样子:一个人在做判断,如何塑造软件的样子。它可能会在某个更高层次上运作。
Rajan Anandan:你们怎么看这个问题?我知道你们不能评论,但你们认为,几年后,AI编码员会不会成为现实?我不再支付20万美元,而是支付5万美元?
Aman Sanger:我们希望能做到。
Rajan Anandan:你们就是朝这个方向发展的吗?
Aman Sanger:我们希望能够构建这样的东西,它将呈现多种形式。比如将会有一个在后台运行的东西,它就像是一个同事,我们希望能够构建它。
我们还认为会有一种形式,更加融入工作流程,让你更紧密地与它合作,快速迭代。
Rajan Anandan:给我留下深刻印象的事情之一,就是你们Cursor和像你们这样的公司——速度。速度真的很快。
告诉我们一些关于公司文化的事,什么是最重要的?你们是如何保持忠于使命,并将其付诸实践的?
Aman Sanger:文化就是那种真正关心编程未来的人。
比如在晚餐桌上,大家讨论的都是关于“如果我们训练一个模型来做这个,然后它以这种方式表现出来会怎么样”的猜想。
然后你会看到UI人员和模型人员在一起讨论,思考未来会是什么样子。就这样,大家都超级兴奋。因为有太多酷的东西可以构建、发明。
这大概就是Cursor文化的本质,也是它能够运作得如此成功的原因。就是这种好奇心,大家都在想着:“下一个要构建的是什么?下一个杀手级功能是什么?
我们如何使Cursor变得比现在更好?”因为我觉得就有一些东西,就在我们眼前,但没人发现。
Rajan Anandan:Cursor完成了1%还是10%?
Aman Sanger:我认为我们可能完成了超过1%,但绝对不到10%。我会说大概是2%或3%。
Rajan Anandan:太棒了,感谢你加入我们!
原视频:Cursor Co-Founder Aman Sanger on the Journey from 0-$100M in 12 Months & the Future of Programming
https://www.youtube.com/watch?v=XBQEdtXjlho
编译:Christine Liu
文章来自于微信公众号“Z Potentials”,作者 :Christine Liu
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md