你有没有想过,为什么大部分人在谈论AI的时候还在纠结ChatGPT能写多少字、回答多少问题,而有些人已经在用AI创造出让你分不清真假的视频内容?当全世界还在为文本生成AI争论不休时,一家名为fal的公司却在悄然重塑整个内容创作的基础设施。他们刚刚完成了1.25亿美元的C轮融资,估值达到15亿美元,由Meritech领投,Salesforce Ventures、Shopify Ventures和Google AI Futures Fund等重量级投资者参与。
这不是又一个AI聊天机器人的故事,而是关于两个土耳其移民如何洞察到一个被大多数人忽视的巨大机会:当所有人都在追逐大语言模型时,他们却坚信真正的AI革命将发生在图像、视频和音频领域。现在,Instagram和TikTok上有一半的视频内容都是AI生成的,而fal正是这场变革背后的基础设施提供者。从2021年的一个小想法,到现在服务超过100万开发者和100多家企业客户,包括Canva、Shopify、Perplexity等知名公司,fal的增长轨迹几乎令人难以置信:在过去12个月里,他们的收入增长了60倍,现在的年化运营收入达到9000万美元。
我深入研究了fal的成长故事后发现,这并不是一个典型的硅谷创业神话,而是一个关于技术洞察力、极致专注和移民创业者独特视角的深刻案例。两位创始人Burkay Gur和Gorkem Yurtseven的经历,以及他们如何在AI基础设施这个竞争激烈的赛道中找到自己的差异化定位,给我带来了很多思考。
很多伟大的公司都是从解决创始人自己遇到的问题开始的,fal也不例外。2021年,当Burkay和Gorkem刚开始创业时,他们原本的想法是为Python计算建立基础设施平台。那时候他们预见到推理计算将成为下一个大趋势,但并不知道具体的机会在哪里。直到2022年底,DALL-E、Midjourney和Stable Diffusion等图像生成模型的出现彻底改变了他们的方向。
作为一个拥有深厚技术背景的团队,他们对这些AI图像生成模型的能力感到震撼,觉得简直就像魔法一样。但同时,他们也发现了这些模型的一个致命缺陷:速度实在太慢了。Burkay在采访中回忆道:"我记得Stable Diffusion 1.5生成一张图片需要19秒,甚至更长时间。"对于习惯了高效工作的技术团队来说,这种延迟简直无法忍受。
这就是fal真正的起点。他们开始夜以继日地优化Stable Diffusion的性能,从编译器和性能工程的第一性原理出发,深入研究GPU利用率、内存管理、工作负载分片等底层技术问题。Gorkem拥有丰富的编译器和性能工程背景,甚至是Python语言的核心贡献者之一。他们的方法是把GPU性能优化当作传统的程序性能优化来处理:先分析瓶颈在哪里,然后一个一个地解决。
这种对速度的极致追求,后来成为了fal最重要的差异化优势。当其他公司还在为几十秒的生成时间而苦恼时,fal已经能够将同样的任务压缩到几秒钟内完成。正如Burkay所说:"我认为延迟会扼杀创造力,延迟会扼杀生产力。"这不仅仅是技术问题,更是用户体验的根本差异。当创作者可以立即看到自己的想法变成现实时,整个创作过程就变得完全不同了。
更重要的是,他们意识到这种优化能力可以构建成一个可插拔的系统。当新的模型发布时,他们可以直接应用相同的优化技术栈,快速让新模型也达到最佳性能。这种前瞻性的架构设计,为后来fal能够快速支持各种新模型奠定了基础。现在,他们通常能在新模型发布的第一天就提供优化版本的API服务,这在竞争激烈的AI模型市场中是一个巨大的优势。
Burkay和Gorkem的移民背景为他们的创业故事增添了特殊的维度。两人都来自土耳其,Burkay在2007年来到美国读大学,那时候Facebook刚刚推出。他在采访中坦承,作为移民面临的最大挑战不是学术上的适应,而是对美国就业市场和职业发展路径的理解。
"在学业方面,我觉得比想象中容易一些,因为土耳其的高中教育体系在数学和科学方面相当不错。但最大的挑战是理解就业市场的运作方式,以及人们如何规划实习和职业发展。"Burkay回忆道。在美国,学生从一入学就开始为暑期实习做准备,并对整个职业道路有详细规划,而他对此完全不了解。这种信息不对称导致他在前几年的实习安排上走了不少弯路。
更具挑战性的是移民身份对职业选择的限制。Burkay曾在Oracle工作,并开始了绿卡申请流程。这是美国移民面临的典型困境:一旦开始绿卡流程,就可能被"锁定"在某个工作岗位上,失去了职业灵活性。这种约束让很多有创业梦想的移民不得不推迟自己的计划。
转折点出现在2015年左右。深度学习开始兴起,Burkay对这个领域产生了浓厚兴趣。当时Coinbase还是一个只有40-50人的小公司,他的朋友邀请他加入新组建的机器学习团队。虽然这个机会让他非常兴奋,但更重要的是,他开始认真考虑创业的可能性。
对于Gorkem来说,加入fal的决定更加戏剧性。当时他在波兰上大学,但在第三周就选择了退学,准备回土耳其继续从事开发者工具方面的工作。正是在这个时候,Burkay通过Twitter联系了他。Gorkem回忆说:"看到Burkay,看到你们团队,看到产品周围的兴奋感,我觉得产品的牵引力刚开始显现,看到我能为团队带来的价值,我确信这些是我见过的最好的人,从氛围来说,我想和他们一起工作十年。"
这种移民创业者的经历给了他们一些独特的优势。首先是对全球市场的天然敏感性,他们不会局限于单一地区的思维模式。其次是对技术基础设施的深度理解,这来自于他们必须在资源有限的情况下解决复杂问题的经验。最后是对长期承诺的重视,因为他们知道在异国他乡建立事业需要更多的坚持和专注。
2023年是AI基础设施竞争最激烈的一年。ChatGPT的成功引发了大语言模型的淘金热,几乎所有的AI基础设施公司都在争夺LLM推理市场的份额。面对这种情况,fal面临一个关键决策:是追随大流进入LLM市场,还是坚持专注于图像和视频模型?
Burkay清楚地记得那个决定性的时刻。当时fal的收入有几个月保持平稳,团队内部出现了分歧。一个诱人的选择是同时支持LLM模型推理,这样可以立即获得更大的市场机会。但经过深思熟虑,他们决定继续专注于图像和视频领域。"专注于图像和视频将成为一个重要的差异化因素。我们已经在这类模型方面有了技术优势,因为我们一直在研究这类模型。"
这个决策的智慧在于,他们认识到专注可以带来更深层的竞争优势。如果他们选择成为一个通用的AI推理平台,就必须在各个方面都做到最好,这对于一个资源有限的初创公司来说几乎是不可能的。相反,通过专注于生成媒体这个垂直领域,他们可以建立真正的专业知识和技术护城河。
更重要的是,他们对这个市场的发展有着独特的洞察。正如Burkay所说:"两年半前,人们看到大语言模型和ChatGPT,他们基本上描绘了这项技术的发展方向,并立即说我们正在走向AGI。我们对图像模型有类似的感觉。"他们相信随着模型性能的提升,图像和视频生成的质量、分辨率和可控性都会大幅改善,最终这个市场会变得和LLM市场一样大。
这种专注策略的另一个好处是能够与客户建立更深层的关系。在早期,fal的所有客户都在做非常相似的事情,这让他们能够深入理解用户的具体需求和痛点。他们可以针对特定的使用场景进行优化,比如产品摄影、虚拟试穿、logo生成等,而不是试图解决所有可能的AI应用问题。
市场最终证明了他们判断的正确性。2024年2月,OpenAI发布了Sora视频生成模型的预告,震撼了整个科技界。fal团队感到他们的预测得到了验证。Burkay说:"我们感到非常兴奋,有人证明了我们是对的,我们更加倍加注我们的信息传递。"从那时起,视频生成模型如雨后春笋般涌现,包括Luma、Runway、Kling、Minimax等,竞争变得异常激烈。但正是因为fal早期的专注和技术积累,他们能够快速适应这波新的模型浪潮。
很多人认为fal的核心竞争力只是让AI模型跑得更快,但实际情况远比这复杂。他们构建的是一个完整的技术体系,涵盖了从基础设施到应用层的各个环节。
首先是他们的多云分布式架构。从创业初期只有8个GPU的时候,他们就意识到作为一个种子期初创公司,不可能从大型云服务提供商那里获得足够的GPU资源分配。于是他们决定构建一个多云系统,自己管理编排层。他们尝试过Kubernetes等现有解决方案,但发现这些工具对于冷启动来说太慢了。
"当我们尝试进行多云Kubernetes部署时,我们看到启动单个容器需要5秒的延迟。5秒对于Web工作负载可能是可以接受的,但对于我们的情况来说不行,5秒的GPU时间非常宝贵。"Gorkem解释道。于是他们开始构建自己的编排系统来实现多云部署。
更关键的是他们的分布式文件系统。当你需要在多个云环境中运行时,数据访问就成为一个巨大的挑战。为了提供和单云环境相同的开发体验,他们构建了自己的分布式文件系统和多层缓存策略。这个系统可以在数据中心层面、节点层面,甚至节点内存层面进行缓存,因为现在的GPU节点通常配备2TB的RAM。
这种分布式缓存系统带来的性能提升是巨大的。如果在同一个数据中心加载相同的模型权重,系统可以从通过100Gbps连接的对等节点读取数据;如果在同一个节点上使用,则可以从NVMe存储直接读取。相比于每次都从Google Cloud Storage或S3获取模型权重,这种方法节省了大量时间。
在AI模型层面,fal的应用机器学习工程团队是他们的另一个秘密武器。这个团队有10-11个人,占整个工程团队的一半以上。他们的工作不仅仅是把模型部署到生产环境,更是成为客户的技术专家,回答各种问题,并针对特定用例进行优化。
但是,Burkay也很现实地看待技术护城河的可持续性:"如果我拿一年前的推理引擎和现在的开源方案相比,它已经落后了,因为开源正在追赶。我不认为推理工程的速度优化是一种持久的护城河。它需要的是持续专注和保持领先一步。"这种认知让他们一直保持警惕,不断投入研发,确保始终处于技术前沿。
这也解释了为什么他们非常重视开源社区的发展。当开源方案有好的想法时,他们会立即采用并在此基础上构建自己的技术栈。这不是简单的抄袭,而是一种持续学习和改进的策略,确保自己始终能够提供最佳的性能和用户体验。
很多人以为AI图像生成就是输入一个提示词,然后输出一张图片,但实际的商业应用远比这复杂。fal的团队很早就发现,真正的客户需求往往涉及复杂的多步骤工作流。
"人们使用图像和视频模型更多是作为链式工作流,你处理图像、去除背景、提高分辨率、添加一些调色板,然后将其转换为可能更加精制的图像甚至视频。"Gorkem解释道。这是一个相当复杂且定制化的工作流,不仅需要推理引擎本身,还需要在此基础上构建工作流系统。
这种工作流的复杂性主要源于早期AI模型的局限性。与大语言模型可以通过零样本或少样本学习泛化到各种任务不同,早期的图像模型质量无法支持一次性生成满足要求的内容。编辑、放大、去背景等功能没有很好的泛化能力,它们通常只是文本到图像的模型。
ComfyUI等工具的出现让这种链式工作流变得可能。人们开始发现可以将多个模型连接起来,比如先用文本到图像模型生成基础图片,然后用同样的模型进行图像到图像的优化,改变图像内容或提高分辨率。这些工作流在消费者端运行良好,但作为API来规模化运行时就面临各种挑战。
fal团队意识到这个趋势的重要性,开始构建自己的工作流产品。"我们看到这些多种不同模型被链接在一起,或者同一个模型以不同方式使用,人们期望输入一个提示词然后得到适合他们用例的结果。"这种能力让即使是性能较弱的模型也能产生有创意的用例,这对整个生态系统都是有益的。
另一个重要的观察是微调(fine-tuning)在图像领域的广泛应用。Burkay估计,图像领域的微调数量可能比语言模型领域多1000倍。这是因为对于早期的图像模型来说,微调是提供上下文信息的唯一方式。虽然现在已经有了更好的上下文模型,但人们仍然会针对特定任务进行微调,比如虚拟试穿或角色一致性,以获得最高的一致性。
这种复杂性也成为了fal的竞争优势。他们不仅提供单个模型的推理服务,还提供完整的工作流解决方案,包括预配置的工具和端到端的配置。客户可以在几天内就部署一个完全功能的生成媒体体验,而不需要花费数月时间来构建基础设施。
fal的早期团队几乎全部由工程师组成,这在AI基础设施公司中并不罕见。但让他们与众不同的是,这些工程师都对商业成功有着强烈的执念。Burkay回忆道:"直到我们大约28个人时,我们都是工程师,第28个员工才是第一个非工程师。"
这种工程师主导的文化带来了一些独特的优势。首先是对技术问题的深度理解和解决能力,这让他们能够快速响应客户的技术需求。其次是对产品质量的极致追求,他们不会满足于"差不多能用"的解决方案。但最重要的是,他们对商业成功有着清晰的认知。
"在fal的文化中,我们是结果导向的,我们真正以收入为导向。这基本上意味着我们必须在市场推广方面和工程方面一样出色。"Burkay说道。这种认知让他们很早就开始投入销售和客户成功工作,而不是等到产品完全成熟后再考虑商业化。
他们对销售工作的态度转变也很有趣。作为技术背景的创始人,他们最初对销售工作有典型的工程师偏见。但是在接受了专业的销售指导后,他们很快就看到了效果,并且深深地投入其中。"我们对此非常着迷,以至于无法放手,我们做了很长时间的创始人主导销售。"
更重要的是,他们将这种以客户为中心的理念融入到了整个公司文化中。他们可能是Slack Connect使用最多的公司之一,与几乎所有客户都建立了Slack连接。这些渠道是开放的,工程师直接参与客户沟通,每个渠道平均有三四个来自应用机器学习团队、产品团队的不同工程师。
"我们不希望有人向我们销售东西。我们希望人们为我们服务,帮助我们,与我们一起成长,与我们合作。这就是我们一直在招聘的人员类型。"这种理念让他们在招聘销售人员时也会选择那些真正愿意倾听客户、为客户服务而不是单纯销售产品的人。
这种文化的成效是显著的。他们不仅在技术上保持领先,在商业上也取得了巨大成功。从客户反馈来看,很多企业选择fal不仅仅是因为技术优势,更是因为他们提供的整体服务体验。客户知道fal的团队会真正理解他们的需求,并且会持续优化以满足这些需求。
当我深入了解fal的发展轨迹时,最让我印象深刻的是他们对市场时机的精准判断。早在2024年初,他们就预测2025年将是"AI视频年",现在看来这个预测正在成为现实。
"ChatGPT的视频时刻,我认为我们还没有达到。我认为有很多迹象表明我们正在接近它。比如你看过V3,它已经接近ChatGPT时刻了。这是一个非常有能力的模型,但我认为我们还没有到那里。"Burkay在采访中说道。但有趣的是,他同时也指出:"如果你现在去看你的Instagram、TikTok信息流,三分之一的视频都是AI生成的,对吧?它已经在某种程度上发生了,只是以一种稍微慢动作的方式进行。"
这种观察反映了AI视频发展的一个重要特点:它不是突然爆发的,而是在逐渐渗透到各个应用场景中。与ChatGPT那种瞬间刷屏的病毒式传播不同,AI视频的采用更多是润物细无声的。人们在社交媒体上看到越来越多高质量的AI生成内容,但往往意识不到这些内容的AI属性。
视频模型市场的竞争格局也验证了fal的判断。当Sora首次发布时,即使是fal团队内部也有人担心OpenAI会一家独大。但随后Luma、Runway、Kling、Minimax等公司相继发布了自己的视频模型,形成了激烈的竞争局面。"每次发布,如果你不是最好的,通常就不会发布。"这种竞争加速了整个行业的发展。
更有趣的是,这种竞争的节奏已经达到了周为单位。"你永远不能说这就是那个模型,然后在一个月内都不会有任何竞争,对吧?甚至两周都不行。"这种快速迭代的环境对fal这样的基础设施提供商来说既是挑战也是机遇。他们需要快速适应新模型,但同时也因为模型的快速更新而获得了持续的增长动力。
fal团队对这种竞争环境有着独特的应对策略。他们与模型开发公司建立了深度合作关系,通常能在模型正式发布前就获得访问权限,这让他们能够提前进行优化和测试。"我们与这些公司合作,所以我们可以在发布前就开始试用,这样我们就能建议我们的客户。"
从商业角度看,这种快速变化的模型格局对fal是有利的。不同的模型在不同的任务上有各自的优势,比如Imagen 3和Imagen 4在角色一致性方面表现出色,而Flux则在生态系统工具方面有优势。这种多样化让客户需要一个能够提供多种模型选择的平台,而不是绑定在某一个特定模型上。
展望未来,fal看到的不仅仅是更好的模型,而是全新的用例。"我们对净新的用例最感兴趣,比如娱乐性的图像生成,人们只是为了好玩,现在变成视频,可能变成简短的可玩游戏等等。随着这些模型变得更强大,这些类型的事情将开始发生。"这种对未来应用场景的想象,正是驱动他们继续投入和创新的动力。
在AI创业公司普遍面临盈利挑战的背景下,fal的商业模式显得特别有趣。他们不仅实现了快速增长,还建立了可持续的盈利模式。这主要得益于他们对市场定位的精准把握和对客户需求的深度理解。
Burkay对AI市场的盈利特点有着清晰的认知:"我认为AI市场是令人难以置信的市场。生成媒体是那种可以立即货币化的东西。在以前的互联网业务版本中,人们等待数年才能将业务货币化。首先建立用户基础,然后可能尝试通过订阅或广告来货币化。但是使用AI,人们愿意立即为此付费。"
这种即付费的特性让fal可以从第一天就验证产品的市场价值。"你构建的MVP应该足够好,让人们开始付费。很容易获得信号,收入数字是否在增长。货币化应该从第零天就成为优先事项,实际上对于创始人来说,通过他们从第一天开始赚取的收入来判断这是一个好想法还是好产品是更容易的。"
fal的收入增长轨迹确实验证了这一点。他们现在的年化运营收入达到9000万美元,在过去两个月中增长了50%以上,在过去12个月中增长了60倍。这种增长不仅体现在数量上,更重要的是客户质量的提升。他们现在服务超过100万开发者和100多家企业客户,包括Quora、Canva、Perplexity、Shopify等知名公司。
他们的双边市场策略也很成功。一方面,他们为开发者和企业客户提供优质的AI模型推理服务;另一方面,他们为模型开发公司提供分发和优化服务。这种模式的成功部分源于他们在处理开源模型方面的优异表现。当一些神秘的新模型(比如早期的Kling)出现时,fal通常是第一个能够为市场提供访问服务的平台。
"我们实际上帮助将这些模型引入市场,这并不一定是有意为之的,只是我们从客户那里看到了巨大的需求。"这种能力让他们在模型开发者和使用者之间建立了独特的桥梁作用。模型开发者希望在fal上发布他们的模型,因为这里有最多的开发者和企业用户;而开发者选择fal,因为这里有最新最好的模型。
除了基础的API服务,fal还为一些模型公司提供基础设施优化和发布支持服务。他们帮助这些公司优化工作负载,为发布日做准备,并提供容量规划和负载均衡等服务。"我们管理着数万个GPU,在某些高峰时期,要做到这一点,我们实际上是在构建一个分布式超级计算机,从不同的供应商那里获取计算资源块,确保所有工作负载都能被编排、扩展和缩减,并能访问超快的分布式文件系统来加载模型权重。"
这种B2B2C的模式为fal带来了多重收入来源,也增强了他们在整个生态系统中的地位。当新的模型发布时,fal不仅仅是一个服务提供商,更是一个能够帮助模型快速获得市场采用的合作伙伴。这种定位让他们在竞争激烈的AI基础设施市场中建立了独特的竞争优势。
当Burkay被问到如果生成视频没有按预期发展会怎样时,他的回答很有意思:"我认为它不可能不起飞。它已经在这里了。它遍布我的信息流。我不知道你的Instagram信息流怎么样,但这些天我无法分辨哪些是真的,哪些不是。"这种自信来自于他们对市场趋势的深度观察和理解。
但更让我感兴趣的是他们对新兴用例的思考。fal团队由于他们的业务性质,拥有对整个生成媒体生态系统的"上帝视角",能够看到各种有趣的应用正在涌现。"我们对这些全新的用例最感兴趣,娱乐性的图像生成,人们只是为了好玩,现在变成了视频,可能会变成简短的可玩游戏或其他什么。随着这些模型变得更强大,这些类型的事情将开始发生。"
这种对"全新用例"的强调很重要。很多人在讨论AI应用时,往往局限于替代现有的工作流程,比如用AI生成图片替代传统的平面设计,或者用AI视频替代传统的视频制作。但真正的机会可能在于那些之前根本不存在的应用场景。
举个例子,实时生成的个性化广告。传统的广告制作需要大量的前期投入,一旦制作完成就很难修改。但通过AI生成技术,广告可以根据不同的受众、不同的时间、不同的上下文实时生成和调整。这不仅仅是效率的提升,而是广告行业商业模式的根本性改变。
Burkay提到了一个让他特别兴奋的应用:"猫咪奥运会"视频。这种完全虚构但极具娱乐性的内容,在传统制作流程下几乎是不可能实现的,但通过AI生成却变得轻而易举。这类内容的成功说明,AI生成媒体的价值不仅在于降低制作成本,更在于开启了全新的创意可能性。
从技术发展的角度看,fal团队认为我们仍然处于生成媒体的早期阶段。现在的模型在某些方面已经非常强大,比如在喜剧时机把握方面,V3模型表现出了令人惊讶的能力。但整体而言,这些模型的潜力还远未被充分开发。
随着模型能力的持续提升,fal看到的不仅仅是更好的单一模型,而是整个创作生态系统的重新构建。"我们希望成为所有这些基础设施的托管地,所有使用这项技术构建的开发者,我们希望他们通过fal来实现。"这种愿景体现了他们对成为整个生成媒体基础设施层的雄心。
从长远来看,fal的成功不仅仅是一个技术公司的成功,更代表了一种新的创业模式:在技术变革的早期阶段,通过专注于特定垂直领域,建立深度的技术优势和客户关系,然后随着市场的扩大而获得指数级的增长。这种模式对于其他AI基础设施创业公司有很大的借鉴意义。
fal的成功故事给我带来了很多思考,特别是对于那些正在或考虑在AI领域创业的人。他们的经验总结起来有几个关键要素。
首先是找到快速增长的细分市场的重要性。正如Burkay所说:"找到一个快速增长的细分市场是创业成功的关键。有很多细分市场始终保持细分,从不增长。但我们很幸运,我们运营的市场非常细分且很小,但也增长得非常快。"这个观察很重要,因为很多创业者会选择已经很大的市场,但竞争激烈;或者选择看起来有潜力但实际上不会增长的小市场。
其次是执行速度的极端重要性。fal团队对速度有着近乎偏执的追求,不仅体现在技术优化上,也体现在业务决策和产品迭代上。"我们在所有事情上都很快。我们通常会在第一天就发布模型。这个领域发展得如此之快,我们必须在让人们使用这些模型、让使用变得简单方面走在前面。"在快速变化的AI领域,速度往往比完美更重要。
第三是技术深度与商业敏感度的结合。很多技术创业者要么过度专注于技术而忽视商业,要么在商业压力下牺牲技术优势。fal团队展示了如何在保持技术领先的同时建立强大的商业能力。他们的工程师直接参与客户沟通,销售团队深度理解技术产品,这种融合创造了独特的竞争优势。
第四是对长期趋势的坚定信念。当大部分市场都在追逐LLM时,fal坚持专注于生成媒体;当视频生成还处于早期阶段时,他们就预测2025年将是AI视频年。这种对长期趋势的判断和坚持,需要的不仅是技术洞察力,更是承受短期不确定性的勇气。
从更广阔的角度看,fal的故事也反映了当前AI创业生态的一些重要特征。基础设施层的创业机会巨大,但需要深厚的技术积累和对市场趋势的准确判断。成功的AI基础设施公司不仅要有技术优势,更要能够与应用层的创新者建立深度的合作关系。
对于那些考虑在AI领域创业的人来说,fal的经验提供了一个重要的启示:不要试图做所有事情,而是要找到一个有巨大潜力的垂直领域,然后在这个领域做到极致。这种专注不是局限,而是为了在合适的时机获得最大的影响力。
最终,fal的成功证明了在技术快速变革的时代,那些能够结合深度技术能力、敏锐市场洞察和快速执行能力的团队,有机会在短时间内建立巨大的商业价值。他们的故事不仅是一个创业成功案例,更是对整个AI基础设施行业发展方向的一个重要指引。从8个GPU开始,到现在管理数万个GPU为全球客户服务,fal用三年时间证明了专注、速度和客户导向在AI时代的巨大力量。
一家处于 stealth 状态的 AI 初创公司,已获得头部一线美元基金的种子轮投资,正在招募founding team成员,以下是岗位JD,感兴趣的朋友欢迎扫码投递简历。其中海外运营增长的岗位,只有两个要求:聪明和英语好,我会手把手教。
文章来自于微信公众号“深思圈”,作者是“Leo”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0