Fellou: 世界首个 Agentic Browser —— 超越浏览,直达行动 Beyond Browsing, Into Action
每天,全球 30 亿用户被困在“点击-切换-填写”的循环中,平均需操作 40 个网站、26 个标签页、20 张表单——这不是科幻小说中的反乌托邦,而是 2025 年人类与浏览器关系的真实写照。当 AI 已在内容生成、数据分析等领域大放异彩,作为数字世界核心入口的浏览器,却仍在沿用 1990 年代的操作逻辑。工具本应解放人类,却让用户沦为“数字劳工”。
Fellou 的破局点:
“浏览器不应只是信息的搬运工,而应成为信息世界的行动者。”
——Fellou 创始人谢扬
我们正站在数字文明的奇点上——AI 重塑了生产力版图,而人类却被囚禁在布满锈迹的浏览器牢笼中。当 GPT-4 在十秒内写完企划案,我们却仍在二十个标签页间疲于奔命;当自动驾驶改写交通规则,我们还在手工填写第 20 张电子表格。这不是技术进步,这是数字时代最荒诞的黑色幽默!
是时候发动一场「生产力革命」了!
想象这样的存在:当你轻语「预定巴厘岛蜜月」,它瞬间化身成最懂你的数字管家——自动比价 30 家航司,筛选符合假期的最优路线,同步预约网红餐厅,甚至根据你妻子的社交动态推荐惊喜景点。这不是科幻,而是新世代浏览器应有的基准操作!
这将是人类史上首个真正「活过来」的工具:它能读懂你深夜加班时嘶哑声线里的疲惫,自动把明早的会议纪要生成待办事项;它能感知到你整理报表时逐渐急促的呼吸节奏,主动弹出动态图表生成器。那些曾经吞噬我们生命的重复劳动,将在 AI 代理人的利刃下灰飞烟灭。
我们不是在优化浏览器,而是在缔造数字世界的「自主神经系统」——当表单自动填充只是最底层的本能反应,当跨平台工作流可以像呼吸般自然流转,人类终于能挣脱「工具的工具」的诅咒。从此,每个创造者都将获得「时间倍速」的超能力,每个灵感迸发的瞬间都不再被机械操作打断。
这场革命将重新定义「人机关系」的宪法:不再是人类跪着适应工具的逻辑,而是工具跪着理解人类的意图。当浏览器学会说「剩下的交给我吧」,我们终于能站在科技金字塔的顶端,以真正的主宰者姿态,把生命投入到唯有人类才能完成的伟大创造中去。
此刻,就是浏览器重生之时——不是升级,而是进化;不是迭代,而是革命。
传统浏览器受限于单向的「人类指令-机器执行」模式,如同需要精密操控的蒸汽机车——用户必须明确每个操作步骤,耗费大量精力在流程性事务而非创造性思考。Agentic Browser(行动型浏览器)是一种基于智能代理架构的新型浏览器范式,通过整合意图理解、任务规划与自动化执行能力,将用户高层目标直接转化为端到端的数字化行动链路,实现从"被动响应指令"到"主动闭环交付"的认知跃迁。
它通过 Browser(浏览器)、Agent(智能体)、Workflow Automation(工作流自动化)的三元融合,构建了一个能自主感知、决策与行动的认知协作系统。
1.Browser:数字世界的全息触手
突破传统网页容器的限制,既承载标准化的网页渲染能力,更深度整合对操作系统、文件系统及本地应用的直接控制权,成为连接数字生态的「超级终端」。
2.Agent:任务导向的认知引擎
基于 LLM 与动态决策算法,将用户模糊的意图(如「筹备跨境营销方案」)拆解为可执行的原子任务(市场调研、竞品分析、预算规划),并实时评估资源与路径的最优解。
3.Workflow Automation:跨域操作的执行中枢
通过 API、插件与脚本的模块化封装,无缝调用跨平台服务(如电商支付、SaaS 工具、云存储),并兼容 A2A(应用间自动化)、MCP(多智能体协作协议)等下一代协议,实现复杂操作的「一键原子化重组」。
这种全新架构使得 Fellou 从传统的信息展示工具转变为真正「帮你工作」的智能生产力平台,完全解放用户双手,让复杂任务在毫无干预下自动完成,实现从意图到结果的一站式交付。
在计算机科学史上,Alan Kay 曾断言:「The best way to predict the future is to invent it」。当我们审视浏览器这一数字文明的基石性工具时,我们发现人类在浏览器上的创新,在不断创造人机交互的新历史。
演进轨迹正暗合着人机协作范式的三次跃迁:从命令行时代的「工具执行者」,到图形界面时代的「信息展示者」,再到移动互联网时代的「服务聚合者」。而今,Fellou 作为 Agentic Browser 的范式突破,通过将 Browser(浏览器)、Agent(智能代理)与 Workflow Automation(流程自动化)整合为三位一体的认知操作系统,标志着第四次范式革命——「有认知力的行动者」的觉醒。
这种三位一体的架构使浏览器从被动工具进化为一个有认知力的行动者:Browser 层保障广泛而实时的信息触点,Agent 层负责意图理解与策略生成,Workflow Automation 层实现跨平台操作的原子化执行。用户仅需保持战略决策者的角色,将 90% 的操作性认知负荷(如比价计算、表单填写、多步骤跳转)转移给系统,真正实现了「意图输入-价值输出」的认知短路。正如蒸汽机驱动流水线重塑生产范式,Fellou 正在重新定义数字时代的人机协作疆界。
过去,浏览器主要分为三种类型:
1.传统浏览器(Traditional Browsers)
核心能力:以网页渲染和信息浏览为主,代表当前浏览器的基本形态。
典型产品:Chrome、Firefox、Safari 等。
2.对话式浏览器(Conversational Browsers)
核心能力:通过 AI 增强交互,支持自然语言问答、内容摘要和辅助生成,但仍需用户主导操作。
典型产品:Microsoft Edge(Copilot)、Opera One + Aria、360 AI 浏览器、豆包及部分 Arc 版本。
3.搜索优化型 AI 浏览器(Search-Optimized AI Browsers)
核心能力:聚焦深度信息检索,利用 AI 整合网页内容,提供精准答案,但仅限于信息查询,不涉及任务执行。
典型产品:Perplexity Comet、新夸克等。
而 Fellou 开创了第四种浏览器范式——Agentic Browser(行动型浏览器),其核心突破在于:
简而言之,Agentic Browser 不仅是信息的窗口,更是能独立完成复杂任务的数字协作者。 用户只需提出目标,Fellou 就能自主执行多步骤流程——从信息检索、数据整合到操作执行,最终提供可落地的解决方案,真正实现“意图即结果”的高效工作方式。Fellou 是专为忙碌的上班族、知识工作者、创业者以及高效工作者打造,让你不再为重复性网络操作浪费宝贵时间。只需一句话指令,Fellou 就能将繁琐的在线任务自动化、调研的自动化 —— 无论是查找资料、提交申请、在线下单还是研究新领域,调研产品或者行业,都将变得轻松快捷,真正让你体验到人工智能时代的高效服务。
Fellou 主要由四大核心能力组成:
1.深度行动(Deep Action)
任务执行速度比最新的通用 Agent 产品 Manus 快 3 倍(平均耗时 3.7 分钟),支持跨私有站点(如 LinkedIn、企业内网)的深度操作,打破传统 AI 工具仅能处理公开数据的局限。
2.主动智能(Proactive Intelligence)
通过上下文记忆与语义理解,构建个人知识库,实现从“被动响应”到“超前预测”的跨越。
3.影子空间(Shadow Workspace)
创新点:在独立沙箱中并行执行任务,用户可随时通过时间轴回溯操作节点,如同拥有“数字分身”。
安全机制:采用零密码泄露设计,所有登录行为均通过本地设备认证完成。
4.智能体网络(Agent Store)
生态价值:开发者可用自然语言编程(Eko 框架)发布垂直领域 Agent,如“跨境电商选品助手”或“学术文献综述生成器”,形成“AI 应用商店”式生态。
传统浏览器的交互逻辑停留在「原子化操作」层面——用户需在多个标签页、平台间手动执行点击、复制、跳转、表单填写等机械动作,如同用算盘处理大数据时代的计算需求。Fellou 的 Deep Action 技术颠覆了这一范式:用户只需输入自然语言指令(如「收集新能源汽车赛道 Top10 公司近三年财报核心指标,生成对比分析报告」),系统即可通过以下机制实现端到端价值交付:
实际上,用户在浏览器上的行为可以大致分为两类:
而 Fellou 为两者提供了颠覆性解决方案:
人工浏览数十个网页筛选有效信息,耗时且易遗漏关键数据。多线程并行抓取目标网页群,通过 LLM 实时提取结构化信息(如竞品价格趋势、技术专利关键词),自动生成带溯源标注的知识图谱。
跨平台操作需要严格遵循预设步骤,容错率低且无法应对动态变化(如网站改版)。基于自主研发的 Eko 智能体框架,可自主调整操作序列(如电商比价时自动切换失效商品链接)、可介入(验证码识别/二次认证时,请求人类介入),实现工作流的韧性执行。
Prompt:在小红书上找小米 SU7 的好评,报告用中文英文双语:
Preview: https://chat.fellou.ai/report/f01fcf27-09e1-45b2-ae87-8e4315f5bc63
Prompt:在 LinkedIn 找有 C++ 经验的浏览器工程师,需要给出工程师的介绍,并附上工程师的 LinkedIn 的链接:
Preview: https://chat.fellou.ai/report/2e21f461-68ef-4e6a-abd1-37511319f841
Prompt: 调研全球“低代码/无代码平台”发展趋势,找出 Top10 代表性公司,分析它们的产品差异、典型客户案例和商业模式:
Preview: https://chat.fellou.ai/report/share/low-code-no-code-market-report-E7Fdx2ww
为验证生成的报告效果,Fellou 团队找了 50 个用户测评,分为五大维度(准确性、描述清晰性、思考深度和广度、可读性),和 Deep Research、Manus、Perplexity 做了打分比较,Fellou 综合评分为最高,其中可读性 > 表述清晰性 > 准确性 > 思考深度和广度:
同时,从执行速度层面来看,Fellou 也优于其他相似产品,在 49 个任务中,Fellou 的平均耗时仅为 3.7 分钟,相比较 Manus 的 18.6 分钟和 OpenAI DeepResearch 的 11.5 分钟皆有显著的速度优势:
Prompt:关注此文中的所有 Twitter 账号 https://mp.weixin.qq.com/s/Gjts6U3KgjVsW3fXYjHtcQ:
Prompt:打开亚马逊,搜索 NVIDIA RTX 4060 显卡,按可用性和客户评分进行筛选,然后将评分最高的型号添加到我的购物车:
Prompt: 根据 Fellou 官网内容,自动发布 Fellou 产品的推广内容到 Twitter:
Prompt: 请将 Product Hunt 网站上排名前 8 的产品名称和介绍编写到我已打开的 Notion 笔记页面中:
Fellou 的自动化 Workflow 依托于 Fellou 团队自研的浏览器使用框架 Eko,其以生产级可干预特性、更快的执行速度、更低的执行成本(_Fellou 单次任务的执行费用在 3 毛人民币到 3 元人民币_)显著优于同类产品:
更多用例可访问 fellou.ai/use-cases 查看。
相比起传统的对话式浏览器 (Conversational Browsers),Fellou核心优势包括:
Fellou 正在重新定义人机协作的边界——它不再是被动等待指令的机械工具,而是通过预见性服务设计。,为用户提出需求,由用户来原则。不同于传统产品只能被动响应用户指令,Fellou 利用先进的深度语义理解和上下文记忆技术,实时捕捉用户在各个网页上的操作轨迹,并不断积累用户的行为数据和操作习惯——从常访问的网站到重复执行的任务,都成为它记忆的一部分。这种“数字记忆”不仅仅是数据的堆叠,而是一种对用户工作模式和习惯的深刻洞察。通过实时捕获用户在网页端的交互轨迹(如高频访问的行业数据库、周期性填写的报表系统),结合 LLM 对操作语义的上下文解构(如从「连续打开 3 份竞品 PPT」推导出「筹备市场分析」的潜在意图),构建动态更新的用户认知画像。
正因为具备这样的能力,Fellou 能够超前识别用户潜在的任务需求:当它察觉到用户即将进行某项重复性操作,或发出一个隐晦的需求信号时,Fellou 会主动发出询问,提醒用户是否需要提前介入或直接接管任务。用户无需再花费精力详细描述需求,而能感受到 Fellou 似乎早已预知下一步,并用温暖而精准的方式将服务送到用户手边。
在搜索旅游攻略的时候主动推荐,一键打开相关网页
这种技术演进暗合了人机交互的「关怀性设计」哲学:当传统工具聚焦于「如何更快完成任务」时,Fellou 在解决「如何让用户更从容地思考」。就像优秀的助手既能预见需求,又懂得保持分寸感,Fellou 通过精准的时机判断与透明的控制权移交,让人工智能不再是冰冷的效率机器,而是兼具专业性与共情力的数字伙伴。
传统 AI 代理常面临「资源争夺困境」——要么因长时间占用本地算力干扰用户操作,要么因云端隔离丧失对本地上下文的感知力。Fellou 通过分层执行环境架构,在效率与体验之间实现精妙平衡:本地、本地虚拟化和云桌面的方式,用以处理不同的任务。
本地即时响应:用户对 Fellou 说「打开我的日历,新建一个周六早上 9 点的健身日历」,这种单步骤 20s 以内就可以执行完成的任务,可以放在本地执行,用户能容忍短暂的对用户电脑的抢占;
本地虚拟化影子空间:需访问本地数据且耗时较长的任务(如「整合过去一周邮件生成待办清单」)。这种既依赖本地上下文,又是长程的任务,适合放到本地的虚拟化环境中执行,这种环境即被称作「影子空间」,他可以做到在 Agent 执行任务时不干扰用户使用电脑,同时用户还可以看到 Agent 的执行进程并在适当时刻加以干预;
云桌面:无需本地上下文的长周期任务,如「在 Github 上找 Transformers 的 Issue 列表,分析其目前存在的 Bug」,则适合放在云桌面中运行,这样就能做到用户关掉电脑外出后还可以在手机上与 Fellou 交互。
并行执行的「影子空间」,有效提升了用户和 Agent 的协作体验
混合影子空间的架构的本质是动态资源路由策略——根据任务复杂度、上下文依赖性和用户场景(办公/移动),智能分配执行环境。当传统 AI 粗暴占用本地资源时,Fellou 如同一位体贴的管家:短暂任务「轻手轻脚」快速完成,复杂任务「移步专用房间」安静处理,需要离场时「云端代班」持续运转,始终让人工智能的服务存在感与用户体验舒适度达到黄金平衡。
Fellou 重构了人机协作的底层逻辑。正如创始人谢扬所言,人与智能的关系应当建立在相互选择、深度互动与彼此支持之上。Fellou 致力于打造一个自然且开放的平台,让每个用户都能将自身的经验和能力沉淀为一个独立的垂直 Agent,这些 Agent 不仅可以帮助自己,更能在社区中共享、相互学习,为他人提供智慧服务。
在这个平台上,每位用户不仅能发布自己独特的经验,打造个性化的对话智能体;同时,也可以将自己在执行某项任务过程中形成的操作序列封装为一个完整的工作流,供其他用户直接调用,实现真正意义上的行动智能体。这里,每一个 Agent 都是智慧与经验的结晶,是人类对自身能力的一种数字化沉淀和再造。
对于高代码开发者,Fellou 提供了 Eko Framework —— 一套通过自然语言设计和部署高效 Agentic Workflow 的开发框架,同时是开源框架 Browser-use 的生产级进阶版本。
这一智能体生态体系不仅打破了传统浏览器只是被动信息展示的局限,更将智能与人类的交互提升到了“共生”层面。Fellou 让每个人都能成为智能生态的一部分:你可以将自己的经验沉淀为 Agent,既为自身赋能,也为社区贡献智慧;你可以通过开放平台不断发现和学习他人的智能方案,共同推动整个生态的进化。正如人与人之间通过交流建立起彼此的信任和合作,Fellou 正在构建一个以“智能体”为媒介的全新数字生态,让技术与情感、经验与创新在这个平台上自由流动,携手赋能每一个用户。
生产级的智能体一个关键挑战在于:如何让智能体不仅依赖环境交互来持续优化行为,还能从结构化的失败反馈中获得改进。我们提出了一种混合反馈经验学习(Hybird Feedback Experience Learning)框架:当基于浏览器的智能体在执行任务过程中失败——无论是由于查询模糊、工具使用错误,还是规划错误——都会触发一个次级分析机制。在这一阶段,人类监督者或大型语言模型(LLM)将对失败的执行轨迹进行回顾性分析,从中提取出可操作的经验洞察,例如误解、次优决策点或被忽视的交互机会。
这些提炼出的经验随后被注入至结构化的经验库中,形成一个不断扩展的“失败感知型示范语料库”。当智能体未来再次遇到类似查询或情境时,基于检索的泛化机制使其能够主动调用此前的纠正策略,从而降低重复失败的概率,加速任务掌握过程。这一混合机制整合了检索增强生成(RAG)与人类参与监督的优势,使智能体的经验库不仅是自我生成的,更是经过反思性丰富的。它标志着迈向具备自我纠错能力的智能体的关键一步,这种能力建立在真实世界交互与元认知分析的双重基础之上。
Fellou 是由 Authing 身份云创始人谢扬创建的 Agent 产品,他在 2019 年创办了 Authing 身份云,为企业和开发者提供事件驱动的身份认证云服务。截止 2024 年,Authing 已服务 700+ 客户和数亿用户,平台拥有数万开发者,每月有千万级认证次数,获得过多家基金数千万美元投资。
同时值得注意的是,Authing 在美国最大的竞争对手 Okta 在 2024 年投资了一家名为 Browserbase 的云浏览器 Infra 公司,这也表明了浏览器相关技术和产品在全球的关注度之高。
据悉,Fellou 即将开源 Agentic Browser 的评估 Benchmark,以用户的实际生产场景和用户体验为中心,构建跨环境、跨应用、跨设备的 Agent 任务集,用以评估 Agentic Browser 提高用户在真实生产环境下生产力的表现。
目前,Fellou 已开启全球内测,提供 PC Mac(Apple 芯片和 Intel 芯片) 版供下载使用(fellou.ai/download),预计在今年下半年会开放 Windows 版和移动版。
文章来自于“夕小瑶科技说”,作者“Fellou”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0