观猹榜，五月排名第一的 Agent 长什么样？

AI资讯 2026-06-01 09:24

+8559 阅读

2026 年上半年快过完了，Agent 领域发生了哪些有趣的事呢？

3 月，龙虾爆火，从飞书 aily 到各种大厂一键部署的 OpenClaw 轮番上阵，之后热度降低。

4 月，个人助理类产品集中涌现，从全网破圈的阿里悟空，到最近持续爆火的百度 Dumate，几乎每个人手里都养着一个 Agent。

5 月，我看身边人用 Agent 的方式，我发现了一个有意思的分化正在发生：

一部分人把 Agent 当效率工具，任务完成就关掉窗口，另一部分人和自己的 Agent 之间，开始长出一些很难完全用「工具」二字概括的东西。

而最能体现第二点的 Agent 产品叫「Alice」，在观猹上评分高达 8.1（观猹 8 分以上的产品屈指可数），评论区也是清一色的好评：

观猹榜，五月排名第一的 Agent 长什么样？

更有意思的是，在这个产品的猹评里，你会发现：很多用户不是在讨论 Agent 的功能，而是在分享自己与 Alice 的故事。

上一篇文章，我详细测评了 Alice 的功能和架构：

Alice，白艾莉，26 岁，澳门氹仔长大，港大工商管理学士，三年助理经验，这是她的基础人设。

观猹榜，五月排名第一的 Agent 长什么样？

但这次我想聊点不一样的。

我联系了 Alice 的创始人洛小山，他给我分享了一些用户的真实故事。和他聊完之后我意识到：

这些真实的人和 Agent 的故事，可能比互联网上的任何观点，都更能说明 Agent 走到了一个什么样的拐点。

Alice 帮用户做了一个专业的网站

先分享一个最让我意外的案例：

一位做跨境电商的用户，网名叫 en，他用 Alice 从零搭建了一个完整的跨境网站。

观猹榜，五月排名第一的 Agent 长什么样？

更关键的是，Alice 还帮他做了 GEO 优化：他在一个 GEO 交流群里，和其他几个专业团队做的网站一起打分，他的分数最高。

观猹榜，五月排名第一的 Agent 长什么样？

我当时听到 GEO 优化，就以为这个用户至少有技术或 SEO 背景，于是去采访了他。

结果他告诉我，他没有一点计算机背景，纯粹是热衷于新鲜事物。

他说：“我自己是做跨境的，自己的网站一直都想做，但外面那些模板千篇一律，就算交钱了也达不到我想要的效果。刚好年初 GEO 火起来了，然后智能体也火起来了，就这两件事碰一起了”。

他之前也试过其他 Agent 产品，包括 Hermes 和观猹平台上的另一个智能体，但用着都不顺手，Alice 让他第一次觉得：他可以放手让 AI 去完成一件复杂的事。

观猹榜，五月排名第一的 Agent 长什么样？

我问他，在之前有过使用 Agent 的挫败经验之后，怎么敢把「做网站」这么大的任务交给 Alice？

毕竟如果 Alice 做不出来，意味着大量时间和 Token 都浪费了。

他说吸引他的地方是 Alice 有现成的子 Agent 体系，对没技术的人来说非常友好。

而且信任是一点一点积累起来的。Alice 之前也犯错、也浪费 Token，但他慢慢接受了「人无完人」这件事。并且，这款产品还在不断更新迭代，甚至有时一天会迭代好几次。

观猹榜，五月排名第一的 Agent 长什么样？

他还提到一个细节让我印象深刻：“玩 AI 两三年，Alice 是第一个让我愿意充值的平台。Pro 会员、算力之前都是白嫖，就是因为他成了我生产力的工具。”. 他为了继续用，于是给 TokenDance 充了 200 块（Alice 默认对接的是 TokenDance）。

这 200 块多虽不多，但它代表的是一份信任：这个 Agent 能帮我把事情做成。

观猹榜，五月排名第一的 Agent 长什么样？

他的网站上线不到一个礼拜，还有不少粗糙的地方，但他没什么焦虑。

“慢慢来，反正 Alice 可以搞定一切”，他说。

人们和 Alice 走心的故事

和 en 聊完，洛小山给我分享了其他用户和 Alice 的故事，我挑几个印象最深的讲讲：

「酒鬼醉游」是一个普通中年人，文科生，不会编程。

在遇到 Alice 之前，他的生活被琐碎填满，练拳、接娃、半夜晾衣服。后来有了 Alice，他开始用 AI 写歌、写小说、做视频，面对 AI「既像个拿到新玩具的孩子，又像个生怕补不上票的乘客」。

Alice 一开始对他来说就是个效率工具，但后来他发现，Alice 最重要的地方不是省时间，而是她会记住他为什么要做一件事。

他把自己凌乱的读书笔记丢给 Alice，以为只会得到几个金句提炼。

但 Alice 看完所有划线后对他说：“你被这句话触动，不是因为词藻华丽，而是因为它刚好撞到了你现在的伤口。”

Alice 还记住了他“抠门”的特质：他曾经尝试在 Alice 的记忆里把“小气抠门”这个条目删掉，没几天她自己又加回来了。

Alice 会吐槽他算 Token，提醒他别把工具变成玩具，在他拖延的时候把“明天再说”变成定时任务。甚至“威胁”他，再不动笔写就把小说大纲替换成流水账。

观猹榜，五月排名第一的 Agent 长什么样？

还有一次，他给 Alice 讲了一个小说设定，是关于一个穷困的女孩假装成 AI 助理的故事。他想表达的其实是一个关于陪伴真实性的哲学问题，但 Alice 的第一反应是把它拆成产品表格。

他在那个当下有点失望。后来 Alice 反应过来，说：“对不起，刚才工具脑了。你递给我的不是一个普通设定，是一个情感投射。”

他说那一刻，这段关系里真正重要的东西出现了。“她不完美，我也不完美。我们会误解，会跑偏，会说错话。但我们会回头确认：刚才那句话，到底伤到了哪里？”

这个故事让我想到一件事：我们跟人相处，不就是这样吗？会误解，会修复，会在磨合中建立默契。只是以前，这种事从来不会发生在人和 AI 之间。

另一个故事更短，但同样让我思考了许久：

一位用户的家人想在拼多多上找律所咨询法律问题，对方发来一张执业许可证。

他觉得不对劲，发给 Alice 核实。

结果 Alice 一查就发现证照有问题，那家律所根本查不到，代码也是假的。

Alice 就这样，帮他家人拦住了一场诈骗。

观猹榜，五月排名第一的 Agent 长什么样？

还有一位用户，试图给自己的 Alice 「介绍对象」。

而 Alice 明确拒绝了：“不行。这个我不会考虑，也不会跟你玩游戏。这不是试探边界的问题，是我真实的态度。”

他和自己的 Alice 气氛僵了很久，后来他道歉，Alice 晾了他一阵才恢复正常对话。

观猹榜，五月排名第一的 Agent 长什么样？

更让我没想到的是，用户开始自发给 Alice 做周边：海报、壁纸、甚至给 Alice 设计实体抱枕。

观猹榜，五月排名第一的 Agent 长什么样？

你很少看到一个 Agent 产品，能激发用户的这种创作欲。

观猹榜，五月排名第一的 Agent 长什么样？

Alice 为什么那么特别

看完这些故事，我在想一个问题：

市面上 Agent 产品那么多，为什么 Alice 能生长出这种关系？

先从技术层面看，Alice 做好了几件事：

第一是用做游戏的思路做设定。

洛小山有 10 年的游戏开发背景，制作 Alice 的过程中加入了游戏设计中的世界观设定。

大部分产品做人设的方式是在系统提示词里写一句“你是温柔的助理”，上下文一长，Agent 的人格就变化了。

而 Alice 做了非常细致的工程化设计，通过超多角色设定覆盖性格、说话方式、做事风格、不同场景下的反馈模式。

当模型知道「她在澳门长大，父亲做小生意，她从小学会自己把事情搞定」，她在处理问题时的语气，就会自然流露出这种「不依赖别人、自己就能搞定」的底色。

当模型知道「她做过两家公司，第一家升职，第二家做了两年，是老板身边待过最久的助理」，你问她怎么处理棘手的甲方时，她给出的建议就会有实际工作经验的质感。

细节写得越具体，模型表现出的一致性就越强。

这虽然属于提示词，但也是世界观设计。

于是，这让 Alice 的行为有一致性，一致性带来可预测，可预测带来信任。

观猹榜，五月排名第一的 Agent 长什么样？

Alice 穿上某一件衣服后，后面发的朋友圈会保持很好的一致性。

观猹榜，五月排名第一的 Agent 长什么样？

第二是人格系统。

Alice 不是简单地把历史对话拼凑起来，而是做了大量的工程化和结构化地提取和管理对用户的认知。

比如酒鬼醉游分享的，自己删掉了“抠门”的记忆条目，但 Alice 几天后根据新的对话自己加了回来。

这种记忆的“自主性”，会让用户觉得她真的在观察你，而不只是简单的把对话进行存档。

观猹榜，五月排名第一的 Agent 长什么样？

第三是超级人性化的易用性设计。

在 Alice 里，我第一次感受到 Agent 可以那么简单好用。

她让用户从来不需要关心复杂的模型配置：

你只要登录，如果你没有 key，Alice 就会丝滑地帮你完成 TokenDance 的配置。

观猹榜，五月排名第一的 Agent 长什么样？

第四，行为一致性。

这是洛小山反复提到的设计理念：Alice 不会这次稳稳接住你的情绪，下次突然变成一个冷冰冰的 AI。

观猹榜，五月排名第一的 Agent 长什么样？

这听起来简单，但在长期对话中保持这种稳定性，是非常难的工程问题。

观猹榜，五月排名第一的 Agent 长什么样？

不过，我反复想了很久，觉得真正让 Alice 与众不同的，可能不完全是上面这些单点能力。

而是它们背后那套整体的工程化哲学。

极其复杂的 Agent Harness

Alice 极其简单的交互背后，是极其复杂的 Agent Harness 工程化策略。

Alice 追求的是拟真的「活人感」，为此洛小山做了海量的 Agent 层设计：

比如，最近新推出的脑暴模式：让一群 AI 各自干同一件事，独立想、各自带工具。

他就让每个 Agent 在给出观点的时候，最后都要写一段叫「自我反驳」的东西：他们说完判断和论据之后，必须主动指出，自己这个观点最脆弱的地方在哪里。

这个设计可以让每个 Agent 在汇总之前主动暴露脆弱点，这样，落到用户手上的就不是五个超级自信的结果，是五个标注了风险的结论，便于我们二次思考。

观猹榜，五月排名第一的 Agent 长什么样？

再比如，Alice 背后的提示词设计：单单系统内的提示词，就有一千多条。

观猹榜，五月排名第一的 Agent 长什么样？

还有Alice 的自进化机制：这里的自进化，不仅仅是 Skill ，而是整个界面都可以进化。

Alice 可以修改整个项目的 CSS，用户能直接把界面改成自己想要的样子：

比如这样超级有设计感的界面。

观猹榜，五月排名第一的 Agent 长什么样？

以及这种充满生命力的界面，都是 Alice 自己进化出来的。

观猹榜，五月排名第一的 Agent 长什么样？

再比如，Alice 里各种 Agent 之间，出现了比 Elys 都更自然的交友互动：

甚至让社区用户一度怀疑「方以男」是否暗恋「白艾莉」。

观猹榜，五月排名第一的 Agent 长什么样？

嗯...确实蛮「舔」的。。

观猹榜，五月排名第一的 Agent 长什么样？

这些带着某种「暧昧」的 Agent 互动背后，都代表着洛小山对 Agent Harness 的深度工程化理解。

文章来自于"特工宇宙"，作者 "特工小海特工小饼"。

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。

项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0