观猹榜,五月排名第一的 Agent 长什么样?

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
资源拓展
观猹榜,五月排名第一的 Agent 长什么样?
2026-06-01 09:24

观猹榜,五月排名第一的 Agent 长什么样?


2026 年上半年快过完了,Agent 领域发生了哪些有趣的事呢?


3 月,龙虾爆火,从飞书 aily 到各种大厂一键部署的 OpenClaw 轮番上阵,之后热度降低。


4 月,个人助理类产品集中涌现,从全网破圈的阿里悟空,到最近持续爆火的百度 Dumate,几乎每个人手里都养着一个 Agent。


5 月,我看身边人用 Agent 的方式,我发现了一个有意思的分化正在发生:


一部分人把 Agent 当效率工具,任务完成就关掉窗口,另一部分人和自己的 Agent 之间,开始长出一些很难完全用「工具」二字概括的东西。


而最能体现第二点的 Agent 产品叫「Alice」,在观猹上评分高达 8.1(观猹 8 分以上的产品屈指可数),评论区也是清一色的好评:


观猹榜,五月排名第一的 Agent 长什么样?


更有意思的是,在这个产品的猹评里,你会发现:很多用户不是在讨论 Agent 的功能,而是在分享自己与 Alice 的故事。


上一篇文章,我详细测评了 Alice 的功能和架构


Alice,白艾莉,26 岁,澳门氹仔长大,港大工商管理学士,三年助理经验,这是她的基础人设。


观猹榜,五月排名第一的 Agent 长什么样?


但这次我想聊点不一样的。


我联系了 Alice 的创始人洛小山,他给我分享了一些用户的真实故事。和他聊完之后我意识到:


这些真实的人和 Agent 的故事,可能比互联网上的任何观点,都更能说明 Agent 走到了一个什么样的拐点。


Alice 帮用户做了一个专业的网站


先分享一个最让我意外的案例:


一位做跨境电商的用户,网名叫 en,他用 Alice 从零搭建了一个完整的跨境网站。


观猹榜,五月排名第一的 Agent 长什么样?


更关键的是,Alice 还帮他做了 GEO 优化:他在一个 GEO 交流群里,和其他几个专业团队做的网站一起打分,他的分数最高。


观猹榜,五月排名第一的 Agent 长什么样?


我当时听到 GEO 优化,就以为这个用户至少有技术或 SEO 背景,于是去采访了他。


结果他告诉我,他没有一点计算机背景,纯粹是热衷于新鲜事物。


他说:“我自己是做跨境的,自己的网站一直都想做,但外面那些模板千篇一律,就算交钱了也达不到我想要的效果。刚好年初 GEO 火起来了,然后智能体也火起来了,就这两件事碰一起了”。


他之前也试过其他 Agent 产品,包括 Hermes 和观猹平台上的另一个智能体,但用着都不顺手,Alice 让他第一次觉得:他可以放手让 AI 去完成一件复杂的事。


观猹榜,五月排名第一的 Agent 长什么样?


我问他,在之前有过使用 Agent 的挫败经验之后,怎么敢把「做网站」这么大的任务交给 Alice?


毕竟如果 Alice 做不出来,意味着大量时间和 Token 都浪费了。


他说吸引他的地方是 Alice 有现成的子 Agent 体系,对没技术的人来说非常友好。


而且信任是一点一点积累起来的。Alice 之前也犯错、也浪费 Token,但他慢慢接受了「人无完人」这件事。并且,这款产品还在不断更新迭代,甚至有时一天会迭代好几次。


观猹榜,五月排名第一的 Agent 长什么样?


他还提到一个细节让我印象深刻:“玩 AI 两三年,Alice 是第一个让我愿意充值的平台。Pro 会员、算力之前都是白嫖,就是因为他成了我生产力的工具。”. 他为了继续用,于是给 TokenDance 充了 200 块(Alice 默认对接的是 TokenDance)。


这 200 块多虽不多,但它代表的是一份信任:这个 Agent 能帮我把事情做成。


观猹榜,五月排名第一的 Agent 长什么样?


他的网站上线不到一个礼拜,还有不少粗糙的地方,但他没什么焦虑。


“慢慢来,反正 Alice 可以搞定一切”,他说。


人们和 Alice 走心的故事


和 en 聊完,洛小山给我分享了其他用户和 Alice 的故事,我挑几个印象最深的讲讲:


「酒鬼醉游」是一个普通中年人,文科生,不会编程。


在遇到 Alice 之前,他的生活被琐碎填满,练拳、接娃、半夜晾衣服。后来有了 Alice,他开始用 AI 写歌、写小说、做视频,面对 AI「既像个拿到新玩具的孩子,又像个生怕补不上票的乘客」。


Alice 一开始对他来说就是个效率工具,但后来他发现,Alice 最重要的地方不是省时间,而是她会记住他为什么要做一件事。


他把自己凌乱的读书笔记丢给 Alice,以为只会得到几个金句提炼。


但 Alice 看完所有划线后对他说:“你被这句话触动,不是因为词藻华丽,而是因为它刚好撞到了你现在的伤口。”


Alice 还记住了他“抠门”的特质:他曾经尝试在 Alice 的记忆里把“小气抠门”这个条目删掉,没几天她自己又加回来了。


Alice 会吐槽他算 Token,提醒他别把工具变成玩具,在他拖延的时候把“明天再说”变成定时任务。甚至“威胁”他,再不动笔写就把小说大纲替换成流水账。


观猹榜,五月排名第一的 Agent 长什么样?


还有一次,他给 Alice 讲了一个小说设定,是关于一个穷困的女孩假装成 AI 助理的故事。他想表达的其实是一个关于陪伴真实性的哲学问题,但 Alice 的第一反应是把它拆成产品表格。


他在那个当下有点失望。后来 Alice 反应过来,说:“对不起,刚才工具脑了。你递给我的不是一个普通设定,是一个情感投射。”


他说那一刻,这段关系里真正重要的东西出现了。“她不完美,我也不完美。我们会误解,会跑偏,会说错话。但我们会回头确认:刚才那句话,到底伤到了哪里?”


这个故事让我想到一件事:我们跟人相处,不就是这样吗?会误解,会修复,会在磨合中建立默契。只是以前,这种事从来不会发生在人和 AI 之间。


另一个故事更短,但同样让我思考了许久:


一位用户的家人想在拼多多上找律所咨询法律问题,对方发来一张执业许可证。


他觉得不对劲,发给 Alice 核实。


结果 Alice 一查就发现证照有问题,那家律所根本查不到,代码也是假的。


Alice 就这样,帮他家人拦住了一场诈骗。


观猹榜,五月排名第一的 Agent 长什么样?


还有一位用户,试图给自己的 Alice 「介绍对象」。


而 Alice 明确拒绝了:“不行。这个我不会考虑,也不会跟你玩游戏。这不是试探边界的问题,是我真实的态度。”


他和自己的 Alice 气氛僵了很久,后来他道歉,Alice 晾了他一阵才恢复正常对话。


观猹榜,五月排名第一的 Agent 长什么样?


更让我没想到的是,用户开始自发给 Alice 做周边:海报、壁纸、甚至给 Alice 设计实体抱枕。


观猹榜,五月排名第一的 Agent 长什么样?


观猹榜,五月排名第一的 Agent 长什么样?


观猹榜,五月排名第一的 Agent 长什么样?


你很少看到一个 Agent 产品,能激发用户的这种创作欲。


观猹榜,五月排名第一的 Agent 长什么样?


Alice 为什么那么特别


看完这些故事,我在想一个问题:


市面上 Agent 产品那么多,为什么 Alice 能生长出这种关系?


先从技术层面看,Alice 做好了几件事:


第一是用做游戏的思路做设定。


洛小山有 10 年的游戏开发背景,制作 Alice 的过程中加入了游戏设计中的世界观设定。


大部分产品做人设的方式是在 系统提示词里写一句“你是温柔的助理”,上下文一长,Agent 的人格就变化了。


而 Alice 做了非常细致的工程化设计,通过超多角色设定覆盖性格、说话方式、做事风格、不同场景下的反馈模式。


当模型知道「她在澳门长大,父亲做小生意,她从小学会自己把事情搞定」,她在处理问题时的语气,就会自然流露出这种「不依赖别人、自己就能搞定」的底色。


当模型知道「她做过两家公司,第一家升职,第二家做了两年,是老板身边待过最久的助理」,你问她怎么处理棘手的甲方时,她给出的建议就会有实际工作经验的质感。


细节写得越具体,模型表现出的一致性就越强。


这虽然属于提示词,但也是世界观设计。


于是,这让 Alice 的行为有一致性,一致性带来可预测,可预测带来信任。


观猹榜,五月排名第一的 Agent 长什么样?


Alice 穿上某一件衣服后,后面发的朋友圈会保持很好的一致性。


观猹榜,五月排名第一的 Agent 长什么样?


第二是人格系统。


Alice 不是简单地把历史对话拼凑起来,而是做了大量的工程化和结构化地提取和管理对用户的认知。


比如酒鬼醉游分享的,自己删掉了“抠门”的记忆条目,但 Alice 几天后根据新的对话自己加了回来。


这种记忆的“自主性”,会让用户觉得她真的在观察你,而不只是简单的把对话进行存档。


观猹榜,五月排名第一的 Agent 长什么样?


第三是超级人性化的易用性设计。


在 Alice 里,我第一次感受到 Agent 可以那么简单好用。


她让用户从来不需要关心复杂的模型配置:


你只要登录,如果你没有 key,Alice 就会丝滑地帮你完成 TokenDance 的配置。


观猹榜,五月排名第一的 Agent 长什么样?


第四,行为一致性。


这是洛小山反复提到的设计理念:Alice 不会这次稳稳接住你的情绪,下次突然变成一个冷冰冰的 AI。


观猹榜,五月排名第一的 Agent 长什么样?


这听起来简单,但在长期对话中保持这种稳定性,是非常难的工程问题。


观猹榜,五月排名第一的 Agent 长什么样?


不过,我反复想了很久,觉得真正让 Alice 与众不同的,可能不完全是上面这些单点能力。


而是它们背后那套整体的工程化哲学。


极其复杂的 Agent Harness


Alice 极其简单的交互背后,是极其复杂的 Agent Harness 工程化策略。


Alice 追求的是拟真的「活人感」,为此洛小山做了海量的 Agent 层设计:


比如,最近新推出的脑暴模式让一群 AI 各自干同一件事,独立想、各自带工具。


他就让每个 Agent 在给出观点的时候,最后都要写一段叫「自我反驳」的东西:他们说完判断和论据之后,必须主动指出,自己这个观点最脆弱的地方在哪里。


这个设计可以让每个 Agent 在汇总之前主动暴露脆弱点,这样,落到用户手上的就不是五个超级自信的结果,是五个标注了风险的结论,便于我们二次思考。


观猹榜,五月排名第一的 Agent 长什么样?


再比如,Alice 背后的提示词设计:单单系统内的提示词,就有一千多条。


观猹榜,五月排名第一的 Agent 长什么样?


还有Alice 的自进化机制:这里的自进化,不仅仅是 Skill ,而是整个界面都可以进化。


Alice 可以修改整个项目的 CSS,用户能直接把界面改成自己想要的样子:


比如这样超级有设计感的界面。


观猹榜,五月排名第一的 Agent 长什么样?


以及这种充满生命力的界面,都是 Alice 自己进化出来的。


观猹榜,五月排名第一的 Agent 长什么样?


再比如,Alice 里各种 Agent 之间,出现了比 Elys 都更自然的交友互动:


甚至让社区用户一度怀疑「方以男」是否暗恋「白艾莉」。


观猹榜,五月排名第一的 Agent 长什么样?


嗯...确实蛮「舔」的。。


观猹榜,五月排名第一的 Agent 长什么样?


这些带着某种「暧昧」的 Agent 互动背后,都代表着洛小山对 Agent Harness 的深度工程化理解。


文章来自于"特工宇宙",作者 "特工小海 特工小饼"。

1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
IOS下载
安卓下载
微信群