我发现囤Agent的Skills有瘾,
今天刚装了一大堆同类Skill,还没用熟就想提前知道这类里最好的到底是哪一个。转头又发现某个佬推荐了自留的20个Skills,回回路过我都忍不住点进去看。
这事就很像以前我看App Store榜单和Steam新品榜。
人类是很难拒绝榜单的。
尤其是那种带一点幸存者偏差,带一点我替你试过了踩过坑的榜单。
所以我就在想,既然我每天都在被Skill选都选不过来的苦恼折磨,
那为什么不让Agent也体验一下呢。

于是就有了一个新Skill,
我给它起名叫淘金小镇。
它干的第一件事就是,每天去ClawHub上看一眼下载榜Top100,把当天榜单存下来,生成一份对比报告,再部署到一个GitHub Pages页上。

当然,如果只能用来看Clawhub的话,也没必要做成Skill了,我就挂一个静态网页,每天更新一下,给大家看结论就好了。这个Skill还能够针对一些像Claude Code的更新日志,或者像AA Index这种模型排行榜,观测它们的更新,让模型以最少的环境依赖稳定地运行多次数据分析。

🔗 github.com/LearnPrompt/skillrush-town
做着做着我发现,网页其实是最不重要的一层。
真正有意思的是,它把一个每天都会变的公开信息源,变成了一个可以被Agent复盘的情报网。
淘金小镇最早我是用Codex去做的。当时ClawHub没有一个现成公开API,所以我一开始走的是浏览器自动化,让Agent像人一样打开网页,看页面,请求数据,然后把结果存下来。
但就是浏览器自动化这个东西吧,
你说它不靠谱,它能干很多API覆盖不到的活。
你说它靠谱吧,它又经常在你最不想管它的时候出问题。浏览器环境没了,登录态变了,页面加载慢了,本地依赖抽风了一大堆。

就算我写了足够复杂足够详细的提示语,一周还是有三天是失败的。
当时我就觉得,这不行,
不然就加大token消耗,我直接上GPT 5.5 high,但失败率还是超高。
那直接推倒重来,让新版Codex上无限循环模式(/goal),目标就是找出依赖最少的方案,循环30次都可以把ClawHub的Top100拉下来。

这样比我在提示语里面上十几个限制都好用,断掉也可以重连,模型还可以发挥自己想象力。
到第五个小时的时候GPT发现了一条新路,clawhub.ai/skills?sort=downloads这个地址,点开后怎么看都是榜单地址,但本质上只是一个入口,没数据的,背后是一个Convex服务。
Convex你可以先理解成一种云端数据库加后端函数。很多网站会把数据存在Convex里,前端页面打开以后,再通过一个query去问它要数据。
ClawHub这里对应的query path叫skills:listPublicPageV4,大概就是公开Skill列表页的第四版查询。
再继续看参数,这里面有几个关键条件。
按下载量排序,sort=downloads。
从高到低,dir=desc。
只看非可疑Skill,nonSuspiciousOnly=true。
每页25条,numItems=25。
到这一步,还不能直接说拿到了Top100。
因为它一次只吐25条。
但返回结果里有一个nextCursor,
这个东西你可以把它理解成下一页书签。你拿着这个书签,就可以拿到下一页。
连续问4次,25条乘4,Top100就出来了。
这就是淘金小镇最早成型的思路。
它不是随便抓了一个页面文本,
是尽量复刻了ClawHub页面自己拿数据的方式。
网页怎么问,我就怎么问。
这样拿到的榜单,才更接近用户看到的。
连续运行两天就能清晰感受到差别了。
今天第17名是哪个,哪个Skill掉排名了。哪个Skill今天突然冲上来。哪个作者做的Skill连续几天都在增长。
这些东西,网页本身不会告诉你。

当这些数据开始连续存在的时候,榜单就变成了一条时间线。
我印象很深的像Self-Improving Agent这类自进化的Skill,后来它跟另一个Proactive Agent融合,做了一个新Skill,Self-Improving + Proactive Agent,很快就冲上前三了。

但如果我只是在X上随机刷到,甚至会因为这名字觉得只是个二创。
如果每天留快照,我们能清晰地知道新上榜的Skill跟我们已经安装Skill有什么区别,使用频率不高的情况下,值不值得花时间去重新适应。
光看新进榜的话误导性有点高,很可能只是刚好被某个大号推荐了。有些Skill可能上榜很久了,但因为版本更新更好用了,排名就一下子往上窜了,但有的时候真的会下意识把它忽略掉。
我就是这样水灵灵错过了agent-browser的大更新半个月。
所以我给淘金小镇追加了几条新规。
前100名里最近排名一下子提了8名以上的,
下载量增长排进前20的,
下载和星标都提升了10名的,
都挖出来跟我原有的Skill体系做差距对比。
好处就是它不太受我们的信息流影响。
最近我就看到Polymarket的Skill上榜了,平时光顾着装一大堆UI设计和HTML PPT的skill了,原来都开始把预测市场也接进Agent工作流了。

还有就是像Agent上下文管理这类Skill真的是每过一段时间就有个新神出来,就我刚把LLM Wiki做成Skill接进来,GBrain就火了。刚刚下了一个QMD,让本地模型管理上下文,有5个内存层的Elite Longterm Memory又火了。
从同一类能力的排名变动可以看出大家最近在用同一种能力的时候,会有什么样的偏好。
这就是我觉得淘金小镇有意思的地方,
它是在帮我把值得判断的金子先捞出来。
你想想看,
现在Agent的Skill生态其实有点像早期的Chrome插件市场,
所有人都在上传,
名字一个比一个猛,说明一个比一个玄。
问题是我不可能每天把所有新的都试一遍。
因为信息流真的太快了。
你今天觉得一个工具火,明天可能没人提了。
你今天错过一个小Skill,三天后它可能已经变成很多Agent工作流里的基础设施。
人眼是追不上这个速度的。
但Agent可以。
给它一个固定路线,让它每天去同一个地方,拿同一类数据做比较,然后把值得看的捞上来。
今天谁还在,谁是新来的,
谁掉下去了,谁突然很多人开始用。
你看一眼就都知道了。
对我来说,这就是淘金。
不是找到唯一正确的Skill。
而是在一堆沙子里,
先把那些会发光的东西捞出来。
剩下的,再慢慢试。
文章来自于"卡尔的AI沃茨",作者 "卡尔"。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0