RPA+AI,才是真正能让你躺平的自动化真神。

搜索
AI-TNT
正文
资源拓展
RPA+AI,才是真正能让你躺平的自动化真神。
2025-05-08 11:48

想写关于RPA的话题很久了。


这次终于找到了一个机会,看到了一些转折点。


是因为昨天打开影刀RPA,想搓一个自动跑图的自动化RPA流程的时候,发现他们更新了一个新功能。


RPA+AI,才是真正能让你躺平的自动化真神。


魔法指令。


这个功能的作用非常简单,就是你现在可以通过AI,来用嘴搭建一套关于网页和数据的RPA流程了。


RPA+AI,才是真正能让你躺平的自动化真神。


这是我觉得,一个非常棒的转折点。


很多朋友可能不知道这意味着什么,也有可能完全不知道RPA是什么。


所以我觉得在给大家看这个魔法指令功能之前,还是先跟不太了解RPA的朋友,说一下他跟Agent的区别和意义。


坦率的讲,最近我听Agent已经听得耳朵旁有点起茧了,特别是MCP火了之后,突然感觉万物皆可Agent了。


听的我快有一点叛逆了。。。


当然,不是因为Agent不牛逼,我很喜欢Agent,Agent很牛逼,我也认为,必然是未来。


只不过当下的时间点,我觉得很多人都已经陷入了某种AI幻觉里,觉得在当下的时间里,在当前的模型能力下,一切都可以Agent,一切都该Agent,一切都是Agent牛逼。


但真的去做落地项目,做业务流程,做一些自动化任务的朋友都知道,你让Agent做着做着,就会从“卧槽牛逼哎,他自己看到错了自己去别的地方找哎”,变成“尼玛怎么又崩了?”、“怎么这一步又理解错了?”、“神经病吧。”


尤其是,越是复杂的流程,越是讲究高精度、不能出错、重复运行的业务,一旦Agent的推理链条超过十步,它有的时候就越来越像是在抽卡。


这个痛点,我在好几个访谈里都说过。


比如你现在做一个复杂、重复的操作流程,要Agent完成20个步骤,哪怕每一步成功率99%,那整体成功率是多少?


0.99的20次方,大概是82%。


听起来不低是吧?但是这个就代表着,每5次任务,就会有一次失败。


而且我给的是每一步99%的成功率,其实大家都知道,这个成功率很多时候是不可能的。


如果给到每一步90%的成功率呢。


RPA+AI,才是真正能让你躺平的自动化真神。


10次只能成功一次。


你告诉我,这玩意在真正需要重复、自动化、稳定运行的生产环境里,咋用嘛。


这个逻辑,在今天很多人聊Agent的时候,是不被认真讨论的。


大家都沉迷在AI帮我做了一件很酷的事的表演性场景里,但是却并不在乎,这个事能不能每天执行100次、1000次、10000次,连续跑3个月不出错。


我之所以这么说,是因为,我真的有一堆浪费时间的重复性任务,是要交给程序自动跑的,是不是AI其实我根本不在乎,我只希望,能稳定、能十年如一日、不出错的运行。


所以,在这种场景上,根本就不应该用什么Agent,而是上,RPA。


RPA,Robotic Process Automation。


RPA+AI,才是真正能让你躺平的自动化真神。


我不知道大家有没有玩过一些手游,我自己十年前玩碧蓝航线和阴阳师的时候,每天都在里面肝肝肝,我还记得玩阴阳师的时候我还在上大学,为了刷升一个六星茨木童子,每天一边看剧一边刷狗粮。


RPA+AI,才是真正能让你躺平的自动化真神。


狗粮就是要升级式神的素材,得到的途径很简单,就是刷副本。然后副本里面是可以开自动的,一把我记得可能几分钟,但是结算和重新开始,还是得手动点几下。


我刷了好几天,实在是烦炸了。


于是就装了一个类似于按键精灵的APP,具体名字我忘了,他的作用,就是记录我点了屏幕哪里,隔了多少时间后又点了什么,是按什么顺序点的。


从而实现,可以把我解放出来,完全自动化的刷狗粮。稳定、重复、日复一日的运行。


于是,在刷了将近一个月之后,我的式神质量突飞猛进,吊打身边一众朋友,甚至还能在我们那个区竞技场打到排行前十。。。


这个东西,我们一般称为脚本。


同时,也是RPA最最最最初级的用法。


真正的RPA,比这玩意高级多了,涉及到各种数据的处理和流转、规则的判断、自动化点击操作等等。


RPA+AI,才是真正能让你躺平的自动化真神。


过去大家一提RPA就觉得老、慢、土、企业服务感太强,觉得AI才是未来。


但现在你回头看,Agent像是带情绪的实习生,做事随机、有创意、有想法,但经常会搞砸一些细节。


而RPA,像是老成稳重的机器人工人,没啥脑子,但给个流程它就一遍遍照着跑,重复、稳定、精准、不多想。


国内我一直觉得最有代表性的RPA产品,就是影刀。


RPA+AI,才是真正能让你躺平的自动化真神。


网址在此:https://www.yingdao.com/


他们自己也总结了一个图,这个图我深表赞同。


RPA+AI,才是真正能让你躺平的自动化真神。


Agent非常酷,像Manus、DeepResearch等等,几乎都是我最常用的产品,特别是OpenAI那个DeepResearch,每个月150次现在甚至都不够我用,我吹了无数次,200刀Pro会员最大的价值所在,我非常的尊敬他们,我也觉得它们很强。


但是场景不一样,在重复性场景上,他们还是太有个性,太聪明了。


在很多时候,自动化真正需要的,是更稳、更可控、更可复用


而不是更聪明。


毕竟,做这种极度重复性的工作,我要的就是你稳定的十年如一日的运行,你要聪明干嘛,你聪明但不靠谱,还不如不聪明。


但是RPA,我认为一直有一个非常大的问题。


就是上手太难了。


你即使不懂AI,不懂编程,你依然还是可以用Cursor、Trae搓出一个小产品,还是可以用DeepResearch给你生成一篇很牛逼的几万字的报告。


但是RPA这玩意,你不会,那就是真不会。


比如我们想做一个网页的自动化,你打开界面,你如果没用过,你是真的有可能懵逼的。


RPA+AI,才是真正能让你躺平的自动化真神。


你想从抖音扒个评论,这是RPA做好的详细流程,别说搭了,大概率,你看都看不懂。


RPA+AI,才是真正能让你躺平的自动化真神。


你要搭流程,要画模块,要定义变量,要像程序员一样思考流程逻辑。


后来影刀这么多年一直都在努力降低门槛,加入了更多可视化、模块化、拖拽式逻辑配置。


但,还是太复杂了。


你本质上还是在做开发。


只是形式换了。


这两年,AI Coding飞速发展,我其实一直想看到,像影刀这种产品,能出一个用AI来搭建RPA流程的功能。


AI本质上就是降维,就是技术平权,RPA很有用,但是太难,大家用不会搭不来,那为什么不能有,用嘴来跟AI提需求,然后转变成RPA的流程呢?


直到现在,在等了半年多以后,我终于看到了。


虽然他现在还是只能用AI生成网页和数据处理的RPA流程,还不能生成桌面端跨软件比如微信的RPA流程,但是至少,我看到了一个非常棒的转折点。


RPA+AI,才是自动化任务的YYDS。


你们把影刀下载下来安装,就能在主界面上看到新建,点击新建 - 新建PC自动化应用,进入到流程搭建页面。


RPA+AI,才是真正能让你躺平的自动化真神。


你就能在标准指令里面,看到这个彩色的魔法指令。


RPA+AI,才是真正能让你躺平的自动化真神。


这个就是用嘴搭流程的功能。


不过在用之前,一定记得现在主界面 - 头像 - 工具 - 自动化插件那。


RPA+AI,才是真正能让你躺平的自动化真神。


先把各种浏览器的插件给装上,要不然后续运行不成功。


RPA+AI,才是真正能让你躺平的自动化真神。


现在,我们举个小例子,比如,想做一个自动化流程用于我自己的学习。


流程是每天在小红书上搜索关键词“AI”,然后把前50个笔记都爬下来,存到一个excel里,再按照一定的数据公式,找出优质内容,把那部分优质的笔记提取出来存储,最后扔到飞书的多位表格里。


我们直接就可以点开魔法指令,然后直接点击进入浮窗。


RPA+AI,才是真正能让你躺平的自动化真神。


你就会发现,她变小了,然后缩到屏幕的一边了。


RPA+AI,才是真正能让你躺平的自动化真神。


默认就是网页自动化,所以我们不需要修改,然后打开浏览器(推荐还是Chrome),打开小红书的网页。


现在,你的界面应该长这个样子,左边是小红书的网页,右边是影刀的魔法指令浮窗。


RPA+AI,才是真正能让你躺平的自动化真神。


然后,我们就直接用嘴,来写我们的指令。


不过影刀跟所有的AI产品都有一个不一样的点,就是他有一个必须的步骤,叫做捕获元素区。


比如我们说,在搜索栏里输入AI,然后点击搜索按钮。


这个Prompt其实不够精准,可能后续运行时会出现一些问题,所以,你需要先捕获元素区,非常明确的告诉它,这是搜索栏,这是搜索按钮。


我们直接点击左下角这个icon。


RPA+AI,才是真正能让你躺平的自动化真神。


你就会发现,你的屏幕变绿了,你可以,在页面上框选各种区域了。


RPA+AI,才是真正能让你躺平的自动化真神。


我们把鼠标放在搜索框的选区上,然后按下Ctrl+Shift再加鼠标左键单击,它就会给你个确认,你点对勾就行。


然后你就会发现,这个选区,出现在你的对话框里面了。


RPA+AI,才是真正能让你躺平的自动化真神。


这个就是一个元素块,我们现在,可以用嘴,来告诉AI,应该对这个元素块进行什么操作了。


比如我就会说。在输入框中输入“AI”。


RPA+AI,才是真正能让你躺平的自动化真神。


输入完以后,下一步就是点击搜索按钮进行搜索了。我们继续如法炮制。选中选区。


RPA+AI,才是真正能让你躺平的自动化真神。


然后在prompt里面写,点击块元素(就是搜索按钮)进行搜索。


RPA+AI,才是真正能让你躺平的自动化真神。


后面就都是一样的流程了,圈中整个笔记区,让他按照笔记链接、作者、标题、正文、点赞数、收藏数、评论数等等来进行爬取,给我存到一个本地的excel里。


RPA+AI,才是真正能让你躺平的自动化真神。


RPA+AI,才是真正能让你躺平的自动化真神。


这样,一个用AI生成RPA的Prompt就写完了,会跟你直接对话,有一点不一样。写完以后,我们可以再点击一下,他们自己的优化提问,提高成功率。


优化完以后,就会变成这个格式,正规很多。


RPA+AI,才是真正能让你躺平的自动化真神。


一切完毕,我们把他,发送出去就行。


过了一会,就会生成魔法指令的窗口,有提示需要安装依赖库的,你就点击安装就行。


这个基本就代表了,RPA流程已经生成完了,哪些选项可以不用管,保存到本地的文件夹路径,是可以手动修改的。


RPA+AI,才是真正能让你躺平的自动化真神。


我手动改成到了D盘。


RPA+AI,才是真正能让你躺平的自动化真神。


然后,我们点击左下角的那个,运行指令,测试一下。


一次,直接完美的成功了。我直接放我的原始未加速录屏,大家可以感受一下。


RPA+AI,才是真正能让你躺平的自动化真神。


真的,看RPA干活,是一种享受。


再来看看本地excel结果。


RPA+AI,才是真正能让你躺平的自动化真神。


完美无瑕。


而且,这个东西,是保存了以后,可以十年稳定如一日的运行的(前提是小红书不改界面),做一次,以后可以一直用。


而且不只是10个,我们完全可以让他存50个笔记,100个笔记,200个笔记。每天抓取一次,这个对于自己学习作用有多大,不言而喻。


RPA+AI,才是真正能让你躺平的自动化真神。


生成完的流程,大家一定要记得,点击确定,因为他只是流程,还不算应用。


RPA+AI,才是真正能让你躺平的自动化真神。


点击确定后,就会回到我们的主界面。


RPA+AI,才是真正能让你躺平的自动化真神。


记得先拖一个网页自动化里的打开网页,到主流程中,以后一运行,就会自动打开小红书了。


RPA+AI,才是真正能让你躺平的自动化真神。


刚才保存下来的内容,我们如果想自动再让RPA帮我们做一轮数据筛选。就可以继续点击魔法指令,但是这一会,用数据处理,帮我们搞excel。


RPA+AI,才是真正能让你躺平的自动化真神。


在得到结果之后,把输出文件可以自定义一个。


RPA+AI,才是真正能让你躺平的自动化真神。


我们再运行测试一下。结果出现了BUG,但是不用慌,直接点击智能修复就行。


RPA+AI,才是真正能让你躺平的自动化真神。


然后继续,成功了,筛选出来了22条,Nice。


RPA+AI,才是真正能让你躺平的自动化真神。


最后,你甚至可以,把这些处理完的数据,直接自动化的,上传到飞书多维表格里。


RPA+AI,才是真正能让你躺平的自动化真神。


以后,每天,你只要需要打开影刀,运行一下,你就有了,全新的AI领域的小红书爆款内容。


RPA+AI,才是真正能让你躺平的自动化真神。


你甚至还可以进一步当个懒癌,跟触发器打通,每天定时自动运行。。。


RPA+AI,才是真正能让你躺平的自动化真神。


除了这个小红书自动爬取之外。


我们还手搓了几个其他的流程,比如每次新生图模型出来,我用我的excel测试集去测,都巨麻烦,因为新模型几乎不可能开放API。


那现在,直接可以用嘴搓个自动生图流程,比如我就搓了个即梦的。


RPA+AI,才是真正能让你躺平的自动化真神。


直接批量生图。


RPA+AI,才是真正能让你躺平的自动化真神。


然后塞到飞书里,甚至我打算,把生视频的也做了。


RPA+AI,才是真正能让你躺平的自动化真神。


这样以后,真的解放双手好吧。。。


写到这里,我真的是发自内心想说一句:


我们这两年,很多时候,都在追问AI能不能干人干不了的事。


但其实,那些重复的、琐碎的、机械的、你知道流程却不想动手的任务。


我更希望,AI能把他,干得更好。


这就是我眼里,AI+RPA的价值。


它不是AI更强,也不是RPA更流弊。


而是合而为一,绽放出更平权的价值。


也许自动化的终点,不是酷炫,而是悄无声息地,替你干完你根本不想碰的那一堆破事。


你都忘了它在工作。


但它一直都在干活。


这可能,就是魔法。


也愿我们每个人。


都能拥有魔法。


文章来自于“数字生命卡兹克”,作者“卡兹克、dongyi”。


RPA+AI,才是真正能让你躺平的自动化真神。

1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载
安卓下载
微信群
沪ICP备2023015588号