速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
资源拓展
速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了
2026-05-29 09:53

每天 9 点,我的数据平台会多出一条粉丝增长记录。


Codex 会去看小红书、抖音、B 站、X 的粉丝数据,判断有没有增长,再把结果写回数据平台。


我打开结果时,最想看的就一件事:今天哪个平台涨了,涨了多少。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


(隐私数据已隐藏)


这就够了。每天先看一眼增长,异常的再打开后台细查。


整个数据分析的功能,都是用 codex 的Computer Use  来实现的。


前两代都卡在哪儿


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


AI 一出来我就在试后台数据巡检。


第一代是 Python——自己写(或让 Codex 写)程序去整理 B 站、抖音这些地方公开的内容数据,免得一个个看。但很多平台对程序化访问限制很严,写出来要么跑不通,要么很快受限。


第二代是 MCP / Chrome 扩展(也叫 Chrome MCP)——让 AI 通过浏览器扩展去操作页面。MCP 跑起来慢,一个多步任务等几分钟才回,烦得不行;Chrome 扩展操控弱,稍微复杂一点的交互(折叠面板、分页加载、富文本框)插件读不到,跑两步就卡。


这两代卡的不是同一个点:Python 卡在平台限制,Chrome 扩展卡在复杂页面。


真正缺的是:当数据只出现在屏幕上时,AI 能不能像人一样看懂当前页面。


Codex 学会用电脑了


Computer Use 接上的就是这一段。


Codex 跨过去的门槛,是模型开始能读懂一个正在运行的电脑界面。


这张截图在模型眼里,会被拆成一组可操作对象:按钮、输入框、菜单、弹窗、加载状态。模型要判断:当前任务下一步该点哪里、输什么、等不等页面加载。


Computer Use 的一轮动作,其实就是这个闭环:


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


OpenAI 公开介绍 Computer-Using Agent 时,讲的也是这个方向:模型针对图形界面交互做过训练,能把屏幕理解、任务目标和鼠标键盘动作接起来。


鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时,它还能重新看屏幕,继续判断下一步。


脚本卡在规则里,插件卡在页面变化里;Codex 能一轮一轮看结果、改动作。


配合定时触发,它就能每天到点巡一圈后台:查粉丝增长、记增量、生成报告。


旧自动化是按点跑脚本,新 Codex 自动化是按点让 AI 接手一段电脑操作。


全程就是和 Codex 说话


全程跟 Codex 对话。但先把两件 Codex App 设置打开,否则定时任务跑不通——这两件是 Codex 真在你本地电脑上操作(不是云端跑)的必要授权,正好印证上一节说的 Computer Use。


前置 · 设置 1:运行时防止系统休眠


Codex App → 设置 → 常规,打开「运行时防止系统休眠」。否则定时到点了电脑还在睡着,根本起不来。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


前置 · 设置 2:电脑操控权限


Codex App → 设置 → 电脑操控,打开「任意应用」和「锁屏操作」。第一次让 Codex 操作 Chrome 时,它还会自动往 Chrome 装一个扩展。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


所有的自动化任务,都在下图的入口。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


设置开好,下面两步走。


第一步——让 Codex 帮你装 codex-auto-report


打开 Codex App,跟它说:


帮我装 codex-auto-report 这个 Skill。安装命令是 npx codex-auto-report-skill install。跑前给我确认一下,装完告诉我结果。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


整个过程你不用打开终端。


codex-auto-report 是我做的一个辅助 Skill——其实就是我懒得每次都跟 Codex 重新解释一遍"反问 6 件事 + 出 HTML 报告",干脆做成 Skill。开头这种后台巡检报告,就是它适合承接的任务类型。


第二步——在 Codex App 里说一句话布置需求


比如:


用 codex-auto-report,帮我建一个定时任务:每天早上 9 点巡检抖音、B 站、X 和数据平台,记录关键数据变化,跑完出一份 HTML 报告。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


Codex 会用白话反问 6 件事,逐项确认:


  • 任务叫什么名
  • 几点跑
  • 在哪个项目目录下跑(你电脑上某个文件夹)
  • 每次跑的时候要做什么(细节)
  • 要不要先试跑一次
  • 涉不涉及敏感信息(账号、密码、API key)


你回完,Codex 自己去创建定时任务。下一天早上 9 点,它就开始跑。


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


全程就是和 Codex 说话——装 Skill 是说话,布置任务也是说话。


它像个不下班的实习生:每天到点上班、跑完发报告。


Computer Use 实际用起来还有不少技巧,遇到问题可以在评论区告诉我——后续我会专门出一篇(或一个视频)展开讲。


什么活能甩,什么活不能甩


速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了


不是所有事都该交给 Codex。适合交的事有 4 条标准。


适合交的 4 条标准


  • 低频:一天一次或几次,不是每分钟操作一次。高频访问就回到平台识别那一套了。
  • 重复:每次动作差不多,不是每次都要重新想方案。Codex 跑的是规律,不是创意。
  • 结构稳定:每次产出格式差不多——比如都是 HTML 报告、都是粉丝数表格。最怕的是这次出表、那次出文章、再下次出 PPT——每天打开像开盲盒。
  • 结果可验证:你一眼能看出来跑对了没。能验证才能放心让它跑。


只把可观察、低风险的事交给 Codex,其他的人来做。


这场拉锯还在继续——下一代工具出现之前,Codex Computer Use 够用了。


文章来自于微信公众号 "AI产品自由",作者 "AI产品自由"

1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
IOS下载
安卓下载
微信群