速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

AI资讯 2026-05-29 09:53

+10453 阅读

每天 9 点，我的数据平台会多出一条粉丝增长记录。

Codex 会去看小红书、抖音、B 站、X 的粉丝数据，判断有没有增长，再把结果写回数据平台。

我打开结果时，最想看的就一件事：今天哪个平台涨了，涨了多少。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

（隐私数据已隐藏）

这就够了。每天先看一眼增长，异常的再打开后台细查。

整个数据分析的功能，都是用 codex 的Computer Use 来实现的。

前两代都卡在哪儿

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

AI 一出来我就在试后台数据巡检。

第一代是 Python——自己写（或让 Codex 写）程序去整理 B 站、抖音这些地方公开的内容数据，免得一个个看。但很多平台对程序化访问限制很严，写出来要么跑不通，要么很快受限。

第二代是 MCP / Chrome 扩展（也叫 Chrome MCP）——让 AI 通过浏览器扩展去操作页面。MCP 跑起来慢，一个多步任务等几分钟才回，烦得不行；Chrome 扩展操控弱，稍微复杂一点的交互（折叠面板、分页加载、富文本框）插件读不到，跑两步就卡。

这两代卡的不是同一个点：Python 卡在平台限制，Chrome 扩展卡在复杂页面。

真正缺的是：当数据只出现在屏幕上时，AI 能不能像人一样看懂当前页面。

Codex 学会用电脑了

Computer Use 接上的就是这一段。

Codex 跨过去的门槛，是模型开始能读懂一个正在运行的电脑界面。

这张截图在模型眼里，会被拆成一组可操作对象：按钮、输入框、菜单、弹窗、加载状态。模型要判断：当前任务下一步该点哪里、输什么、等不等页面加载。

Computer Use 的一轮动作，其实就是这个闭环：

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

OpenAI 公开介绍 Computer-Using Agent 时，讲的也是这个方向：模型针对图形界面交互做过训练，能把屏幕理解、任务目标和鼠标键盘动作接起来。

鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时，它还能重新看屏幕，继续判断下一步。

脚本卡在规则里，插件卡在页面变化里；Codex 能一轮一轮看结果、改动作。

配合定时触发，它就能每天到点巡一圈后台：查粉丝增长、记增量、生成报告。

旧自动化是按点跑脚本，新 Codex 自动化是按点让 AI 接手一段电脑操作。

全程就是和 Codex 说话

全程跟 Codex 对话。但先把两件 Codex App 设置打开，否则定时任务跑不通——这两件是 Codex 真在你本地电脑上操作（不是云端跑）的必要授权，正好印证上一节说的 Computer Use。

前置 · 设置 1：运行时防止系统休眠

Codex App → 设置 → 常规，打开「运行时防止系统休眠」。否则定时到点了电脑还在睡着，根本起不来。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

前置 · 设置 2：电脑操控权限

Codex App → 设置 → 电脑操控，打开「任意应用」和「锁屏操作」。第一次让 Codex 操作 Chrome 时，它还会自动往 Chrome 装一个扩展。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

所有的自动化任务，都在下图的入口。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

设置开好，下面两步走。

第一步——让 Codex 帮你装 codex-auto-report

打开 Codex App，跟它说：

帮我装 codex-auto-report 这个 Skill。安装命令是 npx codex-auto-report-skill install。跑前给我确认一下，装完告诉我结果。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

整个过程你不用打开终端。

codex-auto-report 是我做的一个辅助 Skill——其实就是我懒得每次都跟 Codex 重新解释一遍"反问 6 件事 + 出 HTML 报告"，干脆做成 Skill。开头这种后台巡检报告，就是它适合承接的任务类型。

第二步——在 Codex App 里说一句话布置需求

比如：

用 codex-auto-report，帮我建一个定时任务：每天早上 9 点巡检抖音、B 站、X 和数据平台，记录关键数据变化，跑完出一份 HTML 报告。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

Codex 会用白话反问 6 件事，逐项确认：

任务叫什么名
几点跑
在哪个项目目录下跑（你电脑上某个文件夹）
每次跑的时候要做什么（细节）
要不要先试跑一次
涉不涉及敏感信息（账号、密码、API key）

你回完，Codex 自己去创建定时任务。下一天早上 9 点，它就开始跑。

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

全程就是和 Codex 说话——装 Skill 是说话，布置任务也是说话。

它像个不下班的实习生：每天到点上班、跑完发报告。

Computer Use 实际用起来还有不少技巧，遇到问题可以在评论区告诉我——后续我会专门出一篇（或一个视频）展开讲。

什么活能甩，什么活不能甩

速通 Codex 自动化：抓信息、看数据、交报告，一个 Codex 就全干了

不是所有事都该交给 Codex。适合交的事有 4 条标准。

适合交的 4 条标准

低频：一天一次或几次，不是每分钟操作一次。高频访问就回到平台识别那一套了。
重复：每次动作差不多，不是每次都要重新想方案。Codex 跑的是规律，不是创意。
结构稳定：每次产出格式差不多——比如都是 HTML 报告、都是粉丝数表格。最怕的是这次出表、那次出文章、再下次出 PPT——每天打开像开盲盒。
结果可验证：你一眼能看出来跑对了没。能验证才能放心让它跑。

只把可观察、低风险的事交给 Codex，其他的人来做。

这场拉锯还在继续——下一代工具出现之前，Codex Computer Use 够用了。

文章来自于微信公众号 "AI产品自由"，作者 "AI产品自由"

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md