OpenAI Codex 现在能帮你操控 Windows 了，我让它帮我整理文件试了下

Codex 学会用鼠标了

前几天 OpenAI 放了个消息出来——Codex 的 computer use 功能正式支持 Windows。之前只在 Mac 上跑，现在好了，PC 用户也能用上了。

说白了就是，Codex 现在能「看见」你的屏幕，然后自己操作电脑。不是那种只能聊天的 AI，是真的帮你干活的那种。

我抱着试试的心态装了一下，给了它三个任务：第一，把我桌面上乱七八糟的文件按类型整理到不同文件夹里；第二，从浏览器下载一份 PDF 然后重命名；第三，打开 VS Code 帮我改一下配置文件里的端口号。

结果还挺意外的。

整理文件那一步它做得不错，建了几个文件夹把图片、文档、压缩包分开了。虽然有个 Excel 文件它犹豫了一下放到了「其他」里，但整体来说比我手动拖拽快多了。

下载 PDF 重命名也顺利，它自己打开 Chrome，搜索了那个文件，下载后用 PowerShell 改了个名，全程没碰鼠标，纯靠看屏幕做判断。

改配置文件就有点翻车了。它打开了 VS Code，找到了那个文件，也定位到了端口那一行——但它改完之后忘了保存。我盯着屏幕看了三十秒才反应过来，然后它自己也意识到了，又自己点了保存。这个过程真的挺像人类的。

速度算不上快，对于老手来说自己操作肯定更快。但有几个场景我觉得真正有价值：一是重复性的文件整理、重命名之类的工作，你走开让它自己跑就行；二是那些你不太熟悉的操作流程，让 AI 替你走一遍，看着也行，录屏也行。

OpenAI 还加了个功能——你不在电脑前的时候，可以通过 ChatGPT 的 App 查看和管理 Codex 的任务状态。这就有意思了，相当于你有个远程的电脑助理。

不过说实话，我还是有点担心权限问题。它能看你的屏幕、操作你的文件，万一出了错怎么办？目前来看 Codex 执行操作之前会在界面上显示它要做什么，给了你叫停的机会。

安全这块，OpenAI 自己也说了，走的端到端加密，截图只在本地处理完才上传关键信息。能不能完全放心，那得看后续有没有翻车案例了。

反正我是打算在日常工作中偶尔让它试试，有些脏活累活，交给 AI 总比自己干强，对吧？