Codex 学会用鼠标了
前几天 OpenAI 放了个消息出来——Codex 的 computer use 功能正式支持 Windows。之前只在 Mac 上跑,现在好了,PC 用户也能用上了。
说白了就是,Codex 现在能「看见」你的屏幕,然后自己操作电脑。不是那种只能聊天的 AI,是真的帮你干活的那种。
我让它干了三件事
我抱着试试的心态装了一下,给了它三个任务:第一,把我桌面上乱七八糟的文件按类型整理到不同文件夹里;第二,从浏览器下载一份 PDF 然后重命名;第三,打开 VS Code 帮我改一下配置文件里的端口号。
结果还挺意外的。
整理文件那一步它做得不错,建了几个文件夹把图片、文档、压缩包分开了。虽然有个 Excel 文件它犹豫了一下放到了「其他」里,但整体来说比我手动拖拽快多了。
下载 PDF 重命名也顺利,它自己打开 Chrome,搜索了那个文件,下载后用 PowerShell 改了个名,全程没碰鼠标,纯靠看屏幕做判断。
改配置文件就有点翻车了。它打开了 VS Code,找到了那个文件,也定位到了端口那一行——但它改完之后忘了保存。我盯着屏幕看了三十秒才反应过来,然后它自己也意识到了,又自己点了保存。这个过程真的挺像人类的。
说点真话
速度算不上快,对于老手来说自己操作肯定更快。但有几个场景我觉得真正有价值:一是重复性的文件整理、重命名之类的工作,你走开让它自己跑就行;二是那些你不太熟悉的操作流程,让 AI 替你走一遍,看着也行,录屏也行。
OpenAI 还加了个功能——你不在电脑前的时候,可以通过 ChatGPT 的 App 查看和管理 Codex 的任务状态。这就有意思了,相当于你有个远程的电脑助理。
不过说实话,我还是有点担心权限问题。它能看你的屏幕、操作你的文件,万一出了错怎么办?目前来看 Codex 执行操作之前会在界面上显示它要做什么,给了你叫停的机会。
安全这块,OpenAI 自己也说了,走的端到端加密,截图只在本地处理完才上传关键信息。能不能完全放心,那得看后续有没有翻车案例了。
反正我是打算在日常工作中偶尔让它试试,有些脏活累活,交给 AI 总比自己干强,对吧?
评论 (0)
暂无评论,来写第一条吧 ✍️