文章作者、来源:新智元
Anthropic与OpenAI竞推移动端AI编程控制台,云端执行任务
【导读】Claude把Cowork塞进手机,Codex钻进ChatGPT,两巨头抢上同一块屏,可谁都没让手机真正干活。被改写的,是写代码的你。
Claude的手机端,要接入Cowork了。
刚刚,TestingCatalog在X上甩出一张图,里面的每一条,都在直接改变着用Claude干活人的工作流:
TestingCatalog放出的Claude移动端Cowork界面,列出四条特性,功能未官宣。
更早之前,已经有人在iOS版的安装包里扒出一个叫「Tasks」的入口:App菜单里多出一个专门的Tasks页面,能新建任务。
无论是命名、图标还是交互,它跟电脑端的Cowork几乎是一个模子刻出来的:重点都不在聊天,而在「存一个任务、往后一键重跑」。
更早前iOS版菜单里被扒出的「Tasks」入口,与电脑端Cowork同源,未官宣
据爆料,这些任务还可能带上浏览器自动化:执行时自己打开网页、抓信息、一步步走完流程,不用你挨个去点。
两条线索指向这样一个转变:Anthropic正把那套桌面端的智能体能力,往手机里搬。从一个聊天框,变成你随身的任务台。
一些开发者也开始坐不住了:终于能在被窝里、地铁上、咖啡桌前,掏出手机指挥Claude干活了?
要看懂这件事,得先把Claude这套体系拆开。
它背后主要是两大组件:派单(Dispatch)和协同办公(Cowork)。
Cowork的Dispatch设置页,要给文件访问权限、让电脑保持唤醒,手机只是那头的入口,活儿在桌面端落地。(图源:Anthropic)
派单是入口。
你在手机上写一句「把上季度销售数据整理成报告」,这句话并不在手机上跑。它被发到你的电脑,电脑上的Cowork调起本地文件、连接器、插件,把活干完,再把结果推回手机。
手机能发起、能看进度、能中途补一句指令、能点「同意」放行,但它一行活儿都不干。它就是控制层(control plane),只传话,不出力。
Cowork刚推出时,规矩写得很死:跑在你自己的电脑上,桌面客户端必须一直开着、电脑不能睡,App一关,会话当场结束。
那会儿干活的,是你那台必须通宵亮着的电脑。手机更像一个对讲机,对着的是电脑上那个正在运行的Cowork。合上笔记本,对讲机就黑屏了。那时候,它是远程遥控,并非云端计算。
但今天的爆料,配上另一条官方动向,味道就变了。
Claude Code的官方文档,已经悄悄把Cowork重新定义了一遍:
Claude Code桌面端的设置里列着三种运行环境:Local是你自己的机器,SSH是你自己的远端服务器,Remote那一档则跑在Anthropic的云上,关掉App也继续,用的是和网页版Claude Code同一套基础设施。
Claude Code桌面端的运行环境选择,Remote一档跑在Anthropic云上,关掉App也继续。(图源:Claude Code官方文档)
你没看错,Claude Code的执行层正在搬家:从你那台必须亮着的电脑,挪进Anthropic的云。
到这儿,上面那条爆料的真实含义才算点透。关掉App后台还在跑,并非手机在硬扛,是那活儿本就放在云端VM上跑。它跟你的手机没关系,甚至跟你那台电脑,都越来越没关系。
当然,这是两条并存的路径,本地执行还在,桌面那套也照用。但官方主动把Cowork改写成「云端自主后台智能体」,方向已经很明确了。
把镜头转向OpenAI,也是熟悉的画面,相似的配方。
5月14日,OpenAI已经把编程智能体Codex搬进了ChatGPT手机App。注意,它并非独立应用,只是ChatGPT里的一个模块。
5月14日,OpenAI把Codex接进ChatGPT手机端,手机负责看进度、审命令,执行仍在远端机器。(图源:OpenAI官方)
官方说,每周已经有超过400万人在用Codex。OpenAI给开发者画的场景,全是日常切口:
但手机这头能干的,就四件事:看任务状态、审批命令、切换模型、发起新活。真正的执行,发生在你的笔记本、专用的Mac mini,或者某台远程机器上。文件、凭证、权限,全留在那台机器里。
中间靠一层安全中继(secure relay)把设备打通,手机收到的,是截图、终端输出、差异、测试结果。换句话说,你在排队买咖啡,devbox在替你重构。
在「移动编程」这个场景上,两家再次撞了个满怀。
他们不约而同,谁都没去做「手机端跑AI」,而是采用了相似的架构:手机是控制台,远端的电脑、VM或云才是执行层,谁都没把AI的算力,真正搬进手机。
差别在哪里?
Anthropic主打「人走了,活继续干」。从手机发个任务,回来活就干完了,鼓励你撒手。
而OpenAI主打「人在回路(human-in-the-loop)」。它反复要你审批,鼓励你盯住。
那么,为什么没有一家,去做真正的「手机本地跑智能体」?
答案很现实。手机的算力、续航、文件和权限环境,撑不起一个长时间运行的智能体常驻。本地运行时(runtime)很可能是条死路。
真正值钱的,是编排那一层,业内叫控制台(control plane)。谁攥住了跨设备的任务调度、状态同步、审批入口,谁就攥住了开发者的工作流。
这场竞争,拼的并非算力下沉到手机,真正争的,是把控制权上移到云端。手机的角色,从你打字的输入端,变成了你指挥AI的控制台。
在这场变化里,开发者的角色,正从「守键盘」变成「派单者」。
你盯的不再是每一行代码怎么写,而是任务怎么定义、结果好不好、哪一步该拦下来。
这活儿,更像监工、管理者,而非纯码农:控制台递到你手里,你成了那个发指令、做判断的人。
开发者一天的时间,也跟着被打散。早上地铁上派一个活,中午审一版差异,下午批准一条命令,晚上收一个PR(pull request)。
守着键盘连敲几个钟头的日子,正在成为过去,变成一段段、随时插进来的「派单加审差异」。
还有一个风险,把读、写、删的权限,交给一个能从手机随手触发的智能体,链条一旦被污染,比如一封带提示注入的邮件、一个钓鱼链接,后果可能难以撤销。
Anthropic自己也在安全说明里提过这条风险,手机能远程操控桌面,方便,也意味着一个误触就能滚雪球。
但方向已经定了,衡量一个开发者的标尺也随之改变。
以后未必看你一天敲了多少行,而是看你派单派得准不准、代码审得怎么样。
手机不再是你写代码的地方,成了你随身的控制台。真正稀缺的,不再是写代码的速度,而是对代码的判断力。
参考资料:https://www.testingcatalog.com/anthropic-prepares-claude-tasks-on-mobile-for-browser-automation/ https://code.claude.com/docs/en/desktop

