造ChatGPT的人，已经不用ChatGPT干活了 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

造ChatGPT的人，已经不用ChatGPT干活了

6 小时前 / 阅读约7分钟

来源：36kr

OpenAI主力AI从ChatGPT转向AI智能体Codex，Codex能接手长周期任务，被各岗位广泛使用，从编程工具变为通用工作流智能体，其底座GPT-5.5能优化自身，人和AI搭班对象变为智能体。

造ChatGPT的人，已经不太用ChatGPT干活了？

不到一年时间，OpenAI就把主力AI从聊天框换成了AI智能体（AI Agent）。

到2026年6月，Codex已经吃下OpenAI全公司每周99.8%的输出token。

就在10个月前，这个数字还不到10%。

转折发生在去年9月前后。Codex接上更强的模型、补齐更多能力，能接的活越来越重。

员工慢慢发现，与其在对话框里一问一答，不如把一大摊任务直接丢给它自己跑。

而这并非某个工程小组在尝鲜。整整一家公司，法务、财务、招聘，每个部门都把它摆上了头号AI工具的位置。

到今天，OpenAI人均超过85%的输出token产自Codex。重度用户本就更费token，全公司加权下来，占比被推到99.8%。

一个聊天机器人，就这样在自己诞生的公司，被同门替换掉了。

https://openai.com/index/how-agents-are-transforming-work/

OpenAI在最新的一篇博客里把话挑明了：

智能体（Agent）正在改写知识工作的基本单位——从一来一回的单次问答，变成一整件可以「丢出去」的长周期任务。

聊天机器人一次只接一个短问题，智能体却能独立跑上几分钟到几小时，自己调工具、自己跟环境交互、自己迭代到交活为止。

如今近四分之一的Codex请求，对应的都是人类得花一小时以上才能干完的活。

OpenAI总裁Greg Brockman转发这份报告时，说道：智能体正在被飞快采纳，加速所有人的工作。

他配的图，就是公司内部这条陡峭的上升曲线。

火从工程师工位，烧到法务办公室

最先改变的是工程师。

这不意外，Codex本就是为写代码的人造的。

2025年12月起，OpenAI的平均工程师就把大部分活儿挪到了Codex上，如今平均一个工程师99%的输出token都走Codex，留给ChatGPT的只剩个零头。

但这把火，并没只停在工程部。

法务、财务、招聘这些根本不碰代码的部门，在2026年4月前后集体越界，把Codex用成了头号工具，而且转得比工程师还快。

如今OpenAI一个律师或招聘，人均超过85%的输出token也产自Codex。

各部门的用量，也像被点着的火一样快速向上攀升。

按OpenAI自报，到2026年6月，研究部门的中位用量翻了56倍，客服32倍，工程27倍，连转得最慢的法务也涨到13倍。

当律师把活儿交给智能体，这画面本身就比任何跑分都更有说服力。

真正的信号，是那些原本不写代码的人

如果只看到工程师偏爱Codex，你可能就漏掉了一个最关键的信号。

从2025年8月起，非开发者用户的增长全面反超开发者：个人端涨了137倍，组织端189倍，OpenAI内部12倍。

一个起家于写代码的工具，正被越来越多压根不懂代码的人用起来。

他们拿Codex干什么？

财务团队用它处理了24771份K-1税表，足足71637页。这套脱敏流程跑下来，团队比去年提前两周收工。

公关团队更直接，搭了一个自动分流的Slack智能体：低风险的演讲邀约自动处理，高风险的转人工审核。

敢交给它的活，也越来越重。

到2026年5月，80.6%的个人用户提过预计超过30分钟的任务，70.2%超过1小时，还有25.6%直接甩给它8小时以上的活。

更微妙的是，业务岗用Codex干的活里，超过四分之一其实是编程。一个做财务的人，正悄悄跨进工程师的地盘。

岗位之间那道墙正在慢慢消失。

OpenAI各部门用Codex干的活，按工作类型拆开看：财务岗里31%是编程，产品营销岗25%，连非技术的「其他」部门都有50%在写代码。岗位的墙，正被Codex一点点抹平。

到这一步，Codex已经不只是编程智能体——它越界成了通用工作流智能体。

这才是它真正让人后背发凉的地方。

从工具到执行者，Codex换了一个身份

撑起这一切的，是Codex角色的彻底转身。

它早已不是那个写代码的补全插件，如今它能接手一整条工程任务链：实现、重构、调试、测试、验证，一条龙全包。

早期版本就能单次自主运行7小时以上，自己迭代实现、修掉测试报错，最后交出一个能跑的方案。

这已经不只是帮你写两行代码，而是你交代一摊事，它自己从头跑到尾。

更能说明问题的是并行规模。

到2026年6月，跑在P99分位的重度用户，单日能让Codex产出超过60小时的智能体轮次，分散在好几个并行的智能体身上。

用户早就不满足于问一个答案，而是一天里同时指挥一支智能体小队。

OpenAI内部Codex的单日智能体运行时长，从普通用户到最重度用户分成五档。到2026年6月，最重度的用户，单日能跑出60小时以上的智能体工作量。

一个人，一天，调度出60小时的活，这是别人一周的活。

Codex的底座是GPT-5.5。它能用更少的token，扛更长的任务。

其中最让人惊讶的，是GPT-5.5干的另一件事。

为了在不拖慢速度的前提下提速，OpenAI让它去重写负载均衡和分区的启发式算法。

GPT-5.5分析了数周的真实流量，写出定制方案，把token生成速度硬生生拉高20%以上。

于是，GPT-5.5成了一台开始优化自己的引擎。

有提前用上它的英伟达工程师甚至说，失去对GPT-5.5的访问权限，感觉像被截了肢。

这一切的背后，人和AI搭班的对象悄悄换了：从一问一答的聊天机器人，变成能独立跑长活的智能体。

不变的是发指令、做判断、担责任的这些依然是人。改变的是办公的默认动作：从打开聊天框问一句，变成把一整件事交给智能体去跑。

这份报告，更像是一次办公方式换挡的预演。

往后真正拉开差距的，是你敢把多大的一摊事，整个交给AI。

参考资料：

https://openai.com/index/introducing-codex/https://openai.com/index/codex-for-every-role-tool-workflow/

https://x.com/gdb/status/2070199649823297653

https://openai.com/index/how-agents-are-transforming-work/https://openai.com/index/harness-engineering/

上一篇：DeepMind 研究科学家：广告没人看了，互联网上AI的流量已经超过了真人

下一篇：两个Anthropic前员工，半年估值68亿

返回列表

火从工程师工位，烧到法务办公室

真正的信号，是那些原本不写代码的人

从工具到执行者，Codex换了一个身份

相关新闻