为什么所有大模型厂商都在疯狂卷 Agentic 和 Coding 能力?
先说结论
这不是跟风,也不是炒概念。
大模型厂商集体押注 Agentic 和 Coding 能力,背后是一个极其清晰的商业逻辑链:
编程 = 最高密度的智力工作 → AI 能写代码 = 证明了通用智能 → 通用智能 Agent 能自主完成任何任务 → 这是史上最大的生产力革命 → 谁先做到,谁就赢得一切。让我们一层层拆开来看。
一、编程,是 AI 能力的"黄金试金石"
你有没有想过,为什么各家大模型发布新版本时,必然要在 SWE-bench(软件工程基准)和 LiveCodeBench 上晒分?
因为写代码是一种极其特殊的能力——它是可以客观验证的推理能力。
写一篇文章,好不好看主观因素多。但写一段代码,有且只有两种结果:跑通了,或者没跑通。代码不说谎,测试套件不说谎。
更深层的原因是:代码本质上是形式化的逻辑。要写出正确的代码,模型必须具备:
这些能力,恰恰就是通用智能(AGI)的核心组件。
麻省理工学院和 Anthropic 的研究者们得出了同一个结论:"代码执行能力是高阶推理任务的最佳代理指标(proxy)"。换句话说,一个模型如果能真正写好代码,它大概率也能处理好法律合同分析、科学实验设计、商业决策推演。
这就是为什么 Dario Amodei(Anthropic CEO)在 2025 年 3 月放出那句石破天惊的话:
"AI 将在 3-6 个月内写出 90% 的代码,12 个月内几乎写出所有代码。"
这不是营销噱头。这是他在描述他们研究团队的技术路线图。
二、千亿美金的市场,已经摆在那里
光讲哲学不够,我们来看数字。
市场规模
头部玩家的惊人数字
| 产品 | 数据 |
|---|---|
| Claude Code(Anthropic) | 2025 年 5 月上线,5 个月内 ARR 突破 10 亿美元;2026 年 2 月已达 25 亿美元 ARR |
| Cursor(Anysphere) | ARR 超 10 亿美元,2026 年 1 月估值达 293 亿美元 |
| GitHub Copilot(微软) | ARR 约 8 亿美元 |
| Lovable / Replit | 均已突破 1 亿美元 ARR |
Anthropic 的整体爆发
- Anthropic 的总收入:
- 2024 年底:约 10 亿美元 ARR
- 2025 年 5 月:30 亿美元
- 2025 年底:90 亿美元
- 2026 年 2 月:140 亿美元
14 个月从 10 亿到 140 亿,增长 14 倍。而这背后最大的驱动力,就是企业客户对 Coding Agent 的疯狂采购。财富 10 强中有 8 家是 Claude 的客户,超过 500 家企业年消费额超过 100 万美元。
三、从"副驾驶"到"自动驾驶"——范式跃迁
要理解为什么是 Agentic,而不只是"更好的代码补全",你需要理解这三代产品的本质区别:
第一代:Autocomplete(自动补全)
我写了半行代码,AI 帮我补全另一半。代表:早期 Copilot、Tabnine 本质:高级的 Tab 键 价值:节省打字时间,提升约 20-30% 效率
第二代:Copilot(副驾驶)
我描述想要什么功能,AI 帮我写出这个函数。代表:GitHub Copilot Chat、CodeWhisperer 本质:代码生成助手 价值:减少查文档和搜索时间,提升约 2-3 倍效率
第三代:Agentic Coding(自主开发 Agent)
我说"帮我给这个项目加上用户登录功能,包括前后端和测试",AI 自主完成从理解需求→规划架构→写代码→跑测试→修 bug 的全流程。代表:Claude Code、Cursor Agent、OpenAI Codex Agent、Google Jules 本质:自主执行复杂多步骤任务的 AI 软件工程师 价值:10-100 倍效率提升,甚至完全替代部分人工
这个跃迁的关键,在于模型具备了"规划-执行-反思-修正"的闭环能力——也就是 Agentic 能力的核心。
当 AI 不再需要人类每一步都手把手引导,而是能自主完成一个完整的工作流,它就从工具变成了"数字员工"。
四、为什么编程是 Agentic 能力的最佳"练兵场"?
你可能会问:Agent 能做的事情很多,为什么偏偏是编程最先突破?
原因有三:
1. 反馈信号最清晰Agent 完成任务后,怎么知道自己做对了?大多数任务(写报告、做分析)需要人来判断。但代码有编译器和测试套件——跑一下就知道对不对,AI 可以自我验证、自我修正,不需要人类介入反馈环。
2. 训练数据最丰富GitHub 上有数十亿行开源代码,配套着 issues、PR、commit message 等完整上下文。这是训练 Coding Agent 的天然金矿,质量和数量都远超其他领域。
3. 商业价值最可量化给一个企业部署 Coding Agent,可以直接量化:之前 10 个工程师做的事,现在 3 个工程师 + AI 就能做。ROI 清晰,采购决策容易。而其他领域的 AI 价值往往更难量化。
这三点叠加,使得 Coding 成了 Agentic AI 最理想的起点——在这里跑通的技术,可以迁移到法律、金融、科研、医疗等其他垂直领域。
五、国内厂商的局面:一场不得不打的仗
国内大模型厂商为什么也在死磕 Coding 和 Agentic?除了以上通用逻辑,还有独特的压力:
"能力代差"的焦虑
过去两年,国际评测榜单上,Coding 能力是国内外模型差距最明显的维度之一。SWE-bench 的得分,一度是国产模型对抗 Claude 和 GPT 系列的软肋。这在技术社区造成了巨大的形象压力。
反过来,一旦在 Coding 评测上追平甚至超越,就是最有说服力的"弯道超车"宣言。2025 年 7 月,阿里 Qwen3-Coder 登顶 Hugging Face 总榜,API 调用量单月暴涨至 1000 亿 Tokens,引发全球开发者关注——这一事件的传播效率,远超任何营销活动。
企业级市场的核心入口
在国内 AI 大客户(银行、制造、互联网)的采购逻辑中,Coding Agent 是"最好落地"的场景之一:
智谱、字节(Coze)、阿里云(百炼)都在 2025 年集中发力企业级 Coding Agent 服务。智谱 GLM Coding Plan 企业版定价仅为竞品 Claude 的四分之一,主打性价比打法,快速渗透国内开发者市场。
标准之争
更深远的是技术标准的制定权。谁的 Coding Agent 生态最强,谁就更容易影响开发者工具链的走向——IDE 插件、CI/CD 集成、代码审查工具……一旦开发者养成习惯,迁移成本极高。字节跳动与 JetBrains 等 IDE 厂商的深度合作,阿里与钉钉生态的整合,都在抢占这个入口。
六、这场竞赛的终点是什么?
把所有线索连起来,你会看到一个清晰的终局图景:
今天:AI 帮你写代码(Copilot 时代) 明天(1-2 年):AI 独立完成一个完整功能模块的开发(Agentic 时代) 后天(3-5 年):一个 AI Agent 团队,从产品需求到上线部署,端到端完成一款 SaaS 产品(Autopilot 时代)宇树科技 CEO 王兴兴曾说过一句话,用来形容人形机器人的未来,但我认为同样适用于 Coding Agent:
"与可控核聚变不同,这不存在物理原理上的约束。只要花时间和脑力投入,智能是可以在机器上复现的。"
编程是人类创造数字世界的语言。当 AI 掌握这门语言,它就拥有了改变数字世界的能力。
这就是为什么,所有大模型厂商都在疯狂卷 Agentic 和 Coding 能力——因为赢得这场竞赛,就是赢得下一个时代的软件产业。
对普通人意味着什么?
如果你是开发者:不学会用好 Coding Agent,就像 2010 年不会用 Google 搜索一样落伍。 掌握 Claude Code、Cursor 这类工具的工程师,生产力已经是普通工程师的 3-5 倍。
如果你是非技术人员:编程门槛正在崩塌。 Vibe Coding(用自然语言描述需求,AI 生成代码)让没有编程基础的人也能构建真实可用的软件。这是近十年来最重要的生产力民主化浪潮。
如果你是企业决策者:Coding Agent 是 ROI 最清晰的 AI 投资方向之一。 不是"考虑要不要用",而是"考虑怎么用得更好"。
斜杠无界持续追踪 AI 工具的最新动态和实战应用,欢迎关注我们的 AI 实战课程,帮你把这些工具变成真正的生产力。