返回博客列表
技术教程

为什么所有大模型厂商都在疯狂卷 Agentic 和 Coding 能力?

2026年2月19日1 阅读
分享

先说结论

这不是跟风,也不是炒概念。

大模型厂商集体押注 Agentic 和 Coding 能力,背后是一个极其清晰的商业逻辑链:

编程 = 最高密度的智力工作 → AI 能写代码 = 证明了通用智能 → 通用智能 Agent 能自主完成任何任务 → 这是史上最大的生产力革命 → 谁先做到,谁就赢得一切。

让我们一层层拆开来看。


一、编程,是 AI 能力的"黄金试金石"

你有没有想过,为什么各家大模型发布新版本时,必然要在 SWE-bench(软件工程基准)和 LiveCodeBench 上晒分?

因为写代码是一种极其特殊的能力——它是可以客观验证的推理能力

写一篇文章,好不好看主观因素多。但写一段代码,有且只有两种结果:跑通了,或者没跑通。代码不说谎,测试套件不说谎。

更深层的原因是:代码本质上是形式化的逻辑。要写出正确的代码,模型必须具备:

  • 多步骤规划:把一个复杂问题拆解成可执行的子任务
  • 状态追踪:理解程序在运行时的内存状态和变量变化
  • 错误推断:看到报错信息,推断出问题根源
  • 跨文件理解:在数千个文件、数十万行代码中找到修改点
  • 这些能力,恰恰就是通用智能(AGI)的核心组件

    麻省理工学院和 Anthropic 的研究者们得出了同一个结论:"代码执行能力是高阶推理任务的最佳代理指标(proxy)"。换句话说,一个模型如果能真正写好代码,它大概率也能处理好法律合同分析、科学实验设计、商业决策推演。

    这就是为什么 Dario Amodei(Anthropic CEO)在 2025 年 3 月放出那句石破天惊的话:

    "AI 将在 3-6 个月内写出 90% 的代码,12 个月内几乎写出所有代码。"

    这不是营销噱头。这是他在描述他们研究团队的技术路线图。


    二、千亿美金的市场,已经摆在那里

    光讲哲学不够,我们来看数字。

    市场规模

  • 全球 AI 开发工具市场:2026 年估值 152 亿美元,年增长率 42%
  • AI Coding 赛道:到 2034 年将达到 473 亿美元,年复合增长率 24%
  • 头部玩家的惊人数字

    产品数据
    Claude Code(Anthropic)2025 年 5 月上线,5 个月内 ARR 突破 10 亿美元;2026 年 2 月已达 25 亿美元 ARR
    Cursor(Anysphere)ARR 超 10 亿美元,2026 年 1 月估值达 293 亿美元
    GitHub Copilot(微软)ARR 约 8 亿美元
    Lovable / Replit均已突破 1 亿美元 ARR
    Claude Code 从 0 到 10 亿美元 ARR 只用了 5 个月——这是 B2B SaaS 史上最快的收入增长速度,没有之一。

    Anthropic 的整体爆发

      Anthropic 的总收入:
    • 2024 年底:约 10 亿美元 ARR
    • 2025 年 5 月:30 亿美元
    • 2025 年底:90 亿美元
    • 2026 年 2 月:140 亿美元

    14 个月从 10 亿到 140 亿,增长 14 倍。而这背后最大的驱动力,就是企业客户对 Coding Agent 的疯狂采购。财富 10 强中有 8 家是 Claude 的客户,超过 500 家企业年消费额超过 100 万美元。


    三、从"副驾驶"到"自动驾驶"——范式跃迁

    要理解为什么是 Agentic,而不只是"更好的代码补全",你需要理解这三代产品的本质区别:

    第一代:Autocomplete(自动补全)

    我写了半行代码,AI 帮我补全另一半。
    代表:早期 Copilot、Tabnine 本质:高级的 Tab 键 价值:节省打字时间,提升约 20-30% 效率

    第二代:Copilot(副驾驶)

    我描述想要什么功能,AI 帮我写出这个函数。
    代表:GitHub Copilot Chat、CodeWhisperer 本质:代码生成助手 价值:减少查文档和搜索时间,提升约 2-3 倍效率

    第三代:Agentic Coding(自主开发 Agent)

    我说"帮我给这个项目加上用户登录功能,包括前后端和测试",AI 自主完成从理解需求→规划架构→写代码→跑测试→修 bug 的全流程。
    代表:Claude Code、Cursor Agent、OpenAI Codex Agent、Google Jules 本质:自主执行复杂多步骤任务的 AI 软件工程师 价值:10-100 倍效率提升,甚至完全替代部分人工

    这个跃迁的关键,在于模型具备了"规划-执行-反思-修正"的闭环能力——也就是 Agentic 能力的核心。

    当 AI 不再需要人类每一步都手把手引导,而是能自主完成一个完整的工作流,它就从工具变成了"数字员工"。


    四、为什么编程是 Agentic 能力的最佳"练兵场"?

    你可能会问:Agent 能做的事情很多,为什么偏偏是编程最先突破?

    原因有三:

    1. 反馈信号最清晰

    Agent 完成任务后,怎么知道自己做对了?大多数任务(写报告、做分析)需要人来判断。但代码有编译器和测试套件——跑一下就知道对不对,AI 可以自我验证、自我修正,不需要人类介入反馈环。

    2. 训练数据最丰富

    GitHub 上有数十亿行开源代码,配套着 issues、PR、commit message 等完整上下文。这是训练 Coding Agent 的天然金矿,质量和数量都远超其他领域。

    3. 商业价值最可量化

    给一个企业部署 Coding Agent,可以直接量化:之前 10 个工程师做的事,现在 3 个工程师 + AI 就能做。ROI 清晰,采购决策容易。而其他领域的 AI 价值往往更难量化。

    这三点叠加,使得 Coding 成了 Agentic AI 最理想的起点——在这里跑通的技术,可以迁移到法律、金融、科研、医疗等其他垂直领域。


    五、国内厂商的局面:一场不得不打的仗

    国内大模型厂商为什么也在死磕 Coding 和 Agentic?除了以上通用逻辑,还有独特的压力:

    "能力代差"的焦虑

    过去两年,国际评测榜单上,Coding 能力是国内外模型差距最明显的维度之一。SWE-bench 的得分,一度是国产模型对抗 Claude 和 GPT 系列的软肋。这在技术社区造成了巨大的形象压力。

    反过来,一旦在 Coding 评测上追平甚至超越,就是最有说服力的"弯道超车"宣言。2025 年 7 月,阿里 Qwen3-Coder 登顶 Hugging Face 总榜,API 调用量单月暴涨至 1000 亿 Tokens,引发全球开发者关注——这一事件的传播效率,远超任何营销活动。

    企业级市场的核心入口

    在国内 AI 大客户(银行、制造、互联网)的采购逻辑中,Coding Agent 是"最好落地"的场景之一:

  • 需求清晰:帮助工程师提效
  • 效果可测:代码质量、交付速度
  • 决策链短:CTO 级别就能拍板
  • 智谱、字节(Coze)、阿里云(百炼)都在 2025 年集中发力企业级 Coding Agent 服务。智谱 GLM Coding Plan 企业版定价仅为竞品 Claude 的四分之一,主打性价比打法,快速渗透国内开发者市场。

    标准之争

    更深远的是技术标准的制定权。谁的 Coding Agent 生态最强,谁就更容易影响开发者工具链的走向——IDE 插件、CI/CD 集成、代码审查工具……一旦开发者养成习惯,迁移成本极高。字节跳动与 JetBrains 等 IDE 厂商的深度合作,阿里与钉钉生态的整合,都在抢占这个入口。


    六、这场竞赛的终点是什么?

    把所有线索连起来,你会看到一个清晰的终局图景:

    今天:AI 帮你写代码(Copilot 时代) 明天(1-2 年):AI 独立完成一个完整功能模块的开发(Agentic 时代) 后天(3-5 年):一个 AI Agent 团队,从产品需求到上线部署,端到端完成一款 SaaS 产品(Autopilot 时代)

    宇树科技 CEO 王兴兴曾说过一句话,用来形容人形机器人的未来,但我认为同样适用于 Coding Agent:

    "与可控核聚变不同,这不存在物理原理上的约束。只要花时间和脑力投入,智能是可以在机器上复现的。"

    编程是人类创造数字世界的语言。当 AI 掌握这门语言,它就拥有了改变数字世界的能力。

    这就是为什么,所有大模型厂商都在疯狂卷 Agentic 和 Coding 能力——因为赢得这场竞赛,就是赢得下一个时代的软件产业。


    对普通人意味着什么?

    如果你是开发者:不学会用好 Coding Agent,就像 2010 年不会用 Google 搜索一样落伍。 掌握 Claude Code、Cursor 这类工具的工程师,生产力已经是普通工程师的 3-5 倍。

    如果你是非技术人员:编程门槛正在崩塌。 Vibe Coding(用自然语言描述需求,AI 生成代码)让没有编程基础的人也能构建真实可用的软件。这是近十年来最重要的生产力民主化浪潮。

    如果你是企业决策者:Coding Agent 是 ROI 最清晰的 AI 投资方向之一。 不是"考虑要不要用",而是"考虑怎么用得更好"。


    斜杠无界持续追踪 AI 工具的最新动态和实战应用,欢迎关注我们的 AI 实战课程,帮你把这些工具变成真正的生产力。
    #AI趋势#Agentic#Coding#大模型#Claude Code#Cursor#智能体#软件工程
    浏览更多文章
    分享