Claude Code vs Cursor vs Codex：AI 编程工具到底该怎么选？ — 小牛AI_XNAI | AI编程工具怎么选

中立

模型与成本策略

Claude Code是专为终端环境设计的AI编码工具，不需要用户更换IDE或改变现有工作流。

博主指出Claude Code深入开发者现有的终端环境，让用户在原有环境中使用AI编辑代码，无需强迫更换工具。

不认同

模型与成本策略

Anthropic将Claude Code同时当作开发者工具和营销工具，许多功能的设计重点在于在Twitter上制造酷炫截图和高效感。

博主批评Claude Code的功能（如宠物模式、斜杠电台）以及界面动画像老虎机，更偏向营销和推文传播，而非纯粹的生产力。

不认同

模型与成本策略

Anthropic的策略是倾向于通过大量消耗token来解决问题，即使存在如内存泄漏等问题，也会用海量token去重写代码。

博主认为Claude Code乐于寻找烧token的方式（如启动多个子代理），并把‘堆token能解决问题’的理念推到极致，这并非最优解。

认同

模型与成本策略

OpenAI的策略是注重提升模型效率，GPT-4o用一半的token就获得了比Claude 3.5 Sonnet更好的基准测试分数。

博主引用Aider基准测试的token消耗数据，说明OpenAI在减少token使用的同时保持或提高准确性，效率更高。

认同

模型与成本策略

Codex的界面极简，专注于完成任务而不是制造上瘾体验，与Claude Code的‘老虎机’式设计形成对比。

博主演示了Codex启动子进程时只有简单的计时器和工作文本动画，认为它‘只是想干活’，而非刻意让用户感到兴奋。

不认同

模型与成本策略

Claude桌面应用体验很差，更新后常需重新登录，且与Web端对话不同步，Anthropic员工几乎不使用该桌面应用。

博主通过亲身经历吐槽Claude桌面应用的登录问题、会话不同步等，并指出Anthropic内部主要使用命令行而非桌面端，应用仅是为了‘存在’。

不认同

模型与成本策略

Anthropic员工内部使用的Claude版本与外部用户版本完全不同，内部有更好的系统提示词和隐藏功能，导致外部用户体验不佳。

博主通过恶意软件误报等案例说明内部与外部系统提示词存在差异，认为‘我们用的和他们用的完全不一样’，且外部版本测试不够。

认同

模型与成本策略

OpenAI内部员工和外部用户使用的是完全相同的Codex应用和模型，透明度更高。

博主指出OpenAI内部用的甚至可能是阉割版（如测试时关闭搜索工具），外部能拿到的比内部还多，表明工具一致性。

认同

模型与成本策略

Cursor的云端环境能启动带完整图形界面的Linux实例来测试改动，而非仅作为无头代码执行沙盒，能力远超竞品。

博主演示了在浏览器中运行Cursor并启动图形化Linux环境，可运行完整应用进行验证，认为其云端功能领先太多。

认同

模型与成本策略

Cursor押注的是未来完全不需要在本地运行代码，只需通过云端智能体处理任务，并在Slack等工具中直接下达指令并获取验证结果。

博主描述了通过Slack机器人派发任务并收到视频验证的工作流，认为这是端到端的团队解决方案，代表了更远的未来。

认同

模型与成本策略

Cursor在发布前会进行极致测试，甚至通过禁用新模型不告知用户来收集问题，以确保质量。

博主指出Cursor将内部测试版直接推给用户，并采取激进手段验证，体现其对质量投入的疯狂程度。

认同

模型与成本策略

Codex聚焦于解决当下智能体编程的实际问题，通过电脑使用等功能验证修改，提高成功率。

博主认为Codex不赌未来模型无限聪明，而是立足现状，用工具让模型能在实际环境中验证代码，这种实用性更强。

中立

模型与成本策略

Anthropic赌的是模型会变得足够聪明，以至于无需实际运行代码就能直接写对，因此当前诸多限制会随之消失。

博主分析Anthropic的产品策略基于对未来模型能力的乐观预期，当模型够强时，现在的工作流问题就会变得无关紧要。

不认同

模型与成本策略

自2024年12月以来，Anthropic的公开模型没有实质进步，甚至Claude 3.7相对3.5是倒退，而OpenAI模型从GPT-4o到GPT-5.5连续多次大升级，差距成倍拉大。

博主以自己从Claude转用Codex的体验变化为据，指出Anthropic模型停滞，而OpenAI模型连续进步三次，这是Codex变强的根本原因。

不认同

模型与成本策略

Claude Code通过频繁增加酷炫功能来弥补底层模型进步的停滞，以制造仍在不断创新的表象。

博主认为Anthropic因模型没有提升，被迫推出大量看起来有趣的功能来维持进步感，并在Twitter上更有效应。

认同

模型与成本策略

Codex的功能如双击Command截屏直接填充上下文、电脑使用验证修改等，是解决实际问题的实用功能，不易过时。

博主以自身使用体验举例，这些功能不花哨，却真正提升了效率和可靠性，是工程师为解决自身问题而做的设计。

认同

模型与成本策略

OpenAI鼓励开发者基于Codex平台构建工具和集成，Codex应用服务器和CLI的部分开源为第三方开发提供了基础。

博主提到自己的智能体T-Code构建在Codex应用服务器上，并称OpenAI乐于看到人们用其构建未来，生态更开放。

不认同

模型与成本策略

Anthropic试图阻止用户在Claude Code之外进行集成，除非深度绑定其内部生态，以此实现供应商锁定。

博主分析Claude Code的钩子系统停止迭代、不提供编程化调用，是为了避免用户转用其他工具时带走资源，意在锁定。

中立

模型与成本策略

Cursor的Agent SDK发布较晚，且命令行工具曾硬编码限制模型选择，导致无法使用最新模型，集成便利性不足。

博主在集成Cursor时遇到麻烦，需与团队反复沟通才修复模型选择问题，表明其集成优先级长期不高。

认同

模型与成本策略

缺乏动力的开发者适合用Claude Code找回产出感，资深工程师适合极简可靠的Codex，团队协作和非技术人员适合Cursor的云端端到端方案。

博主在结尾给出了基于工具设计哲学的用户适配建议，强调应匹配个人工作流和需求。

认同

模型与成本策略

AI编程工具的选择应基于个人工作流，并允许工具适当重塑流程，不能生搬硬套其他工具的使用方式。

博主以自己试用不同工具的经验为例，说明按工具本身风格使用才能得到更好体验，建议观众都去尝试以找到最适合的。