凤凰体育app官网入口 我把Cursor和Copilot齐扔了: 实测Token从120万砍到4万


Claude Code称霸后,我把Cursor和Copilot齐扔了:实测Token从120万砍到4万
上周,Graphon AI 低调完成 830 万好意思元融资,推出 “pre-model intelligence layer” 来处置企业多模态数据关联贫苦;险些合并技巧,Anthropic 发布了 Dreaming 机制,让 Agent 不详在 session 间自我注目和迭代当作。
这两件事重叠在沿路,让我这个带队作念 AI 测试和企业级 Agent 落地的老兵忍不住把 coding 器具栈又全部重测了一遍。往时半年,咱们团队在里面鼓吹 Agentic workflow,代码关系任务占比卓绝 60%。以前靠请示词 + 简便 RAG 硬刚,当今玩法透澈变了。
实在痛点任务
我选了一个典型的留传系统重构任务:
一个约 2.8 万行 的 Java Spring Boot 行状,触及 6 个微行状调用、老旧 JPA 查询和手写缓存逻辑。条目重组成复古 Agentic payment、当代 observability、添加 guardrails,并输出完整搬动叙述。

第一轮:Cursor 3.1 + Composer 2(4月版块)
使用 Cursor 并行 Agent 模式,喂完整 repo + AGENTS.md。
耗时约 45 分钟 交互,模子在 Sonnet 4.x 和 Opus 间切换。
完成度约 70%,但 payment 轮廓层与 guardrails 出现显著破裂,observability 也漏了中枢 metric。
总 Token 猝然约 120 万,后续东说念主工成就花了 2.5 小时。
中枢问题是:Cursor 在跨文献瞎想上深度不够,碰到跨行状一致性问题时容易堕入局部最优,需要抓续东说念主工纠偏。
第二轮:Claude Code(Opus 4.7 + Dreaming preview)
合并任务,径直扔 repo + 慎重指示,凤凰体育app官网入口先让它 plan 再实行。重要是用上了刚发布的 Dreaming 才能——它会在子任务间主动暂停、自我 review,寻找 pattern 和潜在 bug。
扫数流程灵验交互仅 18 分钟。
Payment 轮廓层处理得非凡合理,guardrails 和 temporal memory 也更干净。
总 Token 猝然约 4.2 万,东说念主工介入仅 40 分钟,合座质地显著着手一个层次。

实在差距就这样大。不是单纯模子更强,而是 Claude Code 的 long-running task handling + self-verification loop,大幅压缩了“请示词拉扯”步伐。
Copilot 也测了。在 inline 补全和小重构上依然率领,但濒临这种跨行状、带 Agentic 语义的任务就力不从心,需要手动照管多个 chat,高下文全靠东说念主脑。
金沙电玩城app官方下载我的中枢不雅点
请示词工程在 Agentic Coding 期间如实正在快速过期。
往时咱们把 80% 的元气心灵花在写齐全 prompt 上,当今更报复的是瞎想 Agent 的“操作系统”:明晰的 AGENTS.md、合理的 repo 结构、器具泄漏情势,以及完整的 feedback loop。Claude Code 的 Dreaming 实质上便是把“东说念主类反念念”这个步伐工程化了。
虽然,不是说 Cursor 和 Copilot 没价值:
Cursor 的 IDE 集成依然顶级,顺适时常小修小补;
Copilot 顺应团队合作的 autocomplete。
我当今的坐褥栈是:Claude Code 主力认真复杂 Agent 任务 + Cursor 赞助裁剪 + Copilot 保留在轻量活水线。

跟着 Agentic AI 从实验走向坐褥(Gartner 量度 2026 年 40% 企业诈欺将镶嵌 task-specific agents),coding 器具的赢输手如故不是“谁的模子更强”,而是谁能信得过把 瞎想-实行-考据 闭环作念好。
传统 RAG 在长高下文模子(Claude 百万 token 级别)眼前被沉着,但 Agentic RAG(带 critic、reflection 和 graph memory)反而变得愈加报复。Graphon AI 推的 pre-model intelligence layer,很可能便是下一块重要拼图。
你当今主力用哪个 coding Agent?
接待在指摘区共享你的实在体验凤凰体育app官网入口,尤其是 Claude Code Dreaming 在践诺情势中的进展,以及你在企业落地中踩过的坑。
