這個單元解決什麼問題工具太多、更新太快,與其記住每個產品名,不如建立一張「以介面型態分類」的地圖,把任何新工具快速對位。這個單元給你這張地圖,並標出截至 2026-05 的主要產品矩陣與正在收斂的跨工具標準。註:每個人都有自己一套對位方式,所以務必有自行決斷的能力。
學習目標
- 能用「介面型態」(對話 / CLI 代理 / IDE 代理 / 桌面代理 / 雲端代理)分類任何 AI 工具。
- 能畫出四大供應商加 Cursor 的產品矩陣,並說出各自的定位。
- 能解釋
AGENTS.md跨工具標準為何重要,以及它正在收斂什麼。 - 能分辨「訂閱制」與「API 計費」兩種使用模式的成本結構差異。
1. 以介面型態分類(核心地圖)
記產品名是徒勞的,這個領域每兩週就有新發布。真正穩定的是介面型態:模型透過什麼形式跟你互動、它能動到什麼、你在哪裡介入。先建立這張地圖,之後任何新工具進來,你只需要問「它是哪一型」,就知道它大概怎麼設定、風險在哪、跟你現有工作流怎麼接。 用兩個判準切:人介入程度(你每一步都要批准,還是派完任務就走)與可動範圍(它只能輸出文字,還是能讀寫你的檔案、執行指令、開 PR)。| 型態 | 人介入程度 | 可動範圍 | 代表(截至 2026-05) |
|---|---|---|---|
| 對話助理 | 每一步都看著 | 僅文字輸出 | Claude.ai、ChatGPT、Gemini |
| CLI 代理 | 審批關卡 | 讀寫檔案、執行指令 | Claude Code、Codex CLI、Antigravity agy CLI |
| IDE 代理 | 編輯器內審批 | 工作區檔案 | Cursor、Antigravity、Copilot |
| 桌面代理 | 目標導向、少介入 | 本機檔案與應用 | Claude Cowork |
| 雲端代理 | 派任務後非同步 | 雲端沙箱、開 PR | Copilot coding agent、Codex cloud、Jules |
2. 四大供應商產品矩陣(截至 2026-05)
把五型對到供應商,得到這張矩陣。重點不是背它,是看出「每家都在往多型擴張」這個趨勢,沒有哪家只做一型。| 介面型態 | Anthropic Claude(主範本) | OpenAI | GitHub / Microsoft | Cursor(Anysphere) | |
|---|---|---|---|---|---|
| 對話助理 | Claude.ai | ChatGPT | Gemini | Copilot Chat | (內建 chat) |
| CLI 代理 | Claude Code | Codex CLI | Antigravity agy CLI | Copilot CLI | (無獨立 CLI) |
| IDE 代理 | (透過 Claude Code / 擴充) | Codex IDE 擴充 | Antigravity IDE | Copilot(VS Code) | Cursor 本體 |
| 桌面代理 | Claude Cowork | (無對等獨立產品) | Antigravity 桌面 app | (無對等獨立產品) | (無) |
| 雲端代理 | (Claude Code 雲端執行) | Codex cloud | Jules | Copilot coding agent | Background agents |
- Claude Cowork ≠ Claude Code。Cowork 是給知識工作者的桌面 agentic 產品(目標導向、動本機檔案與應用),Code 是給開發者的 CLI。兩者不同產品、不同介面型態。
- Cursor 是第三方。由 Anysphere 開發,不是任何一家模型供應商的自家產品,它接各家模型。
3. AGENTS.md:跨工具標準的崛起
過去每家工具有自己的專案規則檔:Claude 的CLAUDE.md、Gemini 的 GEMINI.md、Cursor 的 .cursor/rules/、Copilot 的 .github/copilot-instructions.md,而 OpenAI Codex 用的是 AGENTS.md。你換工具,規則就得重寫一遍。這個碎片化正在收斂,收斂的方向正是 Codex 帶頭的那一份 AGENTS.md。
AGENTS.md 是一個開放的 Markdown 格式,用來給代理專案級的指令與脈絡(程式慣例、build 步驟、測試要求)。它源自 OpenAI Codex 的工具鏈,2025-08 釋出,到 2026 已被 60,000+ 開源專案與框架採用,包含 Codex、Cursor、GitHub Copilot、Jules、VS Code、Gemini CLI、Amp、Devin、Factory 等 [1]。
治理面是它能成為標準的關鍵:AGENTS.md 於 2025-12 連同 MCP、goose 一起,捐進 Linux Foundation 旗下新成立的 Agentic AI Foundation(AAIF),由 OpenAI、Anthropic、Block 共同創立,Google、Microsoft、AWS、Bloomberg、Cloudflare 等支持 [1]。也就是說,幾家彼此競爭的供應商,把專案規則檔的標準交給了一個中立基金會託管,這是「不會被單一廠商綁架」的訊號。
4. 訂閱制 vs API 計費
同一個模型,你用哪種帳單拿到,成本結構完全不同。搞錯會在你想自動化時踩坑。- 訂閱制(ChatGPT Plus/Pro、Claude Pro/Max、Gemini AI Pro/Ultra 等):固定月費,用量上限通常是滾動時窗(如每 5 小時、每週的訊息或 token 配額)。適合互動式、人在迴路的日常使用。撞到上限就得等時窗刷新。
- API 計費:按 token 計費(輸入 + 輸出分開計價),無互動式上限,適合自動化、批次、大量程式化呼叫。一個跑整夜的 agent loop 該用 API,不該用訂閱席位去硬撐。
研究者的第三條路:本地推論訂閱與 API 之外,把開源權重模型跑在自己的硬體上(vLLM、SGLang、llama.cpp)是第三個選項。代價是要自己維運與調校,換來的是兩件事:成本(一次性硬體投入取代持續的 token 帳單,大量推論時可能更划算)與隱私(敏感資料不出本機,不經第三方)。對處理未發表資料、受規範資料集的研究工作流,這條路的隱私屬性常常是決定性的,而非成本。三條路怎麼選,取決於你的用量曲線與資料敏感度,不是哪條「比較先進」。
5. 如何持續追蹤地景(而非追星)
這個領域的資訊雜訊比極低,二手「年度盤點」「最強工具排行」多半是 SEO 內容農場或行銷觸及,不是給你決策用的。建立你自己的低噪訊管道:- 訂官方一手來源:各供應商的 changelog 與 release notes、官方工程部落格、Youtube。一手資訊比任何二手整理準、也快。
- 追蹤權威/具影響力人物:如已知的 Anthropic 核心工程師的推文等等。
- 用分類地圖過濾:看到新產品,先問「它是哪一型」,而不是「它有多強」。對位完,你就知道要不要進一步看。大多數新發布對你是不相關的,分類能讓你三秒篩掉。
- 把「值不值得投入」交給框架:一個工具該不該花時間學,不看 star 數、不看別人推薦,看它對你的任務是否真有增益。也或是從高 star 數、他人推薦的項目中去提取或改成更適合自己的工具。這個判斷框架在 03-2。
用地圖對位一個你沒看過的工具:
agy2026-05 的 Google I/O 發布了 Antigravity 2.0,其中一個新東西叫 agy。假設你只看到這個名字,用地圖跑一遍:- 哪一型?它是 CLI(命令列叫用、用 Go 重寫求低記憶體與快啟動),所以是 CLI 代理那一列,可動範圍是讀寫檔案、執行指令。
- 取代了什麼?它是 Gemini CLI 的接替者,Gemini CLI 於 2026-06-18 對 AI Pro/Ultra 停服 [2]。所以如果你本來用 Gemini CLI,這是你的遷移目標。
- 設定大概長怎樣?CLI 代理這型的共通設定面(規則檔、權限/沙箱、MCP)你在 Part II 都學過;Antigravity 體系的具體檔名(
~/.gemini/GEMINI.md、工作區.agents/、MCP 設定~/.gemini/config/mcp_config.json)在 02-6。 - 要不要投入?看你是否在 Gemini 生態、是否需要它的平行子代理。判斷框架走 03-2。
常見誤區
自我檢核
通過本單元的標準
- 拿一個你沒用過的工具名,你能在 30 秒內說出它屬於哪一型、可動範圍多大、設定大概長怎樣嗎?
- 你能說出 Claude Cowork 與 Claude Code 的差異、以及為什麼 Cursor 不算「某家供應商的自家工具」嗎?
- 你能解釋
AGENTS.md收斂的是什麼、以及它由誰治理、為什麼這件事重要嗎? - 一個要跑整夜的自動化任務,你會用訂閱席位還是 API?為什麼?
來源與延伸閱讀
快變動事實標註截至 2026-05;模型版本與產品細節以官方 changelog 為準。- [1] Linux Foundation, “Announces the Formation of the Agentic AI Foundation (AAIF)… AGENTS.md”(治理、創始成員、首批專案),2025. https://www.linuxfoundation.org/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation ;標準站 https://agents.md(截至 2026-05)
- [2] Google Developers Blog, “Transitioning Gemini CLI to Antigravity CLI”(
agy、Gemini CLI 停服日)與 “Google I/O 2026 developer highlights: Antigravity”(2.0 五面平台、I/O 2026 發布),2026. https://developers.googleblog.com/an-important-update-transitioning-gemini-cli-to-antigravity-cli/ ;https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-developer-highlights/(截至 2026-05) - 各供應商產品與設定細節、模型版本:Anthropic https://www.anthropic.com 、OpenAI https://help.openai.com 與 https://developers.openai.com/codex 、Google https://support.google.com/gemini 與 https://ai.google.dev 、GitHub https://docs.github.com/copilot 、Cursor https://cursor.com/docs(截至 2026-05,逐項以官方頁為準)。
- 銜接:02-1 設定的層級模型、02-6 各工具設定對照、03-2 跳脫 star 數的評估框架。