跳轉到主要內容
這個單元解決什麼問題工具太多、更新太快,與其記住每個產品名,不如建立一張「以介面型態分類」的地圖,把任何新工具快速對位。這個單元給你這張地圖,並標出截至 2026-05 的主要產品矩陣與正在收斂的跨工具標準。註:每個人都有自己一套對位方式,所以務必有自行決斷的能力。

學習目標

  • 能用「介面型態」(對話 / CLI 代理 / IDE 代理 / 桌面代理 / 雲端代理)分類任何 AI 工具。
  • 能畫出四大供應商加 Cursor 的產品矩陣,並說出各自的定位。
  • 能解釋 AGENTS.md 跨工具標準為何重要,以及它正在收斂什麼。
  • 能分辨「訂閱制」與「API 計費」兩種使用模式的成本結構差異。

1. 以介面型態分類(核心地圖)

記產品名是徒勞的,這個領域每兩週就有新發布。真正穩定的是介面型態:模型透過什麼形式跟你互動、它能動到什麼、你在哪裡介入。先建立這張地圖,之後任何新工具進來,你只需要問「它是哪一型」,就知道它大概怎麼設定、風險在哪、跟你現有工作流怎麼接。 用兩個判準切:人介入程度(你每一步都要批准,還是派完任務就走)與可動範圍(它只能輸出文字,還是能讀寫你的檔案、執行指令、開 PR)。
型態人介入程度可動範圍代表(截至 2026-05)
對話助理每一步都看著僅文字輸出Claude.ai、ChatGPT、Gemini
CLI 代理審批關卡讀寫檔案、執行指令Claude Code、Codex CLI、Antigravity agy CLI
IDE 代理編輯器內審批工作區檔案Cursor、Antigravity、Copilot
桌面代理目標導向、少介入本機檔案與應用Claude Cowork
雲端代理派任務後非同步雲端沙箱、開 PRCopilot coding agent、Codex cloud、Jules
型態決定風險面,不是品牌同一個供應商會橫跨多型(OpenAI 有對話的 ChatGPT、CLI 的 Codex、雲端的 Codex cloud)。你該警覺的是可動範圍:對話助理最多給你錯資訊,CLI 與雲端代理能改你的檔案、跑你的指令、動你的 repo。可動範圍越大,前置設定(權限、沙箱、審批策略)越不能省,這條線貫穿 Part II 與 03-3。

2. 四大供應商產品矩陣(截至 2026-05)

把五型對到供應商,得到這張矩陣。重點不是背它,是看出「每家都在往多型擴張」這個趨勢,沒有哪家只做一型。
介面型態Anthropic Claude(主範本)OpenAIGoogleGitHub / MicrosoftCursor(Anysphere)
對話助理Claude.aiChatGPTGeminiCopilot Chat(內建 chat)
CLI 代理Claude CodeCodex CLIAntigravity agy CLICopilot CLI(無獨立 CLI)
IDE 代理(透過 Claude Code / 擴充)Codex IDE 擴充Antigravity IDECopilot(VS Code)Cursor 本體
桌面代理Claude Cowork(無對等獨立產品)Antigravity 桌面 app(無對等獨立產品)(無)
雲端代理(Claude Code 雲端執行)Codex cloudJulesCopilot coding agentBackground agents
旗艦模型版本是最高時效的一欄,別背模型代號換得比產品還快。截至 2026-05,Anthropic 旗艦為 Claude 4.x 家族(Opus 4.8 / Sonnet 4.6 / Haiku 4.5),Google Antigravity 2.0 以 Gemini 3.5 Flash 為底。OpenAI GPT 世代版本請以官方 changelog 為準。判斷工具時看介面型態與設定機制,模型版本當作會浮動的參數,用時再查。
兩個命名陷阱先講清楚(沿用 README 第 5 節的澄清):
  • Claude Cowork ≠ Claude Code。Cowork 是給知識工作者的桌面 agentic 產品(目標導向、動本機檔案與應用),Code 是給開發者的 CLI。兩者不同產品、不同介面型態。
  • Cursor 是第三方。由 Anysphere 開發,不是任何一家模型供應商的自家產品,它接各家模型。

3. AGENTS.md:跨工具標準的崛起

過去每家工具有自己的專案規則檔:Claude 的 CLAUDE.md、Gemini 的 GEMINI.md、Cursor 的 .cursor/rules/、Copilot 的 .github/copilot-instructions.md,而 OpenAI Codex 用的是 AGENTS.md。你換工具,規則就得重寫一遍。這個碎片化正在收斂,收斂的方向正是 Codex 帶頭的那一份 AGENTS.md AGENTS.md 是一個開放的 Markdown 格式,用來給代理專案級的指令與脈絡(程式慣例、build 步驟、測試要求)。它源自 OpenAI Codex 的工具鏈,2025-08 釋出,到 2026 已被 60,000+ 開源專案與框架採用,包含 Codex、Cursor、GitHub Copilot、Jules、VS Code、Gemini CLI、Amp、Devin、Factory 等 [1]。 治理面是它能成為標準的關鍵:AGENTS.md 於 2025-12 連同 MCP、goose 一起,捐進 Linux Foundation 旗下新成立的 Agentic AI Foundation(AAIF),由 OpenAI、Anthropic、Block 共同創立,Google、Microsoft、AWS、Bloomberg、Cloudflare 等支持 [1]。也就是說,幾家彼此競爭的供應商,把專案規則檔的標準交給了一個中立基金會託管,這是「不會被單一廠商綁架」的訊號。
對你的實際意義趨勢是專案級規則從「每家一種檔名」往單一 AGENTS.md 收斂,跨工具遷移成本下降。但收斂未完成:各工具對 AGENTS.md 與自家專屬檔的優先序仍不同(Antigravity 視 GEMINI.md 為對 AGENTS.md 的覆寫/補充、未宣告嚴格優先序;Copilot 同時讀 AGENTS.mdCLAUDE.md/GEMINI.md、衝突時取捨非確定性;Cursor 把 AGENTS.md.mdc 的簡化替代)。你現在的務實做法:新專案優先寫 AGENTS.md 放共通規則,工具專屬的少量差異再放各家專屬檔。各工具的精確優先序與檔名見 02-6

4. 訂閱制 vs API 計費

同一個模型,你用哪種帳單拿到,成本結構完全不同。搞錯會在你想自動化時踩坑。
  • 訂閱制(ChatGPT Plus/Pro、Claude Pro/Max、Gemini AI Pro/Ultra 等):固定月費,用量上限通常是滾動時窗(如每 5 小時、每週的訊息或 token 配額)。適合互動式、人在迴路的日常使用。撞到上限就得等時窗刷新。
  • API 計費:按 token 計費(輸入 + 輸出分開計價),無互動式上限,適合自動化、批次、大量程式化呼叫。一個跑整夜的 agent loop 該用 API,不該用訂閱席位去硬撐。
研究者的第三條路:本地推論訂閱與 API 之外,把開源權重模型跑在自己的硬體上(vLLM、SGLang、llama.cpp)是第三個選項。代價是要自己維運與調校,換來的是兩件事:成本(一次性硬體投入取代持續的 token 帳單,大量推論時可能更划算)與隱私(敏感資料不出本機,不經第三方)。對處理未發表資料、受規範資料集的研究工作流,這條路的隱私屬性常常是決定性的,而非成本。三條路怎麼選,取決於你的用量曲線與資料敏感度,不是哪條「比較先進」。

5. 如何持續追蹤地景(而非追星)

這個領域的資訊雜訊比極低,二手「年度盤點」「最強工具排行」多半是 SEO 內容農場或行銷觸及,不是給你決策用的。建立你自己的低噪訊管道:
  • 訂官方一手來源:各供應商的 changelog 與 release notes、官方工程部落格、Youtube。一手資訊比任何二手整理準、也快。
  • 追蹤權威/具影響力人物:如已知的 Anthropic 核心工程師的推文等等。
  • 用分類地圖過濾:看到新產品,先問「它是哪一型」,而不是「它有多強」。對位完,你就知道要不要進一步看。大多數新發布對你是不相關的,分類能讓你三秒篩掉。
  • 把「值不值得投入」交給框架:一個工具該不該花時間學,不看 star 數、不看別人推薦,看它對你的任務是否真有增益。也或是從高 star 數、他人推薦的項目中去提取或改成更適合自己的工具。這個判斷框架在 03-2
用地圖對位一個你沒看過的工具:agy2026-05 的 Google I/O 發布了 Antigravity 2.0,其中一個新東西叫 agy。假設你只看到這個名字,用地圖跑一遍:
  1. 哪一型?它是 CLI(命令列叫用、用 Go 重寫求低記憶體與快啟動),所以是 CLI 代理那一列,可動範圍是讀寫檔案、執行指令。
  2. 取代了什麼?它是 Gemini CLI 的接替者,Gemini CLI 於 2026-06-18 對 AI Pro/Ultra 停服 [2]。所以如果你本來用 Gemini CLI,這是你的遷移目標。
  3. 設定大概長怎樣?CLI 代理這型的共通設定面(規則檔、權限/沙箱、MCP)你在 Part II 都學過;Antigravity 體系的具體檔名(~/.gemini/GEMINI.md、工作區 .agents/、MCP 設定 ~/.gemini/config/mcp_config.json)在 02-6
  4. 要不要投入?看你是否在 Gemini 生態、是否需要它的平行子代理。判斷框架走 03-2
整個對位後,你用一張不變的地圖把一個會變的產品放進了已知座標。這就是這個單元的全部重點。

常見誤區

反模式清單
  • 用供應商記工具:「OpenAI 的那個」「Google 的那個」記不完也對應不上,因為每家都橫跨多型。用介面型態記,地圖才穩定。
  • 把 benchmark 排名當「對我的任務更好」:排行榜測的是平均任務,不是你的任務。某模型在 leaderboard 第一,不代表在你的領域、你的工作流裡更好用。判斷見 03-2
  • 追每一個新發布:每個新工具都有遷移成本與學習成本。看到新東西先用地圖對位、再問「它解決我哪個現有痛點」,沒有就跳過。FOMO 不是技術選型理由。
  • 以為 AGENTS.md 已經是一統標準:收斂在進行中但未完成,各工具優先序不同。把它當「共通層」用,但別假設行為到處一致。

自我檢核

通過本單元的標準
  1. 拿一個你沒用過的工具名,你能在 30 秒內說出它屬於哪一型、可動範圍多大、設定大概長怎樣嗎?
  2. 你能說出 Claude Cowork 與 Claude Code 的差異、以及為什麼 Cursor 不算「某家供應商的自家工具」嗎?
  3. 你能解釋 AGENTS.md 收斂的是什麼、以及它由誰治理、為什麼這件事重要嗎?
  4. 一個要跑整夜的自動化任務,你會用訂閱席位還是 API?為什麼?

來源與延伸閱讀

快變動事實標註截至 2026-05;模型版本與產品細節以官方 changelog 為準。