跳轉到主要內容
全書術語的一句話定義,採台灣學術繁體中文,英文原名保留。事實主張依官方文件,快變動項標註截至 2026-05。

Part I 基礎與進階認識

token:模型處理文字的最小單位(子詞),非字也非詞;影響成本與上下文佔用。中文常一字 1 至 2 個 token,密度高於英文。 tokenization:把輸入文字切成 token 序列的過程;不同模型用不同 tokenizer,粗估需以官方工具為準。 上下文視窗(context window):模型一次能處理的 token 上限(含輸入與輸出),視窗滿了最舊內容被擠出。 上下文腐化(context rot):上下文接近滿載或中段時模型品質下降的現象;Chroma(2025)測 18 個模型均觀察到 [1]。 lost in the middle:長上下文中,模型對中段資訊的注意力顯著低於開頭與結尾的現象(Liu, et al., 2023)[2]。 上下文工程(context engineering):管理進入上下文視窗的一切(指令、知識、歷史、工具結果),以提升產出品質。Anthropic 定義為「在有限注意力預算內找最大化目標達成率的最小高訊號 token 組」[3]。詳見 01-4 幻覺(hallucination):模型產生看似合理但不正確內容;源於生成式模型優化「像不像」而非「對不對」。 temperature:縮放機率分布銳利度的取樣參數。趨近 0 趨同、趨近 1 趨發散;想可重現就壓低,想發想方案就調高。 top-p(nucleus sampling):只從累積機率達到 p 的候選 token 群裡取樣,動態裁掉長尾。 系統提示(system prompt):平台或開發者設定的指令層,優先序高於使用者輸入,是規則檔的技術基礎。 工具呼叫(tool use / function calling):模型決定呼叫外部工具並把結果以 tool 角色回填上下文的機制;模型只「請求」,harness 才「執行」。 agentic loop:觀察 → 決策 → 行動 → 再觀察的自主迴圈;是 agent 與單純對話的本質差異。 harness:agent 的執行外殼,負責工具執行、權限邊界、狀態持久化、迴圈終止、觀測、kill switch;模型決定能力天花板,harness 決定你拿到幾成。詳見 01-6 augmented LLM:Anthropic 用語,指被檢索、工具、記憶等能力增強過的 LLM;harness 圍繞它運轉。 kill switch:被外部觸發終止 agent 行程的機制;不依賴被入侵的 process 自殺。 heartbeat dead-man switch:長時間任務定期寫心跳,外部 supervisor 偵測心跳停滯就 kill 整個 process group 的死人開關。 prompt engineering:把任務寫成模型可執行規格的設計法;結構化骨架、XML 標籤、Few-Shot、Automated Prompt Optimization(APO)。詳見 01-3 Few-Shot:在 prompt 中放 2 至 3 個範例,把抽象的風格或格式要求校準成模型可對齊的樣板。 APO(Automated Prompt Optimization):以評估函式驅動的自動 prompt 迭代;代表實作為 OPRO(Yang, et al., 2023)[4] 與 DSPy(Khattab, et al., 2023)[5]。 workflow:LLM 與工具被預先以程式路徑編排的系統;步驟與跳轉由你定義,模型只在每個節點內做事。詳見 01-5 agent:LLM 自主決定流程與工具用法的系統;彈性高、可控性低。 DAG(directed acyclic graph):步驟的有向圖;畫出後可平行機會自己浮現(無路徑相連的節點可同時跑)。 Vibe Coding:憑感覺、低結構地讓 AI 寫程式;本 Playbook 主張以設定與驗證取代盲目接受。

Part II 設定與機制

CLAUDE.md:Claude 的記憶與規則檔,分 managed、user、project、local 四層;managed 不可被個人關閉。詳見 04-1 @path 匯入語法:在 CLAUDE.md@path/to/file 匯入其他檔;最多 4 層遞迴;常用 @AGENTS.md 讓 Claude 與其他工具共讀同一份基線。 AGENTS.md:跨工具的開放規則檔標準,由 Linux Foundation 旗下 Agentic AI Foundation 治理;原生支援工具逾二十個,採用專案逾六萬(截至 2026-06)。 Rules(.claude/rules/*.md:模組化規則檔,frontmatter 寫 paths 可綁到 glob;觸及對應檔案時載入,否則不佔 context。詳見 04-2 Skill(SKILL.md:以目錄形式存在的可重用流程,隨需載入;description 寫得好壞決定模型會不會自動叫用。詳見 04-4 漸進式揭露(progressive disclosure):Skill 把昂貴內容拆到 references/scripts/,主檔只放必要入口;降低每次叫用的 context 成本。 Hook:事件驅動的確定性自動化機制(PreToolUse、PostToolUse、Stop、SessionStart 等,截至 2026-06 共 30 個事件),把「模型記得」升級成「系統保證」。詳見 04-6 exit 2 攔截語義:hook 在 PreToolUse 階段 exit 2 等同拒絕該工具呼叫;模型會看到拒絕回饋並調整計畫。 Subagent(子代理):擁有獨立 context window 的子任務執行容器;v2.1 起採內建(Explore、Plan、general-purpose)加自訂兩層結構。詳見 04-10 isolation: worktree:Subagent 用 git worktree 物理隔離檔案系統,支援平行不衝突的子任務。 Plugin:打包 skills、agents、hooks、MCP 與 LSP 設定、背景監控的單元;透過市集或 git URL 分發,namespace 隔離避免同名衝突。詳見 04-8 Marketplace(plugin 市集):官方 claude-plugins-official 與社群 claude-community 兩個公開市集,附 /plugin install 安裝路徑。 Harness 外殼的層次:OpenClaw 等案例研究歸納:Identity(SOUL.md)、Memory(MEMORY.md)、Heartbeat、Tool conventions、Bootstrap、User 等 Markdown 檔在工作區共同組裝 agent 人格與行為。詳見 05-1 MCP(Model Context Protocol):把外部工具與資料源接給模型的開放標準;一個 server 對外暴露 toolsresourcesprompts 三類介面。詳見 04-9 MCP transport:client 與 server 間的傳輸協定;Claude Code 支援 stdio(本機行程)、http(含 streamable-http 別名)、sse(deprecated)、ws。 MCP scope:MCP server 的設定範圍;local(個人、不共享)、project(進版控、需 user approval)、user(個人所有專案)。 CLI-first:能用 CLI 完成的操作優先 CLI,MCP 作為 fallback;CLI 沒有 schema 預載成本、stdout 可裁、可 shell pipe 串接。詳見 04-10

Part III 風險與評估

提示注入(prompt injection):把外部不可信內容誤當指令執行的攻擊;應用層的設計限制,不是模型 bug。詳見 03-3 三重威脅(Willison triple threat):私密資料、不可信內容、對外通道三條件同存時,提示注入從「讓模型說怪話」升級為資料外洩工具。 記憶污染(memory poisoning):跨 session 在記憶中植入載荷,未來 session 組裝時觸發;記憶狹窄、定期輪換是緩解。 供應鏈風險:第三方 Skill、plugin、規則、hook 帶入的安全風險;Snyk ToxicSkills(2026-02)報告 3,984 個公開 skill 約 36% 含 prompt injection [6]。 provenance(來源可溯):元件來源是否具名、可追溯,作為信任訊號。 hidden unicode / bidi 攻擊:藏在零寬字元(U+200B 等)與雙向控制碼(U+202AU+202E)裡的不可見載荷;人類看不到,模型看得到。 飽和檢查(saturation check):benchmark 全數通過代表測試太簡單、缺乏鑑別力;需加 edge case 直到至少一個 model tier 失敗。詳見 03-4 盲信(blind trust):看起來合理就接受的可驗證性盲點;對可驗證主張一律驗證是解毒劑。

Part IV 客製化與自動化(補充概念)

path-scoped rule:以 frontmatter paths: ["src/**/*.ts"] 限定規則只在符合 glob 的檔案觸及時載入的規則檔。詳見 04-2 @-mention 顯式叫用:主對話用 @subagent-name 直接叫用某個 Subagent,不依賴模型依 description 自動觸發。 context: fork:Skill 把自己整段程序丟到一個 Subagent context 內執行;Subagent 用 skills: 預載程序到自己的 context。 heartbeat 排程:OpenClaw 等 harness 採用的定時觸發機制;agent 在排程點被喚醒跑一輪 turn,模擬「在背景值守」。 soul-md / memory-md:OpenClaw 工作區的人格與記憶 Markdown 檔;agent 每次啟動讀自己的「靈魂」才開始工作。詳見 05-1

Part V 評估與案例研究(補充概念)

NemoClaw / always-on agent:NVIDIA 為常駐代理設計的安全外殼;對應企業級 SLA、團隊共用基礎設施、統一審計的硬化模式。詳見 05-3 Harness 可視化:OpenClaw 把人格、記憶、心跳、工具慣例等拆成可讀的 Markdown 檔,讓使用者能直接審查與修改 agent 設計。

跨單元共通詞

設定層級(config layer):使用者全域層、專案層、本地層的設定分層;層級高的優先序不一定高,由各工具規則決定。詳見 02-1 最小權限原則(least privilege):代理與工具只給任務實際需要的權限;超出即收回。 憑證邊界(credential boundary):代理專用 PAT、個人 PAT、機器帳號之間的隔離邊界。 pre-flight 檢查:執行前的快速核對(權限、訓練退出、機密路徑掃描),避免事後收拾。 mixed 查證(hybrid verification):通用概念直接寫,快變動事實(設定檔名、版本、機制)一律查官方文件。 provenance 標註:在引用、範例、連結旁邊標明來源、作者、日期、可信度。

對應單元