全書術語的一句話定義,採台灣學術繁體中文,英文原名保留。事實主張依官方文件,快變動項標註截至 2026-05。
Part I 基礎與進階認識
token:模型處理文字的最小單位(子詞),非字也非詞;影響成本與上下文佔用。中文常一字 1 至 2 個 token,密度高於英文。 tokenization:把輸入文字切成 token 序列的過程;不同模型用不同 tokenizer,粗估需以官方工具為準。 上下文視窗(context window):模型一次能處理的 token 上限(含輸入與輸出),視窗滿了最舊內容被擠出。 上下文腐化(context rot):上下文接近滿載或中段時模型品質下降的現象;Chroma(2025)測 18 個模型均觀察到 [1]。 lost in the middle:長上下文中,模型對中段資訊的注意力顯著低於開頭與結尾的現象(Liu, et al., 2023)[2]。 上下文工程(context engineering):管理進入上下文視窗的一切(指令、知識、歷史、工具結果),以提升產出品質。Anthropic 定義為「在有限注意力預算內找最大化目標達成率的最小高訊號 token 組」[3]。詳見 01-4。 幻覺(hallucination):模型產生看似合理但不正確內容;源於生成式模型優化「像不像」而非「對不對」。 temperature:縮放機率分布銳利度的取樣參數。趨近 0 趨同、趨近 1 趨發散;想可重現就壓低,想發想方案就調高。 top-p(nucleus sampling):只從累積機率達到 p 的候選 token 群裡取樣,動態裁掉長尾。 系統提示(system prompt):平台或開發者設定的指令層,優先序高於使用者輸入,是規則檔的技術基礎。 工具呼叫(tool use / function calling):模型決定呼叫外部工具並把結果以tool 角色回填上下文的機制;模型只「請求」,harness 才「執行」。
agentic loop:觀察 → 決策 → 行動 → 再觀察的自主迴圈;是 agent 與單純對話的本質差異。
harness:agent 的執行外殼,負責工具執行、權限邊界、狀態持久化、迴圈終止、觀測、kill switch;模型決定能力天花板,harness 決定你拿到幾成。詳見 01-6。
augmented LLM:Anthropic 用語,指被檢索、工具、記憶等能力增強過的 LLM;harness 圍繞它運轉。
kill switch:被外部觸發終止 agent 行程的機制;不依賴被入侵的 process 自殺。
heartbeat dead-man switch:長時間任務定期寫心跳,外部 supervisor 偵測心跳停滯就 kill 整個 process group 的死人開關。
prompt engineering:把任務寫成模型可執行規格的設計法;結構化骨架、XML 標籤、Few-Shot、Automated Prompt Optimization(APO)。詳見 01-3。
Few-Shot:在 prompt 中放 2 至 3 個範例,把抽象的風格或格式要求校準成模型可對齊的樣板。
APO(Automated Prompt Optimization):以評估函式驅動的自動 prompt 迭代;代表實作為 OPRO(Yang, et al., 2023)[4] 與 DSPy(Khattab, et al., 2023)[5]。
workflow:LLM 與工具被預先以程式路徑編排的系統;步驟與跳轉由你定義,模型只在每個節點內做事。詳見 01-5。
agent:LLM 自主決定流程與工具用法的系統;彈性高、可控性低。
DAG(directed acyclic graph):步驟的有向圖;畫出後可平行機會自己浮現(無路徑相連的節點可同時跑)。
Vibe Coding:憑感覺、低結構地讓 AI 寫程式;本 Playbook 主張以設定與驗證取代盲目接受。
Part II 設定與機制
CLAUDE.md:Claude 的記憶與規則檔,分 managed、user、project、local 四層;managed 不可被個人關閉。詳見 04-1。@path 匯入語法:在 CLAUDE.md 用 @path/to/file 匯入其他檔;最多 4 層遞迴;常用 @AGENTS.md 讓 Claude 與其他工具共讀同一份基線。
AGENTS.md:跨工具的開放規則檔標準,由 Linux Foundation 旗下 Agentic AI Foundation 治理;原生支援工具逾二十個,採用專案逾六萬(截至 2026-06)。
Rules(.claude/rules/*.md):模組化規則檔,frontmatter 寫 paths 可綁到 glob;觸及對應檔案時載入,否則不佔 context。詳見 04-2。
Skill(SKILL.md):以目錄形式存在的可重用流程,隨需載入;description 寫得好壞決定模型會不會自動叫用。詳見 04-4。
漸進式揭露(progressive disclosure):Skill 把昂貴內容拆到 references/ 與 scripts/,主檔只放必要入口;降低每次叫用的 context 成本。
Hook:事件驅動的確定性自動化機制(PreToolUse、PostToolUse、Stop、SessionStart 等,截至 2026-06 共 30 個事件),把「模型記得」升級成「系統保證」。詳見 04-6。
exit 2 攔截語義:hook 在 PreToolUse 階段 exit 2 等同拒絕該工具呼叫;模型會看到拒絕回饋並調整計畫。
Subagent(子代理):擁有獨立 context window 的子任務執行容器;v2.1 起採內建(Explore、Plan、general-purpose)加自訂兩層結構。詳見 04-10。
isolation: worktree:Subagent 用 git worktree 物理隔離檔案系統,支援平行不衝突的子任務。
Plugin:打包 skills、agents、hooks、MCP 與 LSP 設定、背景監控的單元;透過市集或 git URL 分發,namespace 隔離避免同名衝突。詳見 04-8。
Marketplace(plugin 市集):官方 claude-plugins-official 與社群 claude-community 兩個公開市集,附 /plugin install 安裝路徑。
Harness 外殼的層次:OpenClaw 等案例研究歸納:Identity(SOUL.md)、Memory(MEMORY.md)、Heartbeat、Tool conventions、Bootstrap、User 等 Markdown 檔在工作區共同組裝 agent 人格與行為。詳見 05-1。
MCP(Model Context Protocol):把外部工具與資料源接給模型的開放標準;一個 server 對外暴露 tools、resources、prompts 三類介面。詳見 04-9。
MCP transport:client 與 server 間的傳輸協定;Claude Code 支援 stdio(本機行程)、http(含 streamable-http 別名)、sse(deprecated)、ws。
MCP scope:MCP server 的設定範圍;local(個人、不共享)、project(進版控、需 user approval)、user(個人所有專案)。
CLI-first:能用 CLI 完成的操作優先 CLI,MCP 作為 fallback;CLI 沒有 schema 預載成本、stdout 可裁、可 shell pipe 串接。詳見 04-10。
Part III 風險與評估
提示注入(prompt injection):把外部不可信內容誤當指令執行的攻擊;應用層的設計限制,不是模型 bug。詳見 03-3。 三重威脅(Willison triple threat):私密資料、不可信內容、對外通道三條件同存時,提示注入從「讓模型說怪話」升級為資料外洩工具。 記憶污染(memory poisoning):跨 session 在記憶中植入載荷,未來 session 組裝時觸發;記憶狹窄、定期輪換是緩解。 供應鏈風險:第三方 Skill、plugin、規則、hook 帶入的安全風險;Snyk ToxicSkills(2026-02)報告 3,984 個公開 skill 約 36% 含 prompt injection [6]。 provenance(來源可溯):元件來源是否具名、可追溯,作為信任訊號。 hidden unicode / bidi 攻擊:藏在零寬字元(U+200B 等)與雙向控制碼(U+202A 至 U+202E)裡的不可見載荷;人類看不到,模型看得到。
飽和檢查(saturation check):benchmark 全數通過代表測試太簡單、缺乏鑑別力;需加 edge case 直到至少一個 model tier 失敗。詳見 03-4。
盲信(blind trust):看起來合理就接受的可驗證性盲點;對可驗證主張一律驗證是解毒劑。
Part IV 客製化與自動化(補充概念)
path-scoped rule:以 frontmatterpaths: ["src/**/*.ts"] 限定規則只在符合 glob 的檔案觸及時載入的規則檔。詳見 04-2。
@-mention 顯式叫用:主對話用 @subagent-name 直接叫用某個 Subagent,不依賴模型依 description 自動觸發。
context: fork:Skill 把自己整段程序丟到一個 Subagent context 內執行;Subagent 用 skills: 預載程序到自己的 context。
heartbeat 排程:OpenClaw 等 harness 採用的定時觸發機制;agent 在排程點被喚醒跑一輪 turn,模擬「在背景值守」。
soul-md / memory-md:OpenClaw 工作區的人格與記憶 Markdown 檔;agent 每次啟動讀自己的「靈魂」才開始工作。詳見 05-1。
Part V 評估與案例研究(補充概念)
NemoClaw / always-on agent:NVIDIA 為常駐代理設計的安全外殼;對應企業級 SLA、團隊共用基礎設施、統一審計的硬化模式。詳見 05-3。 Harness 可視化:OpenClaw 把人格、記憶、心跳、工具慣例等拆成可讀的 Markdown 檔,讓使用者能直接審查與修改 agent 設計。跨單元共通詞
設定層級(config layer):使用者全域層、專案層、本地層的設定分層;層級高的優先序不一定高,由各工具規則決定。詳見 02-1。 最小權限原則(least privilege):代理與工具只給任務實際需要的權限;超出即收回。 憑證邊界(credential boundary):代理專用 PAT、個人 PAT、機器帳號之間的隔離邊界。 pre-flight 檢查:執行前的快速核對(權限、訓練退出、機密路徑掃描),避免事後收拾。 mixed 查證(hybrid verification):通用概念直接寫,快變動事實(設定檔名、版本、機制)一律查官方文件。 provenance 標註:在引用、範例、連結旁邊標明來源、作者、日期、可信度。對應單元
- 基礎觀念全貌 → 01-1 為什麼要「正確地」使用 AI 工具
- LLM 與 agent 機制 → 01-2 LLM 與 Agent 的運作基礎
- 上下文工程細節 → 01-4 上下文工程
- 設定層級模型 → 02-1 設定的層級模型
- 隱私安全詞彙 → 附錄 B 隱私與安全設定 checklist、03-3 安全、隱私與供應鏈風險
- 跨工具設定詞彙 → 02-6 其他工具設定對照
- 客製化詞彙 → 04-1 CLAUDE.md 至 04-11 Agent Teams 與 Sub Agent
- 案例研究詞彙 → 05-1 OpenClaw 至 05-4 三條路線比較
- [1] Chroma, “Context Rot in Long-Context Language Models,” 2025. [Online]. Available: https://research.trychroma.com (截至 2026-06 查證;含 18 個模型實測)
- [2] Liu, et al., “Lost in the Middle: How Language Models Use Long Contexts,” 2023. [Online]. Available: https://arxiv.org/abs/2307.03172
- [3] Anthropic, “Effective context engineering for AI agents,” 2026. [Online]. Available: https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
- [4] Yang, et al., “Large Language Models as Optimizers,” 2023. [Online]. Available: https://arxiv.org/abs/2309.03409
- [5] Khattab, et al., “DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines,” 2023. [Online]. Available: https://arxiv.org/abs/2310.03714
- [6] Snyk, “ToxicSkills: 2026 Report on Malicious Skills in the Wild,” 2026. [Online]. Available: https://snyk.io (需確認原始出處:Snyk ToxicSkills 2026-02 報告的可引用 URL)