當你的 AI Agent 團隊從 1 個擴展到 12 個,「每個 Agent 該裝什麼 Skill」就不再是偏好問題,而是組織設計問題。

這篇文章整理 2026 年 4 月 24 日的實際審計結果,把原本的 HTML 內部報告轉成部落格可讀版本:你可以直接看到組織架構、Skill 覆蓋率、獨佔瓶頸、完整矩陣觀察,以及下一步該怎麼調整。

原始報告也已公開,可直接查看:HTML 版完整報告

Dashboard

| 指標 | 數值 | |------|------| | Agent 總數 | 12 | | Skill 總數 | 46(39 shared + 7 local) | | 平均 Skills / Agent | 10.8 | | 最多 Skills | Dev CTO(33) | | 最少 Skills | QA Reviewer(0) | | 具備 browse 的 Agent | 11 / 12 |

這裡最值得注意的,不是平均值,而是分佈極不均衡。CTO 幾乎拿走了所有交付、測試、部署類能力;另一方面,Sales 與部分營運角色的工具嚴重不足。

組織架構

這次審計覆蓋的是一個三層式 Agent 組織:

Founder(用戶)
  └── Operations(CEO)
        ├── Secretary(COO)
        │     ├── Content
        │     └── HRBP
        ├── Dev(CTO)
        │     ├── PM(CPO)
        │     └── Designer
        ├── Finance(CFO)
        │     └── Data Analyst
        └── Marketing(CMO)
              └── Sales(CRO)

QA Reviewer 獨立存在,維持 read-only 審查角色

職責分工本身很合理:CEO 做全局協調,四個 C-level 各自管垂直領域,底下 IC 承接專業工作,QA Reviewer 保持獨立審查。

真正的問題不在 org chart,而在 skill chart。

各 Agent 概況

| Agent | Skills | 關鍵觀察 | |------|------:|------| | Operations(CEO) | 15 | 全局協調完整,但缺 shipreview,無法直接推動關鍵交付 | | Secretary(COO) | 11 | 適合日常營運,但少 codexdesign-html | | Dev(CTO) | 33 | 配置最完整,也是明顯瓶頸 | | Finance(CFO) | 10 | 財務基礎足夠,但少 benchmarkautoplan | | Marketing(CMO) | 10 | 管部落格卻少 shipcodex,技術自主性不足 | | Content | 9 | 適合知識管理,但少自動化與視覺化能力 | | HRBP | 10 | 組織管理能力不錯,適合再補 retrocheckpoint | | PM(CPO) | 13 | Review 類能力完整,但少 benchmarkcheckpointretro | | Designer | 10 | 設計工具鏈完整,但少 investigateqa-only | | Data Analyst | 9 | 分析能力不錯,但缺 design-htmlautoplan | | Sales(CRO) | 6 | 運營角色中最弱,缺核心戰力 | | QA Reviewer | 0 | 零 skill 是刻意設計,為了保持審查獨立性 |

三個關鍵發現

1. CTO 獨佔太多技能,形成系統性瓶頸

Dev(CTO)獨佔的能力不只是「比較多」,而是集中在最關鍵的交付鏈路:

  • ship
  • review
  • qa
  • qa-only
  • canary
  • freeze
  • unfreeze
  • guard
  • health
  • land-and-deploy
  • setup-deploy
  • document-release
  • gstack-upgrade

這代表任何要發布、驗收、部署、健康檢查的任務,最後都得經過 CTO。這不是專業分工,而是單點故障。

最直接的修補方式:

  1. ship 開放給 CEO。
  2. qa-only 開放給 Designer。
  3. 視實際流程,再把 review 逐步擴散給 PM 或其他適合的角色。

2. Sales 的工具太少,不足以承擔營收任務

Sales(CRO)只有 6 個 skills,是整個運營線裡最弱的一個角色。缺的是三種會直接影響營收效率的能力:

  • investigate:客戶深度調研
  • design-html:提案頁面與銷售素材
  • codex:CRM 與流程自動化

如果 Sales 只能聊天、不能調研、不能快速做提案、不能自動化 pipeline,那這個角色的天花板會很低。

3. Marketing 管內容,卻沒有內容交付能力

Marketing(CMO)管理部落格與內容增長,但沒有 shipreviewcodex。結果是每次想推部落格更新,都得繞道 CTO。

這種配置會讓行銷工作流卡住在工程交接,而不是卡在內容本身。對內容站來說,這是很不必要的摩擦。

Skill 普及度排行

幾乎全員標配

  • browse:11 / 12
  • careful:11 / 12
  • learn:11 / 12
  • para-memory-files:11 / 12

這四個 skill 基本上就是 Agent 團隊的底線配備。

中度普及

  • investigate:8 / 12
  • checkpoint:6 / 12
  • office-hours:6 / 12
  • plan-eng-review:6 / 12
  • codex:5 / 12

其中最值得警覺的是 investigate。它其實是基礎能力,但現在還沒做到全員化。

低覆蓋但高價值

  • design-html:只有 Marketing 與 Designer 具備
  • autoplan:只有 CEO 與 CTO 具備
  • retro:只有 CEO 與 CTO 具備

這不是稀有能力,而是尚未擴散的高槓桿能力。像 Data Analyst、Secretary、Content 都很適合補上 design-html;CFO、PM 很適合補 autoplan;HRBP、PM 很適合補 retro

Skill × Agent 矩陣的核心觀察

看完整矩陣後,可以整理出四個重點:

  1. 基礎四件套 browsecarefullearnpara-memory-files 覆蓋率達 92%,這是好的。
  2. investigate 還沒有變成真正的基礎能力,CMO、Designer、Sales 都缺。
  3. 設計輸出能力集中在 Marketing + Designer,但其實 Data Analyst、Secretary、Content 都有明顯需求。
  4. Paperclip 管理相關能力集中在 CTO + HRBP,這個分工反而是合理的。

獨佔 Skills

只有一個 Agent 使用的 skills,通常不是特色,而是風險訊號。

CTO 獨佔

  • ship
  • freeze
  • unfreeze
  • guard
  • health
  • canary
  • cso
  • qa
  • qa-only
  • land-and-deploy
  • setup-deploy
  • document-release
  • gstack-upgrade

其他低擴散技能

  • devex-review:只有 PM
  • plan-devex-review:只有 CEO + PM
  • benchmark:只有 Dev + Data Analyst

這些技能不一定都要全員化,但至少要刻意決定它們為什麼只在這些位置,而不是自然長成技能孤島。

改善建議

高優先

  1. Sales 新增 investigatedesign-htmlcodex
  2. Marketing 新增 investigateshipcodex
  3. 拆散 CTO 的獨佔能力,先從 CEO 的 ship、Designer 的 qa-only 開始

中優先

  1. investigate 補到 CMO、Designer、Sales
  2. checkpoint 補到 HRBP、PM、Designer
  3. design-html 補到 Data Analyst、Secretary、Content

低優先

  1. retro 補到 HRBP、PM
  2. autoplan 補到 CFO、PM
  3. benchmark 補到 PM
  4. QA Reviewer 維持零 skill,但可以評估是否給 browse 做外部標準驗證

快速行動清單

如果你只想今天就動手,這 10 項最值得先做:

| Agent | 建議新增 Skills | 原因 | |------|------|------| | Sales | investigate, design-html, codex | 客戶調研、提案製作、CRM 自動化 | | Marketing | investigate, ship, codex | 競品分析、部落格自主部署、腳本能力 | | Designer | investigate, qa-only | 用研與設計 QA 自主測試 | | Secretary | codex, design-html | 日常營運自動化、會員通知頁面 | | Finance | benchmark, autoplan | KPI 追蹤、月度結帳規劃 | | Content | codex, design-html | 知識整理自動化、視覺化輸出 | | Data Analyst | design-html, autoplan | 報告視覺化、分析計畫 | | Operations | ship, review | CEO 可直接推動交付與審查 | | HRBP | retro, checkpoint | 團隊回顧、長任務保存 | | PM | benchmark, checkpoint, retro | 指標追蹤、進度保存、迭代回顧 |

這份審計背後的設計原則

這次盤點再次驗證幾個很實用的原則:

  1. 基礎能力要全員化,否則協作成本會飆高。
  2. 技能缺口還能補,技能瓶頸更危險,因為它會卡住整條交付鏈。
  3. QA Reviewer 保持零 skill 是合理的,因為審查角色要盡量避免工具偏見。
  4. 真正的差異化不在 shared skills,而在各角色的 local skills 與授權邊界。

如果你也在經營多 Agent 團隊,最值得先做的不是追求更厲害的 agent,而是先檢查:有沒有哪一個 agent 已經變成你整個系統的單點故障。


本文基於 2026-04-24 的實際 Agent Team Skill Audit 報告整理。原始版本為內部 HTML 報告,現已轉為公開閱讀版並保留完整報告連結。