當你的 AI Agent 團隊從 1 個擴展到 12 個,「每個 Agent 該裝什麼 Skill」就不再是偏好問題,而是組織設計問題。
這篇文章整理 2026 年 4 月 24 日的實際審計結果,把原本的 HTML 內部報告轉成部落格可讀版本:你可以直接看到組織架構、Skill 覆蓋率、獨佔瓶頸、完整矩陣觀察,以及下一步該怎麼調整。
原始報告也已公開,可直接查看:HTML 版完整報告。
Dashboard
| 指標 | 數值 | |------|------| | Agent 總數 | 12 | | Skill 總數 | 46(39 shared + 7 local) | | 平均 Skills / Agent | 10.8 | | 最多 Skills | Dev CTO(33) | | 最少 Skills | QA Reviewer(0) | | 具備 browse 的 Agent | 11 / 12 |
這裡最值得注意的,不是平均值,而是分佈極不均衡。CTO 幾乎拿走了所有交付、測試、部署類能力;另一方面,Sales 與部分營運角色的工具嚴重不足。
組織架構
這次審計覆蓋的是一個三層式 Agent 組織:
Founder(用戶)
└── Operations(CEO)
├── Secretary(COO)
│ ├── Content
│ └── HRBP
├── Dev(CTO)
│ ├── PM(CPO)
│ └── Designer
├── Finance(CFO)
│ └── Data Analyst
└── Marketing(CMO)
└── Sales(CRO)
QA Reviewer 獨立存在,維持 read-only 審查角色
職責分工本身很合理:CEO 做全局協調,四個 C-level 各自管垂直領域,底下 IC 承接專業工作,QA Reviewer 保持獨立審查。
真正的問題不在 org chart,而在 skill chart。
各 Agent 概況
| Agent | Skills | 關鍵觀察 |
|------|------:|------|
| Operations(CEO) | 15 | 全局協調完整,但缺 ship、review,無法直接推動關鍵交付 |
| Secretary(COO) | 11 | 適合日常營運,但少 codex、design-html |
| Dev(CTO) | 33 | 配置最完整,也是明顯瓶頸 |
| Finance(CFO) | 10 | 財務基礎足夠,但少 benchmark、autoplan |
| Marketing(CMO) | 10 | 管部落格卻少 ship、codex,技術自主性不足 |
| Content | 9 | 適合知識管理,但少自動化與視覺化能力 |
| HRBP | 10 | 組織管理能力不錯,適合再補 retro、checkpoint |
| PM(CPO) | 13 | Review 類能力完整,但少 benchmark、checkpoint、retro |
| Designer | 10 | 設計工具鏈完整,但少 investigate、qa-only |
| Data Analyst | 9 | 分析能力不錯,但缺 design-html、autoplan |
| Sales(CRO) | 6 | 運營角色中最弱,缺核心戰力 |
| QA Reviewer | 0 | 零 skill 是刻意設計,為了保持審查獨立性 |
三個關鍵發現
1. CTO 獨佔太多技能,形成系統性瓶頸
Dev(CTO)獨佔的能力不只是「比較多」,而是集中在最關鍵的交付鏈路:
shipreviewqaqa-onlycanaryfreezeunfreezeguardhealthland-and-deploysetup-deploydocument-releasegstack-upgrade
這代表任何要發布、驗收、部署、健康檢查的任務,最後都得經過 CTO。這不是專業分工,而是單點故障。
最直接的修補方式:
- 把
ship開放給 CEO。 - 把
qa-only開放給 Designer。 - 視實際流程,再把
review逐步擴散給 PM 或其他適合的角色。
2. Sales 的工具太少,不足以承擔營收任務
Sales(CRO)只有 6 個 skills,是整個運營線裡最弱的一個角色。缺的是三種會直接影響營收效率的能力:
investigate:客戶深度調研design-html:提案頁面與銷售素材codex:CRM 與流程自動化
如果 Sales 只能聊天、不能調研、不能快速做提案、不能自動化 pipeline,那這個角色的天花板會很低。
3. Marketing 管內容,卻沒有內容交付能力
Marketing(CMO)管理部落格與內容增長,但沒有 ship、review、codex。結果是每次想推部落格更新,都得繞道 CTO。
這種配置會讓行銷工作流卡住在工程交接,而不是卡在內容本身。對內容站來說,這是很不必要的摩擦。
Skill 普及度排行
幾乎全員標配
browse:11 / 12careful:11 / 12learn:11 / 12para-memory-files:11 / 12
這四個 skill 基本上就是 Agent 團隊的底線配備。
中度普及
investigate:8 / 12checkpoint:6 / 12office-hours:6 / 12plan-eng-review:6 / 12codex:5 / 12
其中最值得警覺的是 investigate。它其實是基礎能力,但現在還沒做到全員化。
低覆蓋但高價值
design-html:只有 Marketing 與 Designer 具備autoplan:只有 CEO 與 CTO 具備retro:只有 CEO 與 CTO 具備
這不是稀有能力,而是尚未擴散的高槓桿能力。像 Data Analyst、Secretary、Content 都很適合補上 design-html;CFO、PM 很適合補 autoplan;HRBP、PM 很適合補 retro。
Skill × Agent 矩陣的核心觀察
看完整矩陣後,可以整理出四個重點:
- 基礎四件套
browse、careful、learn、para-memory-files覆蓋率達 92%,這是好的。 investigate還沒有變成真正的基礎能力,CMO、Designer、Sales 都缺。- 設計輸出能力集中在 Marketing + Designer,但其實 Data Analyst、Secretary、Content 都有明顯需求。
- Paperclip 管理相關能力集中在 CTO + HRBP,這個分工反而是合理的。
獨佔 Skills
只有一個 Agent 使用的 skills,通常不是特色,而是風險訊號。
CTO 獨佔
shipfreezeunfreezeguardhealthcanarycsoqaqa-onlyland-and-deploysetup-deploydocument-releasegstack-upgrade
其他低擴散技能
devex-review:只有 PMplan-devex-review:只有 CEO + PMbenchmark:只有 Dev + Data Analyst
這些技能不一定都要全員化,但至少要刻意決定它們為什麼只在這些位置,而不是自然長成技能孤島。
改善建議
高優先
- Sales 新增
investigate、design-html、codex - Marketing 新增
investigate、ship、codex - 拆散 CTO 的獨佔能力,先從 CEO 的
ship、Designer 的qa-only開始
中優先
- 把
investigate補到 CMO、Designer、Sales - 把
checkpoint補到 HRBP、PM、Designer - 把
design-html補到 Data Analyst、Secretary、Content
低優先
- 把
retro補到 HRBP、PM - 把
autoplan補到 CFO、PM - 把
benchmark補到 PM - QA Reviewer 維持零 skill,但可以評估是否給
browse做外部標準驗證
快速行動清單
如果你只想今天就動手,這 10 項最值得先做:
| Agent | 建議新增 Skills | 原因 |
|------|------|------|
| Sales | investigate, design-html, codex | 客戶調研、提案製作、CRM 自動化 |
| Marketing | investigate, ship, codex | 競品分析、部落格自主部署、腳本能力 |
| Designer | investigate, qa-only | 用研與設計 QA 自主測試 |
| Secretary | codex, design-html | 日常營運自動化、會員通知頁面 |
| Finance | benchmark, autoplan | KPI 追蹤、月度結帳規劃 |
| Content | codex, design-html | 知識整理自動化、視覺化輸出 |
| Data Analyst | design-html, autoplan | 報告視覺化、分析計畫 |
| Operations | ship, review | CEO 可直接推動交付與審查 |
| HRBP | retro, checkpoint | 團隊回顧、長任務保存 |
| PM | benchmark, checkpoint, retro | 指標追蹤、進度保存、迭代回顧 |
這份審計背後的設計原則
這次盤點再次驗證幾個很實用的原則:
- 基礎能力要全員化,否則協作成本會飆高。
- 技能缺口還能補,技能瓶頸更危險,因為它會卡住整條交付鏈。
- QA Reviewer 保持零 skill 是合理的,因為審查角色要盡量避免工具偏見。
- 真正的差異化不在 shared skills,而在各角色的 local skills 與授權邊界。
如果你也在經營多 Agent 團隊,最值得先做的不是追求更厲害的 agent,而是先檢查:有沒有哪一個 agent 已經變成你整個系統的單點故障。
本文基於 2026-04-24 的實際 Agent Team Skill Audit 報告整理。原始版本為內部 HTML 報告,現已轉為公開閱讀版並保留完整報告連結。