AI 大神工作流拆解：Garry Tan、Karpathy、Pieter Levels 怎麼用 AI

Garry Tan 的 gstack 把 Claude Code 變成一支虛擬工程團隊，28+ 個 skill 涵蓋從產品拷問到部署監控的完整流程
Karpathy 的 AutoResearch 讓 AI agent 自主跑 ML 實驗，兩天 700 個實驗、找到 20 個真實改進
Pieter Levels 一人零員工 年收 $3M+，用最無聊的技術棧（PHP + jQuery + SQLite）打造高利潤產品
Simon Willison 的 llm 工具 有完整 plugin 生態，是另一種「一個人做所有事」的範本
關鍵共通點：這些大神不是「會寫 code」，而是「會指揮 agent」

Garry Tan：把 Claude Code 變成工程團隊

Y Combinator CEO。他不只在推 AI，他自己就是最 hardcore 的使用者。2026 年的數字很驚人：

每週 10K 行 code
每週 100 個 PR
50 天不間斷
同時跑 10-15 個 agent session
相比 2013 年的自己，產出提升 810 倍

所有東西都開源了。

GitHub Repo

garrytan/gstack -- 82.1k stars，23 個專業 slash command，把 Claude Code 變成虛擬工程團隊。CEO、Designer、Eng Manager、QA、Release Manager 角色齊全。技術棧是 TypeScript 74% + Go Template 15% + Shell 7%。
garrytan/gbrain -- 5.4k+ stars，AI Agent 的持久化記憶系統。三層架構：Git Brain Repo（Markdown）+ Postgres/pgvector 檢索 + Agent Skills。

gstack 完整 Skill 清單（28+ slash commands）

這是整份報告最值得細看的部分。每一個 skill 背後都是一套完整的 prompt 設計。

Planning & Design（規劃與設計）

/office-hours -- YC 式產品拷問，六個 forcing questions
/plan-ceo-review -- CEO 模式，找 10-star product，4 種挑戰模式
/plan-eng-review -- 鎖定架構、資料流、edge cases、測試覆蓋
/plan-design-review -- 設計維度 0-10 評分
/plan-devex-review -- DX audit，開發者體驗
/design-consultation -- 完整設計系統創建
/design-shotgun -- 多方案對比探索
/design-html -- Mockup 轉 production HTML

Review & QA（審查與測試）

/review -- 找 CI 過但 production 炸的 bug：race conditions、N+1、trust boundary violations
/design-review -- 視覺 QA，找 AI slop pattern
/devex-review -- 實際跑一遍 getting started flow
/qa -- 讀 diff、開真實瀏覽器測每個頁面、自動修 bug
/qa-only -- 只報告不修
/cso -- OWASP Top 10 + STRIDE 安全審計

Shipping & Deployment（發布與部署）

/ship -- sync main, run tests, push, 開 PR
/land-and-deploy -- merge + 等 CI + deploy + 驗證 production
/canary -- 部署後持續監控
/benchmark -- 效能基線追蹤
/document-release -- 自動更新文件

Utilities & Power Tools（工具）

/browse -- 真實 Chromium 瀏覽器控制
/autoplan -- CEO + Design + Eng review 自動串聯
/investigate -- 四階段系統化 debug
/retro -- 團隊週回顧 + 貢獻分析
/learn -- 跨 session 記憶管理
/codex -- 用 OpenAI Codex 做獨立 code review
/pair-agent -- 跨 agent 協調
/careful / /freeze / /guard -- 安全護欄

他怎麼把這些串起來

Garry 的工作流不是一條線，是一張網：

/office-hours -- 驗證想法是否值得做
/plan-ceo-review -- 確保在解決對的問題
/plan-eng-review -- 鎖定架構和技術方案
實際寫 code -- Claude Code 主力，10-15 個 agent 並行
/review -- 找 production-level bugs
/qa -- 真實瀏覽器跑完所有頁面
/cso -- 安全審計
/ship -- 自動 push + PR
/land-and-deploy -- merge + deploy + 驗證
/canary -- 部署後監控
/retro -- 回顧總結

關鍵不是每一步，而是並行。一個 session 跑 /qa，另一個跑 /review，第三個在寫新 feature，第四個在修 bug -- 全部同時。靠 Conductor 做多 agent 協調，每個 agent 有自己的 tab。

gbrain 記憶架構

gbrain 是三層設計：

Layer 1 -- Brain Repo：Git 倉庫裡的 Markdown 檔案，人類可讀的 source of truth
Layer 2 -- GBrain Retrieval：Postgres + pgvector，hybrid search（全文 + 向量）
Layer 3 -- Agent Skills：讓 AI agent 直接查詢和寫入記憶

預設用 PGLite（WASM 嵌入式 Postgres 17.5），零依賴啟動。當記憶超過 1000 個檔案，用 gbrain migrate --to supabase 遷移到雲端。Supabase Pro $25/月可以撐 45,000 頁。

Andrej Karpathy：Vibe Coding 教父的完整武器庫

OpenAI 共同創辦人、Tesla AI 前總監。他 coin 了 "vibe coding" 這個詞，自己已經好幾個月沒手寫 code 了。他的每一個 repo 都是教科書級別的極簡主義。

完整 GitHub Repo 清單

autoresearch -- 76.2k stars，AI agent 自主跑 ML 研究。給一個 GPU，過一夜自動跑 80-100 個實驗
nanoGPT -- 57.1k stars，最簡單、最快的中型 GPT 訓練/微調 repo，社群 LLM 教育入門標竿
nanochat -- 52.4k stars，用 $100 訓練出能用的 ChatGPT，nanoGPT 的聊天版本
LLM101n -- 36k+ stars，Eureka Labs 的旗艦課程：從零到一建 Storyteller AI
llm.c -- 29.7k stars，純 C/CUDA 訓練 LLM，沒有 Python，沒有 PyTorch
llama2.c -- 19.4k stars，一個 C 檔案就能推理 Llama 2
micrograd -- 15.6k stars，用最少 code 實現自動微分和神經網路，PyTorch 核心概念濃縮到幾百行
minbpe -- 10.4k stars，BPE tokenizer 的最小實現
build-nanogpt -- 4.8k stars，從零建 nanoGPT 的教學 repo，每個 commit 都是一步
microgpt -- GitHub Gist，200 行純 Python，零依賴，訓練+推理一個 GPT，十年功力的結晶

AutoResearch 架構詳解

核心思路很簡單：讓 AI Agent 當研究員。

你在 program.md 寫下研究方向，指向一個 AI coding agent，然後去睡覺。早上醒來，你有一個 git history 記錄了所有經過驗證的改進。

三個關鍵檔案：

prepare.py（不可修改）-- 資料準備 + 評估。BPE tokenizer 8192 詞彙、訓練語料處理、定義 val_bpb 驗證指標
train.py（agent 修改）-- GPT 模型、optimizer、訓練循環。這是 agent 唯一能改的檔案
program.md（人類撰寫）-- 同時承載三個功能：指令（搜尋什麼）、約束（不能改什麼）、停止條件（何時結束）

每個實驗固定 5 分鐘 wall-clock time。成功指標是 val_bpb（validation bits per byte），越低越好。流程：修改 code -> 訓練 -> 評估 -> 保留/丟棄 -> 重複。一晚上 80-100 個實驗。

實際成果：對著已經優化過的 nanochat 跑了兩天，約700 個實驗，找到約20 個真實改進。發布當天 860 萬次瀏覽。

Dobby -- 不是玩具，是他真的在用的智慧管家

Dobby（哈利波特的家養精靈）是跑在 OpenClaw 上的 AI agent，控制 Karpathy 家裡的：音響系統、燈光、安防、窗簾、HVAC、泳池和 SPA。之前管理這些需要六個 app，現在只要發 WhatsApp 訊息。

技術上，Dobby 會自動掃描本地網路發現裝置、逆向工程未公開的 API（比如 Sonos endpoints）、從網路上找 API 文件來學習控制方法。完全不需要手動配置，還能監控快遞到貨發圖片提醒。

Dobby 本身沒有開源，但底層的 OpenClaw 是開源的。

Karpathy 的工具選擇邏輯

他說自己處於一種 "psychosis" 狀態，因為 AI 能做的事太多了：

快速原型 -> Windsurf / Cursor
架構強化 -> Claude Code / GitHub Copilot
ML 研究 -> 自己的 AutoResearch 框架
日常生活 -> OpenClaw + Dobby

他反覆強調：vibe coding 是驚人的生產力倍增器，但不能替代架構智慧。

Pieter Levels：一個人打天下的極致

一個人，零員工，年營收 $3M+。70+ 個失敗產品後找到了公式。他證明了一個人加 AI 工具可以做到什麼程度。

產品清單與月營收

| 產品 | 網址 | MRR | 說明 | |------|------|-----|------| | PhotoAI | photoai.com | ~$105-138K | AI 照片生成器，占總收入 70% | | Fly Pieter | fly.pieter.com | ~$75-100K | 3 小時用 Cursor 做的飛行模擬器，12 天達 $1M ARR | | InteriorAI | interiorai.com | ~$42-45K | AI 室內設計 mockup，99% 利潤率，零人工 | | RemoteOK | remoteok.com | ~$41K | 遠端工作職缺平台，2015 年創建 | | NomadList | nomadlist.com | ~$20-25K | 數位遊牧城市排名 | | AvatarAI | avatarai.me | 已下降 | AI 頭像生成器，首週賺 $150K |

反直覺的技術棧

後端：PHP。對，就是 PHP。PhotoAI.com 是 14,000 行原始 PHP + inline HTML/CSS/JS
前端：jQuery + $.ajax + float:left。沒有 React，沒有 TypeScript，沒有 flexbox
資料庫：SQLite
AI 工具：GPT-4 做內容審核，Stable Diffusion 做圖像生成
開發工具：Cursor AI（2025 後全面轉向）
部署：單機 VPS

為什麼？他的哲學是：用最簡單的工具，最快地驗證市場。複雜度是利潤的敵人。 當 InteriorAI 99% 利潤率、零人工運營時，你不需要 React + TypeScript + Kubernetes。

Fly Pieter：3 小時做出 $1M ARR 產品的過程

打開 Cursor，輸入 "make a 3d flying game in browser with skyscrapers"
Cursor 用 Three.js 生成基礎 3D 場景
用 Claude 3.7 Sonnet + Grok 3 迭代添加功能
加上射擊氣球、建築倒塌、行動端適配
用 ChatGPT debug 重複功能
PeerJS + WebSockets 做多人聯機
Stripe 接支付
發 Twitter -> 病毒式傳播

Levels 的核心原則：一個人做所有事、用最 boring 的技術棧、快速發布快速驗證、公開透明、一個 idea 不行就換下一個（70+ 次失敗）。

其他值得追蹤的人和 Repo

Simon Willison -- SQLite + LLM 生態系的大神

Django 共同創辦人，955 個 GitHub repo。他做的每一個工具都是「一個人夠用」的極簡哲學。

simonw/llm -- 11.7k stars，命令列 LLM 工具。支援 OpenAI/Anthropic/Gemini/Llama/Ollama，對話存 SQLite，有 plugin 系統（tools/models/embeddings/fragments），可以讓 LLM 在終端跑工具
simonw/datasette -- 11k stars，任何 SQLite 資料庫一鍵變成可互動網站 + API
simonw/sqlite-utils -- ~2k stars，SQLite 操作的 Python CLI 和函式庫
simonw/shot-scraper -- ~2.3k stars，命令列網頁截圖工具

Simon 的 llm 工具支援六種 hook：register_commands、register_models、register_embedding_models、register_tools、register_template_loaders、register_fragment_loaders。任何人都可以寫 plugin 擴展功能。這跟 Garry Tan 的 gstack skill 體系是類似的思路，但更底層、更靈活。

Agent 框架四大選手

| 框架 | Stars | 適合場景 | |------|-------|---------| | AutoGPT | 183k | 最早的自主 AI agent，2026 年已演化成完整平台，可視化 workflow builder + marketplace | | CrewAI | 47.8k | 多 agent 角色扮演，純 Python 不依賴 LangChain，PyPI 總下載 27M | | LangGraph | 29.8k | Graph-based agent 編排，durable execution + human-in-the-loop，Klarna/Replit/Elastic 在用 | | BabyAGI | 20k+ | 最早的 task-driven agent loop，學習 agent 基本概念的最佳起點 |

AI 編碼工具三巨頭

| 工具 | Stars | 定位 | |------|-------|------| | Claude Code | 115k | Anthropic 官方終端 AI 編碼工具，gstack 的基座 | | OpenAI Codex CLI | ~75k | Rust 寫的，追求速度，支援 GPT-5.5 | | Claude Agent SDK | -- | Anthropic 官方 Agent SDK，Python + TypeScript |

AI 平台

| 平台 | Stars | 說明 | |------|-------|------| | OpenClaw | 350k+ | 個人 AI 助手，本地運行，連接 50+ 平台 | | Dify | 138k+ | 開源 LLM 應用開發平台，可視化 workflow builder | | Open WebUI | 132k | 自架 AI 介面，支援 Ollama，282M+ downloads | | Chatbot UI | 33.1k | McKay Wrigley 做的開源 AI 聊天介面 |

McKay Wrigley 還有幾個值得看的 repo：ai-code-translator（4.2k stars，AI 跨語言 code 翻譯器）、paul-graham-gpt（2.7k stars，對 Paul Graham 文章做 RAG）、mckays-app-template（1.9k stars，全端專案模板）。

一句話總結

這些大神的共同點不是他們「會寫 code」，而是他們會指揮 agent。Garry Tan 靠 gstack 把品質管控自動化，Karpathy 讓 AI 自己跑實驗，Pieter Levels 用最簡單的工具最快驗證市場。

Karpathy 說得好：「閒置的 token 代表你是瓶頸，你的委派速度不夠快。」

下一篇會整理具體可以拿來用的工具箱：AI side project 靈感、CLAUDE.md 配置範例、MCP server 推薦清單。