• Garry Tan 的 gstack 把 Claude Code 變成一支虛擬工程團隊,28+ 個 skill 涵蓋從產品拷問到部署監控的完整流程
  • Karpathy 的 AutoResearch 讓 AI agent 自主跑 ML 實驗,兩天 700 個實驗、找到 20 個真實改進
  • Pieter Levels 一人零員工 年收 $3M+,用最無聊的技術棧(PHP + jQuery + SQLite)打造高利潤產品
  • Simon Willison 的 llm 工具 有完整 plugin 生態,是另一種「一個人做所有事」的範本
  • 關鍵共通點:這些大神不是「會寫 code」,而是「會指揮 agent」

Garry Tan:把 Claude Code 變成工程團隊

Y Combinator CEO。他不只在推 AI,他自己就是最 hardcore 的使用者。2026 年的數字很驚人:

  • 每週 10K 行 code
  • 每週 100 個 PR
  • 50 天不間斷
  • 同時跑 10-15 個 agent session
  • 相比 2013 年的自己,產出提升 810 倍

所有東西都開源了。

GitHub Repo

  • garrytan/gstack -- 82.1k stars,23 個專業 slash command,把 Claude Code 變成虛擬工程團隊。CEO、Designer、Eng Manager、QA、Release Manager 角色齊全。技術棧是 TypeScript 74% + Go Template 15% + Shell 7%。
  • garrytan/gbrain -- 5.4k+ stars,AI Agent 的持久化記憶系統。三層架構:Git Brain Repo(Markdown)+ Postgres/pgvector 檢索 + Agent Skills。

gstack 完整 Skill 清單(28+ slash commands)

這是整份報告最值得細看的部分。每一個 skill 背後都是一套完整的 prompt 設計。

Planning & Design(規劃與設計)

  • /office-hours -- YC 式產品拷問,六個 forcing questions
  • /plan-ceo-review -- CEO 模式,找 10-star product,4 種挑戰模式
  • /plan-eng-review -- 鎖定架構、資料流、edge cases、測試覆蓋
  • /plan-design-review -- 設計維度 0-10 評分
  • /plan-devex-review -- DX audit,開發者體驗
  • /design-consultation -- 完整設計系統創建
  • /design-shotgun -- 多方案對比探索
  • /design-html -- Mockup 轉 production HTML

Review & QA(審查與測試)

  • /review -- 找 CI 過但 production 炸的 bug:race conditions、N+1、trust boundary violations
  • /design-review -- 視覺 QA,找 AI slop pattern
  • /devex-review -- 實際跑一遍 getting started flow
  • /qa -- 讀 diff、開真實瀏覽器測每個頁面、自動修 bug
  • /qa-only -- 只報告不修
  • /cso -- OWASP Top 10 + STRIDE 安全審計

Shipping & Deployment(發布與部署)

  • /ship -- sync main, run tests, push, 開 PR
  • /land-and-deploy -- merge + 等 CI + deploy + 驗證 production
  • /canary -- 部署後持續監控
  • /benchmark -- 效能基線追蹤
  • /document-release -- 自動更新文件

Utilities & Power Tools(工具)

  • /browse -- 真實 Chromium 瀏覽器控制
  • /autoplan -- CEO + Design + Eng review 自動串聯
  • /investigate -- 四階段系統化 debug
  • /retro -- 團隊週回顧 + 貢獻分析
  • /learn -- 跨 session 記憶管理
  • /codex -- 用 OpenAI Codex 做獨立 code review
  • /pair-agent -- 跨 agent 協調
  • /careful / /freeze / /guard -- 安全護欄

他怎麼把這些串起來

Garry 的工作流不是一條線,是一張網:

  1. /office-hours -- 驗證想法是否值得做
  2. /plan-ceo-review -- 確保在解決對的問題
  3. /plan-eng-review -- 鎖定架構和技術方案
  4. 實際寫 code -- Claude Code 主力,10-15 個 agent 並行
  5. /review -- 找 production-level bugs
  6. /qa -- 真實瀏覽器跑完所有頁面
  7. /cso -- 安全審計
  8. /ship -- 自動 push + PR
  9. /land-and-deploy -- merge + deploy + 驗證
  10. /canary -- 部署後監控
  11. /retro -- 回顧總結

關鍵不是每一步,而是並行。一個 session 跑 /qa,另一個跑 /review,第三個在寫新 feature,第四個在修 bug -- 全部同時。靠 Conductor 做多 agent 協調,每個 agent 有自己的 tab。

gbrain 記憶架構

gbrain 是三層設計:

  • Layer 1 -- Brain Repo:Git 倉庫裡的 Markdown 檔案,人類可讀的 source of truth
  • Layer 2 -- GBrain Retrieval:Postgres + pgvector,hybrid search(全文 + 向量)
  • Layer 3 -- Agent Skills:讓 AI agent 直接查詢和寫入記憶

預設用 PGLite(WASM 嵌入式 Postgres 17.5),零依賴啟動。當記憶超過 1000 個檔案,用 gbrain migrate --to supabase 遷移到雲端。Supabase Pro $25/月可以撐 45,000 頁。

相關生態 Repo

  • paperclipai/paperclip -- Zero-human company 編排系統。Node.js server + React UI,管理 AI agent 團隊的目標、預算、審批。
  • openclaw/openclaw -- 350k+ stars,2026 年 GitHub 史上增長最快的項目。個人 AI 助手,跑在你自己的裝置上,支援 WhatsApp/Telegram/Slack/Discord/iMessage。

Andrej Karpathy:Vibe Coding 教父的完整武器庫

OpenAI 共同創辦人、Tesla AI 前總監。他 coin 了 "vibe coding" 這個詞,自己已經好幾個月沒手寫 code 了。他的每一個 repo 都是教科書級別的極簡主義。

完整 GitHub Repo 清單

  • autoresearch -- 76.2k stars,AI agent 自主跑 ML 研究。給一個 GPU,過一夜自動跑 80-100 個實驗
  • nanoGPT -- 57.1k stars,最簡單、最快的中型 GPT 訓練/微調 repo,社群 LLM 教育入門標竿
  • nanochat -- 52.4k stars,用 $100 訓練出能用的 ChatGPT,nanoGPT 的聊天版本
  • LLM101n -- 36k+ stars,Eureka Labs 的旗艦課程:從零到一建 Storyteller AI
  • llm.c -- 29.7k stars,純 C/CUDA 訓練 LLM,沒有 Python,沒有 PyTorch
  • llama2.c -- 19.4k stars,一個 C 檔案就能推理 Llama 2
  • micrograd -- 15.6k stars,用最少 code 實現自動微分和神經網路,PyTorch 核心概念濃縮到幾百行
  • minbpe -- 10.4k stars,BPE tokenizer 的最小實現
  • build-nanogpt -- 4.8k stars,從零建 nanoGPT 的教學 repo,每個 commit 都是一步
  • microgpt -- GitHub Gist,200 行純 Python,零依賴,訓練+推理一個 GPT,十年功力的結晶

AutoResearch 架構詳解

核心思路很簡單:讓 AI Agent 當研究員

你在 program.md 寫下研究方向,指向一個 AI coding agent,然後去睡覺。早上醒來,你有一個 git history 記錄了所有經過驗證的改進。

三個關鍵檔案:

  • prepare.py(不可修改)-- 資料準備 + 評估。BPE tokenizer 8192 詞彙、訓練語料處理、定義 val_bpb 驗證指標
  • train.py(agent 修改)-- GPT 模型、optimizer、訓練循環。這是 agent 唯一能改的檔案
  • program.md(人類撰寫)-- 同時承載三個功能:指令(搜尋什麼)、約束(不能改什麼)、停止條件(何時結束)

每個實驗固定 5 分鐘 wall-clock time。成功指標是 val_bpb(validation bits per byte),越低越好。流程:修改 code -> 訓練 -> 評估 -> 保留/丟棄 -> 重複。一晚上 80-100 個實驗。

實際成果:對著已經優化過的 nanochat 跑了兩天,約700 個實驗,找到約20 個真實改進。發布當天 860 萬次瀏覽。

Dobby -- 不是玩具,是他真的在用的智慧管家

Dobby(哈利波特的家養精靈)是跑在 OpenClaw 上的 AI agent,控制 Karpathy 家裡的:音響系統、燈光、安防、窗簾、HVAC、泳池和 SPA。之前管理這些需要六個 app,現在只要發 WhatsApp 訊息。

技術上,Dobby 會自動掃描本地網路發現裝置、逆向工程未公開的 API(比如 Sonos endpoints)、從網路上找 API 文件來學習控制方法。完全不需要手動配置,還能監控快遞到貨發圖片提醒。

Dobby 本身沒有開源,但底層的 OpenClaw 是開源的。

Karpathy 的工具選擇邏輯

他說自己處於一種 "psychosis" 狀態,因為 AI 能做的事太多了:

  • 快速原型 -> Windsurf / Cursor
  • 架構強化 -> Claude Code / GitHub Copilot
  • ML 研究 -> 自己的 AutoResearch 框架
  • 日常生活 -> OpenClaw + Dobby

他反覆強調:vibe coding 是驚人的生產力倍增器,但不能替代架構智慧。


Pieter Levels:一個人打天下的極致

一個人,零員工,年營收 $3M+。70+ 個失敗產品後找到了公式。他證明了一個人加 AI 工具可以做到什麼程度。

產品清單與月營收

| 產品 | 網址 | MRR | 說明 | |------|------|-----|------| | PhotoAI | photoai.com | ~$105-138K | AI 照片生成器,占總收入 70% | | Fly Pieter | fly.pieter.com | ~$75-100K | 3 小時用 Cursor 做的飛行模擬器,12 天達 $1M ARR | | InteriorAI | interiorai.com | ~$42-45K | AI 室內設計 mockup,99% 利潤率,零人工 | | RemoteOK | remoteok.com | ~$41K | 遠端工作職缺平台,2015 年創建 | | NomadList | nomadlist.com | ~$20-25K | 數位遊牧城市排名 | | AvatarAI | avatarai.me | 已下降 | AI 頭像生成器,首週賺 $150K |

反直覺的技術棧

  • 後端:PHP。對,就是 PHP。PhotoAI.com 是 14,000 行原始 PHP + inline HTML/CSS/JS
  • 前端:jQuery + $.ajax + float:left。沒有 React,沒有 TypeScript,沒有 flexbox
  • 資料庫:SQLite
  • AI 工具:GPT-4 做內容審核,Stable Diffusion 做圖像生成
  • 開發工具:Cursor AI(2025 後全面轉向)
  • 部署:單機 VPS

為什麼?他的哲學是:用最簡單的工具,最快地驗證市場。複雜度是利潤的敵人。 當 InteriorAI 99% 利潤率、零人工運營時,你不需要 React + TypeScript + Kubernetes。

Fly Pieter:3 小時做出 $1M ARR 產品的過程

  1. 打開 Cursor,輸入 "make a 3d flying game in browser with skyscrapers"
  2. Cursor 用 Three.js 生成基礎 3D 場景
  3. 用 Claude 3.7 Sonnet + Grok 3 迭代添加功能
  4. 加上射擊氣球、建築倒塌、行動端適配
  5. 用 ChatGPT debug 重複功能
  6. PeerJS + WebSockets 做多人聯機
  7. Stripe 接支付
  8. 發 Twitter -> 病毒式傳播

Levels 的核心原則:一個人做所有事、用最 boring 的技術棧、快速發布快速驗證、公開透明、一個 idea 不行就換下一個(70+ 次失敗)。


其他值得追蹤的人和 Repo

Simon Willison -- SQLite + LLM 生態系的大神

Django 共同創辦人,955 個 GitHub repo。他做的每一個工具都是「一個人夠用」的極簡哲學。

  • simonw/llm -- 11.7k stars,命令列 LLM 工具。支援 OpenAI/Anthropic/Gemini/Llama/Ollama,對話存 SQLite,有 plugin 系統(tools/models/embeddings/fragments),可以讓 LLM 在終端跑工具
  • simonw/datasette -- 11k stars,任何 SQLite 資料庫一鍵變成可互動網站 + API
  • simonw/sqlite-utils -- ~2k stars,SQLite 操作的 Python CLI 和函式庫
  • simonw/shot-scraper -- ~2.3k stars,命令列網頁截圖工具

Simon 的 llm 工具支援六種 hook:register_commands、register_models、register_embedding_models、register_tools、register_template_loaders、register_fragment_loaders。任何人都可以寫 plugin 擴展功能。這跟 Garry Tan 的 gstack skill 體系是類似的思路,但更底層、更靈活。

Agent 框架四大選手

| 框架 | Stars | 適合場景 | |------|-------|---------| | AutoGPT | 183k | 最早的自主 AI agent,2026 年已演化成完整平台,可視化 workflow builder + marketplace | | CrewAI | 47.8k | 多 agent 角色扮演,純 Python 不依賴 LangChain,PyPI 總下載 27M | | LangGraph | 29.8k | Graph-based agent 編排,durable execution + human-in-the-loop,Klarna/Replit/Elastic 在用 | | BabyAGI | 20k+ | 最早的 task-driven agent loop,學習 agent 基本概念的最佳起點 |

AI 編碼工具三巨頭

| 工具 | Stars | 定位 | |------|-------|------| | Claude Code | 115k | Anthropic 官方終端 AI 編碼工具,gstack 的基座 | | OpenAI Codex CLI | ~75k | Rust 寫的,追求速度,支援 GPT-5.5 | | Claude Agent SDK | -- | Anthropic 官方 Agent SDK,Python + TypeScript |

AI 平台

| 平台 | Stars | 說明 | |------|-------|------| | OpenClaw | 350k+ | 個人 AI 助手,本地運行,連接 50+ 平台 | | Dify | 138k+ | 開源 LLM 應用開發平台,可視化 workflow builder | | Open WebUI | 132k | 自架 AI 介面,支援 Ollama,282M+ downloads | | Chatbot UI | 33.1k | McKay Wrigley 做的開源 AI 聊天介面 |

McKay Wrigley 還有幾個值得看的 repo:ai-code-translator(4.2k stars,AI 跨語言 code 翻譯器)、paul-graham-gpt(2.7k stars,對 Paul Graham 文章做 RAG)、mckays-app-template(1.9k stars,全端專案模板)。


一句話總結

這些大神的共同點不是他們「會寫 code」,而是他們會指揮 agent。Garry Tan 靠 gstack 把品質管控自動化,Karpathy 讓 AI 自己跑實驗,Pieter Levels 用最簡單的工具最快驗證市場。

Karpathy 說得好:「閒置的 token 代表你是瓶頸,你的委派速度不夠快。」

下一篇會整理具體可以拿來用的工具箱:AI side project 靈感、CLAUDE.md 配置範例、MCP server 推薦清單。