Anthropic 共同創辦人 Jared Kaplan：Scaling Laws 不是玄學，是他問了個蠢問題問出來的

Scaling Laws 讓 AI 從試錯變成可規劃：模型性能跟算力、資料量、參數量呈現精確的冪次關係，精確到 Kaplan 說「跟物理或天文裡看到的趨勢一樣準」，這讓 AI 進步變成可以投資、可以排程的事。
預訓練 + 強化學習兩個階段都還沒見頂：預訓練學世界知識，強化學習對齊人類意圖，兩邊擴大計算都還在持續變好。
任務時間長度大約每 7 個月翻倍：現在 AI 能可靠完成的任務從秒、分往小時走，照這條曲線外推，會走到幾天、幾週、幾個月。
模糊任務是最後一關：有標準答案的任務（寫程式、解數學）AI 已經很強，因為對錯好定義；但講笑話、寫詩、有品味這種需要細緻獎勵信號的任務，還差得遠。
他的建議：在能力邊界上蓋東西：因為 Claude 4 還有點笨，但 Claude 5 會來，今天蓋一個「還差一點」的產品，明天就被下一代模型推到能用。

原始影片：Jared Kaplan at YC AI Startup School

這場我最大的收穫，一句話：AI 的進步不是碰運氣，而是一條可預測、還沒見頂的曲線——而看懂這件事的人，不該把今天的模型榨乾，該在快速移動的能力邊界上蓋東西。 Kaplan 是 Anthropic 共同創辦人，本來做了大半輩子理論物理，他帶進 AI 的不是某個演算法，是一種「盯著大局、問蠢問題」的習慣，而整套現代 AI 投資邏輯就是這個習慣挖出來的。

為什麼我這樣看？拆成四點給你。

一、Scaling Laws 把 AI 從「碰運氣」變成「工程」

Kaplan 講現代模型訓練分兩段：預訓練（學人類寫的文本、抓詞跟詞之間的相關性）跟強化學習（拿人類回饋去強化有用、誠實、無害的行為）。重點是這兩段都有 Scaling Law——你擴大計算，性能就可預測地變好，而且兩邊都還沒見頂。

他描述發現這件事的當下：

這些美妙的趨勢，跟你在物理學或天文學裡看到的任何東西一樣精確。這讓我們充滿信心，AI 會以非常可預測的方式變得越來越聰明。

我覺得這句話才是整場的核心。一旦進步可預測，AI 就從「研究員碰運氣」變成「投錢、排程、會兌現」的工程問題。Kaplan 自己也很誠實地說，這不是因為 AI 研究員突然變聰明，而是「我們找到一個很簡單的方法系統性地改善 AI，然後我們就一直跑這個流程」。可規劃，正是後面一切外推的前提。

二、那套法則的起點，只是一個物理學家問的蠢問題

而那個方法怎麼來的？他說物理學的訓練就是「盯著大局，問真正愚蠢的問題」。2010 年代大家都在喊大數據，他就問：資料到底要多大才有用？大家都注意到大模型比較好，他就問：到底好多少？就這兩個蠢問題，挖出了背後精確到嚇人的冪次關係。

Kaplan 不是科班出身的 AI 研究者，他從大型強子對撞機、粒子物理、宇宙學一路做到弦理論，做到有點無聊、覺得進展太慢，才被朋友拉進 AI。這個出身很關鍵，因為他帶進來的不是技術，是一種把「大家都默認的趨勢」量到精確的偏執——別人喊口號的地方，他停下來問「你確定是指數嗎」。第一節那條可規劃的曲線，就是這個蠢問題的產物。

三、外推這條曲線：從秒級任務走到月級任務

既然進步可預測，就能往前外推。Kaplan 用兩個軸來看 AI 能力。Y 軸是靈活度（能處理多少種模態、多少種任務），X 軸他覺得更有趣——是一個人要花多久才能完成這個任務。

他引了一個觀察：AI 能可靠完成的任務長度，大約每 7 個月翻倍，現在落在數小時這個量級。照這條線外推，幾年內就會走到 AI 能獨立扛幾天、幾週、甚至幾個月的工作——一群模型合起來做完一整個人類組織、甚至一整個科學社群的事。這就是「可規劃」變成具體時間表的樣子。

四、但邊界跑很快，所以該在邊界上蓋、不是把模型榨乾

外推很猛，他也沒只報喜。要真的解鎖人類等級 AI，他點出三個還沒補上的洞：

組織知識：模型不能只是白紙，得像在公司待過幾年的人那樣懂上下文。
記憶：做長任務時要能追蹤自己的進度、存下來、之後再調用。這是 Claude 4 才開始加進去的。
處理模糊任務：這是他講得最坦白的一塊。寫程式、解數學進步很快，因為對錯好界定，強化學習很好做；但「講個好笑話、寫首好詩、做研究有品味」這種，需要更細緻的獎勵信號，現在還做不好。

他對人類角色講得很準：AI 的智慧形狀跟人不一樣，會做出讓你驚豔的事，也會犯蠢到不行的基本錯誤；但判斷對錯比從頭生成容易，所以人現在最主要的位置，是當那個檢查工作的管理者。

正因為邊界還有洞、而且跑很快，他給創業者的建議才成立：去蓋那些現在還不太成功的東西。因為 Claude 4 還有點笨，但你可以預期 Claude 5 會來把它推到能用——在能力邊界上實驗，因為那條邊界正在快速移動。他還補一句用 AI 來整合 AI：真正的瓶頸不是模型不夠強，是它進步太快，我們根本來不及把它塞進產品、公司、流程裡。

他丟了一個我很有感的類比：電力剛出現時，最笨的用法是把蒸汽機換成電動馬達就收工；真正的價值是重新設計整間工廠怎麼運作。

AI 也一樣，不是把舊流程的某一步換成 AI，是重想整件事怎麼做。

我自己的 takeaway

兩件事黏在我腦袋裡。

第一，蠢問題的價值。Kaplan 整套 Scaling Laws 的起點，是不甘心地追問「你確定是指數嗎？會不會是冪次？是二次的嗎？」我自己在搭 AI 工作流的時候，常常急著往下做，反而沒停下來問那個最笨、最大局的問題。他提醒我，把大趨勢量到更精確，本身就是一種槓桿——因為你會知道往哪推最划算，而別人還在瞎猜。

第二，「在邊界上蓋」跟我搞一人工作流的處境一模一樣。我手上很多自動化現在都還差一口氣、還有點笨，照他的邏輯，這些不該丟掉，該留著等下一代模型把它推過線。我真正該投資的不是把今天的模型榨乾，是把流程設計好——讓底層一換代，整套東西自動變強。這跟他講的「重新設計工廠」是同一回事，只是他在前沿實驗室，我在自己的桌子上。

想聽他怎麼描述那條五個數量級都沒斷的曲線，還有他被問到「什麼情況會讓你相信曲線要變了」時的回答，原片在這：Jared Kaplan at YC AI Startup School。

Anthropic 共同創辦人 Jared Kaplan：Scaling Laws 不是玄學，是他問了個蠢問題問出來的

一、Scaling Laws 把 AI 從「碰運氣」變成「工程」

二、那套法則的起點，只是一個物理學家問的蠢問題

三、外推這條曲線：從秒級任務走到月級任務

四、但邊界跑很快，所以該在邊界上蓋、不是把模型榨乾

我自己的 takeaway

延伸閱讀

François Chollet 說：把模型養大不會生出智慧，缺的是另一種東西

Karpathy 說軟體又變了一次——這次我們是用英文在寫程式

Elon Musk 在 YC 講了 45 分鐘，但真正打到我的是「保持有用」這四個字