• 軟體創作的民主化是 Replit 的核心使命:Amjad Masad 認為,當編程不再是工程師的專屬技能,人類史上最大的創意爆發將隨之而來——Replit 要做的是拆掉這道門。
  • AI 代理正在取代傳統軟體工程流程:Replit 的 AI Agent 能從自然語言需求直接生成、部署、測試應用,覆蓋認證、資料庫、支付等完整功能——不只是程式碼補全,而是端到端的軟體建造
  • 「任何人都是創造者」的時代正在到來:當 AI 處理程式碼細節,人類可以專注於「想建什麼」——Masad 認為這是一個創造力將從技術門檻中解放的歷史性時刻。
  • 封閉的反饋迴圈是高品質自主開發的關鍵:有效的軟體開發代理不只需要會寫程式,還需要能執行測試、看見錯誤輸出、自主修正——Agent 的自我修復能力決定了輸出品質。
  • 平台效應是 Replit 的長期護城河:數百萬開發者在 Replit 上建造、分享、部署,這個生態系統帶來的網路效應和資料飛輪,是純 AI 模型無法複製的競爭優勢。
原始影片:https://www.youtube.com/watch?v=lWmDiDGsLK4

Amjad Masad [00:02]

我被要求談談軟體的未來。因此,這次演講的大部分內容將圍繞我們在 Replet 的工作,我們認為軟體的未來方向,以及試著做出一些預測或思考這個時刻的實際意義。如果你回想一下計算機的歷史,主機曾經是那個時代最主流的計算設備。使用主機需要成為專家。隨後個人電腦問世,最初的個人電腦有點像玩具。你購買了一台 Mac,然後使用 Mac Paint 等等,並沒有真正的商業用途。當時人們對 Apple 嘲笑,直到 Excel 的出現。Excel 是在電腦上實際有用的第一款軟體。現在,個人電腦運行著世界經濟。實際上,如果你走進數據中心,那裡也都是個人電腦,都是 x86 電腦。因此,使用的範圍從少數專家所用的工具,變成了一種每個人都能使用的東西。軟體工程也是如此,像現代的軟體工程職業可以追溯到 70 年代,隨著 Unix 和 C 語言的興起,人們開始接受培訓以成為軟體工程師。當時仍需要四、五、六年的大學教育,以及另兩到三年的在職培訓,才能夠非常熟練地完成工作。我認為今天的軟體正在經歷相似的轉變,從只有專家才做的事情,變成任何人都能做的事。而這正是我們建立 Replet 的原因。我在 Replet 工作了近九年,我們的願景始終是解決編程,使每個人都能編寫軟體。因此,我們建立了一個 IDE,構建了語言運行時,構建了在線沙盒環境,建立了部署,建立了圍繞這一切的雲服務。然後當 AI 進入這個場景時,我們意識到我們使命的終極表達就是讓你不需要編碼。編碼是讓更多人製作軟體的瓶頸。因此大約在 23 年底或 24 年初,我們決定將所有資源投入到代理(agents)上。當時,代理的功能僅僅是勉強能用。

Amjad Masad [03:05]

當時,代理的功能僅僅是勉強能用,但你能從一些基準測試中看出它們的發展趨勢。因此,SWEBench 是一個軟體工程基準。它基本上是一組來自主要代碼庫的 GitHub 問題,以及那些問題的單元測試和拉取請求的最終狀態,你測試代理的方式是將其放入一個環境中,讓它解決這些問題中的一些。從 22 年開始你能看出它的功能還很有限,23 年基本開始有些效果,而到了 24 年初,你會注意到我們正沿著這一趨勢前進,可以看出軟體工程正在被自動化,或者說軟體工程的大部分正在被自動化。現在,我認為這個說法有點過時,我們的 SWEBench 目前已經達到了 70% 到 80%。這個基準的飽和並不意味著我們已經自動化了所有的軟體工程,但我們正在朝著製造真正有用的軟體工程代理邁進,坦白說,它們可能已經在那裡了。對於任何代理來說也都是如此,如果在座的各位正在建立某種代理項目,請真心相信這一點。像我不斷告訴我的團隊一樣,我們需要對於今天製造劣質產品保持開放心態,因為兩個月下來模型將會變得更好,而你的業務和產品將突然變得可行。因此,今天是代理瞬息萬變的時期,但能夠編寫代碼的代理其實是容易的部分。困難的部分是圍繞它的基礎設施。有時我稱之為代理存在的棲息地。因此你需要虛擬機,理想情況下在雲中,最好不是在你的計算機上,因為你知道代理其實也可能會搞砸你的計算機,可能會做一些可怕的事情。因此它需要被沙盒化,並且需要可擴展。如果你運行一個像 Replet 這樣的產品,你需要能夠擴展到數百萬用戶,並且需要能夠支持所有編程語言和各種包。當前的軟體工程代理的訓練是在標準的 Linux 環境中進行的。他們需要能夠使用 shell,能夠讀取和寫入文件。但是他們也是需要能夠安裝包,無論是系統級別包、Linux 包,還是語言包。並且在許多情況下,代理希望能夠使用更多的編程語言。因此,目前許多嘗試建立代理的環境都非常受限。

Amjad Masad [05:43]

因此,你所需要的是一個盡可能開放的環境,類似於軟體工程師工作的那種環境。因此你還需要哪些其他東西才能推出真正的軟體呢?你需要部署,你需要數據庫。真的要思考所有你作為軟體工程師所做的一切,所有這些工具都必須對軟體工程代理可用。因此,今天早些時候我看到,如果你在 Karpathy 的演講中,他提到編碼部分是簡單的部分。這與我所提到的觀點類似,但他談到的是真正尚未解決的許多不同問題,但實際上我們已經解決了很多問題。因此,Replet 一開始就配備了不錯的單一登入驗證。最好使用建置的服務。因此,Replet 實際上只需要一行代碼來啟用單一登入。因此當你要求 Replet 代理進行集成時,它會實際使用 Replet 的驗證系統,基本上就像啟用設置一樣,然後你就擁有用戶驗證、用戶管理,這些用戶資訊存儲在數據庫中。顯然,你也可以部署應用程序,可以將域名鏈接到它。我們有秘密管理,有安全的方式來使用 API 密鑰。我們還有後台任務。你知道,許多應用程序需要能夠在後台持續運行,尤其是在這個代理時代。存儲又是,代理需要能夠存儲東西。他們需要能夠從網路上抓取東西,比如圖片、文檔等,並將它們存儲以便未來使用。還有一些其他內容在發展藍圖中,包括通用模型訪問。因此,現在要求模型生成應用程序或對處理圖像或視頻的某種操作真的很麻煩。你必須弄清楚要使用哪個模型。必須獲取 API 密鑰並完成所有這些。在不久的將來,任何你在 Replet 上要求的模型,都會直接在你的應用程序中提供。我們會處理帳單和 API 整合等所有內容。支付非常重要。不僅是用戶為應用程序付費。例如,你在 Replet 上建立一家初創公司,你是創業者,你顯然需要收集用戶付款,但我也認為將來你希望你的代理可以擁有一些錢包以便能夠支付服務。

Amjad Masad [08:08]

能夠支付服務。假設你的代理決定需要一個 Tulio 整合,而 Replet 或你正在使用的其他系統沒有工具整合,那麼它應該能夠在後台輸入信用卡並提供該服務。一個更激進的想法是你的代理需要能夠雇用人。例如,如果它遇到 CAPTCHA,並且不知道如何解決這個 CAPTCHA,應該去傳送任務給某個人,請求一個人幫著解決這個 CAPTCHA。不管是什麼,總有很多任務仍然需要人類參與,你希望你的代理能夠擁有足夠的資金來支付服務。同樣,代理之間的互動也是如此。你希望你的代理能夠進入市場,尋找可以雇用的其他代理。太多的 YC 初創公司正在構建各種代理,例如會計代理、銷售代理,因此你需要你的軟體工程代理能夠集成這些代理。因此,我知道很多人認為 MCP 是一個代理間的工具,但實際上 MCP 是一種更傳統的 RPC 協議。因此,這並不會真正解決這個問題。我們的業務或技術模型中的另一個方面是考慮自主性水平。所以當我幾年前開始探討 Replet 會成為什麼樣子,或許十幾年之前,當前的尖端代碼助手是語言伺服器,對吧?如果你在使用 VS Code,那就是 IntelliSense。你可以將其視為第一級自主性。你知道,如果你考慮一下自駕車或汽車中的駕駛輔助系統,最初的駕駛輔助就是車道輔助,這是第一級。一級 AI 代碼補全助手,這可以視為第二級。第三級是我們在 Replet Agent 創始時所開發的,我會稱之為 3.5。它可以獨立運作約 10 到 15 分鐘,但仍然需要不時得到你的輸入來測試應用程序,確保應用程序正常運行。而現在我們正在開發第 3 版。我會稍後更加詳細地談談第 3 版。第 3 版基本上就像是第四級,就像你幾乎到達了。它仍然需要你關注一些,但實際上其運作相對完全自主。Bore Plus,我假設我們在未來幾年會達到這個目標,你真的可以啟動 1000 個代理,給他們大量的問題,並可靠地確信其中 95% 的問題都會得到解決。

Amjad Masad [10:43]

95% 的問題都會得到解決。那麼任何一位工程師或產品經理,實際上任何人都能生成數百甚至數千個工程師為他們工作。因此,他們需要很少的監督,所以作為程式設計師,您可以以指數的方式增強影響力。所以我們現在在 V3 上工作的問題是,這是基於三個支柱。一個是端到端測試。今天的計算機使用,一些模型稱為計算機使用,如果你曾經使用過 openi operator,這個概念是模型可以進入計算機,像人一樣單擊並使用電腦,但它們速度較慢,成本高且效果不佳,但這就是我早前提到的事情,你想要構建一個在目前可能達到的邊緣,現在邊緣的概念對我來說是計算機使用真的在這些模型能夠達到的最前沿,我認為在接下來的 3 到 6 個月內,它們將變得更好,將創造出一個全新的市場,也可能開始自動化許多真正的工作。一旦我們進行應用程序測試後,你知道,撤回會像這種煩人的事,讓你不斷進行QA開始自己執行 QA,這將使其能夠工作 30、40、甚至 兩小時的工作量。今天的焦點是測試時間計算。如果你考慮一些 03 或者深度學習模型的主要洞察,模型能夠消耗或生成越多的 token,它就變得越智能。現在,像 03 這樣的模型生成大量的 tokens並嘗試推理,但其中很多都是近似的。它無法從環境中獲取回饋。這就像它只是靜坐思考。您想在真正的計算環境中讓模型生成假設並實時測試它的假設。因此,在 Replet,我們建立了一個全可交易的可逆文件系統。所以當您在 Replet 時,您對文件系統所做的每一次編輯都是在時間中的原子快照。這使我們能夠便宜地創建文件系統的副本和寫入分支。因此,我們這方面的想法是,每當遇到棘手的問題,或者如果有相當大的預算,您可以始終開啟它,但每次代理進行重大更改時,它會為自己分叉,並且在不同的方式上多次進行該問題的求解。

Amjad Masad [13:52]

求解,然後找出最佳解決方案,並將該解決方案合併到主要分支中。所以想像一下,當你思考問題時,通常在模擬你可以做的事情的不同分支時,你會有各種不同的假設需要測試。因此,我們也希望使代理能夠這樣操作。因此,在解決任何給定問題時,生成大量不同的處理方式,然後並行測試所有這些方案。這將使代理的可靠性提升兩到三倍。所以這就是採樣和模擬。最後,該模型能夠為它創建的每一個功能生成測試。今天的 Replet 代理經常創建一個功能,然後後來又破壞了那個功能,但這也適用於所有其他程式碼和游標。因此,我們希望確保一旦代理進行了一系列更改或功能,它始終執行測試來確保不會破壞軟體。這實際上比聽起來更為困難,聽起來好像是寫測試然後執行它們,但實際上模型在生成單元測試方面相當糟糕,因此這方面還有很多工作要做。這也需要快速進行,以使其在每次變更時運行。因此,這就是我們在 V3 上正在努力的內容。這是一項大規模的基礎設施工作,想要為代理創造最佳的生存環境,並能夠變得最可靠。但讓我們快轉到我提到的五級自主性。就是我們能想象到的最自主的系統。>> YC 的下個批次目前正在接受申請。你是創業者嗎?請訪問 y combinator.com/apply。永遠不會太早,填寫申請將提升你的想法。好吧,回到視頻中。 >> 我的預測是,所有應用程式軟體的價值將接近於零。換句話說,軟體將變得極其便宜,以至於沒有人會再從傳統的SaaS軟體中賺取利潤。我不是說這會在明天發生,甚至明年。我已經放棄了預測時間表。我知道這將在幾年的時間內實現。如果任何人能夠通過一個提示生成任何類型的軟體,無論其複雜程度如何,那麼應用程式的價值將降至幾乎為零。

Amjad Masad [16:42]

所以這實際上看起來會是什麼樣子呢?目前你知道,在初創生態系統中的技術生態系統中,有這麼多通用的SaaS,任何經營小型業務或甚至大型業務的人,可能已經購買了數十個以便運行商業,即使在今天,你也能夠使用像 Replet 代理這樣的工具或編寫自己的軟體來替代這些軟體的大部分。我相信在未來幾年內,這個替代程度將從約 15% 增加到 100%。這將徹底改變軟體市場。再給你講一個故事,Replet 的一位同事 Kelsey,她在 HR 工作,她這輩子從未寫過一行軟體,但她想要一個組織軟體。她有一些特定的需求,例如想將其連接到 ADP,我們的薪資軟體,而她有一些功能需求,但她在市場上找不到一款完全符合她需求的組織方案。那些軟體非常昂貴,每年要花費數萬美元。因此她決定自己製作。她花了一周,也不過三天,就做出了我們今天使用的組織軟體,我們可以進入市場並以每年幾萬美元的價格將其作為SaaS產品銷售。所以這真是讓人驚訝,對吧? 我是說,像這樣的HR專業人員能製作一個軟體運行他們的工作。這就是正在發生的現象。試著想像幾年後。這樣的軟體業務將根本改變,也會被顛覆。不僅軟體,甚至我認為我們的工作方式,企業的運作方式,以及公司如何運作也都將徹底改變。今天我們有這些角色,你知道,自工業革命以來,當工廠成為主要創建模式的時候,公司喜歡專業化,經濟中的現代專業化由此出現,每一個人負責產品的某一部分。它在工廠的組裝線上製造,而另一個人則負責測試,另一個人則負責組裝。因此,這種專業化已經是經濟趨勢的方式很長一段時間。這也有道理,對吧?你希望人們能夠專業化,儘可能使他們能夠被取代。這就是現代經濟的運作方式。但是一旦你的 HR 專業人員同時也是軟體工程師,甚至是一個潛在的市場營銷人員,這樣他們可以學習任何東西。

Amjad Masad [19:30]

他們可以學習任何東西。事實上,AI 代理能為他們做任何事情,你知道,將會進入一個工作不再那麼專業化的世界,並且不再那麼孤立。實際上,我們今天已經看到這種現象,並且在 Replet,我們根據這一理念來構建我們的組織和業務。我們第一次構建了一個真正的產品團隊,產品管理團隊,而我們的產品團隊實際上是由設計師、工程師和產品經理組成,幾乎總是同一個人。因此,我們正試圖將許多角色合併在一起,創建一種通才型員工。因此,組織將更像一個網絡而不是層級。因此,它將看起來更像一個開源項目,而不是一個傳統的公司層級,帶有市場營銷部門、銷售部門。每一位員工早上醒來時,他們的任務不再是撰寫這封市場營銷郵件,或優化這個按鈕,而是要使業務運作,為業務創造價值。因此,每個人都成為了一種企業家,這將真正顛覆並根本改變公司運作的方式。這是一種模型,真正沒有人真正接受過,甚至還沒有人開始討論,但你要真的好好思考,如果每個人都有一個通用的軟體工程代理,並且有各種角色的代理,顯然領域專業知識仍然是重要的,但它的重要性不再像過去那樣重要。它的相對重要性降低了百倍,這也影響著人們如何創建業務,影響未來可以為我們提供的機會。 我讀過一本非常有趣的書,這本書是在 80 年代寫的,這太瘋狂了,因為它的預測非常準確。所以我只想讀出這段話。想法將成為財富,無論它出現在哪裡都將獲得獎勵。在這種環境中,最大的財富來源將是你腦海中的思想,而不是單靠物質資本,任何想法清晰的人都可能會變得富有。信息時代將會是向上流動的時代。當中最聰明、最成功和最有抱負的人將會成為真正的主權個體。現在,這本書中的一些話可能有點過時,信息時代可能我們今天稱之為智能時代。但是這本書預測了像加密貨幣、遠程工作等各種事情。

Amjad Masad [22:13]

如加密貨幣、遠程工作等各種事情,這個像主權個體的概念,一個因科技而獲得賦能的人,因為這些代理能夠創造出巨大的個人財富,將成為常態。想想像 Satoshi 這樣的人,Satoshi 這個單獨的個體創造出了價值超過一兆美元。他創造的比特幣市值過兆,但不管市場價值到底多少,這都只是由一個人創造的。他們寫了那篇論文,寫了那段程式,然後將其推出去,並造成巨大的影響。雖然還有許多人參與這個龐大的市場,但它是由一個人創造的,我們甚至不知道他是誰。我認為未來這種情況會變得普遍。真正美好的事情是,機會的獲取將是普遍的。無論您的地理位置是矽谷還是世界其他地方,只要你能清晰地思考並利用這些技術,能夠清晰地思考並生成良好的想法,進入 Replet,輸入這些想法,製作初版軟體,今天你就可以開始變得更加像這個主權個體。同樣,協作的運作將會無縫進行。所有人都在談論 10 億美金的單一人公司,但我覺得這實際上有點偏離重點。真正有趣的是,你能非常迅速地組織一群人。你也可以非常迅速地組織一群代理。你能夠組建這些公司並隨時解散。你可以創建具有使命目的的公司或計劃並快速解散。在某些情況下,這可能發生在一兩天內。在某些情況下,你可能會認為你是與另一個人在互聯網上合作,但他們實際上是由其他人創建的代理,正在為他們工作。因此,我們的工作模式和開創初創公司的方式將根本改變,隨著交易成本下降到零,你聘用全職員工的理由將變得越來越少。想想現在叫計程車,獲得 Uber 的交易成本幾乎只需點擊手機上的一個按鈕。我認為未來獲得開發人員的方式無論是軟體代理還是人類都將變得如此,可能只需一個按鈕。我想解決這個問題。您可能要讓代理去找尋和訪談各種不同的人或代理,並找到解決該問題的最佳方案。因此,你就能像光速一樣創建業務。現在,你知道,我提到了應用程式軟體將接近於零,這並不意味著所有軟體的價值都將接近於零。今天你知道,快速代理或其他代理的運作方式是,代理生成一個軟體,然後使用者用這個軟體來解決問題。你可以把這些東西看作是中介步驟。相反,代理可以直接解決問題。因此,對於 Replet 來說,也許還有許多其他企業需要生存,某種時候,Replet 需要停止專注於製作應用程序,開始專注於用軟體解決問題。

Amjad Masad [24:51]

因此,我想留出充分的時間給問題。所以,我會在這裡結束,並打開問題環節。>> 我的名字是 Chinat,來自斯坦福,很高興見到你。我的第一個問題是,在這未來的情景中,你是否會看到人類可能會同時與多個代理互動,還是會有一個單一的代理?如果是多個代理的話,我們將如何應對這些不同代理之間數據記憶和上下文的分散問題? >> 我認為會有多個代理,而我認為這是事實的原因是,假設我是一個擁有獨特領域專業技能的人,假設我是一名在某些相當稀少的案件中世界頂尖的律師。因此,我擁有這種我不會分享的領域專業知識。我不會去出售給像 Scale AI 這樣的公司,讓他們去賣給 OpenAI 或 Google 等公司,我只會將這些資源保留給自己。但我會以此為基礎來進行盈利,只是通過讓我的知識融入一個代理,讓其成為這個非常專業的代理,然後我也可以進行擴展。因此,我認為人們將會建立這些代理,代他們工作,然後會有代理在外組建這些代理團隊,自然會有軟體開發的代理,或許你將這一切都是通過聊天 GPT 或任何好的主介面來運行,但我認為它將會是一個多代理的世界,具有不同的上下文,這就像我們今天的世界一樣。當我去找律師時,我需要提供我的上下文,因此,可能會有一些協議,而這也是為什麼他們所說的 MCP 真的無法解決代理之間的問題。我認為這個領域需要更多有趣的協議,也許這是某個人可以建立的初創公司。 >> 嗨,謝謝你給我的見解。我有一個問題是,在不遠的將來,我們將擁有可以自動化大部分(如不是全部)的實質性和平面認知任務的 AI 系統,並且越來越多地將任務委派給代理,這些代理在代表你運作,並和為他人工作而運作的其他代理進行互動,那麼人類還會剩下什麼可以去做的呢?或者我們將會成為怎樣的人類呢?因為我們大部分的物理和認知方面都能由智能體來完成。 >> 我認為這基本上取決於你對 AI 的世界觀以及對人類能力的獨特性和優越性的信念,因此這會變成一種宗教討論,但我的觀點是,人類有一些特別之處,而我認為目前 AI 的實現存在根本限制,或許未來會有改變,但目前 AI 無法真正泛化超出分佈的範圍,所有 AI 能做的事情都需要在數據中有所表現。比如再舉回那位頂尖的律師的例子,他在處理某些非常稀有的案件方面非常擅長,這依然是其他人無法做到的,或者說每當出現真正新穎的問題、真正新穎的情況時,還是需要人類的智慧來解決這個問題。因此,我認為人類將會更多地位於創造性的位置,代理也能創造性,但他們的創造性類型並不是全新的知識。這更多是關於如何將不同事物結合在一起。而且,但這種「想法成為財富」的概念,讓人真正感興趣的是,人們可以快速生成新穎的想法並加以測試,而我不認為我們會達到一個時點,讓你告訴一位代理,嘿,幫我找出一個商業想法並去測試所有想法,我認為我們不會在短期內達到這一點。謝謝你的演講。我跟隨 Replet 已經好多年了,實際上我也是在 Replet 上學會編程的,所以你提到了清晰表達思考的重要性和未來的想法。你會把這當作一個理由,支持文科、批判思維的教育模式而不是更專注於 STEM 技能的教育焦點嗎?

Amjad Masad [27:38]

你擁有的介面,但我覺得這將會是一個多重代理的世界,擁有不同的聯絡人,類似我們今天的世界。當我去找律師時,我需要提供我的背景。因此,呃,也許會有一些協定,這就是為什麼他們談到MCP並不能真正解決代理之間的問題。我認為這個領域需要更多有趣的協定,也許這是一個初創公司可以建立的東西。 >> 嗨,謝謝你提供的深刻見解。我有以下問題:在不遠的未來,我們將擁有能夠自動化大部分甚至全部有意義的實體和認知任務的AI系統,並且越來越多地委託代理代表你行事,與其他代表他人行事的代理溝通,那麼人類還能做什麼?我們的人類狀態會是什麼樣子,因為我們的實體和認知方面都可以由智慧體來完成。 >> 我認為這根本上取決於你的世界觀,以及你對AI的限制與人類所能做之獨特性和優越性的信念。因此這有點像是一場宗教性的討論,但我的看法是人類有某種特別之處,而我的看法是我們現在做AI的方式有根本的限制,也許這個問題能得到解決,但今天的AI無法真正地概括出分佈之外的所有內容,AI所能做的每一件事都需要在數據中表示。例如,我再提這位律師的例子,他在非常稀有的案件中是全球的專家,呃,這又是其他人無法做到的事情,或者說每當出現真正新穎的問題、真正新穎的案例時,你仍然需要人類的創造力來解決這個問題。因此,我認為人類在創造性方面會更為突出,我認為代理也能具備創造性,但他們的創造性並不是全新的知識。這更像是,呃,這就是創造力的許多方面是將不同事物結合在一起。因此,這個“思想變現”之類的概念,呃,是讓人感到興奮的地方,因為人們可以快速生成新穎的思想並進行測試,而我認為我們不會到達那種能告訴代理“嘿,去幫我找一個商業想法並測試所有它們”的地步。我不認為我們會在短時間內到達那裡。謝謝你的演講。我已追隨Replet多年,其實我也是在Replet上學會編程的。因此,你提到清晰思考的價值和思想變現的方式。

Amjad Masad [30:24]

我不認為這些觀點是互斥的,但是我確實認為文科將變得更有價值。我認為 today 工程師往往會略顯狹隘與經濟的可能性所需的比例相比,因為你知道,我所展示的那種未來公司模型中,每個人都變成更加通才的話,現在的工程師有能力忽視他們所處經濟的實際情況。許多工程師只是專注於非常狹窄的領域。因此,我認為人們需要擁有更廣泛的世界觀和技能組合。因此,我不認為這兩者是互斥的,我想,科學思維會變得相當重要。 >> 嗨,對。 我更想了解的是,Replet 在技術堆棧中在哪個方面取得了重大進展。因為正如你所說,Replet 可以執行任務長達一小時。因此,考慮到 Replet 可能使用的是封閉源代碼的模型,沒有訪問預訓練和後訓練的能力,你的技術堆棧中在哪一部分創造了如此驚人的創新,以使你的模型能夠自主運行一個小時。 >> 這是我所謂的模型的棲息地。因此,商業模型能夠訓練出非常優秀的模型。它們可以將模型訓練到最大程度的自主性,並且能夠在長時間內保持一致性,但我們或任何代理公司需要能夠提供這個代理存在的基礎設施。因此,我提到的所有這些組件。一個非常關鍵的事情是 Replet 意味著你可以稱之為事務性或原子性的思想。因此對 Replet 計算機環境的每一次變動與系統的每一個其他組件保持同步。因此,現在在 Replet 中,如果你查看歷史,你可以看到先前的檢查點,而且其實你可以恢復到任何一個並將應用程序在那個狀態下重新啟動,因此我們認為這個基礎設施將對提高模型的可靠性至關重要。我認為訓練能提供的可靠性有限,但環境的回饋和快速嘗試事物的能力是可靠性實現的上限。因此這就是我們所關注的。 >> 嗨,我是 Sophia。謝謝你,我非常感謝你的演講,並且我一直在關注你,當時你在 AI for developers 的活動中談論 ghostwriter 和其後面的工作。但我很好奇的是,代理是否會在某些設定上過度飽和,是否在你使用這些代理或加入一個綜合相關的創業公司時,應考慮這一點。 >> 我認為軟體工程代理確實像是一個相當棘手的領域。有很多人想要這麼邊。並且如果你來的晚,你希望擁有真正新穎的觀念以便於能在那裡競爭。不過,你知道,有一些事情例如誰在為 HR 或財務構建代理。我知道有一家公司在做會計。出於某種原因,很多公司正在進行 SDR。這是一個相當擁擠的市場。我開始的好辦法是思考自己感興趣的東西,並且你擁有的領域知識是什麼?所以,創建代理公司出發的最佳方式是,如果你自己是一名合規官,然後你就剛好對合規事務充滿熱情。誰會對合規事務感興趣,我不知道,但是如果你對合規事務有激情,去創建一家代理公司,因為這樣你能學到最多,也擁有大多數的領域知識,而這對於建立代理公司來說是最重要的。嘿,如果軟體和建造軟體的成本要降到零,那麼相對而言,構建軟體的平台,例如 Replet,的價值萎縮也將變到零。因此,長期來看你們計劃如何賺錢,如何競爭像 Bolton 和 lovable 等競爭者? >> 是的。你注意到我提到了並非所有軟體,而是具體說明應用軟體。我認為軟體將繼續影響我們的生活,但大多數將會是自動化的。例如,我使用 Replet 建立了很多個人軟體,其中大部分是關於管理我生活和家庭,進行許多自我量化的事情,很多有關我的睡眠和日常數據,然後我花了很多時間繪製那些數據,並進行各種分析,結果我應該能夠告訴 Replet 代理這是我的目標,你去弄清楚需要建造哪種軟體,然後你搞清楚如何操作,告訴我需要購買什麼可穿戴設備,還有我早上需要記錄的內容,和我需要完成的事,然後 Replet 代理將能夠運行所需的軟體,獲取我所需的東西,到我的家中部署。什麼樣的傳感器,然後為我解決問題。我認為 Replet 需要轉型為一個通用的問題解決者,以便我們的公司能夠生存。我認為對於許多其他公司而言,我認為這已經在發生,尤其是提到的那些原型產業,公司已經變得相當擁擠。我認為 Replet 實際上在今天的優勢在於它的全棧功能,從想法到已部署和擴展的軟體。 >> 嗨,我的名字是 Emma,我對你預想的所有程式都是由代理編寫的未來感到興奮,但我也有些擔憂,因為已知有一個問題是,如果你在一個由另一個模型生成的數據上訓練生成的模型,會出現累積錯誤、累積噪音的問題。因此,我的問題是,在這個未來,其中程式都由代理編寫,然後也在測試和批准,如何阻止這個錯誤爆炸的問題,同時還允許這些模型增長和演化? >> 我的判斷是,我們會很快進入更接近 alpha zero 的訓練風格,這意味著你將有一個更傳統的 LLM,該 LLM 在整個互聯網上進行訓練,但在新一代訓練的方式是給它一個強化學習的環境,在這個環境中生成大量問題,進行自我對戰,尋找這些問題,並進行回饋。而這一切會以大規模的平行方式進行。我認為這是我們獲得新一代軟體代理的方式,因為不會再訓練在 human code 上,因為如你所說,將不會再有人類的代碼,因此我們必須解決這個問題,否則就會非常嚴重的停滯。 >> 嗨,我對這些代理所需的系統報告支持非常感興趣,而我發現你發佈的通用包管理器及其使用的 Nyx 相當有趣。你提到的這種支援的快照和然後的分叉和合併。我正在進行相似的事情。 >> 那你應該來工作! >> 我想知道這些是否是公開可用的,或是否有什麼開源的計畫。 >> 嗯,是的,我們開放開源了我們的一些包管理工作。我們是 Nexos 的主要貢獻者,因此我們使用的 Nex OS 是一個事務性操作系統生成器,我能夠形容成這樣,並且最低限度的文件系統事務會,至少會在談論中,但這個項目目前仍在進行中。但是的,來 Replet 實習並學習這一切,然後自己去發展成就! >> 謝謝。好吧,謝謝大家。

Amjad Masad [33:20]

以達到可靠性的高峰。因此這是我們所專注的。 >> 嗨。所以你談到通才員工,並且這是企業的未來。我完全同意這一願景,但我發現自己困在當前找到能使我為這種未來鋪路的角色上。我們應該關注什麼樣的機會?在初創公司或其他公司中應注意什麼樣的職位,以便讓我們具備成為好的通才員工在未來五年所需的技能?我知道成為創始人是一個選項,但不是我們所有人都想立即進入那條職業岔路。呃,有些人希望與他人合作,建立團隊合作技能並學習所有其他事情。我們該怎麼辦?加入盡早的初創公司。顯然你可以將其視為一種指數衰減的曲線,當你成為創始人時獲得的通才經驗最多,然後隨著員工人數的增長,當你到達一百名員工的時候,你的通才經驗就會減少,但無論如何盡早加入,根據你的風險偏好以及所有這些。但是,甚至在一家B輪公司的第20位員工,我認為你會獲得比在某個FANG公司更多的經驗。即便你加入了那家初創公司,你也需要尋找這些通才的機會。因此不要坐著等著別人給你任務。要有這樣的心態:我早晨醒來,不是看待待辦清單,而是看待任務,而我的任務是使這家公司成功或更具價值。 >> 嗯,嗨,我的名字是Shivam。我也想問關於一小時的自動化代理開發的問題。呃,具體來說,你能多談一下你和你的團隊是如何看待值得追求的長時間範圍,而不是改善短期時間範圍的推理呢?所以,我認為你談及的短期時間範圍更多的是呃,讓我們來工作在可靠性上,而長期時間範圍則是讓我們來工作於自治,呃,去除人類的介入以及持續測試和提供反饋的人類負擔。呃,所以我們在做這兩件事。當我談論可靠性時,這更多的是對推理的投資以及更多投資於這個平行代理。呃,試驗與錯誤是我在討論的,同時我們將這稱為抽樣與模擬。然後對於長期範圍,更加專注於測試,確保因為隨著時間的推移,會有一種金漂移。代理可能會開始做一些你不喜歡的事情,但沿著這段道路設置測試的護欄將使其保持更加一致。隨著我們收集更多有關失敗和有效的數據,你可以選擇呃,去調整那個,或者你也可以只是繼續改善提示,呃,並添加更多護欄來使其變得更好。因此我認為兩者都很重要。 >> 嗨,我是Sophia。呃,感謝你的演講,我一直在關注你,當你在AI for developers活動中談論ghostwriter和背後的工作時,我遇到了你。呃,但我對於代理是否在某些特定領域過度飽和,並且在你工作或加入一家正在做某件事情的初創公司時,是否應考慮到這點感到好奇。 >> 我認為軟體確實非常棘手。軟體工程代理,想要進行這方面的很多人。如果你是晚來者,你需要有一個真正新穎的想法才能在這裡競爭。但是,呃,還有許多問題,比如誰在為人力資源或財務建立代理。我知道有一家公司在做會計。有很多公司在進行SDR,不知為何,這里非常擁擠。我開始的時候是你對哪方面感興趣,以及你在哪些領域有專業知識。所以,開始代理公司最好的方式就是如果你自己是一名合規官,你可以開始一家合規公司,或者如果你對合規懷有熱情,我不知道有誰對合規充滿熱情,但如果你對合規充滿熱情,呃,去創辦一家代理公司因為你會學到最多,並且你會擁有最多的領域知識,而領域知識是建立一家代理公司最重要的資料。

Amjad Masad [35:48]

嗨,所以如果軟體及其建設成本趨近於零,則由此,建立軟體的平台,如Replet,其價值捕獲將下降至零。那麼,你打算如何在長期內賺錢,並且如何與其他競爭者如Bolton和Lovable競爭呢? >> 是的。所以,請注意我說的是不是舊軟體。我說的是應用軟體,具體來說。因此,我認為軟體將繼續掌控我們的生活,但其中很多會是自動化的。例如,我在Replet上編寫了大量個人軟體,其中很多是關於管理我的生活和家庭,並像你知道的那樣,進行大量的量化自我工作,數據包括我的睡眠等等。然後我花了很多時間來繪製這些數據和執行所有這些工作。與其這樣,我應該能夠告訴Replet代理:這是我的目標,你找出需要建造的軟體,告訴我如何操作,然後告訴我需要購買什麼可穿戴設備,早上需要登錄什麼,還有我該做什麼,然後她就能為我生成軟體,獲取我家需要的東西,什麼樣的感測器,然後為我解決問題。我認為Replet必須成為我們公司存活的通用問題解決者。我認為對於許多其他公司來說,尤其是你所提到的原型製作領域,已經變得相當擁擠。我認為Replet今天真正出色之處在於它是全棧的。它可以從創意到已部署和擴展的軟體。 >> 嗨,呃,我的名字是Emma,我對你描述所有代碼均由代理撰寫的未來願景感到非常興趣。但我也有點擔心,因為有一個著名的問題,即如果你基於另一個模型生成的數據來訓練生成模型,你就會遇到累積錯誤、累積噪聲的問題。所以我的問題是,在這個未來,代碼是由代理編寫的,由代理測試的,然後由代理批准的,我們如何防止這個爆炸性錯誤問題,同時仍允許這些模型成長和發展?我猜不久的將來,我們會進入更像是alpha zero的訓練方式,其中你有一個更傳統的LLM,這個模型是基於互聯網上的所有資料進行訓練的。然而,下一代的訓練方式將是給它提供一個強化學習的環境,讓其生成大量問題並進行自我對弈,反饋,並以這種大量平行的方式進行。

Amjad Masad [38:20]

以大量平行的方式進行。我認為這就是我們將獲得下一代軟體代理的方式。它不會基於人類代碼進行訓練,因為如你所說,未來不會有任何人類代碼,所以我們必須解決這個問題,否則我們將面臨嚴重的瓶頸。嗨,我對這些代理所需的一些系統支持很感興趣。呃,我發現你發布的通用包管理器和你使用的Nix非常有趣。你提到了這種寫時複製快照、分支和合併。呃,我正在做類似的事情。 >> 好吧,你應該來這裡工作。 >> 呃,我想知道這些東西是否公開或是否存在。我想你可能在考慮開源。 >> 嗯,是的,我們確實開源了我們的一些包管理器工作。我們在Nexos中有很多貢獻。因此,我們使用Nex OS,這是一種交易操作系統生成器,我能描述的最佳方式是這一點,並且可能檔案系統的相關內容最少會談論一下,但這正是當前正在積極進行的工作。呃,但對,來Replet實習,學習這些東西,然後自己去建立。 >> 謝謝。好,有賴於大家。

Amjad Masad [40:46]

以大規模並行的方式。我認為這就是我們將如何獲得下一代軟體 agent 的方法。它不會在人類程式碼上訓練,因為就像你說的,不會再有人類程式碼了,所以我們必須解決這個問題,否則我們會嚴重停滯。(觀眾提問)我對這些 agent 所需的系統支援非常感興趣。我覺得你們發布的通用套件管理器和你們使用 Nix 的方式很有趣。你提到了寫時複製的快照、分支和合併。我也在做類似的事情。(Amjad)你應該來我們這邊工作。(觀眾)我想知道這些有沒有公開可用的?(Amjad)我們開源了一些套件管理器的工作。我們是 NixOS 的重要貢獻者。我們使用 NixOS——最好的描述方式是一個事務性作業系統產生器。檔案系統的部分至少我們會談論它,但這目前正在積極開發中。來 Replit 實習,學會所有這些東西,然後自己去建造吧。謝謝。好的,謝謝大家。