Anthropic公司Claude Opus 4.6模型花費兩萬美元嘗試編寫C編譯器

Anthropic安全防護團隊研究員Nicholas Carlini在一項實驗中，讓新發布的Opus 4.6模型構建C編譯器，這讓他感到"興奮"、"擔憂"和"不安"。這一實驗也讓GitHub上的許多觀察者產生了質疑。

贊助商廣告

Carlini在與Opus 4.6官方發布同步的博客中詳細介紹了這項被他稱為"智能體團隊"的實驗。他表示："我讓16個智能體從零開始編寫基於Rust的C編譯器，要求能夠編譯Linux核心。經過近2000次Claude Code會話和20000美元的API成本後，智能體團隊產生了一個10萬行的編譯器，能夠在x86、ARM和RISC-V架構上構建Linux 6.9。"

實驗設計與自主工作機制

據Carlini介紹，在智能體團隊中，"多個Claude實例在共享代碼庫上並行工作，無需人類主動干預"。一個關鍵任務是解決"需要操作員在線並可協同工作"的問題，這意味著消除Claude Code等待人類指示下一步行動的需求。

"為了促進持續的自主進展，我構建了一個框架，讓Claude陷入簡單循環中...當它完成一項任務時，立即開始下一項任務。"Carlini繼續說道："我讓每個Claude智能體自己決定如何行動。大多數情況下，Claude會選擇'下一個最明顯的'問題。"

成本與效果分析

在近兩周的時間裡，通過近2000次Claude Code會話，Opus 4.6消耗了20億個輸入Token和生成了1.4億個輸出Token，總成本接近20000美元。Carlini表示，這使其成為"極其昂貴的項目"，但"這個總成本只是我自己完成這項工作成本的一小部分，更不用說整個團隊了"。

實驗結果與局限性

實驗產生的編譯器能夠成功構建許多項目，但並非全部。它還不是真正編譯器的即插即用替代品。此外，生成的代碼效率不高，Rust代碼質量"合理但...遠未達到專業Rust程序員可能產生的質量"。

Carlini得出結論："智能體團隊展示了自主實現整個複雜項目的可能性。"但作為前滲透測試專家，他表示完全自主開發帶來了真正的風險。"程序員部署他們從未親自驗證過的軟體的想法確實令人擔憂。"最終，這個實驗"讓我興奮，但也讓我感到不安"。

贊助商廣告

社區反饋與爭議

GitHub上的評論更加直接，特別是因為他們認為20000美元的價格標籤忽略了其他一些因素，比如模型最初訓練時使用的大量其他程序員代碼。

用戶mohswell評論道："如果我去超市，偷了他們所有麵包的一點點，然後把它們拼在一起，沒人會說我從零開始做麵包。他們會說我是小偷。如果這是'從零開始'，那我的烹飪就是從農場到餐桌。"

用戶Sambit003則表示："留言區和問題本身就是每個人都在經歷的'絕對電影'時刻。"

Q&A

Q1：Claude Opus 4.6智能體團隊是如何工作的？

A：智能體團隊中多個Claude實例在共享代碼庫上並行工作，無需人類主動干預。研究員構建了一個框架讓Claude進入簡單循環，當完成一項任務時立即開始下一項任務，每個智能體自己決定如何行動。

Q2：這個C編譯器項目花費了多少成本和資源？

A：項目歷時近兩周，進行了近2000次Claude Code會話，消耗了20億個輸入Token和生成了1.4億個輸出Token，總成本接近20000美元。最終產生了一個10萬行的編譯器，能夠在x86、ARM和RISC-V架構上構建Linux 6.9。

Q3：這個AI生成的編譯器效果如何？

A：編譯器能夠成功構建許多項目，但並非全部，還不是真正編譯器的即插即用替代品。生成的代碼效率不高，Rust代碼質量合理但遠未達到專業程序員的水準。