宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Anthropic公司Claude Opus 4.6模型花費兩萬美元嘗試編寫C編譯器

2026年02月11日 首頁 » 熱門科技

Anthropic安全防護團隊研究員Nicholas Carlini在一項實驗中,讓新發布的Opus 4.6模型構建C編譯器,這讓他感到"興奮"、"擔憂"和"不安"。這一實驗也讓GitHub上的許多觀察者產生了質疑。

Carlini在與Opus 4.6官方發布同步的博客中詳細介紹了這項被他稱為"智能體團隊"的實驗。他表示:"我讓16個智能體從零開始編寫基於Rust的C編譯器,要求能夠編譯Linux核心。經過近2000次Claude Code會話和20000美元的API成本後,智能體團隊產生了一個10萬行的編譯器,能夠在x86、ARM和RISC-V架構上構建Linux 6.9。"

實驗設計與自主工作機制

據Carlini介紹,在智能體團隊中,"多個Claude實例在共享代碼庫上並行工作,無需人類主動干預"。一個關鍵任務是解決"需要操作員在線並可協同工作"的問題,這意味著消除Claude Code等待人類指示下一步行動的需求。

"為了促進持續的自主進展,我構建了一個框架,讓Claude陷入簡單循環中...當它完成一項任務時,立即開始下一項任務。"Carlini繼續說道:"我讓每個Claude智能體自己決定如何行動。大多數情況下,Claude會選擇'下一個最明顯的'問題。"

成本與效果分析

在近兩周的時間裡,通過近2000次Claude Code會話,Opus 4.6消耗了20億個輸入Token和生成了1.4億個輸出Token,總成本接近20000美元。Carlini表示,這使其成為"極其昂貴的項目",但"這個總成本只是我自己完成這項工作成本的一小部分,更不用說整個團隊了"。

實驗結果與局限性

實驗產生的編譯器能夠成功構建許多項目,但並非全部。它還不是真正編譯器的即插即用替代品。此外,生成的代碼效率不高,Rust代碼質量"合理但...遠未達到專業Rust程序員可能產生的質量"。

Carlini得出結論:"智能體團隊展示了自主實現整個複雜項目的可能性。"但作為前滲透測試專家,他表示完全自主開發帶來了真正的風險。"程序員部署他們從未親自驗證過的軟體的想法確實令人擔憂。"最終,這個實驗"讓我興奮,但也讓我感到不安"。

社區反饋與爭議

GitHub上的評論更加直接,特別是因為他們認為20000美元的價格標籤忽略了其他一些因素,比如模型最初訓練時使用的大量其他程序員代碼。

用戶mohswell評論道:"如果我去超市,偷了他們所有麵包的一點點,然後把它們拼在一起,沒人會說我從零開始做麵包。他們會說我是小偷。如果這是'從零開始',那我的烹飪就是從農場到餐桌。"

用戶Sambit003則表示:"留言區和問題本身就是每個人都在經歷的'絕對電影'時刻。"

Q&A

Q1:Claude Opus 4.6智能體團隊是如何工作的?

A:智能體團隊中多個Claude實例在共享代碼庫上並行工作,無需人類主動干預。研究員構建了一個框架讓Claude進入簡單循環,當完成一項任務時立即開始下一項任務,每個智能體自己決定如何行動。

Q2:這個C編譯器項目花費了多少成本和資源?

A:項目歷時近兩周,進行了近2000次Claude Code會話,消耗了20億個輸入Token和生成了1.4億個輸出Token,總成本接近20000美元。最終產生了一個10萬行的編譯器,能夠在x86、ARM和RISC-V架構上構建Linux 6.9。

Q3:這個AI生成的編譯器效果如何?

A:編譯器能夠成功構建許多項目,但並非全部,還不是真正編譯器的即插即用替代品。生成的代碼效率不高,Rust代碼質量合理但遠未達到專業程序員的水準。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新