Anthropic並沒有打算以這種方式介紹Mythos。這家公司稱之為迄今為止最強大AI模型的詳細資訊,通過其內容管理系統(CMS)的數據泄露事件浮出水面,曝光了一個在推理和編程能力方面顯著提升的大語言模型。
這次數據泄露是由該公司員工無意中通過一個公開訪問的數據存儲庫暴露了關於該大語言模型的資料,包括一篇關於它的部落格草稿。獨立安全研究人員上周首次發現了這一問題。
在該問題被披露後,Anthropic限制了對數據存儲的公共訪問,隨後將此次曝光歸因於其CMS的配置錯誤,並向最先報道此次泄露事件的《財富》雜誌確認了該模型的存在。
專注於Apple相關泄露的M1Astra也標記了這次曝光,在訪問受限之前在X平台上存檔了一份Anthropic關於Mythos的部落格草稿副本。
在那份草稿中,Anthropic本身語調謹慎,表達了對該模型在網路安全方面潛在影響的擔憂。
"在準備發布Claude Mythos時,我們希望格外謹慎行事,理解它所帶來的風險——甚至超出我們在自己測試中了解到的風險,"該公司寫道,並補充說特別專注於評估近期網路安全風險。
該部落格進一步表示,Anthropic希望首先將Mythos推廣到企業安全團隊,並已經與"少數早期訪問客戶"測試該模型的網路安全能力。
這一理由似乎很直接:如果當今的模型已經能夠識別甚至幫助利用軟體漏洞,那麼像Mythos這樣更強大的系統可能會顯著加速發現和濫用——這對防禦者和攻擊者都提高了賭注。
Pareekh諮詢公司首席分析師Pareekh Jain表示,Mythos對首席資訊安全官和企業安全團隊來說可能是雙刃劍,縮小了網路攻擊和防禦之間的差距。
Jain說,一方面,像Mythos這樣的模型可以通過自動化漏洞發現、持續紅隊測試、更快的分類和大規模威脅搜尋等領域來轉變安全防護;另一方面,它可能通過讓AI智能體以高技能自主行動來使網路攻擊變得更容易。
Jain補充說,對首席資訊安全官而言,這種風險並非理論性的,因為早期的模型很快就被改裝成開發惡意軟體的工具。
HCLTech高級技術專家Vladimir Belomestnov在LinkedIn上的一篇文章中寫道,由於Mythos具有"遞歸自修復"等能力,風險甚至更高。
Belomestnov寫道:"泄露的文件突出了AI自主識別和修補自身代碼漏洞的能力。即使這目前僅限於輔助利用,它也表明人類和機器軟體工程之間的差距正在縮小。"
然而,Anthropic似乎距離該模型的完全發布還有一段距離。
部落格草稿副本寫道:"Mythos也是一個大型的、計算密集型模型。對我們來說服務成本非常高,對我們的客戶來說使用成本也會很高。我們正在努力使該模型在任何通用發布之前變得更加高效。"
然而,明確的是,該公司已經在規劃一個針對網路安全用例的分階段推出。
該公司在部落格草稿中寫道:"在接下來的幾周里,我們將慢慢擴大更多使用Claude API的客戶對Claude Mythos的訪問權限。由於我們特別關注網路安全用途,這是我們最初打算擴展早期訪問計劃的地方。"
還有另一份部落格文章副本,該副本還將該模型命名為Capybara。Anthropic尚未明確該模型的最終名稱。
然而,對模型名稱的猶豫不決並沒有阻止它在上周震動市場。包括CrowdStrike、Palo Alto Networks、Zscaler和Fortinet在內的網路安全供應商股價下跌,投資者評估Claude Code Security中更強大的模型對競爭格局可能意味著什麼。
然而,Avasant研究總監Gaurav Dewan對Mythos對供應商影響更加樂觀:"強大的模型不會取代網路安全平台"。
相反,Dewan看到供應商越來越多地將來自Anthropic、OpenAI等公司的前沿模型嵌入其技術棧中,用於漏洞發現、代碼和雲態勢管理,以及威脅調查和響應自動化。
Dewan補充說:"人們可以期待合作夥伴關係和受控集成,而不是去中介化。已經擁有遙測、工作流程和執行能力的供應商將受益最多。"
Q&A
Q1:Mythos是什麼?有什麼特殊能力?
A:Mythos是Anthropic開發的大語言模型,被該公司稱為迄今為止最強大的AI模型。它在推理和編程能力方面有顯著提升,具有"遞歸自修復"能力,能夠自主識別和修補自身代碼中的漏洞,主要針對網路安全用例設計。
Q2:為什麼Anthropic對發布Mythos如此謹慎?
A:因為Mythos的強大能力可能帶來網路安全風險。如果當今模型已能識別和利用軟體漏洞,那麼Mythos這樣更強大的系統可能顯著加速漏洞發現和濫用。它可能被惡意使用來開發惡意軟體,讓AI智能體以高技能自主進行網路攻擊。
Q3:Mythos何時能夠普及使用?
A:目前還沒有確定的時間表。Anthropic表示Mythos是大型計算密集型模型,服務和使用成本都很高,公司正在努力提高效率。目前計劃分階段推出,首先針對企業安全團隊,已開始與少數早期客戶測試,將逐步擴大訪問範圍。






