2026 年 4 月 7 日,Anthropic 做了一件 AI 產業史上前所未有的事:發布了自家有史以來最強大的模型,卻同時宣布不會對外公開。
這個模型叫做 Claude Mythos Preview,是一個通用型前沿大語言模型。它在程式撰寫、推理能力和自主代理任務上都展現了跨世代的躍進,但真正讓 Anthropic 決定「不敢放出來」的原因,是它在網路安全領域展現出的驚人能力——Mythos 能夠自主發現並利用幾乎所有主流軟體中的安全漏洞,而且速度和精確度遠遠超越人類資安專家。Anthropic 為此同步推出了一項名為 Project Glasswing 的防禦性資安計畫,將模型僅限提供給特定科技巨頭使用。
這篇文章將帶你從技術能力、產業衝擊、全球政府反應到企業啟示,完整拆解這場正在重塑 AI 與資安格局的重大事件。
Mythos 能做到什麼?三個讓 Anthropic 自己都嚇到的數字
在深入討論之前,先看三組數據,它們直接說明了 Mythos 為什麼引發如此大的關注。
第一,漏洞發現的規模。 根據 Anthropic 前沿紅隊的技術報告,團隊在過去數週使用 Mythos 進行測試,結果在每一個主流作業系統和每一款主流瀏覽器中都發現了 zero-day 漏洞——也就是過去完全未知、從未被修補的安全缺陷。總計發現了數千個高嚴重性漏洞,其中超過 99% 在文章發布當下仍未修補。
第二,漏洞利用的跳躍。 發現漏洞是一回事,把漏洞變成可執行的攻擊程式(exploit)是完全不同層次的能力。Anthropic 用 Firefox 147 的 JavaScript 引擎作為基準測試:上一代旗艦模型 Claude Opus 4.6 在數百次嘗試中只成功產出 2 個可用的 exploit,而 Mythos 成功了 181 次——這是 90 倍的性能跳躍,而且只隔了一個模型世代。
第三,自主性的質變。 Anthropic 內部沒有資安背景的工程師,晚上讓 Mythos 去尋找遠端程式碼執行漏洞(RCE),隔天早上醒來就收到一份完整的、可運作的攻擊程式碼。整個過程不需要人類介入。在另一個案例中,Mythos 自主串聯了四個不同的漏洞,撰寫了一個複雜的 JIT heap spray 攻擊,成功逃脫瀏覽器的渲染器沙盒和作業系統沙盒。
這些能力並不是 Anthropic 刻意訓練出來的。根據官方說法,它們是模型在程式碼理解、推理和自主性上整體進步後「自然浮現」的副產品。換句話說,一個更擅長寫程式和修漏洞的模型,同時也更擅長找到和利用漏洞。
被 Mythos 挖出來的「古董級」漏洞
Mythos 找到的漏洞不是那種淺層的、容易被傳統工具抓到的問題。相反,它專門找到那些人類資安專家和自動化工具審查了數十年卻始終遺漏的深層缺陷。
最具代表性的案例包括:一個存在於 OpenBSD(以安全性著稱的作業系統)中長達 27 年的 TCP SACK 漏洞,攻擊者只需發送兩個特製封包就能癱瘓任何執行該系統的伺服器;一個隱藏在 FFmpeg 影音處理庫中 16 年的越界寫入漏洞,儘管模糊測試工具(fuzzer)已經對該程式碼路徑執行了 500 萬次測試卻從未觸發;以及一個 FreeBSD NFS 實作中存在 17 年的遠端程式碼執行漏洞(CVE-2026-4747),允許未經驗證的攻擊者取得完整的 root 存取權限。
值得注意的是,根據 VentureBeat 的深度報導,發現 OpenBSD 漏洞的整個研究活動成本約為 2 萬美元(涵蓋 1,000 次完整測試),而最終成功發現漏洞的那一次執行成本不到 50 美元。當 AI 把頂級資安研究的成本降到這個數量級,整個攻防經濟學就徹底改變了。
Project Glasswing:用最強的矛來打造最強的盾
面對如此強大的能力,Anthropic 選擇了一個出人意料的策略:不賣、不放、先防禦。
他們同步發布了 Project Glasswing(玻翅蝶計畫),一項集結全球頂級科技公司的防禦性資安計畫。「Glasswing」這個名字來自一種翅膀近乎透明的蝴蝶,暗喻軟體漏洞就像隱形的翅膀——存在但難以察覺。
12 家核心合作夥伴包括:Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks。此外還有超過 40 家組織獲得了 Mythos 的存取權限,涵蓋了負責建構和維護關鍵軟體基礎設施的機構。
Anthropic 為這項計畫投入了高達 1 億美元的模型使用額度,並額外捐贈 400 萬美元給開源安全組織。對於超出額度的使用,Mythos 的定價為每百萬輸入 token 25 美元、每百萬輸出 token 125 美元,可透過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取。
計畫的核心邏輯很直接:在攻擊者取得類似能力之前,先讓防禦方用 Mythos 找出並修補盡可能多的漏洞。Anthropic 承諾將在 90 天內(約 2026 年 7 月初)發布公開的調查結果報告。
這個策略本質上是一場與時間的賽跑。根據 NBC News 的報導,Anthropic 前沿紅隊負責人 Logan Graham 指出,Mythos 的突出之處在於它能自主串聯多個漏洞,進行長距離、多步驟的複雜攻擊。多位資安專家估計,具備類似能力的開源模型可能在 12 至 18 個月內出現。一旦這些能力普及化,任何勒索軟體集團或國家級駭客都能以極低成本大規模挖掘和武器化漏洞。
華爾街與各國政府的恐慌反應
Mythos 的影響力迅速從科技圈蔓延到金融界和政府高層。
美國:財政部長親自召集銀行 CEO 緊急會議。 根據 CNBC 的獨家報導,4 月 8 日,美國財政部長 Scott Bessent 和聯準會主席 Jerome Powell 在財政部總部召集了一場緊急閉門會議。出席者包括 Citigroup CEO Jane Fraser、Goldman Sachs CEO David Solomon、Bank of America CEO Brian Moynihan、Wells Fargo CEO Charlie Scharf 和 Morgan Stanley CEO Ted Pick。JPMorgan CEO Jamie Dimon 受邀但未能出席。Fortune 的報導指出,這是近年來罕見的由最高層級金融監管官員因 AI 威脅而直接召集銀行業領袖的會議,顯示美國政府已將 AI 驅動的網路攻擊視為系統性金融風險,而不僅僅是 IT 問題。
英國:AISI 獨立測試確認能力跳升。 英國政府的 AI 安全研究所(AI Security Institute, AISI)對 Mythos 進行了獨立評測。在專家級 Capture the Flag 挑戰中,Mythos 達到了 73% 的成功率——在 2025 年 4 月之前,沒有任何 AI 模型能完成哪怕一道專家級題目。更關鍵的是,AISI 自行設計了一個名為「The Last Ones」的 32 步驟企業網路攻擊模擬(從初始偵察到完整接管網路),估計人類專家需要約 20 小時才能完成。Mythos 是史上第一個從頭到尾完成這項測試的 AI 模型,在 10 次嘗試中成功了 3 次,平均完成 22 個步驟。AISI 稱 Mythos 代表了「相較前一代模型的顯著躍升」。
金融界的連鎖反應。 Goldman Sachs CEO David Solomon 在財報電話會議中公開表示,該銀行正與 Anthropic「密切合作」,並正在「加速」資安投資。英國方面,英格蘭銀行的跨市場營運韌性小組(CMorg)預計在兩週內召開 Mythos 專題會議,參與者包括財政部、國家網路安全中心(NCSC)和金融行為監管局(FCA)的官員。IMF 總裁 Kristalina Georgieva 也在訪談中表示,全球金融體系目前「尚不具備」防禦大規模 AI 網路攻擊的能力。
質疑的聲音:Mythos 真的那麼獨特嗎?
面對鋪天蓋地的報導,也有不少資安專家提出了不同觀點。
資安公司 Aisle 的創辦人兼首席科學家 Stanislav Fort 進行了一項驗證實驗:他們從 Anthropic 展示的案例中取出具體的漏洞程式碼,用小型開源模型進行測試。結果顯示,8 個模型中有 8 個都成功偵測到了 FreeBSD NFS 的那個旗艦漏洞,其中最小的模型只有 36 億參數,每百萬 token 成本僅 0.11 美元。Aisle 的結論是:漏洞發現能力可能已經相當普及,Anthropic 的論述誇大了這些能力的獨佔性。
知名資安學者 Bruce Schneier 則從另一個角度切入,在個人部落格中認為這在很大程度上是 Anthropic 的一次成功 PR 操作。他指出,許多記者只是重複了 Anthropic 的說詞,缺乏批判性的獨立驗證。不過 Schneier 也承認,AI 在資安領域的能力確實正在快速逼近質變的臨界點。
另一方面,Bloomberg 的一位資安分析師報導,Aisle 的測試方法存在根本差異:他們測試的是「給定漏洞程式碼,模型能否辨識問題」,而 Mythos 的能力是「在數百萬行程式碼中自主找到漏洞,並將多個漏洞串聯成完整的攻擊鏈」。這兩者之間的差距,就像知道一棟建築的某扇門沒鎖和能夠從外部找出所有弱點並規劃完整的入侵路線之間的差別。
Anthropic 的「不可能三角」:安全、商業與政治
Mythos 事件也暴露了 Anthropic 當前面臨的微妙處境。
在安全與商業之間,Anthropic 選擇不公開發布 Mythos,這與其一貫強調的「負責任 AI 開發」品牌形象一致。但這也意味著放棄了一個巨大的商業機會——Mythos 是其有史以來最強大的模型,卻只能以有限的方式產生營收。
在安全與政治之間,情況更加複雜。就在 Mythos 發布的同一時期,Anthropic 正面臨美國國防部將其標記為「供應鏈風險」的爭議,原因是 Anthropic 堅持限制其 AI 技術在軍事領域的使用。總統川普和國防部長 Pete Hegseth 公開批評了該公司。根據 Euronews 的報導,Anthropic 共同創辦人在 Semafor 世界經濟論壇上表示,他不希望這場政治爭議妨礙到國家安全層面的合作。
這場事件的另一個背景值得注意:就在 Mythos 正式發布前約兩週,Anthropic 的 Claude Code 工具才剛發生了一次嚴重的原始碼洩漏事件,512,000 行 TypeScript 程式碼和 44 個隱藏功能被意外公開。連續兩次重大事件,對一家以安全為核心品牌定位的公司來說,無疑帶來了額外的信任壓力。
對企業的啟示:AI 資安時代的生存指南
無論 Mythos 的能力是否被誇大,它所代表的趨勢是真實且不可逆的:AI 正在從根本上改變資安攻防的經濟學和速度。
對於企業決策者來說,有幾個核心要點值得關注。
修補速度將成為生死線。 當 AI 能在漏洞公開後數小時內自動生成可用的攻擊程式碼,傳統的「每月修補」節奏已經完全不夠。Anthropic 在技術報告中明確建議,企業必須大幅縮短安全更新的部署時間,盡可能啟用自動更新,並將包含 CVE 修復的依賴套件更新視為緊急事項而非例行維護。
基礎安全措施比以往更重要。 UK AISI 在評測報告的結論中特別強調,Mythos 目前能夠攻破的是「安全防護薄弱的系統」。定期更新、嚴格的存取控制、安全配置和完整的日誌紀錄——這些看似老生常談的基本功,在 AI 攻擊時代反而成為最關鍵的防線。
AI 基礎設施的安全治理需要升級。 隨著企業大量導入 AI 工作負載,GPU 資源的管理與安全配置變得更加重要。AI 模型的訓練和推論環境本身也可能成為攻擊目標,企業在擴展 AI 基礎設施時需要將安全設計納入架構的每一層,從硬體選型到容器化部署都不能忽略。
防禦也可以用 AI。 這是 Mythos 事件中最常被忽略的面向。同樣的能力如果用在防禦端,可以自動、持續、大規模地掃描企業的程式碼庫,在攻擊者找到漏洞之前先行修補。正如 Anthropic 所說,在新的平衡點建立之後,AI 最終將更有利於防禦方而非攻擊方。但過渡期會很動盪。
Mythos 之後:AI 資安的未來圖景
Mythos 不是終點,而是一個訊號。
Anthropic 自己也承認,這些能力不是 Mythos 獨有的——它們是模型通用能力持續進步的自然延伸。這意味著 OpenAI、Google、甚至開源社群遲早也會達到類似的水準。資安公司 Corridor 的首席產品長 Alex Stamos 估計,開源模型在漏洞發現方面追上前沿模型只需要大約六個月。
在更長的時間尺度上,這場變革將重新定義軟體安全的基本假設。過去數十年建立的「人工審計 + 自動化掃描」模式,正在被「AI 自主攻防 + 即時修補」的新典範取代。Cloud Security Alliance 近期發布的白皮書(由前 CISA 局長 Jen Easterly、Bruce Schneier 等數十位資安領袖共同撰寫)得出了一個直接的結論:Glasswing 不是特例,而是一個將會擴散的能力範式,資安團隊應該立即開始為這個新時代做準備。
對於正在建構或擴展 AI 基礎設施的企業而言,現在是重新審視從雲端 GPU 服務(GaaS)到本地部署架構的安全策略的最佳時機。在 AI 能力指數級增長的世界裡,基礎設施的安全性不再是附加選項,而是核心競爭力。
本文由 INFINITIX 團隊編撰,資料來源包括 Anthropic 官方發布、Frontier Red Team 技術報告、UK AI Security Institute 評測報告、以及 Bloomberg、CNBC、Fortune、NBC News 等國際媒體報導。
常見問題(FAQ)
Claude Mythos 是什麼? Claude Mythos Preview 是 Anthropic 於 2026 年 4 月 7 日發布的最新前沿大語言模型。它是 Anthropic 目前能力最強的模型,在程式碼撰寫、推理和自主代理任務上都展現了跨世代的躍進,尤其在網路安全漏洞發現與利用方面具備超越大多數人類專家的能力。由於其強大的攻擊性資安能力,Anthropic 選擇不對外公開發布,僅限特定合作夥伴使用。
Claude Mythos 跟 Claude Opus 4.6 有什麼差別? Mythos 在多項基準測試中大幅超越 Opus 4.6。以 Firefox 147 漏洞利用為例,Opus 4.6 在數百次嘗試中僅成功 2 次,Mythos 則成功 181 次,性能差距達 90 倍。在網路安全漏洞複現測試中,Mythos 達到 83.1%,Opus 4.6 為 66.6%。在 SWE-bench Pro 軟體工程測試中,Mythos 為 77.8%,Opus 4.6 為 53.4%。Mythos 屬於全新的模型層級(代號 Capybara),定位在 Opus 之上。
為什麼 Anthropic 不公開發布 Claude Mythos? 因為 Mythos 能自主發現並利用幾乎所有主流作業系統和瀏覽器中的 zero-day 漏洞,包括自動串聯多個漏洞成完整攻擊鏈。如果這個能力被惡意行為者取得,可能對全球關鍵基礎設施構成重大威脅。Anthropic 決定先讓防禦方搶得先機,透過 Project Glasswing 計畫修補漏洞後,再考慮更廣泛的發布策略。
Project Glasswing 是什麼?有哪些公司參與? Project Glasswing(玻翅蝶計畫)是 Anthropic 發起的防禦性資安計畫,目的是在攻擊者取得類似能力之前,先用 Mythos 找出並修補關鍵軟體中的漏洞。12 家核心合作夥伴包括 Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA 和 Palo Alto Networks。另有超過 40 家組織獲得存取權限。Anthropic 投入了 1 億美元使用額度和 400 萬美元開源安全捐贈。
Claude Mythos 的 API 定價是多少? Mythos Preview 的定價為每百萬輸入 token 25 美元、每百萬輸出 token 125 美元。目前僅透過 Project Glasswing 計畫提供,可透過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取。一般用戶目前無法使用。
一般人什麼時候可以使用 Claude Mythos? Anthropic 目前沒有公開的發布時間表。官方表示「最終希望讓用戶在安全可控的情況下大規模部署 Mythos 級模型」,但需要先開發足夠的安全防護機制。根據洩漏的草稿文件,Anthropic 計劃透過 Claude API 分階段擴大存取範圍,但該模型目前服務成本非常高,仍在進行效率優化。
Mythos 真的有那麼厲害嗎?有沒有質疑的聲音? 有。資安公司 Aisle 的測試顯示,小型開源模型也能偵測到 Anthropic 展示的部分漏洞,認為漏洞發現能力可能沒有 Anthropic 宣稱的那麼獨佔。資安學者 Bruce Schneier 也認為這有 PR 操作的成分。不過,多數專家承認 Mythos 在「自主發現 + 自動生成攻擊程式 + 多漏洞串聯」這個完整鏈條上的能力確實是前所未見的。
Mythos 對企業有什麼實際影響?該怎麼應對? 最直接的影響是修補速度將成為生死線。當 AI 能在漏洞公開後數小時內自動武器化,傳統的每月修補節奏已不足夠。企業應立即強化基礎安全措施(定期更新、存取控制、完整日誌),啟用自動更新機制,並開始評估將 AI 導入防禦端的可能性。對於正在建構 AI 基礎設施的企業,安全設計需要從硬體選型到容器化部署的每一層都納入考量。Claude Mythos 和之前的 Claude Code 洩漏事件有關嗎? 兩者是獨立事件,但時間上非常接近。2026 年 3 月底,Claude Code v2.1.88 的完整原始碼因 npm 打包錯誤被意外公開,揭露了 KAIROS 自主代理模式等 44 個隱藏功能。約兩週後,Mythos 正式發布。連續兩起事件對 Anthropic 的安全