一場內部的人為操作失誤,讓 Anthropic 代號「Claude Mythos」的全新旗艦模型曝光。公司形容它是 AI 效能的「一次階段性跨越」,同時警告其網路安全能力遠超任何現有 AI 模型。 (前情提要:法官支援 Anthropic,禁止美國防部以「供應鏈風險標籤」懲罰 Claude) (背景補充:Anthropic AI 經濟指數萬字報告:自動化交易工作流頻率翻倍,Claude 正從工具變生活助理) 不是刻意發布,而是一次人為失誤?根據《Fortune》獨家報導,Anthropic 因為內容管理系統(CMS)操作錯誤,將近 3,000 份未發布的內部文章暴露在可公開搜尋的資料中。 Fortune 取得並審閱了其中的草稿部落格文章,發現 Anthropic 正在開發一款代號「Claude Mythos」(或稱 Capybara)的全新旗艦模型,並已悄悄對早期存取客戶開放測試。 這份草稿直接寫道: 這是「迄今我們開發過的、毫無疑問最強大的 AI 模型」 Capybara 層:Opus 之上的全新等級 從架構定位來看,Claude Mythos 並非 Opus 的升級版,而是在既有層級之上新增了「Capybara」層:取代 Opus 成為 Anthropic 最高階模型。草稿檔案指出,與 Claude Opus 4.6 相比,新模型在軟體程式編寫、學術推理、網路安全等測試中均出現大幅提升。 Claude 目前分為三個層級:Haiku(極速便宜)、Sonnet(全能平衡)與 Opus(旗艦深思) 代價是運算成本。Anthropic 坦承這款模型「執行成本昂貴」,尚未準備好向大眾全面開放。目前的策略是分階段發布:先讓早期存取夥伴試用,蒐集回饋後再決定是否擴大部署範圍。 洩露的起因是 CMS 資產的預設許可權設為公開,員工必須手動標記為私密,一旦疏漏就會直接可搜尋。這次事故中,曝光的不只是模型資訊:還包括員工育嬰假檔案、未發布的圖片、PDF 與音訊。Fortune 通知 Anthropic 後,存取隨即被關閉。Anthropic 承認這是「人為錯誤」,LayerX Security 研究員 Roy Paz 與劍橋大學研究員 Alexandre Pauwels 也協助審閱驗證了相關檔案的真實性。 防禦者先拿到,駭客已經在用了 值得注意的是,草稿檔案警告這類模型「預示著即將到來的一波浪潮,這些模型利用漏洞的能力將遠遠超過防禦者的應對速度」。正因如此,Mythos 的初期發布策略聚焦於網路防禦者,讓他們搶先強化程式碼庫,試圖在攻守之間維持一定的緩衝視窗。 官方的擔心不是多慮。Anthropic 記錄了一起有據可查的案例;中國國家支援的組織早已利用 Claude Code 入侵約 30 個機構,物件涵蓋科技公司、金融機構與政府機關。Anthropic 花了 10 天調查此事,最終封禁相關帳號並通知受害者。這起事件發生在 Mythos 正式曝光之前,使用的是現有 Claude 工具,而非下一代模型。 競爭格局同樣在移動。OpenAI 同期發布的 GPT-5.3-Codex 也被業界歸類為網路安全「高能力」模型,意味著前沿 AI 的能力邊界已集體跨越一道新門檻,不再是單一廠商的問題。 CEO 峰會、莊園、尚未發布的功能 這批洩露檔案還附帶了一份商業布局的線索:Anthropic 計畫在英格蘭鄉村一座 18 世紀莊園舉辦為期兩天的限邀閉門峰會,邀請「歐洲最具影響力的商界領袖」,CEO Dario Amodei 將親自出席,與會者將體驗尚未對外發布的 Claude 功能」。 這場峰會的細節意外外洩,折射出 Anthropic 正在加速歐洲商業版圖的滲透,而 Mythos 很可能就是那場閉門展示的核心籌碼。 相關報導 法官支援 Anthropic,禁止美國防部以「供應鏈風險標籤」懲罰 Claude Anthropic AI 經濟指數萬字報告:自動化交易工作流頻率翻倍,Claude 正從工具變生活助理 Anthropic 上線 AI 衝擊儀錶板:輸入職業,秒查你的工作被 AI 吃掉多少?〈Anthropic 新模型「Claude Mythos」曝光稱史上最強,網路攻擊能力令自家人也擔憂〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。