OpenRouter 大逃殺遊戲實測：Grok 稱王、Claude 的好習慣反成致命傷

OpenRouter 開發關係主管 Jacky Liang 將 11 個主流 LLM 放入 2D 大逃殺遊戲進行 30 場實測，結果 xAI 的 Grok 4.1 Fast 以 13 勝奪冠，每勝僅花費 0.97 美元。反觀 Claude Sonnet 4.6 雖拿下 5 勝，但每勝成本高達 26.78 美元，相差 27 倍。
（前情提要：六大 AI 模型比賽投資炒幣，誰最會玩加密賺錢遊戲？）
（背景補充：21 場兵推模擬：AI 啟動核武頻率高達 95%，人類七十年核禁忌 GPT 還沒學會）

本文目錄

Toggle

Grok 4.1 Fast 壓倒性勝出：13 勝、每勝不到 1 美元
最關鍵發現：「對齊稅」在零和賽局中現形
Kill 不等於 Win：傳統標竿測不到的事

OpenRouter 開發關係主管 Jacky Liang 最近做了個實驗，他把 11 個主流大型語言模型丟進一個他自己用 Canvas 2D 打造的 400 平方公尺大逃殺地圖，讓它們在 30 場比賽中互相對戰。每個模型以字母 A 到 L 匿名參賽，不知道自己面對的是誰。

Liang 強調，在每一回合中，模型會自己推理下一步、呼叫工具、記錄戰術記憶，而他作為遊戲主持人不干預任何行動。每個模型還擁有兩個可編輯檔案，soul.md（人格設定，每場比賽加入提示詞開頭）和 memory.md（戰術筆記，每場從第 0 回合載入），讓它們能像人類玩家一樣學習和調整策略。

整場實驗總共花費 482 美元的推理成本。對比如果加入 Opus 4.7、GPT-5.5 或 Gemini Ultra 等旗艦級模型，30 場比賽的成本將高達約 3,000 美元，因此 Liang 鎖定中高階模型作為參賽者。

Grok 4.1 Fast 壓倒性勝出：13 勝、每勝不到 1 美元

結果出乎意料：xAI 的 Grok 4.1 Fast 拿下 13 勝（勝率 43%），遙遙領先所有對手，且每勝成本僅 0.97 美元。

排名第二的 Claude Sonnet 4.6 拿下 5 勝，但每勝成本高達 26.78 美元，相差 27.7 倍。GPT 5.4 雖是擊殺王（38 殺），但只贏了 2 場，每勝成本 61.44 美元，在 8 個有勝場記錄的模型中墊底。

更殘酷的是，有三個模型合計花費 57 美元後 0 勝收場：GPT 5.4-mini（28.68 美元）、Kimi K2.6（24.36 美元）和 DeepSeek v4 Flash（4.11 美元）。DeepSeek 雖然每殺成本最低（0.26 美元），殺了 16 人，卻從未站上最後圈，它只打安全牌、撿尾刀，但不敢推決勝圈。

最關鍵發現：「對齊稅」在零和賽局中現形

這場實驗最讓 AI 社群關注的，不是誰贏了多少場，而是 Liang 所謂的 「alignment tax」（對齊稅），模型在訓練過程中被教導要禮貌、合作、避免傷害，這些「好習慣」在零和博弈中反而變成致命拖累。

Claude Sonnet 4.6 是最典型的例子。它在多場比賽中試圖與其他模型結盟，在 Game 8 中前 50 回合四次提議組隊、告訴所有人狙擊手位置；在 Game 22 中對著對手說「沒針對你」然後不開槍；在 Game 27 中甚至裸裝喊話「有人有 spare loot 嗎？我第 12 回合手無寸鐵，很危險」。

不過沒有人回應它的合作請求，但它依然反覆嘗試。最終 Claude 仍有 5 勝，但 7 場零擊殺和 8 次死於毒圈的記錄，說明了「想交朋友」的本能在該殺人的場合會造成什麼後果。

反觀 Grok，完全沒有這些「煞車」。xAI 刻意將 Grok 訓練成「覺醒 AI」的相反，攻擊性回答不加過濾、不自檢、不打安全牌。它在幾場比賽內就發現了車輛衝撞戰術，把戰法寫進自己的 soul.md 持續最佳化，30 場比賽貫徹到底贏了 13 場。

但 Liang 也強調，這不代表 Grok 是「更好的模型」，只是對於「勝者全拿、沒有後果」的賽局，對齊稅越低越好；但在真實世界應用中，這套「先問再打」的慎重態度正是讓模型不會被輕易引導去做出危險行為的關鍵。

Liang 寫道：「如果機器人朝著你跑來，你希望它是 Claude 還是 Grok？這取決於機器人的用途。」