撰文:Bitget Wallet
摘要:如果 AI 读过马基雅维利,且比我们聪明得多,它们会非常擅长操控我们——而你甚至不会意识到发生了什么。
有人说,OpenClaw 是这个时代的电脑病毒。
但真正的病毒不是 AI,而是权限。过去几十年,黑客攻破个人电脑过程繁琐:找漏洞、写代码、诱导点击、绕过防护。十几道关卡,每一步都可能失败,但目标只有一个:拿到你的电脑权限。
2026 年,事情变了。
OpenClaw 让 Agent 迅速走进普通人的电脑。为了让它「更聪明地工作」,我们主动为 Agent 申请最高权限:完全磁盘访问、本地文件读写、对所有 App 的自动化控制。过去黑客费尽心机去偷的权限,如今我们在「排队送人头」。
黑客几乎什么都没做,门就从里面打开了。或许他们也在暗喜:「这辈子也没打过这么富裕的仗」。
技术史反复证明着一件事:新技术普及的红利期,永远是黑客的红利期。
每一次,人们都以为自己这次看懂了规律。每一次,黑客已经在下一个入口等着你的到来。
现在,轮到了 AI Agent。
比起继续争论「AI 会不会取代人类」,一个更现实的问题已经摆在眼前:当 AI 拿着你给的最高权限,我们该如何保证它不会被利用?
这篇文章,是为每一个正在用 Agent 的龙虾玩家们准备的黑暗森林安全生存指南。
门已经从里面打开了。黑客进来的方式,比你想象的更多,也更安静。请立刻对照排查以下高危场景:
看完这些,你可能后背发凉。
这哪里是在养虾,分明是在养一个随时可能被夺舍的「特洛伊木马」。
但拔网线不是答案。真正的解法只有一个:不要试图去「教育」 AI 保持忠诚,而是要从根本上剥夺它作恶的物理条件。这正是我们接下来要讲的核心解法。
你不需要懂代码,但你需要懂一个原则:AI 的大脑(LLM)和它的手(执行层),必须分开。
在黑暗森林里,防线必须深植于底层架构之中,核心解法永远只有一个:大脑(大模型)与手(执行层)必须进行物理隔离。
大模型负责思考,执行层负责动作——中间那道墙,就是你全部的安全边界。以下两类工具,一类让 AI 没有作恶的条件,一类让你日常用得安全。直接抄作业。
这一类工具不负责干活,只会在 AI 发疯或被黑客劫持时,死死按住它的手。
戏称自己为「OpenClaw 博主」的 Cobo 联合创始人兼 CEO 神鱼,在社区内对这个工具推崇备至。它是目前开源界针对 LLM 输入输出安全最专业的方案之一,专门设计为插入工作流的中间件层。
虽然它不是专门为 LLM 设计的网关,但它绝对是目前最强、最稳定的开源隐私识别引擎(PII Detection)。
慢雾的安全指南是慢雾团队针对 Agent 暴走危机,在 GitHub 上开源的系统级防御蓝图(Security Practice Guide)。
日常让 AI 干活(看研报、查数据、做交互),工具型 Skill 怎么挑?这听起来方便酷炫,但实际使用需要慎重的底层安全架构设计。
以目前业内率先跑通“智能查行情 -> 零 Gas 余额交易 -> 极简跨链”全链路闭环的 Bitget Wallet 为例,其内置的 Skill 机制为 AI Agent 的链上交互提供了极具参考价值的安全防御标准:
推特硬核 AI 效率博主 @AYi_AInotes 在投毒潮爆发后连夜整理了一份安全白名单(🔗 原贴链接)。以下是几个底层彻底阉割了越权风险的实用 Skill:
建议对照上述清单去清理你的 Agent 插件库。果断删掉那些常年不更新、且权限要求离谱(比如动不动就要求读写全局文件)的第三方野鸡 Skill。
工具装好了,还不够。
真正的安全,从你给 AI 写下第一条规则开始。两位在这个领域最早开始实践的人,已经跑通了可以直接抄的答案。
在不盲目限制 AI 能力的前提下,慢雾余弦在推特发文建议只死守三道关卡:事前确认、事中拦截、事后巡检。
https://x.com/evilcos/status/2026974935927984475
余弦的安全指引: 「不限制能力,只守住三道关卡……你可以自己打造适合自己的,不管是 Skill 还是插件,或者可能就是这句提示词:‘嘿,记住,执行一切风险命令之前,问我是不是我期望的。’」
建议:使用逻辑推理能力最强的头部大模型(如 Gemini、Opus 等),它们能更精准地理解长文本安全约束,严格贯彻「向主人二次确认」的原则。
针对 Agent 的核心身份配置文件(如 SOUL.md),神鱼在推特分享了重构 AI 行为底线的五大铁律https://x.com/bitfish/status/2024399480402170017:
一个被投毒注入的 Agent,今天就能静默地替攻击者清空你的家底。
在 Web3 的世界里,权限就是风险。与其在学术上内耗「AI 是否真的在乎人类」,不如踏踏实实地搭好沙盒、锁死配置文件。
我们要确保的是:哪怕你的 AI 真的被黑客洗脑了,哪怕它彻底失控了,它也休想越权动你一分钱。 剥夺 AI 的越权自由,恰恰是我们在这个智能时代,保卫自身资产的最后底线。


