安全护栏难敌加速竞速：Fable 5三天下架揭示AI治理困局

作者：Sleepy；来源：区块律动

当前AI行业呈现一种矛盾现象：企业高管在会议上对技术风险表达深切担忧，呼吁加强监管；而会议结束后，新一代模型照常发布，性能越来越强，发布时间表越来越紧凑。同一批人，上午还在警告技术失控风险，下午就全力推动产品加速上市。这种言行不一背后，是AI技术滚滚向前的行业现实。

Anthropic公司最新发布的Fable 5模型完美诠释了这种困境。该模型于6月9日正式上线，仅存活三天，就在6月12日被美国政府紧急叫停。当天下午，Anthropic接到美国政府电话，获得90分钟缓冲时间。傍晚五点二十一分，正式指令到达：所有外国国民不论身处何地都不得继续使用该模型，包括Anthropic自己的外籍员工。理由是四个字——国家安全。

被叫停的Fable 5和刹不住车的AI

国家安全落到一个AI模型身上看似沉重，但Fable并非普通模型。这是Anthropic一直未公开的Mythos模型的“安全版本”，通过一层安全护栏确保用户无法利用它进行网络攻击、高危科学研究等可能造成严重后果的行为。然而Amazon向美国政府提交报告称，有人能够“越狱”直接通过Fable调用Mythos模型，这引起了美国政府的高度警觉。

讽刺的是，Anthropic可能是全球最认真对待AI风险的公司之一。公司创始人Dario Amodei曾任OpenAI研究副总裁，一批创始成员也来自OpenAI。他们亲眼见证模型能力指数级增长背后的兴奋与隐患。Anthropic比同行更早提醒技术失控风险，甚至主动建议政府应有权阻止危险模型部署。

没想到美国政府真正动用这一权力时，首个目标竟是Anthropic自家的模型。Amazon提示风险，美国政府保护国家安全，Anthropic执行安全防护措施——每个环节都在履行职责，却共同促成了一个非理想结果。

被叫停的Fable 5和刹不住车的AI

表面上这是一次行业刹车，实则不然。一个模型上线三天即被行政命令叫停，恰恰说明没有参与者自愿减速，才需要外部强制干预。如果公司、安全研究者、客户和政府之间存在有效的协调减速机制，事态不至于发展到动用国家安全手段。更何况这一刀切下去，停下的只有Anthropic一家，其他竞争者仍在全速前进。

Fable 5本身就是折中产物。Anthropic手中真正强大的模型是Mythos，因能力过强从未公开。2026年4月，公司通过Project Glasswing将Mythos预览版交给安全机构寻找漏洞。但到了6月，公司仍在商业压力下将此类能力推向公众。

安全作为竞争力本身存在内在矛盾——竞争力要求跑得更快，安全要求适当减速。Anthropic试图让两者共存，但事实证明这种平衡极难达成。

今年年初，Anthropic就因Claude的军事用途与五角大楼产生分歧。公司推出Claude Gov供美国政府使用，但拒绝大规模国内监控和无人监督的致命自主武器。在Anthropic看来，这是责任的边界；在国家安全体系看来，边界本身就是麻烦。

6月初，Anthropic提出一个想法：前沿实验室或许需要协调放缓，甚至共同暂停，为政策制定留出时间。“协调”成为关键词，因为单家公司减速无法保证全球安全。Anthropic停下，OpenAI、Google、xAI不一定停下，资本市场绝不会停下。在这种环境中，单方面克制不是美德，可能意味着被淘汰。

被叫停的Fable 5和刹不住车的AI

Fable上线后最先不满的是安全研究人员。IBM X-Force研究者Chompie指出，Fable会拒绝大量仅涉及边缘安全问题的请求，有时连阅读博客文章都可能触发限制。安全护栏试图分辨用户意图，但模型只能看到文字和上下文，无法区分修门和撬锁的差别。

两天后，一份报告递交美国政府，事件性质从此改变。Anthropic强调时间差：发布前多次通知美国政府，政府未反对甚至参与测试，公司获得了部署许可。三天后，同一系统突然要求下架。美国政府始终未提供具体细节，Anthropic审查演示后认为只是几个已知且不严重的漏洞，其他公开模型同样存在。

开发者不满意，政府也不满意，Anthropic夹在中间左右为难。背后是整个不信任链条在运作，每一环节都在防备上一环节，最终社会难以相信有任何实体能真正承担责任。

有效加速主义（e/acc）近年来成为技术乐观主义信条：推动技术加速发展，无需过度关注监管、社会结构和伦理问题，相信技术进步能解决大问题。并非每家公司都自称e/acc信徒，但这种主张无需普遍认可就能改变环境。能力竞赛、无限算力、融资时间表、国家竞争、军事需求、开发者对强大工具的渴求——这些因素共同形成了一种“气候”。

强大如Anthropic，是这个加速时代少数反复呼吁刹车的声音，但最终仍需先证明自己跑得够快。技术加速不需要坏人，只需要每个好人都认为自己不能第一个停下。

Fable事件是交出刹车权的代价。公权力介入是因为行业自律不足，但公权力不一定按预期方式运作。国家安全机制最熟练的动作不是协商，而是封锁、许可和例外。

AI早已不是边界清晰的技术。当前沿模型同时嵌入商业、科研、国防和基础设施，谁有能力决定其使用限制？所有人都知道速度太快，但速度本身已成为生存条件。

历史提供镜鉴：1914年8月1日傍晚，德皇威廉二世下令全军总动员。命令发出几分钟后，伦敦来电称只要德国不攻击法国，英国能让法国保持中立。德皇大喜，命令总参谋长小毛奇调整计划只攻击俄国。小毛奇回答：办不到。理由是百万大军的铁路运输时刻表用一年时间精密制定，无法更改。

后来历史学家发现，铁路部门每年都演练临时改线，东线方案一直备着。火车真要掉头，完全可行。那一夜真正发生的不是没有刹车，而是站在控制闸旁的人坚信刹车不可触碰。他没问能否改变，而是太确定不能改变。

于是火车继续向西行驶，将本可局限于三国间的冲突，演变成席卷欧洲的大战。没人想要这个结果，但每个人都认为自己在做最该做且不得不做的事。

AI的加速就是这样一列已经启动的列车。它不是某个人创造的，而是算力、资本和国家野心一节节拼接而成，自行向前。车上所有人都做着看似最正确的事，列车却不断加速。

这就是AI时代令人不安之处：危险并非无人看见，刹车并非真的不存在。呼吁刹车的人坐在车内，意识到危险的人脚踩油门。这个行业最警惕的东西，往往正是它拼命创造的东西。Fable本应成为让所有人暂停审视的案例，但在文章撰写期间，又有几个新模型发布，每个都自称最强。

愿意第一个踩下刹车的人，至今仍未出现。