作者:Sleepy;来源:区块律动
当前AI行业呈现一种矛盾现象:企业高管在会议上对技术风险表达深切担忧,呼吁加强监管;而会议结束后,新一代模型照常发布,性能越来越强,发布时间表越来越紧凑。同一批人,上午还在警告技术失控风险,下午就全力推动产品加速上市。这种言行不一背后,是AI技术滚滚向前的行业现实。
Anthropic公司最新发布的Fable 5模型完美诠释了这种困境。该模型于6月9日正式上线,仅存活三天,就在6月12日被美国政府紧急叫停。当天下午,Anthropic接到美国政府电话,获得90分钟缓冲时间。傍晚五点二十一分,正式指令到达:所有外国国民不论身处何地都不得继续使用该模型,包括Anthropic自己的外籍员工。理由是四个字——国家安全。

国家安全落到一个AI模型身上看似沉重,但Fable并非普通模型。这是Anthropic一直未公开的Mythos模型的“安全版本”,通过一层安全护栏确保用户无法利用它进行网络攻击、高危科学研究等可能造成严重后果的行为。然而Amazon向美国政府提交报告称,有人能够“越狱”直接通过Fable调用Mythos模型,这引起了美国政府的高度警觉。
讽刺的是,Anthropic可能是全球最认真对待AI风险的公司之一。公司创始人Dario Amodei曾任OpenAI研究副总裁,一批创始成员也来自OpenAI。他们亲眼见证模型能力指数级增长背后的兴奋与隐患。Anthropic比同行更早提醒技术失控风险,甚至主动建议政府应有权阻止危险模型部署。
没想到美国政府真正动用这一权力时,首个目标竟是Anthropic自家的模型。Amazon提示风险,美国政府保护国家安全,Anthropic执行安全防护措施——每个环节都在履行职责,却共同促成了一个非理想结果。

表面上这是一次行业刹车,实则不然。一个模型上线三天即被行政命令叫停,恰恰说明没有参与者自愿减速,才需要外部强制干预。如果公司、安全研究者、客户和政府之间存在有效的协调减速机制,事态不至于发展到动用国家安全手段。更何况这一刀切下去,停下的只有Anthropic一家,其他竞争者仍在全速前进。
Fable 5本身就是折中产物。Anthropic手中真正强大的模型是Mythos,因能力过强从未公开。2026年4月,公司通过Project Glasswing将Mythos预览版交给安全机构寻找漏洞。但到了6月,公司仍在商业压力下将此类能力推向公众。
安全作为竞争力本身存在内在矛盾——竞争力要求跑得更快,安全要求适当减速。Anthropic试图让两者共存,但事实证明这种平衡极难达成。
今年年初,Anthropic就因Claude的军事用途与五角大楼产生分歧。公司推出Claude Gov供美国政府使用,但拒绝大规模国内监控和无人监督的致命自主武器。在Anthropic看来,这是责任的边界;在国家安全体系看来,边界本身就是麻烦。
6月初,Anthropic提出一个想法:前沿实验室或许需要协调放缓,甚至共同暂停,为政策制定留出时间。“协调”成为关键词,因为单家公司减速无法保证全球安全。Anthropic停下,OpenAI、Google、xAI不一定停下,资本市场绝不会停下。在这种环境中,单方面克制不是美德,可能意味着被淘汰。

Fable上线后最先不满的是安全研究人员。IBM X-Force研究者Chompie指出,Fable会拒绝大量仅涉及边缘安全问题的请求,有时连阅读博客文章都可能触发限制。安全护栏试图分辨用户意图,但模型只能看到文字和上下文,无法区分修门和撬锁的差别。
两天后,一份报告递交美国政府,事件性质从此改变。Anthropic强调时间差:发布前多次通知美国政府,政府未反对甚至参与测试,公司获得了部署许可。三天后,同一系统突然要求下架。美国政府始终未提供具体细节,Anthropic审查演示后认为只是几个已知且不严重的漏洞,其他公开模型同样存在。
开发者不满意,政府也不满意,Anthropic夹在中间左右为难。背后是整个不信任链条在运作,每一环节都在防备上一环节,最终社会难以相信有任何实体能真正承担责任。
有效加速主义(e/acc)近年来成为技术乐观主义信条:推动技术加速发展,无需过度关注监管、社会结构和伦理问题,相信技术进步能解决大问题。并非每家公司都自称e/acc信徒,但这种主张无需普遍认可就能改变环境。能力竞赛、无限算力、融资时间表、国家竞争、军事需求、开发者对强大工具的渴求——这些因素共同形成了一种“气候”。
强大如Anthropic,是这个加速时代少数反复呼吁刹车的声音,但最终仍需先证明自己跑得够快。技术加速不需要坏人,只需要每个好人都认为自己不能第一个停下。
Fable事件是交出刹车权的代价。公权力介入是因为行业自律不足,但公权力不一定按预期方式运作。国家安全机制最熟练的动作不是协商,而是封锁、许可和例外。
AI早已不是边界清晰的技术。当前沿模型同时嵌入商业、科研、国防和基础设施,谁有能力决定其使用限制?所有人都知道速度太快,但速度本身已成为生存条件。
历史提供镜鉴:1914年8月1日傍晚,德皇威廉二世下令全军总动员。命令发出几分钟后,伦敦来电称只要德国不攻击法国,英国能让法国保持中立。德皇大喜,命令总参谋长小毛奇调整计划只攻击俄国。小毛奇回答:办不到。理由是百万大军的铁路运输时刻表用一年时间精密制定,无法更改。
后来历史学家发现,铁路部门每年都演练临时改线,东线方案一直备着。火车真要掉头,完全可行。那一夜真正发生的不是没有刹车,而是站在控制闸旁的人坚信刹车不可触碰。他没问能否改变,而是太确定不能改变。
于是火车继续向西行驶,将本可局限于三国间的冲突,演变成席卷欧洲的大战。没人想要这个结果,但每个人都认为自己在做最该做且不得不做的事。
AI的加速就是这样一列已经启动的列车。它不是某个人创造的,而是算力、资本和国家野心一节节拼接而成,自行向前。车上所有人都做着看似最正确的事,列车却不断加速。
这就是AI时代令人不安之处:危险并非无人看见,刹车并非真的不存在。呼吁刹车的人坐在车内,意识到危险的人脚踩油门。这个行业最警惕的东西,往往正是它拼命创造的东西。Fable本应成为让所有人暂停审视的案例,但在文章撰写期间,又有几个新模型发布,每个都自称最强。
愿意第一个踩下刹车的人,至今仍未出现。
