姚旭郭博瑞：禁用的Anthropic前沿模型与其AI治理框架：新的对撞与隐藏的逻辑

作者：姚旭、郭博瑞发布时间：2026-06-13 23:53:35 来源：全球人工智能创新治理中心+收藏本文

2026年6月11日，Anthropic创始人达里奥·阿莫迪（Dario Amodei）在其个人博客上发布政策长文《论AI的指数级发展及其政策应对的报告》（Policy on the AI Exponential，以下简称《报告》），系统阐述了其对于人工智能时代监管体系、经济政策、公民自由以及国际秩序重构的整体构想。然而，就在《报告》发布后不久，美国商务部于6月12日针对Anthropic的Fable 5和Mythos 5模型发布限制措施，要求暂停外国用户对相关模型的访问权限。面对这一监管冲击，Anthropic随即发布《关于美国政府中止 Fable 5 和 Mythos 5 访问权限指令的声明》（Statement on the US Government Directive to Suspend Access to Fable 5 and Mythos 5，以下简称《声明》）进行回应。这两份时间上紧密相连、内容上相互关联的文本，为观察美国前沿AI企业的真正诉求与背后考量提供了一个独特的观察窗口。

在此背景下，本文尝试回答以下问题：Anthropic究竟试图构建怎样的AI治理政策叙事？这些政策主张背后蕴含着何种商业利益与政治考量？而美国政府随后出台的监管措施，又在多大程度上揭示了科技企业安全叙事与真实利益诉求之间的张力？

Policy on the AI Exponential原网页。

图片来源：Dario Amodei个人博客

《论AI的指数级发展及其政策应对的报告》核心内容

在《报告》中，阿莫迪以“AI指数级发展与政策制定速度之间的错配”为逻辑起点，系统阐述了其对于人工智能治理的总体构想。阿莫迪认为，AI能力正沿着“缩放定律”（Scaling Law）持续跃升，并将在未来数年内达到“一座数据中心内汇聚万千天才”的“强AI”（Powerful AI）阶段。然而，相较于技术迭代的高速推进，政府立法与监管体系反应迟缓，导致现有治理机制难以及时应对即将到来的深刻变革。因此，阿莫迪主张抓住当前有限的政策窗口期，提前构建适应AI时代的新型治理框架。

围绕这一判断，阿莫迪提出了五个重点政策方向。第一，在监管与公共安全领域，他认为前沿模型已经对网络安全、生物安全和系统失控等领域构成现实威胁，主张建立类似航空安全监管的制度体系，对超过特定算力门槛的模型建立强制测试、第三方审计和政府许可制度。第二，在宏观经济领域，他预测AI可能带来持续性的劳动力替代和财富集中，因此提出建立就业追踪体系、就业激励政策以及全民基本收入等再分配机制，以缓解社会冲击。第三，在科技创新领域，他主张改革以生物医药为代表的监管体系，避免传统审批制度阻碍AI驱动的科学突破。第四，在国家与公民自由领域，他警告AI可能被用于大规模监控和权力扩张，提出限制自动化武器国内使用、加强隐私保护和保障公民获取AI法律援助等措施。第五，在国际层面，他强调AI将成为决定未来国家实力的核心战略资源，主张由美国及其盟友构建基于共同价值观的“AI信任联盟”，通过协调监管、共享技术和强化芯片出口管制等方式，确保民主国家在全球AI竞争中的主导地位。

总体而言，《报告》并非单纯讨论技术风险，而是一份涵盖国内治理、经济转型与国际战略的综合性政策蓝图。其核心主张在于：在AI能力即将实现跨越式突破的背景下，通过提前构建监管体系、调整经济政策并重塑国际秩序，实现对AI革命的主动塑造，而非被动应对。

然而，作为全球最具影响力的AI企业之一，Anthropic的政策态度并非完全中立。阿莫迪所提出的治理框架虽然以公共利益和全球安全为名义，但其具体政策主张与Anthropic自身的商业利益、市场竞争地位以及政治诉求之间存在高度重合。因此，有必要从商业逻辑与政治逻辑两个维度，对《报告》提出AI治理政策框架背后的真实动因进行进一步审视。

商业逻辑：Anthropic的利益考量

尽管《报告》以“防范AI指数级风险”为核心叙事，但从企业行为逻辑出发，其政策主张并非完全脱离商业利益考量。作为正处于高速扩张阶段的前沿AI企业，Anthropic既需要向资本市场证明自身具备领先的安全治理能力，也需要在竞争日趋激烈的大模型赛道中巩固既有优势。因此，阿莫迪所倡导的风险治理框架，不仅是一套公共政策建议，更是一种塑造企业信誉、强化市场地位的战略工具。在这一意义上，安全叙事与商业利益并非相互对立，而是形成了相互支撑的协同关系。

首先、通过风险渲染叙事，Anthropic实现对自身安全与社会风险应对能力的变相宣传，为推进IPO进程争取市场信任。在《报告》中，阿莫迪通过描绘前沿模型在生物安全、网络攻击等领域的指数级毁灭风险，建立起一种“技术亟需规制”的迫切危机感，并基于此提出了一套涵盖国家强制审计、社会转型保障的政策框架建议。然而，阿莫迪在强调公共安全议题的同时，也集中突出了Anthropic在安全治理、理发参与和企业责任等维度的积极贡献。

例如阿莫迪在文本中着重强调了Anthropic在立法层面的重要影响，指出“在2025年，Anthropic支持了透明度立法，协助加州通过了SB 53法案，在纽约州通过了RAISE法案，并在2026年初协助伊利诺伊州通过了SB 315法案”，以此向资本市场明示其政策游说能力与合规先发优势。同时为了进一步对冲公众对大模型能源消耗与社会替代的民意反弹、获取社会信用，阿莫迪在文中公开标榜Anthropic所承担的社会责任，反复强调“Anthropic为应对电价上涨而做出的出资承诺”。

此外值得关注的是，阿莫迪在强调政府监管重要性的同时，也主张赋予AI企业更大的权力和治理参与空间，认为“AI公司应当拥有比普通私营实体更多的权力分立”，并将自家的“长期利益信托制度”作为行业自治的典范加以强调。这些政策建议在积极回应AI安全关切的同时，也在客观上凸显出Anthropic在安全治理上的领先能力与优势地位，有助于其进一步将Anthropic重视安全的市场优势转化为投资者可评估、可溢价的无形资产，助力IPO上市冲刺。

其次，Anthropic针对6月12日美国商务部发布的针对Anthropic的Fable 5和Mythos 5模型管制禁令的声明，也展现出AI企业在安全治理目标与商业利益之间所面临的现实平衡。商务部直接指明Anthropic模型存在巨大“非通用越狱漏洞”，导致Anthropic在上市前夕遭遇重大安全信誉减值风险。

面对模型安全争议可能带来的市场预期变化和企业声誉压力，Anthropic在《声明》将回应重点更多放在技术和风险界定的客观解释上。例如《声明》反复强调该漏洞在工程上属于极低概率，并强调类似情况并非Anthropic所独有，指出“该报告中展示的潜在漏洞在其他模型中（包括OpenAI的GPT-5.5）也广泛存在”，是前沿模型中普遍存在的技术细节问题，而非重大安全漏洞。这种表态体现出AI企业在安全治理责任与市场声誉之间的复杂权衡，在面对实体行政封禁带来的巨大损失面前，Anthropic需要将回应重点优先放在风险澄清上，以对冲企业市场声誉受损所带来的消极影响。

Anthropic回应美国商务部关于Fable 5和Mythos 5模型管制禁令。

图片来源：X平台Anthropic官方账号

此外，Anthropic基于自身优势针对性地提出政策建议，有助于其利用既有的安全治理能力构建排他性的商业壁垒，从而塑造市场竞争优势。在《报告》一文中，阿莫迪提出了前沿AI治理的五大核心方向，其中第一部分便聚焦于“前沿模型的测试、审计与许可”。他明确呼吁立法机关应当以“起步算力”作为合规分水岭，对超过特定算力阈值的模型实施强制性的第三方红队测试。

这一呼吁在推动阻断技术风险的同时，也有助于Anthropic借助制度化监管框架强化自身市场竞争优势。作为长期以“AI安全”为自身市场优势的企业，Anthropic“负责任缩放政策（Responsible Scaling Policy）”早已将高昂的对抗性测试与合规审计嵌入到了既有的研发流程中，实现了安全边际成本的内部消化。

一旦阿莫迪在文中所提出的政策框架落地，这种全行业的测试标准规定对Anthropic仅会带来低程度影响，但对于中小型AI初创企业、大学科研机构以及广泛AI开源社区来说，则带来了重大的算力损耗与成本压力。阿莫迪所倡导的监管框架，在有助于提高前沿模型开发的安全合规要求的同时，也客观上为其分散了市场竞争压力，使Anthropic长期积累的安全治理能力得以转化为市场竞争优势，有可能重塑行业竞争格局。

政治逻辑：政企关系的修复尝试

除了商业层面的考量，《报告》同样具有鲜明的政治属性。当前，美国人工智能治理已深度嵌入大国竞争与国家安全框架之中，前沿AI企业越来越难以保持所谓“价值中立”的技术立场。对于Anthropic而言，其发展不仅依赖资本市场支持，也高度受制于政府监管环境。因此，阿莫迪提出的诸多政策主张，实际上体现出企业主动将自身利益嵌入美国国家战略的倾向。通过强调民主国家技术联盟、强化出口管制以及突出美国本土安全边界，Anthropic试图重塑与特朗普政府的关系，为自身争取更有利的发展空间。

一方面，阿莫迪通过划定“美国优先”的AI安全边界，展现出与特朗普政府国家安全议程想契合的政策立场，有助于修复Anthropic与特朗普政府之间破裂的政企关系。在《报告》中，阿莫迪在探讨AI军事应用带来的潜在风险时，精细地划定了一条地理红线，即“禁止在国内使用全自动武器”。但从全球公共安全的角度来看，自动化武器的扩散威胁并无国界之分，若其治理框架真如宣传般“为人类长远安全负责”，该红线理应覆盖全球所有安全场景。

然而，将防护对象限制于“美国国内”，而并未将面向他国的AI军事应用纳入政策限制范围之内。这一双重标准的体现，本质上是向强调“美国优先”的特朗普政府传递出向其政治议程靠拢的积极信号。由于Anthropic此前因安全审查等问题与官方关系紧绷，阿莫迪试图通过将企业安全边界与美国本土的国防利益深度绑定，以重建与政策制定者之间的信任纽带。

但实际上，对特朗普“美国优先”政治议程的靠拢，与企业自身的全球化商业利益存在天然矛盾。6月12日美国商务部一纸禁令限制全球外籍用户访问 Fable 5 和 Mythos 5模型，即便是身处美国境内或是Anthropic的外籍员工也在限制范围之中，由于难以按国际切分用户，Anthropic不得不实施全球全线下线的重创举措。这一案例表明企业与政府之间的政策协调并不必然意味着企前者能够获得监管豁免，而是往往要以牺牲商业利益为代价前提。

另一方面，Anthropic以价值观叙事为基础，支持构建由美国主导的全球AI治理体系，并试图在此过程中强化与美国政府战略目标之间的协调性。然而，这一政策立场与企业面向全球市场开展业务的现实需求之间也存在一定张力，可能为其带来反噬效应。在《报告》中，阿莫迪专门在“国家与公民自由”以及“确保民主国家的领导地位”章节中，极力呼吁建立一个由西方主导的全球信任联盟，并在多边框架下收紧针对芯片和半导体制造设备（SME）的出口管制。

这一叙事通过将技术标准与意识形态强行挂钩，在强调共同价值观的同时，与特朗普政府所强调的科技领导权竞争和国家安全政策方向具有较高一致性。例如Anthropic试图通过主动融入美国的对华遏制叙事，展现与特朗普政府战略目标的政策协同性，从而希望扭转此前因安全审查和诉讼而引发的紧张关系，为企业塑造更有利的政策环境。

然而这种政治策略，与Anthropic作为基础模型提供商需要面向全球市场服务和盈利的企业利益存在着根本性冲突。面对美国商务部针对外国人使用Fable 5 和 Mythos 5的模型禁令，Anthropic 被迫做出全球全员下线模型的决策，严重损改企业自身利益。这一结果表明，科技企业主动嵌入国家战略的政策选择，不仅可能难以取得预期的积极效果，反而可能带来非预期政策后果，重创企业自身的全球商业布局与盈利生态。

总体而言，《报告》并非一份纯粹的技术治理蓝图，而是一份兼具政策倡议、市场竞争和政治沟通功能的战略文本。阿莫迪所构建的AI安全叙事，一方面帮助Anthropic强化其“负责任AI领导者”的企业形象，巩固在资本市场和行业竞争中的优势地位；另一方面，也体现出Anthropic主动向美国国家安全与地缘竞争议程靠拢的政治考量。

然而，美国商务部针对Anthropic模型的管制措施表明，当企业战略过度依附于国家权力时，其自身也可能成为监管扩张的受害者。对于今天的美国AI企业而言，最大的挑战或许不在于如何塑造风险叙事，而在于如何在资本、国家与全球市场之间保持一种可持续、稳定的平衡。

附件1 Amodei发布的政策报告中文译文

论AI的指数级发展及其政策应对

2026年6月11日

在《指环王》的其中一个支线剧情里，两个霍比特人试图唤醒Treebeard——一棵充满智慧但行动迟缓、拥有自我意识的树——来保卫他的森林，抵御正在砍伐树木的军队。问题在于，Treebeard的运行速度与霍比特人截然不同。他仅仅向另一棵树打个招呼就要花上整整一天的时间，因此想要让他和他的同类快速采取行动，几乎是不可能的。

AI 与我们政治体制的交汇，感觉就像是霍比特人遇到了Treebeard。AI 正在以迅雷不及掩耳之势向前推进——在短短四年内，AI 模型就从几乎无法写出一行连贯的代码，发展到如今承担了各大 AI 公司大部分的代码编写工作。在生物学、物理学、数学、金融、法律、翻译以及许多其他领域，也取得了类似的飞跃。AI 的“缩放定律”（Scaling Laws）预言，随着算力的增加，通用认知能力将呈指数级增长；如今，这一定律已经拥有了十多年的经验证据支持。如果这些缩放定律再持续仅仅一两年，我们很可能会迎来我所说的“强 AI”（Powerful AI），或者说“一座数据中心内汇聚万千天才”。

与此形成鲜明对比的是，政策——尤其是立法——其推进速度非常缓慢。通常这有其正当理由：政府掌握着极大的公权力，这些权力通常最好不要被过于仓促地动用。然而，这种时间尺度上的错配依然令人十分痛苦：在国会采取行动所需的数年时间里，AI 就可以从一个有趣的玩具演变成那群“一座数据中心内汇聚万千天才”。

在 AI 成为一项重大商业技术的过去几年里，我们这些想要负责任地应对它的人，一直面临着一个两难境地。我们可以清晰地看到这一指数级增长的发展走向：我们强烈怀疑，在几年内，AI 将成为极少数能够从根本上重塑整个政策格局的技术之一，就像核武器重塑地缘政治、工业革命从根本上重塑每一个经济和社会议题一样。但是，对于那些只看 AI 在当时能做什么的人来说，它看起来更像是一项平庸普通的技术——或许类似于最新的消费级应用或加密货币。当时很难让大多数政策制定者和企业相信，除了“放任自流”（laissez faire）的态度之外，其他任何做法都是合理的。而且说句公道话，由于AI 的颠覆性影响当时尚未显现，且我们也不知道它们具体会以何种形式呈现，因此即使有采取行动的意愿，也很难设计出正确的政策。

鉴于这种局势所带来的局限性，许多安全倡导者（包括Anthropic）迄今为止一直把重点放在倡导那些能够“保留选择权”、“为未来的快速反应做准备”或“让世界更好地洞察未来发展趋势”的政策行动上——比如透明度立法、芯片出口管制以及收集 AI 对就业影响的数据。这些还远远不够，但在当时，这似乎已是力所能及的极限了。

然而，在过去的几个月里，AI 拥有惊人力量及其带来风险的证据已经变得不容置疑。其中最具代表性的例子莫过于 Claude Mythos Preview，以及人们发现前沿模型对网络安全构成了非常现实的风险，这有可能对金融部门、关键基础设施和国家安全造成破坏。Mythos Preview 打乱了全球网络安全的格局。但它更深远的意义在于，它毫无疑问地证明了 AI 模型现在已成为关乎全球和国家战略利益的工具。Mythos 级别模型所呈现的网络风险，绝不会是我们必须面对的最后一种风险。我相信生物风险可能很快就会随之而来，而严重的 AI 自主性风险可能紧随其后。

我们现在需要在全球范围内共同启动一个缓慢而摇晃的政策机制，来应对从现在开始将以令人吃惊的速度激增的风险与机遇。许多政策制定者正在展现出越来越开放的行动态度，看到我们的同行也纷纷转向我们过去几年一直倡导的立场，这令人感到欣慰。这很好，但我担心这些早期行动相比于 AI 的快速迭代，至少已经落后了一年的步伐。本文正是为了消除这一差距：阐明当前的指数级增长已进行到何处，以及为了迎接这一时刻我们需要采取怎样的集体行动。

我将把重点放在五个在 AI 世界中需要重新构想的常规政策领域：监管与公共安全、宏观经济与税收政策、科学创新、国家与社会之间的权力平衡，以及地缘政治。由于 Anthropic 是一家美国公司，我将主要从美国政策的角度来阐述，但我的大部分建议对世界其他地区同样适用。

与本文同步，Anthropic 正在发布一份关于前沿模型测试的立法提案，以及一份针对工作流失的政策框架，我们计划为后者提供实质性的资金支持。我们计划在未来做得更多，但我们将这些视为表明我们严肃态度的第一步。

1. 监管与公共安全

每一种新技术或新产品都兼具益处和危害，因此都在创新与安全之间带来了两难抉择。对产品进行监管可以降低其造成伤害的可能性，并在改善全球人类生活方面发挥了重要作用，但它也可能直接削弱其带来的益处，并间接挫伤创新的积极性。此外，还有哈耶克式的观点认为，监管机构往往缺乏对复杂的经济权衡做出正确决策所需的信息，因此监管往往既缺乏成效又带来负担。与之相关的一个概念是科林里奇困境（Collingridge dilemma），该理论指出，一项技术的影响往往很难预料，直到它变得难以轻易管理时才被察觉，而那时通常为时已晚。

这些动态在 2023 年至 2024 年对 AI 产生了重大影响。当时 Anthropic 很清楚，AI 在未来可能有能力制造出威胁数百万人的生物武器，或者产生自主的错误行为，在极端情况下甚至可能威胁到人类自身。不那么明确的是这些风险出现的具体形式、如何最好地对其进行测试和缓解，以及它们在实践中会如何演变。因此，提前制定的法律面临着极高的风险，最终可能会变得毫无成效——既制造了毫无意义或低价值的合规要求，又漏掉了实际风险中最为关键的源头。

最终，我们得出结论，当时正确的做法是透明度。AI 模型的开发商应当必须披露其安全流程以及他们在模型上运行的测试，并报告任何关键的安全事件，以便公众和科学界能够在风险显现时更好地对其进行观察。当风险变得更加确定且其轮廓更加清晰时，通过透明度获得的证据就可以用来设计明智的法律，从而精准打击最令人担忧的风险。因此，在 2025 年，Anthropic 支持了透明度立法，协助加州通过了 SB 53 法案，在纽约州通过了 RAISE 法案，在伊利诺伊州通过了 SB 315 法案（2026 年初），并在联邦层面倡导建立透明度标准。

然而，现在风险已经清晰地降临了。是时候超越透明度，对 AI 进行更严肃、更具约束力的监管了。我相信，至少在指数级增长的当前阶段，最好的类比是汽车、飞机或药物——这些都是现代经济必不可少的强大技术，但如果设计或运行不当，都有能力剥夺大量人的生命。因此，我认为我们应当以联邦航空管理局（FAA）等机构为模型来构建 AI 监管。前沿 AI 模型和飞机一样，应当被要求通过技术测试和审计；如果它们达不到高度的安全标准，其发布应当被阻止或撤回，以维护公共安全。我很高兴看到特朗普政府的行政令正逐步让政府在 AI 领域发挥更大的作用，尽管 Anthropic 的提案建议采取更进一步的行动。我们的提案包括以下要素：

算力超过特定门槛的模型应当接受由合格第三方进行的强制性测试，以评估其在四个特定领域的风险水平：网络安全、生物武器、AI 系统失控，以及可能加速这些其他风险的自动化研发。

如果根据第三方评估确定模型呈现出不可接受的风险，政府应当有权阻止或遏制该模型的部署。这一权力必须被严格限定在上述四个特定风险范围内，并且必须采取保护性措施，防止政治偏袒或任意武断的决策。

第三方评估可由政府机构（类似于 FAA）或一组经政府授权和检查的私营组织来执行，这些组织将根据特定标准对模型进行评估（即“监管市场”路径）。

开发先进 AI 模型的 AI 公司必须拥有强大的安全标准来保护其模型权重，应当进行定期的红队测试和渗透测试，并应当与政府合作以抵御重大的威胁主体。

必须及时报告在上述四个关键领域发生的安全事件。

可能在未来的某个时候（或许相对较快就会到来），我们需要采取超越这些方案的举措，届时最强大的 AI 系统看起来将不再像飞机或汽车，而更像可以武器化的核材料——它不再“仅仅”是对公共安全的威胁，而是对全人类的威胁。如果那一天到来，我们可能需要比我目前提出的更为激进的监管措施。但是，正如在 2024 年很难针对并应用我如今建议的这些措施一样，我认为我们不应该操之过急。我们应当针对今天正在浮现的危险来设计政策，同时打好基础，以便在新危险出现时能够更快速地升级我们的应对手段。

2. 宏观经济与税收政策

长期以来，各国政府都面临着一个难题：如何在鼓励经济增长的同时，提供重要的公共服务并确保最弱势的群体得到照顾。这些争论中一个重要（且通常是正确的）前提是，经济增长是脆弱且难以实现的——也就是说，尽管减少不平等可能会带来重大益处，但必须在增加税收或赤字所带来的经济拖累之间做出权衡。

我怀疑强大的 AI 可能会打破这一假设。如果 AI 能够比人类更好地完成大多数认知任务，那么理所当然地，它可以通过加速科学、技术和运营效率，带来极其快速且强劲的经济增长。AI 构建更强大 AI 的迭代能力，可能会进一步重度催化这种增长。但正是由于完全相同的原因，相比以往的技术，AI 可能会在更广泛的层面上替代人类的认知能力，同时改变经济的速度也远快于以往的技术。因此，我们有理由认为，AI 对劳动力市场造成的颠覆可能会比以往的技术大得多，且潜在地具有更持久的颠覆性。我们面临着这样一个风险：最终陷入一个经济权衡罗盘被固定在“超高增长、超高不平等”设置上的世界，并且可能很难从该设置中解脱出来。在这样一个世界里，核心挑战将不再是激励增长，而是寻找一种让每个人都能共享红利的方法。

在本篇文章讨论的所有话题中，宏观经济和持久性的劳动力流失无疑是最受公众关注、也最容易被误解的话题，因此我想在两点上表达得极其明确。

第一，持久性的工作流失是不可取的，也是危险的，我们应该竭尽全力去减少或阻止它，而不是去促成它。我在采访和文章中对工作流失发出警告，是因为我希望政策制定者和私营部门能有最好的机会去适应和应对，而不是因为我想成为一个“末日预言家”。作为一家公司，Anthropic 总是竭尽所能与客户合作，寻找创造性的新应用场景和新的收入来源，让他们能够用现有的员工队伍做更多的事情，而不是仅仅关注成本节省（这往往意味着裁员）。我们也在不断尝试思考新的交互范式，以便随着 AI 系统的进步，让渡给人类尽可能积极的角色来与 AI 系统协同工作。更广泛地说，整个世界去尝试以尽可能多的新方式使用 AI 是非常有价值的，因为这是社会发现新的潜在工作形态的途径。我确实认为 AI 将带来许多新的经济机遇。我曾预测 AI 将使单个个体能够创建价值十亿美元的公司，而我们已经看到只有几个人的团队建立了收入达数亿美元的业务。但与此同时，我们应该认识到，尽管我们付出了所有努力，AI 仍有很大的可能性会造成显著且持久的工作流失——这可能是这项技术及其广泛复制人类认知方式所固有的属性。

第二，任何对 AI 引发的工作流失的应对措施，都需要同时解决“在经济上供养每个人”的需求，以及“让人们找到意义、目标和独立选择的能力”的需求。后者最终更为重要，它取决于关于社会如何组织、人们应该追求什么以及什么构成美好生活的深层问题。事实上，我非常乐观地认为，即使在一个 AI 在各方面都比每个人都强的世界里，人类依然可以过上具有深层目标感的生活，并努力去创造令人惊叹和美丽的事物。但这需要整个社会共同去探索解决，而不是政策能够直接解决的。政策所能提供最大帮助的地方在于，通过减缓工作流失并为那些可能受到影响的人提供经济支持，来为我们争取做这项工作的时间。

本着这种精神，一些可能有所帮助的关键政策干预措施包括：

衡量与追踪。人们很容易将单纯的数据收集和分析视为不足以应对如此规模的问题，但如果我们无法准确衡量地面上正在发生的事情，我们就不可能得到好的政策。Anthropic 运营一份关于人们如何使用 Claude 的经济指数（Economic Index）已经快一年半了，但政府拥有我们所没有的数据渠道，可以极大地扩展其经济统计数据，以更仔细地追踪 AI 带来的工作流失。

促进就业的激励措施。广泛的促进就业政策激励措施可以帮助减缓或减少工作流失，包括：在人们不得不接受较低薪资工作时给予补偿的薪资保险政策（wage insurance policies）、鼓励雇主不进行裁员的留任税收激励（retention tax incentives）、劳动力培训补贴，以及旨在促进雇主与雇员匹配以加快劳动力市场适应速度的基础设施。虽然具体采用哪种干预措施效果最好取决于 AI 带来何种劳动力流失，但我们应该欣然接受这些政策可能带来的成本和市场低效，尤其是因为它们很可能会被 AI 驱动的生产力提升所抵消。

长期宏观经济支持。如果 AI 驱动的劳动力流失最终规模巨大并永久性地拉低了劳动力需求，那么可能就有必要超越单纯的激励计划，向很大一部分劳动力提供长期的收入支持。诸如全民基本收入（Universal basic income）之类的机制可以通过对相关公司征税或提高资本利得税来筹集资金。全民资本账户（Universal capital accounts）提供了另一种途径。广义上讲，快速的经济增长应该能为共同繁荣创造税基。

我没有提到一个经常成为对 AI 经济担忧焦点的话题，即数据中心，特别是它们推高能源价格的潜在风险。我的观点是，AI 公司应该出资来消化电价的上涨——Anthropic已经做出了这样的承诺——但我认为公众对数据中心表现出的敌意，在很大程度上是对 AI 更广泛经济焦虑的一种象征或宣泄口。重要的是，我们要就这些更广泛的经济问题进行直接的社会对话，并切实拥有令人信服的解决方案，否则它们很可能会像在数据中心问题上那样，间接地表现出来。

3. 加速 AI 的积极影响

正如我们必须努力应对 AI 本身在创新与安全之间的平衡一样，我们也必须努力应对那些可能被 AI 加速的技术（如生物医药、能源或材料科学）在两者之间的平衡。但是，虽然 AI 本身可能会带来突如其来的新型挑战，且我们没有任何先前的处理经验，但被 AI 加速的其他领域可能会遇到一个截然不同的问题：现有的监管体系是为较慢的创新节奏而设计的，根本没有准备好应对 AI 将带来的新产品和新突破的洪流。AI 还可能使这些下游技术变得更安全、更可预测，从而打破了诸如食品药品监督管理局（FDA）等监管机构的怀疑论假设。

因此，对于 AI 的下游应用——与 AI 本身截然相反——我更担心监管机制会减缓进展（因为它无法应对加快的变革步伐），而不是担心它无法应对重大风险。我们最不希望看到的是，在 AI 的风险赫然耸现的同时，其带来的红利却被减缓，因此尽快在这个问题上采取行动至关重要。

这一问题及其解决方案在科学、商业和技术的每个领域都会有不同的表现形式，因此我将聚焦于一个具有代表性的领域：生物医药创新。这既是因为它很可能是 AI 带来最大人道主义益处的源泉，也是因为这是一个监管尤其复杂的领域。我们不知道 AI具体将如何加速生物医药创新，但它似乎很可能会：

大幅提高新候选药物进入监管审批流程的速度；

提高新药的疗效并改善其安全性特征，因为有了更好的优化以及或许对底层生物学有了更好的理解；

针对以往从未被成功治愈过的疾病开发候选药物；

快速创造出全新形式的疗法，类似于过去几十年中抗体、多肽和细胞疗法如何成为新的治疗类别。

其中一些进展自然会加速监管时间线，而不需要结构性的变革。疗效更显著的药物可以缩短临床试验时间、降低试验成本，并启动加速审批机制。但目前的监管体系在设计上施加了高水平的审查和许多阶段的测试，其假设前提是候选药物往往不起作用，而且即使起作用也往往存在严重的安全性问题。无论是美国食品药品监督管理局（FDA）还是欧洲药品管理局（EMA），候选药物通过监管流程的典型时间是 7 到 8 年，部分原因就在于这些悲观的假设。如果不进行改革，AI 只会挤爆或使这个体系超载。

显然，我们不希望改变是以催生一批“江湖郎中式”的假药或大范围的安全事件为代价。但如果发生 AI 驱动的快速科学加速，一些相对简单的改革可以使 FDA、EMA 和类似机构更具适应性。

临床过程中许多此前需要昂贵且缓慢的实验步骤，可能很快就可以通过AI 模拟或分析来完成。监管机构现在就应该考虑制定标准，以明确接受此类方法需要满足什么条件。这意味着一旦这些方法奏效，就可以迅速予以采用，而不是经历一段不必要的测试仍被继续要求的漫长时期。可以应用这一做法的领域包括：

基于 AI 的药代动力学和药效学（PD/PK）建模；

毒理学预测，以避免需要多种动物进行毒理学实验；

更准确的剂量选择，以减少试验中对大范围剂量测试的需求；

通过分析大型数据集进行生物标志物验证；

临床试验中的合成控制组（Synthetic control arms），以减少招募更多受试者的需求；

开发替代终点（Surrogate endpoints，在衰老和神经退行性疾病中尤为重要）。

除了这些具体的例子之外，各机构还应该考虑更激进、更灵活的加速审批机制。如果我对 AI 的预测是正确的，很快就会出现许多在毫无征兆下效果极佳的干预措施，监管体系应该准备好认真对待它们，而不是采取过度怀疑的态度。

生物医药的加速应该会大幅增加 AI 的益处，但值得注意的是，它可能也有助于降低 AI 的风险。改革生物医药审批可能有助于生物防御，而 AI 驱动的生物医药进步也可能改善心理健康，这可以对社会产生稳定作用。

4. 国家与公民自由

每一种政体都必须面对国家权力的界定及其界限问题。国家在保护其民众免受内部和外部威胁方面，拥有正当的、往往是生死存亡般的利益。然而，赋予国家过多的权力也无法接受。现在在很大程度上成功地维持了这种平衡，但即便在最好的时期，这种平衡也是脆弱的。为了维系这种平衡，需要依赖数个世纪以来建立起的大量法律和宪法机制——例如在美国，有《第一修正案》、《第四修正案》、《第五修正案》、《治安官动员法》（Posse Comitatus Act）、《外国情报监视法》（FISA）等等。

AI 有可能打破这种平衡，同时戏剧性地提高了其风险博弈的筹码。但是，如果我们能够迅速反应并迎接这一时刻，我们就能利用 AI 创造一个世界，使其对自由的保障比以往任何时候都更加稳固和持久，同时对威胁的防御也更加得力。

掌握在错误人手中的强大 AI 可能会成为可怕的工具，而我们现有的法律和宪政保护尚未完全准备好应对这一威胁。从根本上说，智能在世界权力中所带来的巨大回报，结合 AI 推进的迅猛速度，为一系列危险主体发动一场出其不意的夺权创造了完美的风暴条件。

这种危险可能会以各种具体的显性技术或运营形式出现，但它们的共同点在于：AI 可能会在绕过现有监督机制的同时，突然赋予个体或组织极其巨大的权力。一个在今天听起来像科幻小说的全自动无人机军队，在未来可能会服从非法命令，并允许政府单方面巩固其权力；而接受过专业训练的人类面对此类非法指令时，则更有可能提出异议。能够大规模分析广泛获取的信息，并以此推断出每位公民生活最深处的细节——这是目前的公民自由法律未曾料及的一种技术能力。所有这些都可能发生得非常迅速，或者在秘密中进行，因此积极强化民主国家对自由和公民自由的承诺至关重要。

以下是我们应该考虑的一些政策设想：

为全自动武器制定可靠的问责规则。自主武器，尤其是任何协调或指挥它们的自主系统，应当被要求服从宪法和指挥问责机制（例如法院命令、立法以及对高级人类监督者的问责），而不是盲目地服从命令。这可能意味着一个设计合理的法律审查小组或司法部门将掌控一个“关闭开关”，或者系统本身在底层训练中就被赋予了寻找并响正当监督权威的机制，亦或是两者兼而有之。

禁止在国内使用全自动武器。虽然为了抵御外部对手（例如俄罗斯入侵乌克兰）而使用全自动武器具有合理的必要性，但没有任何理由将其用于针对美国人。军队在国内的行动能力已经受到了一些限制，但在理想情况下，法律也应当在执法中禁止使用此类武器。

堵住批量数据收集/数据代理人的漏洞。根据现行法律，美国人与私营公司（如互联网提供商）共享的数据可以被购买，并用于国内监视和执法中的批量分析。这种隐私保护方面的漏洞在 AI 出现之前就已存在，但 AI 将大幅提高风险筹码，因为它使对这类数据的海量分析变得比过去更具揭示性和实用性。这一漏洞应当被堵住。

在政府采取不利行动期间，公众有权获得 AI 咨询服务。作为一个普遍原则，任何作为政府不利行动（如监管或法律行动）对象的个人或组织，似乎都有必要获取至少与政府在特定行动中获准使用的 AI 能力相当的 AI 支持。这意味着不能给予政府不公平的优势，从而在实际上侵蚀公民的合法权利。这可以作为《行政程序法》、正当程序保护或《第六修正案》中获得法律代理权的一种延伸或解释来加入。

最后值得注意的是，在面对 AI 驱动的权力篡夺时，政府并不是我们唯一需要提防的实体。在历史上的不同时期（如美国的镀金时代或英国的东印度公司），有些公司已经变得足够强大，以至于它们控制了国家或采纳了准国家的特征。AI 很快就会变得如此强大，以至于我担心它无法安全地完全托付给政府或公司，必须对两者都有制衡。

监管是解决如何约束公司的一个答案（我对此的想法在第1部分中），但同样重要的是，AI 公司应当拥有比普通私营实体更多的权力分立和问责制。Anthropic 的“长期利益信托”（Long-Term Benefit Trust，一个旨在让公司坚守其使命的独立治理机构）就是这样一种结构，整个行业应当继续探索走得更远的机制。找准这种平衡——使公司和政府的权力都受到实质性的制衡——至关重要。

5. 确保民主国家的领导地位

或许是由于近期在互联网和电信方面的经验，人们形成了一种常见的本能，即在发掘新技术时带有地缘政治眼光，将其视为贸易政策的工具，目的在于“将我们的技术栈扩散到世界各地”。但我非常坚定地认为，AI 要深刻得多，它重置了整个游戏棋盘，所有未来的地缘政治战略都必须围绕它来重塑——就像核武器一样，但潜在的影响甚至更深远。

如果 AI 真的很快就会成为“一座数据中心内汇聚万千天才”，或者达到任何哪怕稍微接近这种状态的程度，那么 AI 很可能会成为任何国家军事和经济实力的主导源泉。在一个由1亿名超级天才组成的虚拟国家中，可以分出1000万人用于军事战略，1000万人用于无人机制造，1000万人用于武器研发，1000万人用于情报收集和分析，1000万人用于通用科学进步，依此类推。一个拥有强大 AI 的国家面对一个没有 AI 的国家——甚至面对一个在 AI 领域落后3年的国家——其差距可能等同于一支二战时期的海军陆战队面对一支中世纪的刀剑军队。

此外，如果强大的 AI 能够实现更深层且潜在具有永久性的压迫（见第4部分），这使得由民主国家成为世界上最强大的国家变得愈发重要——或者至少针对 AI 驱动的压迫存在强有力的保护机制。这也增加了推行聚焦之地缘政治战略的紧迫性。

民主国家应当寻求建立一个以按照共同价值观构建 AI 为核心的全球联盟，通过让身处联盟之中变得越来越有吸引力、而身处联盟之外变得越来越没有吸引力，来循环往复地尝试将世界其他地区吸引进来。该联盟应当是对第1部分至第4部分所讨论的 AI 政策设想的协调国际化演进，并努力通过在联盟内部共享、同时对联盟外部进行封锁的方式，来掌控构建 AI 所至关重要的供应链。一些原则和运行目标可能包括：

管理 AI 供应链。信任联盟的成员应当在彼此之间自由共享芯片和半导体制造设备（SME），同时通力合作阻止对手获取。美国对向中国出口前沿芯片和半导体制造设备的管制，是美国在 AI 领域保持总体领先地位的主要功臣，这些政策需要被扩大、收紧，并与其它志同道合的国家进行协调。诸如正在审议中的《硬件技术控制多边协调法案》（MATCH）和《人工智能监督法案》（AI OVERWATCH Act）是这里良好的第一步，盟友民主国家需要考虑采取类似的措施。

协调应对 AI 风险。如果能在国际上进行协调，第1部分中所描述的应对生物、网络安全和自主性风险的政策将会更有效（同时对行业的负担更小）。这意味着公司可以遵循兼容的标准，而监管机构可以相互学习如何最好地衡量和缓解这些风险。执法和情报机构也应当在追踪和瓦解滥用威胁方面开展更紧密的合作，例如瓦解恐怖分子利用 AI 制造生物武器的企图。

共享 AI 的红利。贸易和监管政策可用于促进AI 经济红利在联盟内的更快速扩散，分享关于如何加速创新的经验。协调互利的部署方法可以帮助将 AI 的益处带给发展中国家。例如，医疗审批制度的协调统一可能会带来对 AI 辅助药物更快、更好的测试和审批（如上文第3部分所述）。

共同防御。联盟内的国家应当共同努力，利用 AI 相互防御并抵御对手的 AI。联盟应当共同确保足量生产由 AI 主导的网络防御、AI 驱动的无人机、AI 驱动的制造、机密 AI 算力、AI驱动的研发，以及共享 AI 驱动的情报收集。

拒绝 AI 赋能的压迫。联盟成员必须拒绝我在《技术的青春期》（The Adolescence of Technology）中警告过的高科技、超高压、AI赋能的专制，并且必须拥有类似于我上文第4部分中所描述的保障措施。

宏观经济合作。就业或工作稳定性的危机就像任何其他经济危机一样，具有跨国界的传染性。因此，各国在共同努力协调宏观经济支持和稳定政策（如第2部分所述）以对抗任何就业影响方面，存在着共同的利益。

其目标应当是使加入联盟的吸引力尽可能最大化——并让保持在联盟之外的代价清晰可见。该联盟将建立在主权国家之间的协调基础之上，每个国家都对本国事务保留完整的权力。它可以循环往复、逐步壮大，从意识形态一致的民主国家（它们自然会顺理成章地加入）开始，并逐步欢迎那些虽然自然契合度较低、但为了换取成员身份带来的巨大益处而准备达到联盟标准的国家。在理想情况下，整个世界最终都将加入。但即使这无法实现，构建这一联盟也能让民主国家处于最有利的地位，去遏制那些仍致力于推行压迫的政权并与之竞争。

行动的窗口期

AI 的指数级增长带来了前所未有的紧迫感和变革步伐，这在通常情况下是政策制定流程难以应对的。但与此同时，它也创造了一个独特的行动窗口期。AI 风险那清晰且迫在眉睫的证据、人们对 AI 潜在的经济价值创造与经济颠覆的初次体验，以及公众对未受监管的 AI 发展模式所表现出的显著抵触情绪——这一切交织在一起，促成了一个政策制定者对前瞻性行动表现出异乎寻常的开放态度的局面。Treebeard和他的森林正在苏醒。

在 AI 行业圈子里，将这种现象视为公关问题并宣称 AI 需要“更好的营销”已经成为一种流行观点。我完全拒绝这种定性。人们对 AI 感到担忧，是因为他们正确地察觉到了其风险是真实存在的，而不是因为 AI 公司的首席执行官们不够盲目乐观。我相信，作为一名 AI 领域的领导者，继续对这些风险保持透明是我的职责，而公众对此种透明度所做出的担忧反应，正是民主问责机制在发挥其应有的作用。核心挑战在于将这种担忧引导至建设性的解决方案上，而不让其堕入盲目的愤怒与暴力之中。

我对寻找解决方案持乐观态度，因为其中许多议题——从应对工作流失、模型的发布前测试、芯片的出口管制，到其他与 AI 相关的政策问题（如能源消耗）——在整个政治光谱中都具有符合常理的吸引力。存在一个虽然充满憧憬但在现实中可期的未来世界：在对 AI 挑战的直接认知推动下，一个广泛的跨党派联盟将促使理智且具前瞻性的政策以远快于以往的速度被采纳。我们越早做到这一点，就能越早让所有人共享 AI 带来的惊人红利。

附件2: Anthropic关于美国政府中止 Fable 5 和 Mythos 5 访问权限指令的声明中文译文

2026年6月12日

美国政府援引国家安全权力，发布了一项出口管制指令，要求中止所有外国国民（无论是在美国境内还是境外，包括 Anthropic 的外籍员工）对 Fable 5 和 Mythos 5 的一切访问权限。该命令的实际效果是，我们必须立即对所有客户停用 Fable 5 和 Mythos 5，以确保合规。Anthropic 旗下所有其他模型的访问将不受影响。

我们于今日下午 5:21（东部时间）收到了政府的指令。公函中并未提供其国家安全疑虑的具体细节。据我们了解，政府认为其发现了一种可以绕过 Fable 5 保护机制或对其进行“越狱”（jailbreaking）的方法。我们审查了该特定技术的演示，该技术被用于识别少数此前已知且较为轻微的漏洞。这些漏洞似乎都相对简单，并且我们发现其他公开可用的模型无需进行绕过也能发现它们。

关于 Fable 的安全防护措施，Anthropic 在发布博客中所阐明的立场如下：

我们建立了强大的安全防护措施，极大地降低了 Fable 被滥用于网络安全（以及其他领域）相关任务的可能性。事实上，我们的防护措施非常强硬，以至于许多用户抱怨它们过于宽泛。

在 Fable 发布前的几周里，Anthropic 与美国政府、英国人工智能安全研究所（UK AISI）、多家私营第三方组织以及内部团队合作，对 Fable 的安全防护进行了总计达数千小时的红队测试。

这些测试表明，Fable 的安全防护措施比以往部署的任何模型都要有效得多。

目前尚无测试者能够找到通用越狱方法（universal jailbreak）——即能够大范围绕过模型安全防护、从而解锁广泛网络能力的越狱方法。

我们怀疑，目前任何模型提供商都无法做到完美的防越狱保护。行业内使用的每一种安全防护措施都容易受到非通用越狱（即在特定情况下可以诱导输出某些网络安全信息）的攻击，并且未来很可能会最终发现通用越狱方法。我们在发布 Fable 5 时就曾明确阐述过这一点。

鉴于目前似乎无法做到完美的防越狱保护，Anthropic 在 Fable 5 上采用了防御纵深（defense in depth）策略。我们的目标是让越狱要么变得范围狭窄（针对非通用越狱），要么让其产生高昂的成本（针对通用越狱），并将此与彻底的监控相结合，以便快速检测并封禁任何成功的攻击。这也是为什么 Anthropic 要求对 Fable 的客户数据保留 30 天的原因——这一政策变动给我们的客户关系带来了实际的成本，但它能让我们得以研究并缓解越狱风险。

我们坚守这一防御纵深策略。它降低了 Fable 带来的风险，使其与整个行业内已经部署的现有模型的风险相当。

我们甚至没有收到过任何关于“引发了有害结果的、令人担忧的潜在非通用越狱方法”的披露。向我们披露的潜在越狱行为要么完全是良性的响应，要么是并不能提供 Mythos 独有能力提升的轻微发现。

迄今为止，政府仅向我们口头提供了关于某种潜在的、范围狭窄的非通用越狱的证据，其本质上是要求模型读取一段特定的代码库并修复其中的任何软件缺陷。我们的理解是，有一种潜在的越狱方法被分享给了政府。我们审查了一份报告，并相信该报告是政府发布指令的依据，我们已证实该报告中展示的能力水平在其他模型中（包括 OpenAI 的 GPT-5.5）也被广泛具备，并且每天都在维护系统安全的防御人员中被使用。我们将在接下来的 24 小时内分享更多细节。

我们正在遵从政府的法律指令，并正为所有用户移除对 Fable 5 和 Mythos 5 的访问权限。然而，我们不赞同“发现一个狭隘的潜在越狱方法就应该成为召回一款已部署给数亿人使用的商业模型的理由”。如果这一标准被应用于整个行业，我们认为它实际上将使所有前沿模型提供商的新模型部署彻底停滞。

正如我们公开声明的那样，我们认为政府应该有能力阻止不安全的部署，但前提是必须将其作为法定程序的一部分，且该程序应当是透明、公正、清晰并基于技术事实的。此次行动并不符合这些原则。对于给客户带来的这一干扰，我们深表歉意。我们相信这是一场误解，并正在努力尽快恢复访问。

原文链接：https://mp.weixin.qq.com/s/hMr4Nd_HrL5S3idXMdhSlA

姚旭 郭博瑞：禁用的Anthropic前沿模型与其AI治理框架：新的对撞与隐藏的逻辑

姚旭郭博瑞：禁用的Anthropic前沿模型与其AI治理框架：新的对撞与隐藏的逻辑