姚旭 辛艳艳等:“自愿”的边界:白宫最新人工智能行政令的政策折中与安全回摆

作者:中心研究室 发布时间:2026-06-07 23:28:10 来源:中心研究室 全球人工智能创新治理中心+收藏本文

2026年6月2日,美国总统特朗普签署行政令《促进先进人工智能创新与安全》(Promoting Advanced Artificial Intelligence Innovation and Security)。与5月下旬一度被推迟的公开签署安排不同,这份文件最终以相对低调的方式落地。多家媒体披露,早期草案曾设置更长的政府访问窗口,引发部分科技界人士担忧其会拖慢美国前沿模型迭代;最终文本将政府访问期限压缩至最多30天,并反复强调自愿参与,不得形成强制许可或发布前审批的情况,意图维持美国人工智能创新生态活力,将国家AI能力建设摆在更加靠前的位置,也反映美国人工智能治理在“松绑”框架下出现了一次安全回摆。


图片

白宫官网关于《促进先进人工智能创新与安全》行政令的发布页面

图片来源:The White House


01 核心内容:在“自愿”框架下引入联邦安全评估




根据白宫公布的行政令原文,文件主要围绕政府系统防护、前沿模型评估和人工智能犯罪执法三条线展开。其基本逻辑不是建立一个覆盖所有模型的监管许可制度,而是在网络安全和关键基础设施场景中,为最具网络攻防能力的前沿模型设置一个有限的联邦介入窗口。


第一,行政令要求强化美国政府系统和关键基础设施的网络防御。文件规定,签署后30天内,国家安全系统委员会应优先推进国家安全系统的网络防御;行政令所称的“战争部长”(Secretary of War)须优先加固战争部信息系统;国土安全部需通过网络安全和基础设施安全局(CISA)发布约束性操作指令或相关指导,加快联邦民用信息系统防护,并在适当情况下,为联邦机构、州和地方政府,以及农村医院、社区银行、地方公用事业等关键基础设施运营者提供网络安全工具和服务,明确包含“在适当情况下提供受涵盖前沿模型(covered frontier models)”的内容。同时财政部则需在30天内牵头建立“人工智能网络安全协调中心”,与产业界和关键基础设施运营者进行“自愿协作”(voluntary collaboration),统筹软件漏洞的扫描、发现、验证、修复和补丁分发。


第二,行政令第3节设置了外界最为关注的“安全的前沿模型部署”(Secure Frontier Model Deployment)机制。文件要求在60天内,由财政部、经国家安全局(NSA)对接的战争部、经CISA对接的国土安全部,会同白宫办公厅主任(经国家网络总监)、总统科技助理(APST)和商务部国家标准与技术研究院(NIST)等部门,共同建立机密基准测试流程,用以评估模型的高级网络能力,并确定何种模型应被指定为“受涵盖前沿模型”(covered frontier model)。相关指定由NSA局长在征询国家网络总监、总统科技助理、CISA负责人和防务部门代表意见后作出。在此基础上,政府将设立一个面向开发者的“自愿框架”(voluntary framework)。开发者可与联邦政府沟通在研模型是否达到“受涵盖前沿模型”门槛;模型符合标准的,可在计划向其他可信合作伙伴开放之前,向联邦政府提供最多30天访问权限,并附带保密、网络安全、内部人员风险与知识产权保护等条件;政府还可与开发者共同遴选哪些可信伙伴能够提前接触这些模型。


图片

《促进先进人工智能创新与安全》行政令第3节提出“安全的前沿模型部署”机制

图片来源:The White House


第三,行政令为这套机制划出明确边界。第3节(c)款专门规定,本节不得被解释为授权设立针对新人工智能模型,包括前沿模型在内,在开发、发表、发布或分发时的强制性政府许可、预先审查或准入审批要求。这是整份文件最关键的限制性设计。换言之,特朗普政府希望获得对最强模型的早期可见性和协调权,却不愿承担建立正式发布许可制度所带来的政治与产业成本,因而以“自愿”二字反复限定上述安排的性质。执法方面,第4节要求司法部长优先依据身份盗用、计算机欺诈、电信欺诈等既有联邦刑事条款(18 U.S.C.§1028、§1030、§1343),打击利用人工智能非法访问、破坏计算机系统,或在非法访问过程中借助人工智能进一步实施其他犯罪的行为。由此可见,行政令并未创设新的人工智能刑事责任框架,而是强调在既有法律工具中提高人工智能相关网络犯罪的执法优先级。


从出台背景看,前沿模型网络能力快速上升是直接诱因。Anthropic在2026年4月推出未公开发布的Claude Mythos Preview模型,称其能在现实开源软件中自主发现并利用隐藏漏洞,并启动“玻璃翼计划”(Project Glasswing),将模型开放给约50家初始合作伙伴,包括大型科技公司、金融机构和关键基础设施相关主体,以便先行修复重要漏洞。据Anthropic 5月下旬发布的初步报告,参与方在约一个月内累计发现逾1万个高危或严重级别漏洞;6月2日,该计划又扩展至15个以上国家的约150家机构。需要说明的是,上述能力描述与漏洞数据主要来自Anthropic自身披露与合作方反馈,第三方独立核验有限,仍需审慎看待,但它确实改变了华盛顿对前沿模型网络安全风险的讨论强度。


图片

Anthropic推出“玻璃翼计划”(Project Glasswing),旨在利用人工智能辅助保护关键软件安全

图片来源:Anthropic


02 折中调和:AI行政令从“临门叫停”到“最终落地”





多家媒体此前披露,本次AI行政令原计划在5月下旬推出,届时安排多家前沿人工智能企业高管出席签署,但在签署前特朗普临时叫停,理由是担心行政令的早期文本会削弱美国相对于中国的技术领先优势,特朗普本人亦对记者表示,他“不喜欢其中某些内容,不想做任何会妨碍美国领先的事。”


从公开报道和最终文本对照看,行政令的5月草案与其6月正式版本之间,最关键的变化是审查窗口和约束性质。早期版本一度被报道为允许政府在模型发布前最多90天获得访问权限,最终文本则将这一窗口压缩至最多30天,并明确写入自愿参与、不得设立强制许可或发布前审批等限制性条款。这一调整说明,白宫并非放弃对前沿模型网络能力的安全关切,而是有意避免把安全评估机制变成事实上的模型发布许可。据Axios报道,离任不久、仍以总统科技顾问委员会联席主席身份发挥影响的前白宫“人工智能沙皇”大卫·萨克斯(David Sacks),与国家经济委员会副主任巴施(Ryan Baasch)共同推动了缩短窗口、确立自愿框架并写入禁止强制许可的措辞。而据Axios、《财富》等媒体报道,在行政令签署前,萨克斯、马斯克和扎克伯格等科技界人士被指对相关机制表达反对或担忧;不过马斯克随后在X上否认自己在特朗普决定前参与游说,Meta和Sacks相关方面则未就路透社置评请求作出回应。


由此,本次AI行政令可以被理解为早期政策思路的压缩版,而非一套全新的监管方案。它保留了政府对前沿模型网络风险的早期评估需求,也删除或弱化了可能被理解为强制审查的安排。特朗普政府借此向安全部门和国会释放回应风险的信号,同时向产业界承诺不会重回重监管路径。产业界的反应印证了这一点,据路透社等报道,OpenAI首席执行官奥特曼(Sam Altman)称该行政令“把平衡把握得恰到好处”,谷歌全球事务负责人沃克(Kent Walker)称其为“重要的一步”,微软总裁史密斯(Brad Smith)称其为“在推进创新的同时保护美国公众安全的重要一步”。不过据Semafor报道,产业界内部并非完全一致:OpenAI对早期版本相对支持,而马斯克、扎克伯格等科技界人士则被多家媒体描述为对政府测试机制持更强警惕态度,担忧“自愿”程序最终演变为事实上的发布前审查。


这一折中也解释了行政令文本中的内在张力。一方面,政府希望在前沿模型真正扩散前获得有限评估和协调能力,防止关键基础设施在新型网络能力面前被动暴露;另一方面,行政令又坚持不设正式许可、不要求所有模型接受审查、不让政府成为模型发布的最终放行者。它追求的是一种安全姿态,而非一套完整监管体系。


图片

2025年,特朗普顾问、被媒体称为白宫“人工智能沙皇”的戴维·萨克斯在白宫活动上发言,特朗普在旁听取

图片来源:《华尔街日报》


03 特朗普2.0 AI政策新图景:松绑主线下的安全回摆





将本次AI行政令放回特朗普第二任期以来的政策脉络观察,它更像是创新优先框架下的一次安全修正,延续性与转向性都较为清晰。


特朗普重返白宫后,首先撤销了拜登政府2023年人工智能安全行政令的相关框架,并于2025年1月23日签署第14179号行政令《消除美国人工智能领导地位的障碍》,要求清理被认为妨碍创新的监管措施,并在180天内制定维持美国主导地位的行动计划。2025年7月23日,白宫发布《赢得竞赛:美国人工智能行动计划》,提出九十余项联邦政策行动,围绕加速创新、建设基础设施、引领国际外交与安全三大支柱展开;同日,特朗普还签署三份配套行政令,分别聚焦加快数据中心基础设施审批、推动美国全栈人工智能技术出口,以及要求联邦采购的大语言模型遵循所谓真实性与意识形态中立原则。这一阶段的重点,是以去监管、基建扩张、出口推广和反“觉醒AI”为抓手,强化美国产业优势。


2025年底,特朗普政府进一步将人工智能治理权向联邦集中。2025年11月,白宫启动“创世纪计划”(Genesis Mission),推动能源部国家实验室、联邦科学数据与人工智能模型结合,服务科学发现和国家战略目标。2025年12月11日,特朗普签署第14365号行政令《确保国家人工智能政策框架》(Ensuring a National Policy Framework for Artificial Intelligence),矛头指向各州AI立法,要求司法部设立“AI诉讼工作组”挑战与联邦政策冲突的州法。2026年3月,白宫又发布国家人工智能立法框架,敦促国会在若干领域以联邦法律预占州级规则空间。


由此看,本次AI行政令并未脱离特朗普2.0的基本主线:仍强调美国优先、产业领先、反对过度监管和维持对华竞争优势,也继续以自愿机制而非法定强制作为主要工具。但它显示出一个值得注意的安全回摆,即在前沿模型网络能力快速上升后,特朗普政府开始承认,仅靠放松监管和企业自律不足以覆盖国家安全风险,联邦政府需要在关键节点上获得更早的可见性和协调权。


这一变化并不等于美国已经形成稳定的前沿模型监管制度。行政令依靠企业自愿配合,既未说明拒绝参与的后果,也未公开“受涵盖前沿模型”门槛如何设定、机密测试由谁监督、测试结果如何防止被政治化使用。美国外交关系协会的评估指出,界定何种模型构成“受涵盖前沿模型”是最具决定性也最难执行的环节:前沿系统的能力不只取决于模型本身,还取决于工具调用、数据管道、部署环境和自主操作能力;门槛过窄,真正危险的能力可能绕过评估,门槛过宽,政府有限的技术和网络安全人力又会被迅速耗尽。美国外交关系协会还提醒,政府无法评估自己看不见的东西,而前沿能力往往只有开发实验室最先掌握,自愿机制能否把企业内部的能力可见性转化为政府可用的安全信息,取决于双方能否形成真实合作。这条脉络中还潜伏着一段尚未理清的紧张关系,五角大楼曾在Mythos发布前不久将Anthropic列为“供应链风险”,理由是该公司拒绝放弃对大规模监控和全自主武器的使用限制,与此同时又在难觅替代方案的情况下继续使用其Claude模型。这种既防范又依赖的矛盾,正是行政令复杂底色的一部分。


图片

2025年7月23日,特朗普在“赢得人工智能竞赛”峰会上展示已签署的AI相关行政令。

图片来源:路透社


04 结语





综合来看,这份行政令反映出三重趋势。


第一,美国人工智能治理正在从单纯松绑转向“安全的创新”叙事组合。特朗普政府仍然反对强监管,也没有恢复拜登时期强制报告、统一安全测试和更广泛风险治理的框架,但已开始把前沿模型视为一种需要政府提前掌握的国家安全变量。人工智能不再只是放手培育的产业优势,也成为可能放大网络攻击、影响关键基础设施安全乃至改变军事竞争形态的双重工具。威凯律师事务所(WilmerHale)即指出,这份行政令是本届政府此前放任式姿态的一次显著转向,其约束力却仍远低于欧盟和中国已经采用的监管体制。


第二,自愿框架是本次行政令最大的政策特点,也是最大的不确定性来源。自愿安排降低了产业阻力,有助于避免迭代被过长审查拖慢,也符合特朗普政府回避重监管标签的政治需要。但若缺乏明确激励或后果,前沿实验室是否会在最敏感的模型上充分配合,仍存疑问。卡托研究所政策分析师隆多尼奥(Juan Londoño)即认为,行政令并不完美,但朝正确方向迈出了一步;他同时担忧,由NSA局长主导判断哪些模型需要审查、哪些可信伙伴优先获取,标准过于模糊,可能成为针对与政府存在摩擦企业的“危险先例”。民主党参议员华纳(Mark Warner)虽欢迎该政策,却批评本届政府是“姗姗来迟地发现,需要重做一件它在执政第一年里草率拆掉的事情”。即便企业愿意合作,政府能否在30天内完成有技术含量的网络能力评估,也取决于测试体系、专业人员和跨部门协调能力。


第三,中美人工智能竞争仍是这一政策转向的底层背景。特朗普叫停早期草案时担忧领先优势受损,最终把窗口从90天压缩至30天,本身就说明安全审查必须服从速度竞争与产业领先的政治约束。美国并不愿为风险治理显著放慢前沿模型发布节奏,也不愿在与中国开源模型、低成本推理和应用生态的竞争中自设过高门槛。因此,本次行政令更像是在安全焦虑与竞争焦虑之间寻找可接受的平衡。


总体而言,本次AI行政令不是特朗普政府人工智能政策的一次有限但重要的安全修正。它没有放弃去监管和美国优先的总体方向,却承认前沿模型能力已经进入需要联邦政府提前介入的风险区间。对美国而言,真正的考验不在于行政令是否写入了“安全”二字,而在于自愿框架能否换来企业的真实配合、机密测试能否跟上模型能力的演进、政府又能否避免把安全评估变成新的政治选择工具。对世界而言,这份文件让人工智能治理的核心矛盾进一步清晰:各国都希望获得最强技术带来的发展红利,却也不得不面对这些能力扩散后可能带来的系统性安全成本。如何在创新与安全、速度与控制之间找到可持续的平衡,将是所有主要参与者都必须回答的问题。



作者:姚旭、辛艳艳、张傲、袁露铭