全球AI创新治理|人工智能经济的GDP测量缺口及其政策影响

作者:萨娜 发布时间:2026-06-23 00:07:17 来源:全球人工智能创新治理中心+收藏本文


编者按


人工智能经济正在快速增长,但其在传统GDP统计中的存在感仍然有限。美国彼得森国际经济研究所(Peterson Institute for International Economics,PIIE)政策简报《人工智能在GDP统计中处于什么位置?填补测量空白》指出,当前美国AI经济的名义算力支出、原始算力容量和质量调整后的AI产出均在高速扩张,但由于AI活动分散在云服务、软件、数据处理和专业服务等多个行业,且AI能力提升带来的价格下降难以被传统统计方法充分捕捉,现有国民经济核算体系尚难准确呈现AI经济的真实规模。文章认为,AI与以往半导体、互联网等技术不同,除提高人类劳动效率之外,也可能会大范围替代部分劳动工作。若统计体系不能及时跟上,财政收入预测、劳动税基评估、利率判断和宏观政策情景分析等都可能出现滞后。面对此情况,文章也提出了多项针对性建议措施,以避免测量缺口进一步转化为政策缺口。


以下编译仅代表原文作者的个人观点与分析立场。详细内容请参阅文末原文链接。


作者简介


安东·科里内克(Anton Korinek)自2026年2月起担任彼得森国际经济研究所非常驻高级研究员,并自2026年5月5日起担任Anthropic研究所(Anthropic Institute)转型性AI经济研究负责人。帕特里克·麦凯尔维(Patrick McKelvey)为加拿大银行(Bank of Canada)高级数据科学家。

01

同一经济现实的两种图景



AI能力迅速跃升,但GDP统计仍然模糊


近年来,AI在美国经济中的位置成为经济评论中反复出现的一道谜题。一方面,前沿AI能力正在以行业观察者认为极为罕见的速度提升,不少人甚至认为通用人工智能(Artificial General Intelligence,AGI)在数年内就可能实现。另一方面,从传统国民经济核算体系看,AI革命主要体现为上游投资的增长,也就是数据中心资本开支的快速扩张;而这些数据中心所支撑的实际生产活动,却几乎没有在宏观经济统计中得到清楚地呈现。美国总体GDP增长仍然温和,生产率统计也只是轻微上升,AI能力提升与宏观经济表现之间的脱节,逐渐成为一个值得进一步解释的问题。


一种解释是AI技术的扩散和采用需要时间。经济学通常认为,通用目的技术(general purpose technologies)所带来的生产率广泛提升的经济收益,往往会滞后于技术本身的发展。这当然可以是解释当前现象的一部分原因。但文章认为,还有另一种与之互补的解释没有得到足够重视,即现有的国民经济核算体系本身就很难有效识别出AI部门带来的经济影响。


GDP测量的概念框架形成于20世纪中期,当时经济结构以制造业为中心。这一框架长期以来发挥了重要作用,今天仍然适用于大部分经济活动。但它隐含一个前提,即经济结构变化相对缓慢,某一部门内部的质量改善也以统计机构能够追踪的速度逐步发生。然而,AI正在挑战这一前提。一方面,AI质量提升速度过快,传统的质量调整价格方法(hedonic adjustment)难以充分捕捉其中变化;另一方面,AI相关活动又分散在例如云服务、软件出版、数据处理等多个行业代码之中,缺乏一个可以整体呈现AI经济的单一统计类别。


AI部门与互联网和半导体等部门的可比性是有限的


AI并不是第一个引发测量争议的尖端技术。半导体和互联网在各自的技术时代也曾引发过类似讨论。文章指出,AI案例具有一个关键差异,使其测量问题可能比以往更加重要。


在此前的技术变革中,技术总体上是人类劳动的补充。更好的芯片可以提升工人和设备的生产效率,免费的数字服务可以通过优化人类的工作时间和注意力分配以提升效率。但这些收益仍然需要经过“人类”这个“瓶颈”才能转化为宏观影响,因此其经济足迹相对有限。相关研究后来普遍认为,对此类技术带来的经济效应在统计层面的低估虽然真实存在,但低估的程度相对较轻。


AI与之不同的是,它是第一个有可能在大范围内替代人类劳动、并由此造成大规模技术性测量偏差的候选技术。如果这一可能性成为现实,过去对宏观经济影响规模形成测量约束的“人类瓶颈”将不再成立,而这种测量缺口的后果也可能远超此前的技术周期。


目前来说,这些挑战仍处于相对可控的阶段。但文章强调,统计相关的基础设施建设需要多年时间,若等到测量缺口问题已变得较为尖锐时,再来补建统计能力,成本将会是高昂的。因此,提前建设AI经济测量框架,是一项必要的面向未来政策变化的准备。


图片

比较2000年互联网泡沫时期与2025年AI相关投资类别对GDP增长的贡献

图片来源:圣路易斯联储(Federal Reserve Bank of St. Louis)文章Tracking AI's Contribution to GDP Growth

02

直接测量揭示了什么


在文章中,作者通过整合多个数据来源,对美国AI生产进行了直接估算。这些数据包括数据中心用电量、芯片存量特征、当前GPU租赁价格、固定性能水平下的AI推理价格,以及训练过程中的算法进步速度。基于以上数据,文章构建了三层测量指标,以分别反映AI经济扩张的不同侧面。


名义算力支出:AI投入规模快速扩大


第一层指标是名义算力支出。作者以当前图形处理器(graphics processing unit,GPU)租赁价格为基础,估算租金以测量美国AI算力支出。结果显示,美国AI算力支出从2023年的370亿美元上升至2024年的900亿美元,并在2025年进一步增至2190亿美元,过去两年的年增长率均为145%。作者还使用全球芯片销售数据进行了交叉验证,发现基于后者的独立数据得到的增长量级大体相近。这说明,即便只看名义支出,AI相关投入已经形成了相当大的规模。2025年约2500亿美元的名义AI GDP估算,已接近美国定期客运航空业的规模。然而,传统GDP统计并没有把这些分散在不同产业中的AI活动整体识别为一个独立部门。


原始算力容量:每一美元购买的计算能力不断提升


第二层指标是原始算力容量。随着芯片效率不断提升,每一美元算力支出所能购买的物理计算能力也在增加。作者使用H100等效单位(H100-equivalent units)衡量美国AI计算能力,发现其年增长率超过200%,高于名义支出的增长速度。这意味着,单纯观察支出增长仍然会低估AI生产能力扩张,实际可调用的计算能力增长更快,而对于理解AI经济的生产潜力而言,算力容量本身比支出金额更为重要。


质量调整后的AI产出:算法进步带来更高增长


第三层指标是质量调整后的AI产出。数据显示,在固定基准性能下,AI推理价格在样本期内每年下降约94%;另有研究估计,在固定性能水平下,训练一个模型所需的计算量每年约下降三分之二。二者叠加后,质量调整后的AI产出在2024年增长约2290%,2025年增长约2271%。在推动这些数字的三类指数级变化中,算法进步在观察期内影响最大。


这里的“质量调整”,是指对AI能力提升本身的考虑与校准。换言之,同样数量的推理令牌,如果由能力更强的模型生成,其经济含义就不同于旧模型生成的内容。因此,质量调整后的推理产出会同时衡量“生成数量”和“能力水平”。训练产出也需要类似处理,因为同样一美元训练算力,如今可以训练出比过去更强的模型。作者将经过质量调整的推理和训练产出合并,得到一个衡量AI部门整体增长的综合指数。


图片

美国AI生产估算,年度平均值

图片来源:文章原文


图片

在相同AI能力水平下,使用AI模型的成本每年约下降94%

图片来源:文章原文


AI卫星账户与AI GDP:两种不同层次的测量目标


在解释这些测量结果时,需要区分两个层次。第一层是较为稳健,也更容易纳入现有统计体系的工作,即把分散在不同产业中的AI活动集中识别出来,形成AI卫星账户。第二层则更具探索性,即尝试把AI看作一个相对独立的经济部门,估算其自身创造的经济价值,也就是作者所说的AI GDP。


第一层测量并不要求改变现有GDP核算方法。它的重点是,在现有国民经济核算体系内部,为AI活动建立一个更清晰的观察窗口。当前AI相关活动分散在云服务、软件出版、数据处理、专业服务等不同产业类别中,单独看任何一个类别,都难以呈现AI经济的整体规模。因此,作者建议将名义算力支出、原始算力容量、质量调整后的AI产出等指标整合起来,建立AI卫星账户(AI satellite accounts)。这类似于统计体系中对能源部门、数字经济或可贸易部门进行专项核算,能帮助政策制定者更系统地看到AI经济整体的发展情况。


在这一层意义上,作者的测量工作主要是对传统产业分类难以识别AI活动的问题进行弥补,而不针对GDP体系本身。更积极地对AI产出进行质量调整,也仍然属于现有统计实践的延伸。统计机构本就会对快速变化的技术产品进行质量调整,问题在于,面对AI这样能力提升极快的技术,调整幅度需要明显提高。文章由此认为,建立AI卫星账户是当前最现实的一个统计起点。


第二层测量则更进一步,作者尝试把AI部门视为一个相对独立的“准经济实体”,并对由AI计算活动创造和由人类脑力活动创造的经济价值进行区分。在这一框架下,作者估算了一个初步的AI GDP。根据对毛利率、服务收入和劳动投入的简化假设,2025年美国名义AI GDP约为2500亿美元;如果按质量调整后的口径计算,其年增长率约为2600%。


不过,作者也承认,这种测量方法仍处在探索阶段,不能替代现行GDP统计框架。相比AI卫星账户,它对现有核算惯例的改变幅度更大,也更依赖一系列尚待验证的假设。因此,这一框架目前更适合作为前瞻性分析工具,用来观察AI在未来可能如何以自身逻辑创造经济价值。随着AI经济的重要性继续上升,特别是当AI活动越来越难被传统行业分类容纳时,这种测量才会变得更加重要。


对总体GDP的影响:统计方法足以改变宏观图景


作为一个说明性测算,作者进一步提出:如果对美国经济中的AI部分使用其质量调整价格指数,而不是当前统计体系中隐含的传统平减指数,那么美国实际GDP增长在2024年可能会高出约2个百分点,在2025年可能会高出约4个百分点。


作者强调,这一结果应被视为上限,而不是准确点估计。原因有二。首先,AI推理目前主要是中间投入,而不是最终产品。更高质量的推理如何转化为最终产出,相关生产函数仍不清楚。观察到的令牌质量大幅改善,并没有按比例转化为能直接进入最终GDP的支出增长。其次,作者的质量调整锚定的是基准性能,而不是直接观察到的经济价值。即便如此,这一测算仍然说明,头条经济统计对AI部门平减方法高度敏感;如果质量调整后的AI产出继续以近期速度增长,统计缺口可能会迅速扩大。

03

为什么AI带来的经济效益难以体现在总体GDP中



价格快速下降抵消了产出的增长


AI经济足迹在GDP统计中不明显,部分可以由会计逻辑直接解释。AI服务的单位价格下降速度几乎与质量调整后产出的增长速度相当,因此名义收入增长相对有限。


半导体行业曾长期呈现类似现象。每一代芯片相对于单位性能都比上一代大幅降价,因此即便质量调整后的半导体产出有巨大增长,其在GDP中的份额仍然相对有限。从这一角度来看,今天的AI是这种现象的一个更极端版本。


文章借用经济学家贾格迪什·巴格瓦蒂(Jagdish Bhagwati)提出的“贫困化增长”(immiserizing growth)概念来理解这一现象,即虽然一个部门或国家的产出快速扩张,但由于贸易条件恶化过快,前者的增长收益就难以在市场价值中体现出来。AI部门发展也遵循了类似的轨迹,其产出数量和质量的大幅增加被单位价格快速下降抵消。未来这种价格下降是否会持续仍然存在不确定性。近期GPU租赁价格趋于坚挺,大型企业对前沿AI服务的承诺不断增加,可能会在未来削弱这一趋势。


图片

固定能力水平下AI推理token的链式Fisher价格指数

图片来源:PIIE工作论文Measuring the AI Economy


消费者剩余与福利测量增加复杂性


第二个不确定性来自消费者剩余。和此前许多数字服务类似,AI可能向消费者提供了大量未被市场收入完整记录的价值。免费服务、广告支持型工具以及其他新型数字产品,已经推动美国经济分析局(Bureau of Economic Analysis)开始在数字经济卫星账户中开展相关追踪;关于“GDP-B”的研究也在把新产品和免费产品带来的价值纳入考量。


AI同样可能创造大量传统收入统计无法捕捉的消费价值。与此同时,文章在测算中原本归于生产者能力提升带来的经济效益,最终也可能会以消费者福利形式体现,而不一定以传统意义上的额外产出形式进入核算体系。


AI发展可能突破“人类瓶颈”


回顾此前关于尖端技术部门的测量争论可以发现,过去二十年生产率放缓是否源于统计未能捕捉互联网和相关数字服务价值,曾是一个重要问题。相关研究经过细致分析后指出,虽然这种误测真实存在,但规模很小,同时也无法解释跨国生产率放缓的差异。因此,作者并不主张今天的AI误测已足以显著改变GDP经济数字,而是强调这种误测可能在未来数年内变得更为重要。


此前被讨论的技术,最终大多是人类劳动和消费的补充,其总体影响受到被其赋能的活动规模的约束,因此关键仍在于AI与人类劳动的关系。AI则是第一个有可能在大范围内替代劳动本身的技术对象。如果AI能力继续扩展,起初先覆盖认知类工作,未来再通过更强的机器人技术进入体力工作,那么此前约束技术影响的“人类瓶颈”就会开始松动。


如果AI服务开始大规模替代过去由人完成的任务,AI价格的参照系也会发生变化。当前讨论AI价格时,通常比较的是“今天的AI”和“上一代AI”,然而,一旦AI真正承担原本由人完成的工作,市场比较的对象就会变成“AI服务”和“人类劳动成本”。由于许多AI服务的使用成本远低于相应的人力成本,企业可能愿意为能够替代劳动的AI能力支付更高价格,AI服务价格快速下跌的趋势也可能随之放缓,甚至在部分场景中转为上升。到那时,此前主要以“能力提升”和“成本下降”形式存在、在GDP中并不显眼的AI生产能力,可能会突然以收入、投资和产出增长的形式进入宏观统计。作者因此强调,现在建设AI测量基础设施,并不是为了修补一个已经完全显现的问题,而是为了提前应对这种可能发生的经济阶段转换。


图片

1870—2024年AI不同发展情景下的美国人均GDP路径

图片来源:达拉斯联储(Federal Reserve Bank of Dallas)文章Advances in AI will boost productivity, living standards over time

04

从测量缺口到政策缺口


作者认为,弥合AI测量缺口的紧迫性,在财政和货币当局负责的中期政策规划中体现得最为明显。


财政政策:如果看不见AI红利,就无法设计分配机制


首先,所得税和工资税是所有发达经济体财政收入的重要支柱。AI时代最核心的财政问题之一,是工资税基是否会被侵蚀,以及如果这一税基下降,什么可以替代它。要回答这一问题,政策制定者必须能够追踪AI部门的生产能力。


传统统计显示,AI部门以相对缓慢的名义速度增长;但根据文章的测量方式来看,AI底层生产能力每年增长则超过一倍。如果财政部门仅基于传统数据进行十年期收入预测,就会显著低估劳动税基冲击的概率,也会相应低估提前设计政策回应的必要性,可能包括税制改革、主权财富基金,或其他收益共享安排等。


看不见的意外收益,就无法被分享,这一逻辑也适用于收入预测之外的议题。无论是直接对AI征税,还是设计算力税、AI服务消费税,或对前沿模型提供商征收意外收益税,都需要先清楚掌握被征税基础的规模。当前官方统计无法告诉政策制定者,某一种AI税收工具究竟能够带来多少收入。即便是AI行业内部提出的产业政策方案,也隐含了对AI经济规模的数量判断,而这些判断目前并未得到官方统计体系支撑。


货币政策:统计滞后可能掩盖经济变化事实


其次,经济政策制定者通常依据已测量的产出缺口、生产率和自然利率来制定政策,而这些指标又来自国民经济核算体系。如果核算体系难以识别AI部门,政策判断就会受到影响。


随着AI投资吸收越来越多的真实资源,包括电力、资本开支和高技能劳动,自然利率很可能也在变化。但在传统统计中,这一信号可能是微弱且滞后的。如果未来AI足够接近劳动替代品,AI产出价格不再像当前这样快速下降,那么此前在名义统计中隐身增长的生产能力就有可能突然进入统计视野。政策制定者如果一直根据一个低增长、低通胀的经济图景进行判断,就可能在经济发生阶段转换时措手不及。


因此,今天投资统计基础设施的成本,相对于未来在关键时刻缺少足够的政策判断信息的代价而言,是很小的。越是在AI经济名义规模尚小的时候,越应提前建设测量能力。

05

三项政策建议


基于上述分析,作者提出三项面向政策和统计共同体的优先事项。具体设计应随着数据改进和AI经济轮廓清晰而不断演化。


建立AI卫星账户


第一,统计机构应与经济合作与发展组织(Organisation for Economic Co-operation and Development,OECD)、国际货币基金组织(International Monetary Fund,IMF)以及其他发达经济体同行协调,开始建设AI卫星账户。


前文讨论的若干指标,包括名义算力支出、原始算力容量、质量调整后的产出指数,都可以作为初始组成部分。这些指标能够在不改变GDP框架方法的情况下,为AI活动提供结构化可见性。随着数据后续的不断改善,账户的详细架构可以逐步完善。关键在于,相关工作必须在缺口变得尖锐之前启动。


作者特别提到,研发资本化最终被纳入2008年国民账户体系(System of National Accounts,SNA)修订,经历了从初步提出到正式实施的漫长过程。相比之下,AI经济增长速度更快,留给统计体系建设的时间窗口明显更短。


图片

图片来源:路透社/Aly Song


建立统计机构、AI企业与学界的数据协作机制


第二,应通过统计机构、AI企业和学术研究者之间的结构化合作,收集更好的AI经济数据。当前测量中的许多缺口,仅靠外部估算无法完全弥合。例如,训练和推理之间的算力分配、AI服务提供商的毛利率、基准性能与经济价值之间的关系,都需要更直接的数据支持。


有针对性的披露协议、跨企业统一定义,以及学术界与产业界之间的数据共享安排,都有助于显著缩小这些缺口。其他行业已经存在类似结构化合作的先例,随着AI部门本身不断增长,为AI建立类似合作机制的必要性也会持续上升。


将AI生产能力纳入中期预测和情景分析


第三,即便AI卫星账户尚未完全建成,经济政策制定者也应把AI生产能力指标纳入中期预测和情景分析当中。相比传统预测中隐含的假设(即AI部门生产能力规模小、增长慢),重新建立一个AI生产能力指标,即便不完美,也更具有信息层面的价值。


财政部门可以利用这些指标,对劳动税基预测进行压力测试;中央银行可以利用这些指标,评估AI投资吸收真实资源的速度,并将前文讨论的经济机制变化纳入情景分析当中。换言之,AI测量不应等到统计体系完全成熟后才用于政策,而应作为一种前瞻性指标,逐步进入政策工具箱。


图片

国际货币基金组织的AI准备度指数页面

图片来源:International Monetary Fund, AI Preparedness Index

06

展望未来



目前,标准国民经济核算仍然能够较好地完成其原本被设计来完成的任务,即追踪人类所经验到的经济福利改善速度。直接测量AI经济,则是在回答另一个如今变得越来越重要的问题:AI部门的生产能力究竟扩张得多快,这种扩张又可能在不远的未来对整体经济产生何种影响。这两个问题都很重要。而二者答案之间的分化,可能成为未来几年最有信息量的宏观经济指标之一。


作者承认,文章提出的估算仍是初步的近似测量。随着质量更高的数据的出现,相关假设可以被进一步修正,AI GDP框架也需要更多发展,才能成为常规政策工具。与此同时,作者强调,不应等到AI经济“大到足够重要”时才重新讨论测量问题。在最需要相关统计时拥有可用数据的最低成本路径,即是趁AI部门在名义上仍然较小时建设测量基础设施。




原文链接




https://www.piie.com/publications/policy-briefs/2026/where-ai-gdp-statistics