全球AI创新治理|让智能体AI为政府服务:准备度框架

作者:栗子宜 发布时间:2026-06-29 14:11:03 来源:全球人工智能创新治理中心+收藏本文


编者按


在当今全球治理版图中,公共行政体系正面临着前所未有的结构性挑战。一方面,公众对公共服务的实时性与个性化需求日益高涨;另一方面,财政空间收紧与劳动力红利衰减,迫使传统政府必须在更少的人力与资源约束下维持高效履职。在这一历史性拐点上,欧洲世界经济论坛提出核心研判:技术已从行政辅助工具转变为政府运营与赢取公众信任的核心驱动力。智能体人工智能(Agentic AI)的兴起正在加速这一转变,推动政务数字化从简单的“纸张搬网”跨越到端到端“成果编排”的新阶段。为此,深入探讨技术转型规律与防范潜在风险,对重塑智能化政府运营生态具有重要参考价值。


以下译文仅代表原文作者的个人观点与分析立场。详细内容请参阅文末原文链接。


摘要


世界经济论坛联合卡普捷米尼发布最新报告《让智能体AI为政府服务:准备度框架》,在全球首次提出系统性的政府智能体AI准备度评估模型。报告倡导政府打破传统部门壁垒,转向基于跨部门“功能流”的思维模式。通过对70项核心政府职能进行多维度评估,该报告发现半数职能已兼具高应用潜能与可控实施复杂度,构成了向智能化治理转型的“高准备度区”。报告建议决策者遵循从“高准备度”向“高复杂度”递进的渐进式转型路径,在平衡技术创新与公共主权、数据安全及伦理风险的前提下,将智能体的变革潜能转化为可量化的公共价值。


作者简介


报告由世界经济论坛(WEF)管理董事兼首席技术官斯特凡·梅尔根塔勒(Stephan Mergenthaler)、全球政府技术中心柏林分中心(GGTC Berlin)常务董事曼努埃尔·基利安(Manuel Kilian)以及卡普捷米尼(Capgemini)执行副总裁兼公共部门全球行业领袖马克·赖因哈特(Marc Reinhardt)等全球顶尖技术治理与政务创新(GovTech)专家联合执笔,并广泛汇聚了来自乌克兰数字转型部、阿联酋总理办公室、德国联邦就业局以及世界银行等多国政府核心数字化官员与高级治理学者的共同智慧。


图片

图片来源:报告原文封面

01

智能体机遇



从流程数字化到成果编排


在过去数十年的数字政府建设中,全球各国的转型核心大多聚焦于既有业务流程的线上迁移。这一阶段的数字化虽然搭建了基础的在线服务窗口、推进了政务数据资产的集中化,但本质上只是改变了信息传递的介质,其底层的公共行政逻辑与碎片化的审批链条并未发生根本性变革,导致传统体制中的效率瓶颈在网络空间中依然留存。


智能体人工智能的诞生则标志着技术赋能路径发生了质的飞跃。它超越了以往仅能进行数据分类或生成文本的单一工具范畴,演变为具备自主规划、上下文感知、实时决策和跨系统行动能力的智能化软件系统。这种技术在政务场景中的核心价值,在于它能够在一个划定的受控约束边界内,自主协调过去需要人工干预的跨业务多步工作流,从而让政府运转告别过去各部门各管一段的机械自动化,跨入围绕群众办事结果进行一站式智能调度的新阶段。为了在行政体系中科学地部署这种新型技术,决策者必须清晰地区分智能体AI与传统自动化工具及通用生成式AI之间的能力边界差异:


图片

图1 传统自动化(RPA)、通用生成式AI与智能体AI的能力边界对比

图片来源:报告原文


传统RPA工具属于完全被动型技术,不具备自主性与学习能力,只能严格依赖预先设定的指令执行机械、高重复性的软件操作。通用生成式AI虽然在内容创作与文本提炼方面展现了灵活性,但其运转极度依赖人类持续的主动提示词输入,且无法直接在真实的政务软件中触发实质性的行政行为。智能体AI拥有显著的自主运转空间、持续的学习进化机制以及动态的长期记忆,能够在复杂的非结构化环境中实时调用政府内部的工具和外部的API接口,敏锐捕捉环境变化并进行实时纠错。


在公共行政的应用实务中,智能体AI应当被定义为一种对人类公务员的能力增强模型,而非简单的岗位替代方案。通过将大量耗费精力的行政事务协调、大体量案卷的多源数据比对以及例行公事的合规性核验交由智能体群组去自主高效处理,公共部门能够将极其宝贵的行政人力资源重新集中于需要高度人类同理心、复杂政策自由裁量权以及需要直接面对面倾听公众诉求的深度治理领域。


为什么智能体AI对政府至关重要


当前全球公共管理正处于转型路口,面临技术演进与资源约束的双重塑造。一方面,商业化智能体技术日益成熟,为政府提供了性能强悍、安全可控的底层支撑;另一方面,财政压力与公众对响应速度的要求,使得传统官僚体制扩张路径难以为继,“少花钱、多办事、办好事”成为刚性约束。调研显示,全球350家大型公共机构中,高达90%的受访部门计划在两到三年内探索或部署智能体AI,智能化转型已成必然趋势。


图片

图2 Gartner 2025年新兴技术成熟度曲线及关键政务技术节点

图片来源:高德纳官方研究报告《Hype Cycle of Emerging Technologies 2025》


这一深度转型正催生出“智能体国家”这一新型公共行政形态。在此架构下,受控自治的AI智能体系统作为新型数字化基础设施常态化嵌入政务流程,可大幅压缩审批时滞,推动政务服务从公众“主动申请”向政府“精准预测、主动触达”的主动模式升级。引入该技术能带来法律尺度一致性飞跃、案卷错误率大幅下降及公众满意度提升等智能化红利。然而,技术主权是一条安全底线,主权国家必须在法律、算力、算法安全等层面拥有最终控制权,确保技术始终服务于国家核心利益与公众福祉。


落地路径:智能化转型的切入点选择


鉴于AI底层算法和软硬件技术的突飞猛进,当前数字政府建设的核心矛盾已经从纯粹的技术可行性论证,逐步转向高难度的顶层战略抉择。对于许多公共部门而言,当下面临的最迫切的战术难题在于,如何在一本极其复杂的政务清单中,精准识别哪些公共活动最适合智能体化改造,哪些政务序列能在投入后产生最丰厚的公共价值回报,而哪些敏感领域又隐藏着失控风险或伦理挑战,因而必须保持高度的战略克制。在这种充满未知的新型技术扩散期,迟缓的战略观望和盲目的冒进尝试都是极度危险的。长期的因循守旧可能导致主权国家在智能化浪潮中陷入被动,最终不得不饮鸩止渴地依附于不符合本国法律、不兼容本地治理文化的外源性商业系统;而缺乏章法的无序试水,则极易催生大量无法兼容、无法跨部门复用的烟囱式试点项目,不仅疯狂吞噬有限的公共财政预算,更会在反复失败中消磨公共管理层对新兴技术的制度性信心。


图片

图3 麦肯锡“根本原因问题求解法”的五大核心要素与闭环流程

图片来源:麦肯锡全球研究院


全球权威IT研究机构给出的警示性预测同样证明了这一战略清醒的重要性,根据其最新行业研判,“到2027年底,全球超过40%的智能体AI项目将因为研发维护费用的非理性飙升、商业与公共价值流动的模糊不清,以及风险管控机制的严重缺失而走向夭折”。这一极其震撼的行业预测为全球雄心勃勃的技术决策者敲响了警钟,再次有力证明了若缺乏严谨、客观、循证的系统性方法论支撑,一腔热血的技术狂热极易在现实复杂的行政壁垒面前撞得头破血流。公共部门必须立刻建立起一套标准化、数据化的准备度评估准则,在技术立项的初始阶段,就将智能体系统的长远生命力、全生命周期综合成本以及可落地的风险控制路线图进行量化推演,以此确保有限的国家公共资源能够精准滴灌在最能释放治理效能的核心土壤之中。

02

一套创新的政府智能体AI准备度框架



基于功能流的评估视角


智能体人工智能的部署呼吁公共行政学在评估视角上进行范式转换。传统的电子政务评估习惯沿着既有的行政权力边界,以部委或局办为单位进行局部数字化度量,或以特定技术工具为中心寻找应用场景。这种传统思维较难匹配智能体跨界调度的特性。智能体的核心优势之一在于围绕特定治理目标,穿透行政藩篱,串联并调动散落在不同部门系统中的数据与功能,形成闭环。如果将其局限在单一部门框架内,易形成智能化孤岛,不利于组件复用和治理效能的规模化放大。


图片

图4 政府智能体AI准备度评估框架的基本要素与推进流程

图片来源:报告原文


基于此,该准备度框架选取了“功能(Function)”而非“部门(Department)”作为最核心的分析单元。此处“功能”被定义为面向最终治理成果、包含一个或多个端到端连贯工作流的周期性行政活动。这种功能视角的转换带来了三大制度红利:首先这种模式与部门行政级别脱钩,缓解了因行政建制调整或政治更迭对评估连贯性造成的干扰,从而更贴近核心运营本质。其次,功能层面的适度抽象能够为政府开展可控的局部试点锁定最佳的空间边界。最后,特定功能上沉淀的技术突破与智能体模板更易平移组装至相似场景,有助于降低边际成本,逐步构建标准化的全域智能体生态,极大地促进了跨部门复用。


价值潜能与实施难度的评估


梳理出政府功能清单仅完成了资产盘点,要制定可落地的执行规划,还需对每项功能进行深度的双轴量化剖析。该准备度框架的核心思路,是将核心政务功能置于由“智能体AI潜能”与“实施复杂度”构建的双维度矩阵中进行审视。“潜能”轴评估“技术能否做好及是否值得投入”。它由自动化契合度、智能体能力的必要性,以及业务本身的办件体量与战略价值三大核心指标复合而成。若某项功能仅需简单逻辑判断,对高级推理需求较低,引入智能体反而可能造成资源浪费。“实施复杂度”轴代表技术在公共行政边界内落地需克服的客观障碍。它由“实施挑战”与“风险伦理”两大子维度交织而成。前者度量底层数据标准化水平、老旧系统集成难度及人员接受度;后者聚焦于系统潜在的偏见、误判后果的可逆性,以及敏感数据的隐私法律红线。这种设计传递出的核心理念是高潜能不等同于天然的执行优先权。若某项功能效率提升明显,但其背后的决策黑箱、潜在的算法歧视等实施复杂度较高,合理的决策是审慎推进,绝不能允许对技术效能的追求超越对公众福祉和行政合规的守护。


政府准备度地形图


图片

图5 基于分值计算的智能体AI三大战略准备度区域

图片来源:报告原文


报告通过专家交叉打分,将70项核心政务职能映射为一幅“政府准备度地形图” 。通过设定合理的准备度分值阈值,复杂的政府职能被划分为三大战略区域:


  • 高准备度区(推荐早期部署区)包含网络安全监测、系统性能监控、公共信息指引、文档全生命周期管理等功能。这些功能依托相对成熟的数据底座,具备高频、规则清晰、标准化程度高的特征。由于实施障碍较少且不涉及实质性行政自由裁量,适合作为政府积累技术经验、建立组织信心的切入点。


  • 中准备度区(阶段性推进区)包含案卷跟踪、福利计算、欺诈检测及许可审批等核心职能。内部主要分为两类集群:一是“中等潜能、低复杂度”功能,适合开展流程解构,通过传统自动化与智能体技术的增量嵌套稳步获取红利;二是“高潜能、中等复杂度”功能,因涉及隐私或合规风险,需在风险缓解机制与数据接口完备后分阶段推进。


  • 低准备度区(长效监测区)包含危机响应协调、员工绩效管理、政策起草及重大投资规划等。这些功能天然依赖复杂的利益博弈、战略预判或定性裁量,现阶段缺乏标准化数据支撑。强行替代面临技术集成障碍与责任归属风险,目前最佳安排是常态化跟踪与局部子流程测试。


从全球地形图到本地化路线图


报告特别强调,全球基准地形图的功能得分仅代表各经济体的中位数发展水平,并非通用模板。不同主权国家与地方行政区域因基础设施成熟度、法律红线及社会文化的差异,必须进行本土化适配。例如,部分在全球基准中因跨部门协同难度大而被归为高复杂度的功能,在已普及统一互操作数据中台或实行扁平化体制的国家,落地难度会显著降低,甚至成为本土优先推进的机会。将全球基准转化为本土智能化实施路线图,政府可遵循以下六个步骤:


图片

图6 将全球准备度地形图转化为本地化实施路线图的六个步骤

图片来源:报告原文


一是确立本地基准。评估跨部门数字化水平、数据基础设施标准化程度、云算力储备、公务员技术素养及自动化决策的法律边界,理清实施环境的优势与约束。二是制定风险缓解战略。针对算力能耗、算法合规、隐私保护及过度依赖自动化导致的人员技能退化等潜在风险,制定具体的安全守则、审计机制与行为红线。三是修正功能级评分。结合本土真实的业务痛点与数据资产现状,运用国内专业知识重新审视两轴指标,将全球基准分值修正为符合本土实际的准备度矩阵。四是合理编排执行序列。坚持循序渐进,优先选择低复杂度、高红利的功能进行试点,并重视数据质检、身份验证等具备强基础设施属性的“乘数功能”,为后续敏感功能上线夯实技术轨道。五是开展业务流程优化。在智能化改造前引入流程重组视角(如传统转型框架),精简并消除不合理的旧有行政节点,避免将低效操作或制度冗余机械地自动化和固化。六是进行受控验证与迭代。通过窄边界的小规模试点,在包含真实数据与用户的受控环境中验证系统集成度与效果,建立客观绩效比对机制,并根据技术演进、法规变化及组织反馈定期动态调整路线图。

03

从成功部署中汲取经验



乌克兰:国家级统一政务人工智能助手


在数字化转型进程中,乌克兰公共服务数字化水平提升明显。在过去的六年里,该国在联合国在线服务指数中的排名从全球第102位上升至第5位。通过打造的“统一政务(Diia)”生态系统,公民可以通过统一的应用程序和门户网站访问电子证件及200多项政府服务。然而,随着上线服务的不断扩大,公共部门发现了一个新的治理瓶颈:公众在面对层层嵌套的数字菜单和专业晦涩的法律行政术语时,依然存在着显著的查找障碍和操作迷茫。为了彻底打破这种“人找服务”的传统被动数字化框架,乌克兰积极探索智能化转型,于2025年9月正式上线了基于智能体架构的Diia.AI国家级人工智能助理,尝试由国家面向公民提供更具主动性和个性化的政务服务。


图片

图7 乌克兰“Diia”统一数字政务生态系统官方界面

图片来源:乌克兰“Diia”数字政府生态系统公开展示素材


Diia.AI的核心特征在于,它改变了以往只能依据固定文本库进行机械回复的传统政务服务聊天机器人形态,具备了在合法授权边界内直接替公民代办、代触发复杂端到端行政行为的超级智能体属性。例如,公民只需在交互界面中通过自然语言提出请求——“请帮我开具一份过去半年的个人收入证明”,系统便能理解上下文语义,在后台协调相关数据库进行合规核验,并在几分钟内向公民返回正式的官方电子文档。在这一工作流运转的背后,设计者采用了零信任的安全技术架构,大模型本身被严格隔离在核心敏感数据之外,不直接接触个人数据,以保障信息安全。截至目前,这一智能体已服务超过29万名公民,签发了7000多份收入证明,并经历了对抗性测试以增强系统的韧性与抗偏见能力。与此同时,通过在支持团队中引入人工智能辅助工具,系统已能够协助处理超过九成的日常政务问询,显著提升了政务响应的效率。


德国:人工智能大型基础设施许可审批系统


大型基础设施项目的审批流程由于涉及复杂的环境评估标准、跨部门的法律法规交织以及大量的工程文本,通常是德国公共行政体系中流程较为繁琐、耗时较长的环节之一。在传统模式下,重大基建项目的案卷审核与跨部门审查周期往往长达数年,这种时滞不仅影响了规划的可靠性,也容易使战略目标的推进超出立法周期,并影响公共资源的利用效率与投资信心。为此,德国联邦数字化和现代化部开发了一套专门针对许可审批的智能化解决方案,旨在使技术能够更及时地对到案材料进行初审与结构化处理。


图片

图8 德国“移动数据空间(MDS)”政策创新举措案例库档案

图片来源:经合组织(OECD)人工智能政策观察库


该系统的核心在于其对法律逻辑推理的针对性处理与检索机制的优化。鉴于将浩瀚如烟的全套国家行政法典塞入大模型进行全域盲目检索会带来极高的计算能力需求、成本与引发AI幻觉的风险,研发团队采取了收窄法律搜索范围的策略。当风力发电场等基础设施建设申请提交进系统后,系统会分析申请材料并对其进行结构化重组,提取核心参数,随后将法律检索范围精准锁定在与该项目高度相关的特定环境和区域法规中。在此基础上,系统通过自主比对案卷事实与法律要件,在人类审批官员的监督下生成法律依据相对扎实的许可决定书草案,以辅助审查工作。这种“技术应用聚焦、自主权适度克制”的渐进式人机协同安排,不仅有助于防范早期技术应用的法律合规风险,也有利于在实务中逐步建立起公务员群体对智能化系统的信任。


阿联酋:联邦级政府人力资源智能体


在大型公共部门体系中,人力资源管理往往面临程序复杂、信息分散以及对人工处理依赖度高的问题。为了推进政府运营的智能化并减少内部事务性冗余,阿拉伯联合酋长国联邦政府人力资源管理局(FAHR)在联邦层面推出了人力资源智能体系统。该系统在联邦人力资源生态中引入了对话式智能交互界面,旨在协助对接和自动化处理130多项数字人力资源服务及员工自助交易。


图片

图9 阿联酋联邦政府人力资源管理局“HR AI Agent”官方发布界面

图片来源:阿联酋联邦政府人力资源管理局官方网站


阿联酋在战略推进上的关键在于,其初期部署主要聚焦于高频次、以信息交互为中心且裁量风险相对有限的业务领域,例如政策解答、服务资格核验以及流程指引等。评估结果表明,该系统目前已能自主解决超过80%的人力资源法规与政策咨询,为多达5万名以上的全域联邦在编公务员提供了全天候的智能化支持。这一应用不仅优化了员工的服务体验,更促进了端到端工作流的重塑,减少了人工干预的比例。通过由智能化系统处理常规的咨询与流转事务,人力资源管理人员得以将更多精力投入到人员规划、能力建设以及绩效优化等更具核心价值的治理环节中,在保证人类责任与组织完整性的前提下,稳步推进智能化的人力资源生态建设。


德国:联邦就业局软件开发智能体


在许多发达经济体公共部门的数字化转型路径中,一个显现的约束并非来自财政预算,而是源于数字技术人才的结构性短缺。德国联邦就业局的数据预测显示,到2032年,该局软件开发等部门预计将有约35%的员工因退休等原因离开组织。这给保障数字化转型进度与应对日益扩大的工作量带来了挑战。为了维持核心就业服务管理系统的持续迭代并沉淀技术能力,该局决定在内部软件工程运维环节开展智能体人工智能试点。


图片

图10 德国联邦就业局IT系统部(IT-Systemhaus)数字化生态入口

图片来源:德国联邦就业局IT系统部官方门户网站


该局首先将切入点对准了长期消耗基层工程师大量工时的事务性瓶颈,即如何将业务部门提出的粗颗粒度需求或口头“用户故事”,转化为符合软件工程技术规范的结构化派工单。在这项技术试点中,该局在安全的本地基础设施内部,运行了一个专门的工单编排开发智能体。该系统能够准确理解业务部门的非结构化长篇文档,在严格遵循软件开发合规规范的前提下进行多步技术推理,自发在系统内组装并生成逻辑闭环的技术工单。工时测算表明,以一个研发小组平均每天处理20个工单为例,该智能体系统的常态化运转每月可节省约150个工作小时。这让核心技术人员得以卸下手工配置的负担,将全副精力投入到基础数据架构整合等更具核心价值的研发方向上,成为公共部门应对技术人才短缺、提升数字化运营韧性的智能化工具。

04

结论


全球数字政府建设正迎来智能体人工智能转型的清晰拐点,这已成为关乎国家未来治理履职能力的时代考题。推动这一变革的成功关键,不在于盲目追逐高风险的前沿应用,而在于遵循客观准度规律开展严谨的战略推进。


各公共部门应将准备度框架作为诊断工具,在执行中坚持“有界自主”的底线原则。必须在法律与制度层面划定权责红线,建立人类官员最终负责与人工干预机制,确保法治政府的透明度、公正性与责任感不因技术释放而受损。转型无法一蹴而就,需依托真实数据环境持续迭代,通过局部功能试点汲取经验,随着基础设施的完善有序扩张智能化治理边界。




原文链接




https://www.weforum.org/publications/making-agentic-ai-work-for-government-a-readiness-framework/