全球AI创新治理｜AI能否改变科研取决于学习能力与制度环境

作者：梁若璇发布时间：2026-04-15 12:04:19 来源：全球人工智能创新治理中心+收藏本文

编者按

近日，德国科研机构马克斯·普朗克学会（the Max Planck Society, MPS）和弗劳恩霍夫协会（the Fraunhofer Society, FhS）的大规模调查显示，AI的扩散不仅是技术问题，更是组织与制度问题。法律不确定性、隐私风险和技能缺口成为研究人员采用AI的主要障碍，而支持创新、鼓励试验和持续学习的组织文化则显著促进其使用。换言之，AI能否真正改变科研，并不完全取决于模型能力，也取决于科研机构如何塑造学习环境、制定规则并提供培训资源。随着AI从工具走向科研基础设施，未来科研竞争或许不再只是学术能力的竞争，也将是学习能力与制度环境的竞争。这一视角为理解AI对科研生态的长期影响提供了更具现实意义的观察框架。

以下译文仅代表原作者的研究观点与分析立场。详细内容请参阅文末原文链接。

摘要

将人工智能融入科研工作，有望显著提升创新效率。作者对两家德国顶尖研究机构的研究人员进行了调查，以了解人工智能的使用情况、应用障碍及其对科研的预期影响。研究人员将人工智能工具广泛应用于基础性和创造性任务，认为这项技术将对科研产生变革性影响。对人工智能的有效使用似乎既依赖于实践经验，也取决于对学习资源的利用程度。人工智能使用中长期存在的性别差距，很大程度上与个体对AI的熟悉程度有关，这也提示了组织层面可能的干预方向。同时，法律不确定性和隐私问题也逐渐凸显，不少研究人员因此呼吁提供更加清晰、统一的高层级监管指引。总体来看，这些发现表明，科研机构可从制度层面着手，推动更加公平、更加有效的人工智能应用。

作者

Chugunova Marina、Harhoff Dietmar、Morgalla Ulrike，马克斯·普朗克创新与竞争研究所研究人员；

Hölzle Katharina、Kaschub Verena、Malagimani Sonal、Rose Robert，弗劳恩霍夫劳动经济与组织研究所研究人员；

引言

随着以大语言模型（LLMs）为代表的人工智能（AI）技术迅速发展，各行各业正面临潜在的深刻变革。与此同时，AI的社会影响及其未来的发展路径也备受讨论。与以往的自动化浪潮相比，AI的一个重要区别在于，其开始显著影响高收入岗位及知识型工作。事实上，AI工具已经被广泛应用于多种高技能职业，从新闻从业者到会计师，再到法律专业人士，且带来了显著的效率提升。然而，尽管AI具备提升生产效率的潜力，其实际效果在很大程度上取决于对技术的运用和使用者的熟练程度。

图片来源：AI CERTs

文章聚焦于AI工具在科研领域的使用方式。在这一领域中，AI的作用可能被进一步放大，因为其不仅能够提升效率，还可能推动新的科学发现并促进出创新。然而，目前尚不清楚研究人员如何看待AI工具在科研中的实际价值，尤其是在一个以开放性探索问题为特征，且通常由高水平研究人员主导的领域中。

为了回答这一问题，作者对欧洲最大的两家研究机构——马克斯·普朗克学会和弗劳恩霍夫协会，开展了一项大规模调查。这两个机构均为德国的公共研究组织，但各自承担不同使命。MPS主要从事基础研究，覆盖多个学科领域，致力于推进科学知识的发展，而不以短期商业应用为导向；相比之下，FhS则更侧重于应用研究，与产业界密切合作，以开发并转化创新技术与解决方案。两者均享有国际声誉，依托公共资金支持，且科研强度较高。

研究人员约78%的工作时间用于科研（图A2）

图片来源：论文原文

相较于其他研究方法，问卷调查在刻画AI在科研全过程中的应用方面具有独特优势，能够覆盖从假设生成、数据分析、科研沟通及管理等多个环节。其中许多应用虽然不会直接体现在最终成果中，却可能对研究结果产生关键影响。对这种“隐性使用”的识别，有助于补充近年来基于观察数据的研究，例如对论文发表记录或GitHub活动的分析。尽管问卷数据基于自我报告，但其优势在于能够提供更为细致和全面的视角，不仅揭示AI应用的具体场景，也有助于识别其推广过程中面临的主要障碍。

该调查所使用样本具有若干重要优势。首先，该样本不仅涵盖了可以通过发表记录识别的资深研究人员，也包括处于职业早期阶段的研究人员和博士生，这些群体将在很大程度上影响未来科研的发展方向。其次，由于两家机构处于同一法律环境和学术传统之下，能够在一定程度上控制法律和文化差异带来的干扰。最后，基于对总体关键特征的掌握，可以评估样本的代表性，并部分缓解“对AI更感兴趣的研究人员更倾向参与调查”这一选择性偏差问题。

基于这些数据，作者分析了研究人员对AI工具的使用模式，以及他们对AI影响和相关监管的看法。需要指出的是，由于问卷数据只能揭示变量之间的相关关系，所呈现的使用模式应被视为描述性结果。尽管如此，这些发现仍有助于识别未来因果研究或政策干预中最具潜力的方向。

方法与样本

2024年6月，作者对MPS和FhS的所有员工开展了一项匿名调查。数据收集历时一个月，每位员工仅限参与一次。鉴于当前关于AI在科研中的使用问题仍然存在激烈争议，调查采取匿名形式，以鼓励受访者畅所欲言。这次调查得到了两家机构管理层的积极推动，期间共发送了两封提醒邮件，这可能有助于提高对该议题关注度较低人群的参与率。最终，作者获得了6215份来自研究人员的完整答卷，基于完整样本计算的响应率为20.5%。

从学科分布来看，受访者主要集中在信息学（24.7%）、物理学（24.1%）和生物学（16.9%），其次是电气工程（16.4%）和机械工程（13.1%），9.8%的受访者来自社会科学领域。大多数受访者（54.8%）从事跨学科研究。约三分之二的受访者为男性，约三分之一拥有博士学位，22.5%的受访者年龄在25至29岁之间（表A1）

图片来源：论文原文

调查主要关注AI工具，并未局限于生成式AI。但鉴于生成式AI在公共讨论中的突出地位，受访者在回答时可能主要联想到这一类工具。考虑到学科范围广泛、AI应用形式多样且不断演进，且许多具有高度专业性，作者未要求受访者具体列举所使用的工具。因此，结果反映的是多种AI工具的综合使用体验，而非针对某一具体工具的评估。未来研究可以进一步细化到具体工具或系统层面，以更好理解基础设施如何影响用户体验。

总体来看，研究的样本在两家机构中具有较好的代表性。表A2基于行政数据将调查样本与总体进行了比较。在MPS中，受访者平均年龄略大，拥有博士学位的比例更高，而女性比例则略低；在FhS中，受访者则略为年轻，且女性比例略高。尽管由于样本量较大，这些差异在统计上显著，但其实际幅度较小。两家机构均以自然科学和工程学为主，因此相较于欧盟整体科研人员结构，社会科学与人文科学等领域的代表性不足。

调查问卷由多个模块构成，包括人口统计信息、研究领域与时间分配、组织氛围、AI熟悉度与使用情况、一个用于评估提示能力的任务，以及关于AI使用障碍、收益、对科研与社会影响的看法以及监管态度等问题。完整问卷见补充材料。

为了评估提示生成能力，研究采用了Carvajal 等人提出的任务设计。受访者会看到一张图片，并需要编写一个prompt，以从语言模型中获取该现象的名称（图A1）。在分析中，作者对每个prompt使用本地语言模型进行10次测试；若其中至少一次正确识别现象名称，或prompt中提及上传图片，则视为成功。对于未填写该题的受访者（占19.5%），作者将其排除在该分析之外。

受访者会看到一张图片，并需要编写一个prompt，以从语言模型中获取该现象的名称（图A1）

图片来源：论文原文

需要强调的是，该研究结果属于描述性分析。作者关注AI的使用模式、障碍与态度，而非因果关系。在解读结果时，应注意尽管匿名设计和组织支持有助于覆盖对AI兴趣较低的人群，但仍无法完全排除一定程度的自选择偏差。此外，调查结果反映的是研究人员的主观感受，而非AI实际效果的客观测量。该调查在德国开展，因而法律与文化环境的跨国差异较小，但某些结果（如对数据隐私的高度关注）也可能具有一定的情境特异性。

为了在充分利用数据的同时降低“假阳性”的风险，研究采用了较为严格的显著性标准：仅当p值小于等于0.005时，才认为结果具有统计显著性。在所有回归分析中，作者控制了教育水平、性别、年龄、研究领域、工作经验年限以及所属机构等变量，这一组变量被称为“标准控制变量”。

结果

研究人员正在积极使用AI工具，其采用模式在不同角色与认知背景下存在差异。在样本中，42.4%的研究人员表示对AI较为熟悉或非常熟悉，另有44.0%表示曾使用过几次。25.9%的研究人员属于高频用户，至少每天在科研中使用一次或以上。仅有22.2%的研究人员在工作任务（包括科研、教学或学术服务）中从不使用AI。另有19%的受访者表示其研究本身涉及AI的开发或研究。相比之下，在2023年的调查中，尚无研究人员报告定期在科研中使用AI，且仅有17.4%的人表示每周至少使用一次生成式AI。这表明，这反映出在相对较短的时间内，AI在研究中的应用发生了巨大转变。在瑞典的高技能职业人群中，ChatGPT的使用率达40%。研究人员对AI工具的认可度与其使用频率呈正相关（表A3，第4列）。不过，这种关系仅为相关性，可能同时包含选择效应和体验效应：研究人员可能因为认为AI有帮助而更多地使用它，也可能是在使用过程中逐渐认识到其价值。

研究人员对AI工具的认可度与其使用频率呈正相关（表A3）

图片来源：论文原文

研究还观察到AI熟悉度与使用存在显著且持续的人口特征差异（图1和表A3）。第一，随着年龄增长，受访者对人工智能的熟悉度降低，使用人工智能工具的频率也随之减少。有趣的是，尽管年长受访者的熟悉度和采用率较低，但他们对人工智能的怀疑态度并未因此增强（表A4）。这一现象缓解了人们对资深研究人员可能阻碍年轻研究人员使用人工智能工具的担忧。第二，即便在整体受教育水平较高的样本中，对AI工具的熟悉度和使用频率也随教育水平的提高而增长。第三，在AI熟悉度及用于研究任务的使用频率方面，存在明显的性别差异。第四，社会科学领域对AI工具的熟悉度最高，甚至高于工程技术领域，这可能反映出自然语言处理技术的发展为社会科学研究打开了新的可能空间。

研究观察到AI熟悉度与使用存在显著且持续的人口特征差异（图1）

图片来源：论文原文

尽管年长受访者的熟悉度和采用率较低，但他们对人工智能的怀疑态度并未因此增强（表A4）

图片来源：论文原文

为了更细致地刻画AI工具在不同研究者中的使用情况，作者基于其科研任务分配，通过k-means方法对研究人员进行了聚类，识别出三类群体：（1）“领导者”，其时间主要用于撰写项目申请以及项目和人员管理；（2）“建设者”，主要从事科研基础设施与工具的开发与维护；（3）“分析者”，主要进行数据收集与分析、概念性研究以及论文和报告撰写（图A3）。

通过k-means方法对研究人员进行聚类，识别出三类群体（图A3）

图片来源：论文原文

在控制多项特征变量后（表A5与表A6），领导者在多个维度上对AI持更为积极的态度：他们不仅更熟悉AI、使用频率更高，也更倾向于认为AI将对其研究领域产生变革性影响，并能够带来包括研究者技能提升、研究质量提高、更多突破性成果以及更积极社会影响在内的一系列收益。

在控制多项特征变量后，领导者在多个维度上对AI持更为积极的态度（表A5与表A6）

图片来源：论文原文

图A4展示了不同研究者类型在这些维度上的总体态度差异。从时间分配来看，领导者往往处于更高的管理层级，因此也更有可能在其团队中推动AI工具的应用。

不同研究者类型在这些维度上的总体态度差异（图A4）

图片来源：论文原文

研究发现，AI使用者与非使用者在态度上存在差异：使用者对AI在研究质量、技能发展以及社会影响方面的作用持更为乐观的看法（表A7）。使用者也更倾向于认为，AI工具有助于在不同机构之间创造更加公平的竞争环境，而非扩大既有差距。尽管绝大多数研究人员（69.2%）预计AI将在未来十年改变甚至彻底革新其研究领域，但他们对于AI对社会整体影响的看法则更为分化：40.6% 认为AI带来的机遇大于风险，而 22.2% 则认为其风险大于机遇。

AI使用者与非使用者在态度上存在差异：使用者对AI在研究质量、技能发展以及社会影响方面的作用持更为乐观的看法（表A7）

图片来源：论文原文

熟悉程度是造成所观察到的性别差距的核心因素。鉴于科学与研究领域中已被充分记录的性别差异，以及技术采用中存在的性别化模式，AI采用的早期差距可能进一步加剧科研可见度、生产率以及职业晋升方面既有的不平等。因此，对这一性别差异进行了更为详细的分析。

与其他样本的研究结果一致，作者同样发现，在科研任务中对AI的熟悉程度和使用频率存在性别差距（图1）。研究数据的细致程度使作者能够考察多种可能导致这一差距的因素，例如对AI的熟悉程度、对这些工具对科研产出或社会影响的看法、对AI工具的信任程度、使用AI的收益差异，以及在相关技能上的投入等。

首先，研究证实，在研究任务中使用AI所观察到的性别差距几乎完全可归因于可观测特征的差异，其中AI熟悉程度是最主要的因素，解释了71%的性别差距，并占总差距的99%（表A8）。

AI 熟悉程度是最主要的因素，解释了71%的性别差距，并占总差距的99%（表A8）

图片来源：论文原文

研究的结果并不支持女性对AI更为怀疑或预期其使用回报更低的观点。那些提高了AI熟悉程度并使用过AI培训资源的女性研究人员，其AI使用率与男性相似，甚至更高。同样，在将样本限制为使用AI工具进行工作任务的研究人员时，对AI有用性的感知在性别之间并无显著差异（表A9）。这表明，对工具回报的预期在解释性别差距方面作用有限；在非使用者中，女性反而比男性更倾向于认为AI工具对科研任务有帮助。令人意外的是，对AI工具影响的看法——例如对研究质量或社会整体影响的看法——在解释采用差距方面只起到较小作用（表A8）。

在将样本限制为使用AI工具进行工作任务的研究人员时，对AI有用性的感知在性别之间并无显著差异（表A9）

图片来源：论文原文

相反，性别差异似乎与利用资源的程度密切相关，而这些资源本可以促进AI的更高效应用。当被问及是否曾查阅相关资源以提升AI工具使用能力（例如提示词工程）时，45.9%的女性研究人员表示从未查阅且无意查阅，而男性研究人员中这一比例为34.8%。这种抗拒态度与观察到的行为一致：女性更倾向于跳过提示词设计任务，不过一旦将范围限定在熟悉AI工具的研究人员中，这一差异便不再显著。同样，虽然总体上女性的提示成功率较低，但在熟悉AI的群体中，这一差距有所缩小。

由于参与模式不同，女性和男性在采用AI工具时所面临的障碍也各不相同。女性最常见的障碍是缺乏相关知识（23.3%），而男性则认为缺乏合适的工具（18.4%）。研究并未发现女性比男性更不信任AI工具的输出：12.3% 的女性研究人员将“信任问题”列为两大障碍之一，而男性为17.5%。在控制可观测特征后，这一差异仍然存在。

总体而言，研究结果表明，女性研究人员采用率较低的主要原因在于对AI工具的熟悉程度，而非对其社会或科学影响的看法。因此，在弥合AI采用中的性别差距方面，提高女性研究人员对AI工具及其应用的认知，可能是值得进一步研究的一个重要方向。此外，结果还表明，女性研究人员较少主动与AI工具进行互动。因此，在制定信息干预措施时，考虑潜在的选择效应可能至关重要。而值得进一步研究的是，不同因素可能导致不同人群中出现具有性别差异的采用模式。

AI是共同创造者，而非单纯的助手。在研究过程的各个阶段，AI工具被用于多种任务（图2）。这些模式表明，AI工具正逐渐融入核心研究活动，而非仅作为辅助手段使用。

在构思和概念开发的早期阶段，31.5%的研究人员表示会使用AI进行文献综述。在实施与分析阶段，AI 在试验与测试（47.9%）以及编写代码（43.2%）方面的使用率尤为突出，这也是总体上最常见的两类应用。在成果传播阶段，32.9%的研究人员使用AI协助撰写研究论文。（图2）

图片来源：论文原文

与此同时，研究人员仍在不断探索AI工具的能力。例如，36.9%的研究人员表示将AI用于与研究无关的创意任务——这一比例较2023年的24.9%有所上升。然而，这一使用场景已不再是最主要的用途，表明AI的使用正向更具针对性和目标导向的方向转变。大多数研究人员（50.6%）使用AI完成2至5类任务。

研究人员在其投入时间最多的科研任务中更倾向于使用AI工具（表A10）。这一模式部分可能是机械性的——在某一任务上投入时间越多，使用AI的机会也越多。但同时也表明，这些工具主要被用于研究人员的核心工作，而非行政沟通等次要任务。值得注意的是，即使在控制人口学差异后，那些在创造性任务上投入更多研究时间（如确定研究目标、概念性工作）的研究人员，比那些更多从事常规或执行性任务（如数据收集、项目和人员管理）的研究人员，更有可能在科研中使用AI工具。

研究人员在其投入时间最多的科研任务中更倾向于使用 AI 工具（表 A10）

图片来源：论文原文

表面上看，AI工具似乎更适用于创造性或概念性任务，而不太适用于执行性任务；然而，对AI有用性的感知差异与使用频率密切相关：在某些任务中更频繁使用AI工具的研究人员，也更倾向于认为AI在这些任务中更有帮助。这些发现与日益增多的研究证据一致，即AI在科研中的作用已超越单纯自动化，逐渐被视为研究过程的共同创作者，甚至是研究流程的管理者。

研究人员寻求利用AI提高效率，但许多人在编写有效的提示词时却举步维艰。50.4%的研究人员表示，他们使用AI来加快工作进度。然而，调查表明，有效使用AI工具是一项技能。尽管研究人员拥有高学历且对AI工具有所了解，但只有五分之一（21.0%）的人成功为测试任务编写了有效的提示词。成功编写提示词与受访者自述的AI熟悉度及使用频率呈正相关（表A11）。相应地，成功编写提示词的受访者认为AI工具更有帮助。

成功编写提示词与受访者自述的AI熟悉度及使用频率呈正相关（表A11）

图片来源：论文原文

提示本身可能是一项新的技能。报告曾使用相关学习资源以提升AI工具使用能力的受访者，更有可能成功创建提示。然而，即使在这一群体中，也只有约三分之一的提示（31.0%）能够生成正确响应。将提示视为一种技能，本身可能也与AI工具的使用相关：不使用AI的研究人员更容易将AI与技能退化联系在一起，而使用者更倾向于认为AI具有促进技能发展的潜力（表A7）。需要注意的是，这一指标反映的是对技能发展的总体看法，而非仅针对提示技能本身。

不使用AI的研究人员更容易将AI与技能退化联系在一起，而使用者更倾向于认为AI具有促进技能发展的潜力（表A7）

图片来源：论文原文

作者承认，该任务仅能粗略衡量提示能力，且主要针对基于聊天的工具，缺乏现实应用中的交互特性。为弥补这一不足，作者采用了刻意放宽的成功标准，即在十次尝试中只要有一次正确响应即视为通过，且排除未尝试的情况。尽管该任务较为简单，但它仍能为大规模且多样化的样本提供一个有用的基准提示能力参考指标。

研究结果表明，有效利用AI工具不仅需要具备使用条件或使用意愿，更需要掌握相关技能。这些技能既源于直接实践，即“做中学”，也源于系统化的学习资源。这些发现表明，教育机构可以通过提供便捷的学习机会，在支持技能发展方面发挥重要作用。

组织可以支持AI的采用。组织环境可能通过消除关键障碍，并营造鼓励成员使用AI的文化与价值观，从而影响AI的采用。首先，受访者报告的多项采用障碍表明，组织结构与流程可能在多个方面发挥支持作用（图4）。最常被提及的两大使用障碍是法律不确定性（17.6%）、缺乏知识（17.4%）以及缺乏合适工具（16.6%）。对于承担较多行政任务（如人员与项目管理）的研究人员而言，法律不确定性尤为突出。

受访者报告的多项采用障碍表明，组织结构与流程可能在多个方面发挥支持作用（图4）

图片来源：论文原文

组织可以通过制定规则来决定AI工具的使用方式。作者询问了受访者其所在机构是否对人工智能的使用进行规范在部门、研究所或研究协会层面感知到存在相关规范，与更频繁地将AI用于研究相关。有趣的是，这种关联因性别而异：当女性研究人员认为存在相关规定时，她们使用AI的可能性反而较低（表A12）。值得注意的是，26%的受访者认为其所属研究协会已经制定了AI相关规定，尽管在调查时并非如此。

当女性研究人员认为存在相关规定时，她们使用AI的可能性反而较低（表A12）

图片来源：论文原文

大多数受访者倾向于通过高层级的制度安排来解决法律不确定性问题：58.7%的人希望来自超国家机构（如欧盟）的监管与指导；其次是51.3%的人希望由其所属研究协会（MPS或FhS）提供；49.0% 的人则期待由专业学术组织给出相关指导。

此外，组织氛围和文化与AI工具的使用存在关联（表A13）：虽然研究人员对自主性、工作负荷及容错度的感知与对AI工具的熟悉程度相关，但只有持续学习导向同时与熟悉程度和实际采用行为稳定相关。如图A6所示，在创新支持、对实验的开放程度以及学习导向等指标上报告更积极组织氛围的研究人员，往往表现出更高的AI熟悉度、更频繁的使用、更高的感知有用性，以及更积极地参与学习资源。

组织氛围和文化与AI工具的使用存在关联（表A13）

图片来源：论文原文

结论

AI的迅猛发展促使科研界迅速采用新工具，使其既成为重要的研究课题，也成为推动科研进步的工具。研究人员正越来越多地将AI融入其核心研究活动。尽管对于AI在突破性创新、技能发展以及科研公平方面的长期影响仍存在分歧，但人们普遍认为，这项技术将深刻改变科研实践。

尽管研究的发现仅揭示相关关系，但它们突出了未来开展因果研究特别有价值的方向。理解组织能力、学习氛围与制度环境如何塑造AI的采用，以及这些因素如何与性别和年龄相互作用，仍然至关重要。未来研究应探讨已观察到差异背后的机制，并评估诸如改善培训获取渠道、营造支持性学习环境以及提供法律支持等干预措施的效果。针对具有不同使命和基础设施的组织开展比较研究，有助于识别实现包容性应用的有效条件。最后，随着技术和制度实践的持续发展，纵向研究视角对于把握人工智能在研究中的整合演变过程至关重要。

原文链接

https://publica.fraunhofer.de/entities/publication/da963528-7d0d-4677-ab27-a165bfbec5f4