作者:沪港所 发布时间:2022-02-21 来源:沪港发展联合研究所+收藏本文
选题人
本文与正在扩大的学术规模有关,提供了如何参与学术论文的思考。本文也讨论了对铺天盖地的新研究论文的标准应对方法,还引入了阿盖尔(Argyle)和贝尔卡(Belka)的对话为读者提供一个思考的视角。本文的作者是 Jan Hendrik Kirchner,一位计算神经科学在读博士。
# “皇帝的新论文”
为了解释这一点,气候评估模型应该允许增长在不同地区有内生的差异。在最近一次午餐交谈中,我的一位同事向我解释了她阅读科研论文的方法。她半开玩笑地称该方法为“不读论文”。它是这样的:
阅读标题并预测摘要会说什么。如果你是正确的,就停止阅读该论文。
否则,阅读摘要并预测主要结果是什么。如果你是正确的,就停止阅读该论文。
阅读引言的最后一段或讨论的第一段,预测结果的细节。如果你是正确的,就停止阅读该论文。
等等……
我喜欢这个方法,主要是因为它的名字很俏皮,但也因为它指出了 “皇帝是裸体的”。一个稍微公开的秘密是,“不读论文”是保持屹立于不断增加的学术文献之巅中的唯一可行策略。但是,虽然人人都知道这一点,但并不是人人都知道“人人都知道这一点”。在讨论区,一些研究人员面不改色地声称自己每月要读100篇论文。然而,虽然每个月略读100篇论文也许是可能的,但读完它们是不可能的。
那么,为什么这不是常识呢?一个可能的原因是,每当我想到科学真的可能不起作用时,我就会感到刺痛的恐惧。我们的制度陷于不充分的平衡状态,科学方法太薄弱,统计假设检验被打破,没有任何东西可以复制,欺诈行为猖獗.....而现在科学家甚至都不读学术论文?这正是我们需要的。
而且情况正在变化。出于某种原因,我们仍然能从这个自称为科学的混乱局面中得到一些新的见解。即使科学家们不详细地阅读所有论文,整个大厦也没有倒塌。这是怎么回事?在这篇文章中,我将介绍一些因 “不读论文”而产生的明显和不明显的问题,以及这些问题如何被证明不是那么糟糕。文章的最后,我建立了一个更好的系统,我将在本文的第二部分展开。
# 情况正在变化
阿盖尔: 好吧,跟我说实话。你怎么能不读论文呢?你怎么知道里面写的是什么?
贝尔卡:好吧,当我是新手的时候,我确实非常仔细地阅读了很多论文。我被卡住了很多次,重新做了很多计算,反复检查了方法,问了我的同事……
阿盖尔:但你现在不这样做了?
贝尔卡:有时我还会这样做!这就是每月读书会和咖啡时间的好处。但我再也没有时间为大多数论文做这些了,因为我还想进行新的研究。我也注意到,从经验来看,我通常对“一篇论文的走向”有不错的想法。我通常会在某个地方看到关于这项研究的海报展示,或者在推特(Twitter)上读到一个帖子。或者我知道这些研究通常来自资深作者的实验室,这让我可以填补空白。
阿盖尔:但这些只是经验法则。如果你错了呢?
贝尔卡:我仍然会看论文,如果它与我预期的有很大不同,我会更仔细地阅读。此外,如果它真的令人惊讶,那么它就会在推特上冒出来。我已经能够非常有效地识别我已经知道的东西和论文所增加的内容之间的差值(delta)。
由一篇(典型)学术论文所增加的“delta”示意图。你以前读过的论文在背景中显示为橙色背景。论文之间的关系用双向箭头表示。橙色背景的大小和形状代表你认为可能是真实的陈述。新读的论文显示为蓝色背景部分。其中新论文认为可能是正确(或有时证明为真)的部分是“delta”。
阿盖尔:我不能信服,但这还不是我唯一的问题。让我们假设你能够大致预测 “delta”的情况。你怎么能评估他们方法的可靠性?你怎么知道他们的研究没有根本性的缺陷?
贝尔卡:我想说这就是同行评议的作用,但我在说这句话时可能无法保持坦然。不过,也不是一无所获。你甚至不需要深入研究方法论,只需阅读2.5分钟,再加上一点常识,你就能对一项研究的复制概率有一个不错的估计。除此之外,在你对任何一项研究的评估中,你都应该考虑到大量的不确定性。在你看到对几十个研究进行的总结分析得出同样的结论之前,你可能不应该把结果包含在你的心理事实数据库中。我想,这个技巧是,得到一个快速的一阶近似,默认情况下假设低可靠性。
阿盖尔:但你也能成为解决问题的一部分!如果人们认真阅读论文,那么薄弱的方法论就会被更快地注意到,可靠的研究就会脱颖而出。
贝尔卡:啊,是的,那会很好,但问题更严重。即使你仔细阅读了每一个字,谁能说作者包括了所有的相关信息?研究人员经常在他们的培养物中添加抗生素以对抗感染,但通常不会在论文中提及这一事实,因为这被视为“肮脏的实验室环境”的危险信号。小鼠是否被安置在一个丰富的环境中(有玩具等),会对大脑解剖和功能产生实质性的影响,但这通常也不会被报告。即使研究人员想要报告一切,“高影响力期刊”通常也会奖励极其简短的文章,并且不允许超过2000-2500字来总结多年的研究。这样的例子不胜枚举。即使激励机制没有如此错位,问题的一部分在于我们甚至不知道哪些因素是重要的。因此,仅仅考虑到文本中的内容,正确的可信度估计大概是不可能的。
阿盖尔:噢,天哪,我有点晕了。
贝尔卡:坐下来冷静一下吧,这很正常。你会习惯的。
阿盖尔:但是......这一切怎么可能成功?是否有一个仁慈的科学之神能确保一切顺利?
贝尔卡:啊哈哈哈,如果真有那就好了,不是吗?我认为我们有两个非神的因素,帮助推动科学向前发展。一个是你“允许在论文中写什么”和“让你相信某事的实际原因”之间的差异。当你做一个实验时,你的样本量可能是你报告的两倍,但其中一半的动物不能被纳入论文,因为比如动物有问题、某些步骤没有成功、有出血、成像质量低于标准......这些数据项没有被报告,但实验者仍然用它们来更新他们对发生的事情的看法。理论研究也是如此,很多辅助性的结果只是没有进入论文,但它们仍然支持主要的信息。所有这些作品中都有一种叙述,其以一种很难写在论文中的方式支撑逻辑,但它仍然加强了你的假设。一篇科研论文中的推论通常由多个逻辑链和聚合的证据支持,而这些证据并非都包含在论文中。
论文中呈现的数据通常只是所记录数据的一个子集。未包含的数据可能是不完整的、部分损坏的,或者一些参数略微不兼容。即使小鼠被描绘出来,同样的论点也适用于理论论证,冗余的推导和探索性的结果通常不被包括在内。
阿盖尔:这并不令人欣慰。人类不是很擅长自欺欺人吗?也许我可以更相信所有这些研究,但它们中的大多数可能仍然是错误的?
贝尔卡:你不应该低估一个好的叙述的重要性。美与真理之间有一些我不太理解的奇怪的联系,这可能也适用于“美丽的故事”……
阿盖尔:我还是不太能够信服。
贝尔卡:我没想到你会这样。是的,你是对的,大多数事情可能会被证明是错误的(或者至少是不太正确的)。但这让我想到了帮助科学的第二个非神的因素:它在不断发展。科学的所有分支学科都可能是根基不牢的,趋势和潮流来来去去,根据一个都市传说,一个数学博士生写了一篇关于一个数学对象的论文,其中没有任何重要的例子,而所有这些事情都好比是桥下的水。有数以百万计的研究人员在做不同程度的合理研究,而科学的自我纠正能力足以最终摆脱研究中的不良因素。“真理”具有某种不可侵犯性,伪科学无法无限期地伪证它。如果你真的知道宇宙是如何运作的,这将给你带来优势,并最终让你成功。学术界的规模确保了一部分研究是可靠的。这部分将比混乱和错误的部分更持久。
一个理想的学术形象
阿盖尔:你提到“你”,但你实际上并不是指我,对吗?如果我没有碰巧幸运地选到一个有成果的研究问题怎么办?
贝尔卡:不完全是,但结果也有一部分取决于你。在不确定性非常高的情况下,有一些策略可以提高你的机会:做多个不同的研究项目,多次转换研究领域,不要被卡住,用20%的努力获得80%的结果。不要(仔细)读(每一篇)论文。
阿盖尔:好吧,你让我彻底迷失了。
贝尔卡:没关系,反正这个虚构的对话已经接近尾声了。
阿盖尔:现在我该相信什么,“不读论文”?你没能让我相信这比仔细阅读一篇论文更好。
贝尔卡:这从来不是我的目的,我也更愿意仔细阅读它们。但这其实不是一个选项。我的观点只是:“不读论文”并不像听起来那么糟糕。
阿盖尔:嗯,我想这是合理的,尽管我仍然怀疑你是不是只是懒惰,并使用大量的文字来掩盖这一点。
贝尔卡:很合理。想要知道自己的信念到底从何而来真的很难。
阿盖尔:嗯。
贝尔卡:嗯。
阿盖尔:我想知道当这场虚构的对话结束后,我们会发生什么。
贝尔卡:我们可以在游泳池里游泳、看日落。
阿盖尔:我喜欢这样。
梦幻般的日落游泳池
# “不读论文”是一种补救措施,而不是一种解决办法。
尽管这种方法可能很有用,但它是出于需要而产生的,而不是因为它是进行研究的最佳方式。现有的科研论文有一个主要缺点:作者不了解读者。在写论文的时候,作者试图把他们的解释分解成预设读者的最小公分母。因此,没有一种理想的方式为真正的读者服务。初学者可能需要更多的背景知识。专家可能会关心更多的原始数据和更多的推测性讨论。来自相邻领域的研究人员可能需要对某些术语进行翻译。未来的读者可能想知道这项研究与未来的工作有什么联系。这些人都不能从一般的论文中得到他们想要的东西。
如果总有机会和作者交谈,而不是阅读他们的论文,那就好多了。你可以快速浏览容易的部分,深入了解你觉得困难的部分。我认为在演讲结束后的提问环节就应该是这样的,但是当听众超过三个人时,这个想法就会很快土崩瓦解。我知道这通常发生在下午茶时间的会议和研讨会上,资深的研究人员相互交谈,从对方那里获得对研究项目实际有用的描述。
这显然不成规模。什么会是更好的解决方案?Arbital在这个方向上做了一些尝试,提供了不同的“速度”来解释,但这个平台已经不存在了。在将来的某个时候,来自Ought的Elicit可能会在菜单上出现类似的功能,但目前的结果还没有个性化(afaict)。理想情况下,我们可能想要的是一个“盒子里的研究员”,可以按需回答有关他们专业领域的问题。每当原来的研究人员完成一个项目后,新的见解就可以从盒子里获得。这听起来很不靠谱,毕竟你不能指望研究人员整天都呆在那里,不是吗?但我认为有一种方法可以让它在语言模型中发挥作用。在本系列的下一篇文章中,我将概述我在这个问题上的进展。敬请关注!