研究人员将数据输入功能磁共振成像扫描仪控制室的计算机

某些类型的脑成像研究需要数以千计的样本量,才能就大脑结构的变化如何影响行为得出可靠的结论。来源:Mark Harmel/Alamy

2008年,克雷格·贝内特(Craig Bennett)将一条死鲑鱼放入磁共振成像(MRI)扫描仪中。贝内特是加州大学圣巴巴拉分校的心理学研究生,他随后研究了鱼的大脑在看到人类不同情绪状态的照片时是如何“反应”的1

这个实验完全能识别出任何大脑活动——它纯粹是作为校准扫描仪的练习——这是一个早期预警信号,提醒人们在解释脑成像实验结果的统计意义时应谨慎。快进到今天,一些人认为认知神经科学领域存在全面的可重复性问题。相反,其他人认为鲑鱼的研究,以及随后发现方法弱点的工作,推动了该领域的发展,激励研究人员在实验设计和数据解释方面做出更好的决定。

今年3月,自然发表了一篇论文2由密苏里州圣路易斯华盛顿大学医学院的Scott Marek和他的同事进行,他们调查了全脑关联研究的可重复性。这些研究使用神经成像技术来探索大脑结构或功能的变化如何影响行为、认知或心理健康。Mareket al。尽管作者指出他们没有调查所有可能的技术或人群,但他们发现需要数千个样本量才能可靠地描述这种关系。这篇论文引发了一些自我反省这将有望推动该领域朝着更稳健的方向发展。

预测难题

本周,位于康涅狄格州纽黑文的耶鲁大学医学院的阿比盖尔·格林(Abigail Greene)和她的同事们研究了认知神经科学中预测模型的可靠性3..这种方法在生物科学中被广泛使用,它使用现有的数据集来预测未来的结果。它已被应用于认知神经科学,以确定大脑活动模式与各种认知和行为特征之间的关系。与全脑关联研究不同,预测模型研究在样本量较小的情况下是可靠的。

Greene和她的同事系统地描述了在认知神经科学中预测模型无法产生准确预测的情况,并表明这种失败不是随机的。相反,它倾向于发生在特定的人群中,而不管数据集是什么——不是平均水平的人群。

这可能被解释为,在认知神经科学领域,预测模型缺乏方法上的稳健性,引发了对该领域更广泛的担忧。一些研究人员告诉自然自从Marek和同事的研究成果发表以来,论文和拨款的审稿人对小样本量的神经成像研究有了更负面的看法——即使它们不是全脑关联研究。这意味着赠款需要扩大,包括可以从数千人那里收集数据的财团,这可能会排挤低资源环境中的小型研究小组和研究人员。

另一些人担心,这些发现将助长该领域以外的科学家的一种看法,即认知神经科学在统计上不足,并且基于系统性失败的模型。然而,这些研究为该领域的显著增长提供了机会,就像它们在其他领域所做的那样。

大约20年前,遗传学界需要面对这样一个现实,即使用候选基因方法来确定性状的遗传基础的研究并没有产生关于基因和疾病的有意义的结果。遗传学比他们最初意识到的要复杂得多,除此之外,还需要更强大的统计火力。

研究人员转向了全基因组关联研究,该研究扫描了许多人的基因组,以确定变异是否以及如何与特定疾病(如心脏病或癌症)相关。最早的研究之一是对96名老年性黄斑变性患者(老年人失明的主要原因之一)和50名对照参与者进行的研究,更多地揭示了这种疾病的遗传性质4.随后又进行了涉及更多人群的研究,研究人员已经证实,样本量越大,重复性越好5.结果,遗传学发生了转变。统计学家与生命科学家一起工作,它既更强大,也更具协作性。

认知神经科学领域正经历着与20年前遗传学领域相似的井喷式增长。成长需要大量的能量,也可能是痛苦的,但它是生命和进化中不可分割的一部分。格林的发现et al。和Mareket al。不应被视为对该领域或其方法的批评,也不应被解释为再现性危机的证据。通过提供清晰的分析来指导研究人员选择他们的实验设计,并在使用两种重要方法时解释他们的结果,他们提供了将认知神经科学推向下一个水平所必需的那种自我反思。一门学科要想进步,我们不仅要欣赏它的优点,还要了解它的缺点。