两个穿着白大褂的研究人员在实验室工作,每个人都在通过显微镜观察。

许多期刊要求研究人员声明他们是否会分享论文的数据。信贷:盖蒂

一项研究报告称,大多数宣称愿意分享期刊文章背后数据的生物医学和健康研究人员,都没有回应访问请求,也没有在被要求时交出数据1

在萨格勒布的克罗地亚天主教大学研究循证医学的Livia Puljak和她的同事们分析了282家BMC杂志在一个月内发表的3556篇生物医学和健康科学文章。(BMC是施普林格Nature的一部分自然;《自然》杂志的新闻团队在编辑上独立于出版商。)

该团队确定了381篇文章与存储在在线存储库中的数据有链接,另外1792篇论文的作者在声明中表示,他们的数据集将在合理的要求下提供。其余的研究表明,他们的数据在已发表的手稿及其补充中,或者没有产生数据,因此共享不适用。

但是在1792篇作者表示愿意分享数据的手稿中,超过90%的通讯作者要么拒绝要么没有回应原始数据的请求(见“数据共享行为”)。在被联系的作者中,只有14%(254人)回复了提供数据的电子邮件请求,只有6.7%(120人)实际上以可用的格式提交了数据。这项研究发表在临床流行病学杂志5月29日。

数据共享的行为。图表显示了愿意分享数据的作者的百分比。

资料来源:Livia Puljak et al

Puljak对很少有研究人员真正分享他们的数据感到“震惊”。“人们说的和做的是有差距的,”她说。“只有当我们要求数据时,我们才能看到他们对数据共享的态度。”

总部位于马萨诸塞州剑桥市的非营利全球数据共享平台Vivli的执行董事丽贝卡•李(Rebecca Li)表示:“(研究人员)没有提供这些数据,这非常令人沮丧。”

科尔切斯特埃塞克斯大学(University of Essex)的社会学家瓦伦丁·丹切夫(Valentin Danchev)说,数据可用性声明没有什么价值,因为许多数据集实际上从未被访问过。

Puljak的结果与Danchev领导的一项研究的结果一致,该研究发现,在主流医学期刊上规定所有临床试验必须共享数据的论文作者的数据共享率很低2

持续的障碍

拒绝提供Puljak研究数据的研究人员给出了各种各样的理由。有些公司在共享数据时没有获得知情同意或道德许可;另一些人则离开了这个项目,把数据放错了地方,或者在翻译采访中的定性数据时遇到了语言障碍。

澳大利亚悉尼大学的儿科医生和循证医学研究员Aidan Tan说,这项研究表明,持久的障碍阻止了研究人员分享他们的数据。他自己调查临床试验负责人的研究发现,人们对数据隐私、参与者保密以及数据被滥用在误导性的二次分析中感到担忧3..研究人员也可能想先发表更多的原创研究,或者害怕被抢先

过去的研究表明,一些领域,如生态学,比其他领域更愿意接受数据共享。但对COVID-19临床试验的多项分析,包括李的一些分析45和褐色6的调查报告称,大约有一半到80%的调查人员不愿意或不打算自由分享数据。

谭秦东说:“令人担忧的是,尽管资助机构(如伦敦的惠康基金会、美国国立卫生研究院和世界卫生组织)高调呼吁数据共享,但在COVID-19大流行期间,数据共享做法似乎没有任何改善。”

解决问题

李推测,许多研究人员并没有完全理解数据共享实际上意味着什么:她说,支撑手稿的数据“应该准备好,格式化好,任何人都可以使用”。

为了鼓励研究人员准备他们的数据,李说,期刊可以让数据共享声明更具规范性。他们可能要求作者详细说明他们将在哪里共享原始数据,谁将能够访问它,何时以及如何访问。

资助者还可以提高数据共享的门槛。美国国立卫生研究院(National Institutes of Health)为了遏制浪费的、不可复制的研究,将很快要求资助申请人包括一种研究方法数据管理和共享计划在他们的应用中。最终,他们将被要求公开分享数据。

李说:“推动数据共享向前发展的力量,取决于那些在研究人员的支持下改变文化的人。”