一排竖着的书,上面贴着彩色便签

直到现在,评估论文如何引用彼此一直是一件痛苦的事情。信贷:盖蒂

几年前,研究人员在试图研究引用模式以阐明某一领域的趋势、确定新的研究兴趣领域或查明诸如过度自我引用等有问题的做法时,会发现相当大的障碍。

首先,他们需要请求访问包含引用数据的大型学术数据库之一,如Web of Science或Scopus。即使获得了访问权,他们也无法公开他们的研究结果所依据的专有数据。

这种情况现在正在改变。大多数在线论文都是用一组称为数字对象标识符(DOIs)的独特字符进行标识的。该系统由Crossref管理,这是一个位于马萨诸塞州林恩菲尔德的非营利性协会,拥有约15,000名出版商、资助机构和其他机构成员。上个月,Crossref宣布,其数据库中与6000多万篇期刊文章相关的引用数据现在可以公开下载和使用。

这在很大程度上要归功于开放引文倡议(I4OC),这是学术出版商、研究人员和其他利益攸关方之间的合作,自2017年启动以来,该倡议一直在鼓励出版商开放引文数据。在某些领域,包括一些大型发行商,对这一技术的接受程度最初并不高。一个自然2019年的一篇社论呼吁那些仍然拖拖拉拉的出版商赶紧加入进来(见自然573, 163 - 164;2019).自然,出版自然,于2018年加入该倡议。自然的新闻团队是独立于出版商的。)

引文数据的开放是受欢迎的。这意味着提高研究的透明度和问责制,这些研究旨在为学者、资助者和政府提供信息,让他们决定应该把精力和资金集中在哪些研究领域。

但还需要更多。并不是所有的出版商都在Crossref上索引论文,也不是所有被索引的论文都有相关的引用数据。7月发表的一项研究发现,2021年索引的论文中约有三分之一缺乏这类数据(n·j·范·艾克和l·沃特曼。预印在https://doi.org/10.31222/osf.io/smxe5上;2022).其中一些文章——特别是社论、信件、更正和书评——可能没有任何参考资料,但这绝不适用于所有的文章。上传引用数据不应该被视为可选的。

任何对文献计量学开放性的追求都有一个重要的警告。2012年的旧金山研究评估宣言(DORA)指出绝不应断章取义或孤立地使用指标来评判研究人员及其工作。我们应该小心,不要过分依赖引用数据,特别是在评估科学家的晋升和工作申请时。但如果使用得当,对所有人开放这些数据只会更好。

开放性不应该仅仅局限于引用数据。Crossref还允许出版商发布其他类型的元数据,如作者关系、资助信息、数据和代码可用性声明以及ORCID id(用于识别单个研究人员)。然而,并不是所有的发行商都这么做。在6月的一封公开信中,由慈善组织组成的合作组织——包括比尔和梅琳达·盖茨基金会和陈·扎克伯格倡议——开放研究资助者组织主张科学的开放共享,他们正确地认为,这样的元数据应该公开go.nature.com/3qvfp3u).

此外,2020年启动的“开放摘要计划”(I4OA)一直在推动研究摘要的公开获取。这将使研究人员更容易发现、阅读和引用研究,并将为使用机器学习技术的分析开辟更多可能性,例如识别术语使用的趋势。(当数据开放时,这样的方法已经为其他科学领域提供了见解,例如评估同行评审报告的质量)。根据7月的研究,2021年被Crossref DOI索引的文章中只有39%有开放摘要,尽管这一比例自2018年以来几乎翻了一番。

在Crossref上存放所有相关元数据应该成为学术出版的规范,为每篇论文生成doi也应该如此。对于那些没有时间或资源来做这件事的出版商,I4OC、I4OA和开放科学社区的其他机构已经宣布他们准备提供帮助。

最终,所有这些举措都必须只是朝着实现所有研究论文完整公开的目标迈出的一步。但在我们达到这一点之前,它们是研究透明度和可重复性的关键。他们应该得到所有人的支持。