Paul gsparg于1991年创立arXiv。图源:John D. and Catherine T. MacArthur基金会

在广受欢迎的预印本服务器arXiv.org上,物理学家、数学家和计算机科学家经常在同行评审之前上传手稿,公开分享他们的发现超过100万研究文章。

(按此放大)

1991年8月,就在万维网出现之前,该资源库以“电子公告板”的形式启动,花了17年时间积累了50万份手稿,但仅用了6年时间就使其数量翻了一番。

研究人员现在每月向arXiv提交约8000篇文章,平均每天超过250篇。网站管理员会在经过简单的质量控制检查后,分批提供未经同行评议的原始稿件,比如由130名志愿审核员中的一名粗略检查是否恰当,以及自动过滤以检查文本是否与现有论文重叠。

12月29日,该网站的论文数量达到了100多万篇。在此之前,管理员们休假归来,并在平安夜(12月24日)下班后更新了服务器。

从arXiv的主页上当前显示的文章数量来看,具有里程碑意义的第100万个标识符的手稿是协方差和逆协方差矩阵的良好条件和稀疏估计使用联合惩罚,由东兰辛密歇根州立大学的Ashwini Maurya于格林尼治标准时间12月26日7:34:19提交。但事实上,arXiv的创始人、纽约伊萨卡康奈尔大学的物理学家保罗·金斯帕格(Paul gsparg)说,该网站的第100万篇文章并不能如此精确地确定。这个数字实际上是一个有点模糊的估计,因为提交的内容被编入索引,而且偶尔会有重复或垃圾提交进来——现在可以通过筛选软件发现这些内容,但在网站早期很容易错过。

革命的开始

arXiv的大量免费手稿收藏现在与在科学期刊上发表同行评议手稿的较慢系统同时运行。但在2011年的一份报告中,当时在新墨西哥州洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)工作的金斯堡创立了一项电子服务,为“在高能物理的一个分支领域工作的几百位朋友和同事”分享预印本文章,这一切都是一个遥远的前景自然这篇文章是为arXiv二十周年而写的1.自成立以来,该服务器已经扩大了其覆盖范围,涵盖了物理学的许多其他领域,以及数学、计算机科学、统计学以及金融和生物学的定量方面。

arXiv服务器的流行程度因学科而异。一些物理学家起初不愿意在正式的同行评议发表之前分享他们的结果,但当他们意识到一种快速宣传他们工作的方式的好处时,他们就改变了主意。例如,2008年一类铁基超导体的发现吸引了一大批凝聚态实验家来到这里,gsparg在他2011年的文章中写道,“他们需要在理论家面前提出优先要求,并把他们的结果展示出来”。

如今,许多重要的发现都会首先发布在网站上。当隐居的俄罗斯数学家格里戈里·佩雷尔曼(Grigori Perelman)证明Poincaré猜想(一种关于三维空间本质的说法,近一个世纪以来一直没有得到证明)时,他只在arXiv.org上发表了他的论文,而没有在其他地方发表过。(稍后佩雷尔曼拒绝菲尔兹奖章为了工作)。去年,该网站启发了生物学的模仿者, bioRχiv.org,由纽约冷泉港实验室出版社(Cold Spring Harbor Laboratory Press)推出。

arXiv正在以前所未有的速度扩张。12月19日,它宣布该公司将把纸质识别号码延长一位数字,以应对预计每月超过1万份的提交量激增。现在它每月收到超过1000万次下载请求。

这些都不是免费的,但仍然相对便宜。预计年度成本2014年工作人员和服务器的费用为885,987美元,每篇论文增加不到10美元。在2010年康奈尔大学图书馆提出请求后,其中大部分资金来自成员机构以及总部位于纽约的私人基金会西蒙斯基金会。

研究人员还在挖掘arXiv存储库,以研究科学家如何交流他们的工作。本月早些时候,gsparg和康奈尔大学物理学研究生Daniel Citron报告了科学家重复使用其他论文文本的频率2通过分析1991年至2012年发表在arXiv.org上的约75.7万篇文章中7个单词短语的重叠部分。其他研究人员正在挖掘arXiv的文章图表的趋势科学思想的普及,就像谷歌图书的数字化让人文学科的研究人员发现了英语文学中特定短语的出现。

gsparg说,100万篇文章是一个自然的里程碑,但物理学家可能更喜欢其他数字里程碑。“1,000,000的意义只是一个以10为基数的意外,我们碰巧有10根手指,而有些人会认为是2根20.= 1,048,576是一个更重要的数字。”“它也是兆字节中的字节数。”

gsparg不会等太久——按照目前的增长速度,这个网站应该在夏天达到那个点。

由干细胞制成的人类精子和卵子前体 美国宇航局的碳绘图仪克服了设计缺陷 物理学家反对多元宇宙的推测