你读了一篇论文,得出了几个基因表达的迷人结论。您决定在您选择的系统上使用一些相同的实验。但是,当你费力地阅读数百页的补充信息时,你会发现复制所需的关键细节缺失了。

欢迎来到令人兴奋但令人沮丧的DNA微阵列研究世界。微阵列是由数千个探针组成的塑料或玻璃芯片,用于同时查询任何组织或生物中许多基因的活性水平。实验的每一步中的变量通常使得跨论文比较几乎不可能。微阵列论文也给评审过程带来了相当大的压力;大量的数据意味着批判性评论是一项艰巨的任务。

然而,裁判员有时会觉得他们没有得到足够的细节,导致谨慎的评审员认为他们必须重新分析原始数据集。在其他情况下,提供的主要数据是在专有软件中,因此无法评论。许多期刊允许作者将巨大的数据文件放在自己的网站上,以便进行审查,直到有一天,毫无道德的作者通过跟踪访问过网站的人,损害了审稿人的匿名性。

为了解决这些问题,国际微阵列基因表达数据(MGED)组织给科学期刊写了一封公开信,提出了发表标准。微阵列社区的其他成员欢迎这些步骤,旨在澄清微阵列实验的最小信息(MIAME)指南(自然遗传学29日,365 - 371;2001)。

对于作者,该提案提供了一个变量清单,应该包括在每一个微阵列出版物,在http://www.mged.org/Workgroups/MIAME/miame_checklist.html.这份核对表填满了所有变量,将在提交时作为补充资料提供。MGED小组建议,期刊需要将微阵列数据提交到两个正在成为主要公共存储库的数据库之一:GEO (http://www.ncbi.nlm.nih.gov/geo/)或ArrayExpress (http://www.ebi.ac.uk/arrayexpress).

饱受折磨的编辑们可以庆幸了,社区终于驯服了微阵列信息这头难以驾驭的野兽。因此,所有提交自然12月1日或之后收到的包含新的微阵列实验的《自然》系列期刊必须包括向编辑邮寄5张光盘。这些磁盘应该包含符合MIAME标准的必要信息。信息必须以一种可被广泛使用的软件包读取的格式提供。与论文结论组成的数据应提交到ArrayExpress或GEO数据库,并在接受发表时或之前提供可用的登录号。

作者应该向社区提供多少数据?具体来说,其他研究人员真的需要仅仅为了测试几个关键基因的表达水平而重新创建精确的微阵列吗?这可能可以通过其他方法来完成?也许随着微阵列技术的进一步发展和标准化,指定如此多变量的需求将会减少,但MGED标准肯定适合该领域的当前状态。