跳转到主要内容

谢谢你访问nature.com。您使用的浏览器版本支持有限的CSS。为了获得最好的体验,我们建议您使用更最新的浏览器(Internet Explorer或关闭兼容性模式)。同时,为了确保继续支持,我们网站没有显示样式和JavaScript。

长非编码rna的功能分类k- m内容

文摘

大多数长非编码rna的功能(lncRNAs)是未知的。与蛋白质相比,具有相似功能的lncRNAs往往缺乏线性序列同源性;因此,识别功能在一个lncRNA很少告诉别人的识别功能。我们开发了一个序列比较法来解构线性序列关系lncRNAs和评估基于大量的短序列相似性称为k-mers。我们发现lncRNAs相关函数通常有类似k-mer资料尽管缺乏线性同源,这k-mer概要文件与蛋白结合lncRNAs和亚细胞定位。使用新颖的分析量化Xist-like监管潜力,我们直接证明进化无关lncRNAs可以编码类似的功能通过不同的空间安排相关序列的图案。K-mer-based分类是一种强大的方法来检测复发lncRNAs序列和功能之间的关系。

这是一个预览的订阅内容,通过访问你的机构

相关的文章

开放获取文章引用这篇文章。

访问选项

买条

时间有限或全文访问ReadCube。

32.00美元

所有价格是净价格。

图1:概述和初始测试k-mer-based序列比较。
图2:LncRNAs相关的函数通常都有相关的k- m内容。
图3:LncRNA本地化和此种关联k- m内容。
图4:K- m内容与lncRNA镇压活动。
图5:镇压所需元素的映射Xist在俄罗斯方块2 kb。

数据可用性

期间生成的数据集和/或分析在当前研究中可用的文章及其补充信息文件。

引用

  1. 艾耶,m . k . et al .长非编码rna的景观在人类转录组。Nat麝猫。47,199 - 208 (2015)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  2. 聊聊,s &科勒,j . RNA在意想不到的地方:长非编码RNA功能不同的细胞环境。Nat。启摩尔。细胞杂志。14,699 - 712 (2013)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  3. Holoch d &莫札,d . rna介导基因表达的表观遗传调控。Nat,启麝猫。16,71 - 84 (2015)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  4. 刘,X。,Hao, L., Li, D., Zhu, L. & Hu, S. Long non-coding RNAs and their biological roles in plants.基因组蛋白质组生物信息学13,137 - 147 (2015)。

    文章公共医学中心PubMed谷歌学术搜索

  5. Rinn, j·l·& Chang h . y .长非编码rna基因调控。为基础。学生物化学启。81年,145 - 166 (2012)。

    文章中科院PubMed谷歌学术搜索

  6. Gutschner, t & Diederichs美国癌症的特点:长非编码RNA的观点。RNA杂志。9,703 - 719 (2012)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  7. 李,j . t . & Bartolomei m . s . X-inactivation印记,长非编码rna在健康和疾病。细胞152年,1308 - 1323 (2013)。

    文章中科院PubMed谷歌学术搜索

  8. 吴,x &锋利,p .答:(不同的转录新基因起源的驱动力?细胞155年,990 - 996 (2013)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  9. 切赫,t·r·&施泰茨j . a .非编码RNA revolution-trashing旧规则建立新的。细胞157年,77 - 94 (2014)。

    文章中科院PubMed谷歌学术搜索

  10. Hezroni h . et al。长非编码RNA进化原理来自17个物种的转录组的直接比较。细胞的代表。11,1110 - 1122 (2015)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  11. Cabili, m . n等。人类大型综合注释基因间的非编码rna显示全局属性和具体的子类。Dev的基因。25,1915 - 1927 (2011)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  12. Derrien, t . et al。人类长非编码rna的GENCODE v7目录:分析他们的基因结构、进化,和表达式。基因组Res。22,1775 - 1789 (2012)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  13. 贝特曼,a . et al . UniProt:蛋白质信息的中心。核酸Res。43D204-D212 (2015)。

    文章中科院谷歌学术搜索

  14. 伯曼,H。,Henrick, K. & Nakamura, H. Announcing the worldwide Protein Data Bank.Nat。结构。医学杂志。10980 (2003)。

    文章中科院PubMed谷歌学术搜索

  15. Ulitsky, i & Bartel d . p . lincRNAs:基因组学、进化和机制。细胞154年26-46 (2013)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  16. 库特,et al。快速的周转率长非编码rna和基因表达的进化。公共科学图书馆麝猫。8e1002841 (2012)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  17. Necsulea, a . et al . lncRNA体验和表达模式的进化在四足动物。自然505年,635 - 640 (2014)。

    文章中科院PubMed谷歌学术搜索

  18. 艾迪,s . r .守恒的RNA二级结构的计算分析转录组和基因组。为基础。启Biophys。43,433 - 456 (2014)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  19. 奎因,j。j。快速进化的营业额是守恒的lncRNA-genome交互。Dev的基因。30.,191 - 207 (2016)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  20. 艾迪,s . r .同源性搜索结构rna:从原理到实际使用的证据。核糖核酸21,605 - 607 (2015)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  21. t·j·惠勒和艾迪,s . r . nhmmer: DNA同源性搜索与概要文件摘要。生物信息学29日,2487 - 2489 (2013)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  22. 大米,P。,Longden, I. & Bleasby, A. EMBOSS: the European Molecular Biology Open Software Suite.趋势麝猫。16,276 - 277 (2000)。

    文章中科院PubMed谷歌学术搜索

  23. 雷,d . et al。rna结合主题的纲要解码基因调控。自然499年,172 - 177 (2013)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  24. Stefl, R。,Skrisovska, L. & Allain, F. H. RNA sequence- and shape-dependent recognition by proteins in the ribonucleoprotein particle.EMBO代表。633-38 (2005)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  25. 埃德加,r c & Batzoglou多重序列比对。咕咕叫。当今。Struc。医学杂志。16,368 - 373 (2006)。

    文章中科院谷歌学术搜索

  26. Altschul, s F。、《W。,Miller, W., Myers, E. W. & Lipman, D. J. Basic local alignment search tool.j·摩尔,杂志。215年,403 - 410 (1990)。

    文章中科院PubMed谷歌学术搜索

  27. Pervouchine, d, d . et al。增强从多个鼠标组织转录组地图显示进化基因表达的约束。Commun Nat。65903 (2015)。

    文章中科院PubMed谷歌学术搜索

  28. 查德威克,b . p . Xi染色质组织的变化和相关性H3K27me3染色质区域的转录序列通过微阵列分析。Chromosoma116年,147 - 157 (2007)。

    文章中科院PubMed谷歌学术搜索

  29. Engreitz, j . m . et al . RNA-RNA交互使特定目标的非编码rna新生Pre-mRNAs和染色质网站。细胞159年,188 - 199 (2014)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  30. 麦,w . et al . Mitotically稳定polycomb协会组与不活跃的x染色体蛋白质速度和enx1滋养层干细胞。咕咕叫。医学杂志。12,1016 - 1020 (2002)。

    文章中科院PubMed谷歌学术搜索

  31. 西方,j . a . et al。长非编码rna NEAT1 MALAT1结合活性染色质网站。摩尔。细胞55,791 - 802 (2014)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  32. 克莱姆森,c . M。,McNeil, J. A., Willard, H. F. & Lawrence, J. B. XIST RNA paints the inactive X chromosome at interphase: evidence for a novel RNA involved in nuclear/chromosome structure.j .细胞。医学杂志。132年,259 - 275 (1996)。

    文章中科院PubMed谷歌学术搜索

  33. 花茎甘蓝j . m . et al .因地制宜沉默的监管元素X失活的机制。细胞151年,951 - 963 (2012)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  34. 他们批判,诉D。,Guillaume, J. L., Lambiotte, R. & Lefebvre, E. Fast unfolding of communities in large networks.j . Stat。机械。理论Ehttps://doi.org/10.1088/1742-5468/2008/10/P10008(2008)。

    文章谷歌学术搜索

  35. 邓纳姆,等。一个集成的百科全书在人类基因组中DNA的元素。自然489年57 - 74 (2012)。

    文章中科院谷歌学术搜索

  36. Carlevaro-Fita, J。Rahim,。Guigo, R。,Vardy, L. A. & Johnson, R. Cytoplasmic long noncoding RNAs are frequently bound to and degraded at ribosomes in human cells.核糖核酸22,867 - 882 (2016)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  37. Van Nostrand e . l . et al .健壮transcriptome-wide发现rna结合蛋白结合位点与增强剪辑(eCLIP)。Nat方法。13,508 - 514 (2016)。

    文章公共医学中心中科院PubMed谷歌学术搜索

  38. 霍金斯,d . m .过度拟合的问题。j .化学。正无穷。第一版。科学。441 - 12 (2004)。

    文章中科院PubMed谷歌学术搜索

  39. Spitale, r . c . et al .结构性痕迹体内解码RNA监管机制。自然519年,486 - 490 (2015)。

    文章公共医学中心中科院谷歌学术搜索

  40. 兰伯特:et al。RNA Bind-n-Seq:定量评估的顺序和结构结合特异性RNA结合蛋白。摩尔。细胞54,887 - 900 (2014)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  41. Smola, m . j . et al .形状显示transcript-wide交互,复杂的结构域,蛋白质相互作用在Xist lncRNA活细胞。Proc。《科学。美国113年,10322 - 10327 (2016)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  42. 迪马特奥,m . et al . PiggyBac工具箱。摩尔。生物方法。859年,241 - 254 (2012)。

    文章中科院PubMed谷歌学术搜索

  43. 叮,s . et al。有效的换位piggyBac (PB)转座子在哺乳动物细胞和老鼠。细胞122年,473 - 483 (2005)。

    文章中科院PubMed谷歌学术搜索

  44. Dowen, j . m . et al .基因控制细胞的身份出现在绝缘社区在哺乳动物染色体。细胞159年,374 - 387 (2014)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  45. Wutz,。,Rasmussen, T. P. & Jaenisch, R. Chromosomal silencing and localization are mediated by different domains of Xist RNA.Nat,麝猫。30.,167 - 174 (2002)。

    文章中科院PubMed谷歌学术搜索

  46. 刘,F。,Somarowthu, S. & Pyle, A. M. Visualizing the secondary and tertiary architectural domains of lncRNA RepA.Nat,化学。医学杂志。13,282 - 289 (2017)。

    文章公共医学中心中科院PubMed谷歌学术搜索

  47. Tyner, c . et al . UCSC基因组浏览器数据库:2017更新。核酸Res。45D626-D634 (2017)。

    中科院PubMed谷歌学术搜索

  48. R核心团队。接待员:统计计算的语言和环境(R统计计算的基础,2017年)。

  49. 沙尔丹哈,a . j . Java Treeview-Extensible微阵列数据的可视化。生物信息学20.,3246 - 3248 (2004)。

    文章中科院PubMed谷歌学术搜索

  50. 堰,w . H。,Emmons, S., Gibson, R., Taylor, D. & Mucha, P. J. Post-processing partitions to identify domains of modularity optimization.算法1093 (2017)。

    文章公共医学中心PubMed谷歌学术搜索

  51. 多布林,a . et al .明星:超速普遍RNA-seq对准器。生物信息学29日,15至21 (2013)。

    文章中科院PubMed谷歌学术搜索

  52. 廖,Y。,Smyth, G. K. & Shi, W. featureCounts: an efficient general purpose program for assigning sequence reads to genomic features.生物信息学30.,923 - 930 (2014)。

    文章中科院PubMed谷歌学术搜索

  53. f . et al . Scikit-learn Pedregosa:机器学习在Python中。j·马赫。学习。Res。12,2825 - 2830 (2011)。

    谷歌学术搜索

  54. 贝利,t . l . et al . MEME套件:主题发现和搜索工具。核酸Res。37W202-W208 (2009)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  55. Machanick p &贝利,t . l . MEME-ChIP:主题分析DNA的大型数据集。生物信息学27,1696 - 1697 (2011)。

    文章中科院公共医学中心PubMed谷歌学术搜索

  56. Darty, K。,Denise, A. & Ponty, Y. VARNA: interactive drawing and editing of the RNA secondary structure.生物信息学25日(1974 - 1975 (2009)。

    谷歌学术搜索

  57. 釜山,s &周k m RNA结构模型的可视化综合基因组内查看器。核糖核酸23,1012 - 1018 (2017)。

    文章中科院公共医学中心PubMed谷歌学术搜索

下载参考

确认

我们感谢UNC的同事讨论,j . Cheng帮助俄罗斯方块克隆。这项工作是由美国国立卫生研究院(NIH)拨款UL1TR002489 GM121806, GM105785,罗勒奥康纳奖。5100683从3月角基金会和资金Eshelman创新研究所Lineberger综合癌症中心和北卡罗来纳大学药理学系(J.M.C.),詹姆斯·s·麦克唐纳基金会21世纪科学Initiative-Complex系统格兰特没有学者奖。220020315 (P.J.M.), NIH米拉奖R35 GM122532 (K.M.W.)。J.M.K.是一个NSF研究生研究员(格兰特dge - 1650116)和支持部分由国家卫生研究院培训格兰特在生物信息学和计算生物学(T32 GM067553)。D.M.L.支持部分由国家卫生研究院培训格兰特在遗传学和分子生物学(T32 GM007092)。时是一个NSF研究生研究员(格兰特dge - 1144081)和支持部分由国家卫生研究院培训格兰特在分子和细胞生物物理学(批准T32 GM08570)。

作者信息

作者和联系

作者

贡献

J.M.K.,P.J.M., and J.M.C. conceived the study. J.M.K., D.S., and J.M.C. performed the computational analysis. S.O.K., K.I., D.M.L., M.D.S., J.S.W., A.R.B., K.M.W., and J.M.C. designed and performed the TETRIS assays. D.W.C., C.R.H., S.W., Q.C., and J.M.K. built the website. J.M.K. and J.M.C. wrote the paper.

相应的作者

对应到j·毛罗。花茎甘蓝

道德声明

相互竞争的利益

作者宣称没有利益冲突。

额外的信息

出版商的注意:施普林格自然保持中立在发表关于司法主权地图和所属机构。

补充信息

补充文本和数字

补充图1 - 11和补充表2 - 6,9、10、13 - 17和21

报告总结

补充表1

策划在人类和小鼠基因工程lncRNAs列表

补充表7

人类lncRNA社区作业和描述

补充表8

鼠标lncRNA社区作业和描述

补充表11

人类社会k-mer概要文件

补充表12

鼠标社区k-mer概要文件

补充表18

k-mer丰富核和胞质lncRNAs

补充表19

蛋白质对数似结果比较空的预测能力和逻辑回归模型

补充表20

蛋白质逻辑回归(LR)精度和召回的结果

补充表22

TETRIS-lncRNA片段信息

补充表23

俄罗斯方块测定寡核苷酸引物

辅助软件

图书馆小k-mer计数频率的核苷酸序列

权利和权限

再版和权限

关于这篇文章

验证通过CrossMark货币和真实性

引用这篇文章

柯克,,Kim, S.O., Inoue, K.et al。长非编码rna的功能分类k- m内容。Nat麝猫50,1474 - 1482 (2018)。https://doi.org/10.1038/s41588 - 018 - 0207 - 8

下载引用

  • 收到了:

  • 接受:

  • 发表:

  • 发行日期:

  • DOI:https://doi.org/10.1038/s41588 - 018 - 0207 - 8

本文引用的

搜索

快速链接

自然简报

报名参加自然简报通讯-重要的科学,每天免费发送到您的收件箱中。

一天中最重要的科学故事,自由在你的收件箱。 报名参加自然简报
Baidu
map