介绍gydF4y2Ba

圆形的rna (circRNAs)最近被证明是一个类的丰富和守恒的rna在动物和植物(审查,请参阅gydF4y2Ba1克ydF4y2Ba,gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba)。大多数circRNAs产生back-splicing pre-mRNAs,主要是局部细胞质gydF4y2Ba3gydF4y2Ba,gydF4y2Ba4 gydF4y2Ba,gydF4y2Ba5克ydF4y2Ba。然而,circRNA体内的一般函数仍然是一个悬而未决的问题。发现了几个circRNAs隔离microrna分子海绵gydF4y2Ba6gydF4y2Ba,gydF4y2Ba7gydF4y2Ba或RNA结合蛋白(RBPs)gydF4y2Ba8gydF4y2Ba(即。,一个s competitors of the linear mRNAs), whereas some nuclear circRNAs were reported to promote transcription of nearby genes9gydF4y2Ba,gydF4y2Ba10gydF4y2Ba。可以翻译自体外合成circRNAs cap-independent时尚gydF4y2Ba11gydF4y2Ba最circRNAs定位在细胞质中,它是非常可能的,许多circRNAs函数作为mrna指导蛋白质合成。gydF4y2Ba

最近我们和其他组织报道,circRNAs确实可以翻译体内通过不同内部核糖体进入位点(ires)gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba,gydF4y2Ba14gydF4y2Ba,gydF4y2Ba15gydF4y2Ba。因为circRNAs缺少5′末端,它的翻译只能启动一个cap-independent机制需要内部核糖体进入位点(IRES)。然而内生ires在真核转录组中是很少见的,甚至他们的存在有时在争论中gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba,产生怀疑circRNA翻译的范围。支持这个观点的,最近的一项研究发现了数以百计的假定的忿怒去系统地搜索选择病毒序列和5′utr人类mRNAgydF4y2Ba19gydF4y2Ba;但是,只有一小部分(< 1.5%)的已知circRNAs ~ 100000gydF4y2Ba20.gydF4y2Ba包含这些新发现的忿怒。gydF4y2Ba

circRNA翻译的研究范围,我们开发了一个基于单元的记者系统屏幕上随机的短序列库驱动circRNA翻译。通过一个接近饱和的屏幕和随后的生物信息学分析,我们确定了97 IRES-like五个一与AU-rich集群分成11组共识图案。IRES-like元素明显富集在人类circRNAs相比,所有线性rna,这表明他们在circRNAs积极的选择。因为这些IRES-like五个一占所有五个一的~ 2%(97/4096),任何超过50-nt应该包含这样一个序列元素的机会,这意味着大多数circRNAs在人类细胞可以通过翻译IRES-like短元素。一致,circRNAs只包含编码序列确实可以滚动圆的方式翻译,大概从内部IRES-like短编码区中的元素。我们进一步发现数百circRNA-coded蛋白质质谱分析数据集,并探索潜在的角色circRNA-coded蛋白质和他们的翻译机制。总的来说,我们的数据表明,短IRES-like元素可以驱动广泛circRNA翻译,这可能代表circRNAs的一般函数。gydF4y2Ba

结果gydF4y2Ba

无偏短IRES-like元素的识别gydF4y2Ba

之前我们报道了GFP-coding circRNAs内生ires可以从不同的病毒或翻译gydF4y2Ba12gydF4y2Ba,gydF4y2Ba13gydF4y2Ba。类似circRNA翻译记者也被其他人使用gydF4y2Ba21gydF4y2Ba,以前也使用体外翻译分析进行验证gydF4y2Ba22gydF4y2Ba。此外,我们进一步证实,从circRNAs GFP蛋白主要是翻译,而不是线性剪接转录readthrough产生的副产品或pre-mRNAgydF4y2Ba反式gydF4y2Ba拼接gydF4y2Ba12gydF4y2Ba。gydF4y2Ba

令人惊讶的是,我们发现三四个简短poly-N序列设计作为ires -控制也可以促进从circRNAs GFP翻译(补充图。gydF4y2Ba1gydF4y2Ba)。这个观察表明,某些短元素除了已知ires足以启动circRNA翻译。系统地识别额外的序列驱动circRNA翻译,我们采用一个无偏屏幕拼接方法最初开发识别管理gydF4y2Ba独联体gydF4y2Ba元素gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba。简而言之,一个库的随机插入十序列开始之前circRNA-coded GFP的密码子gydF4y2Ba26gydF4y2Ba转染293 t细胞,生成circRNAs可以翻译成完整的GFP(方法和辅助数据gydF4y2Ba1克ydF4y2Ba)。绿色细胞活跃circRNA翻译可以恢复fluorescence-activated细胞排序(流式细胞仪),我们使用与junction-specific rt - pcr引物从circRNAs放大插入的序列。可以随后插入decamers测序识别IRES-like驱动circRNA翻译(图的元素。gydF4y2Ba1gydF4y2Ba)。gydF4y2Ba

图1:广泛IRES-like元素可以驱动circRNA翻译。gydF4y2Ba
图1gydF4y2Ba

源数据提供了一个源数据文件面板(gydF4y2BaegydF4y2Ba- - - - - -gydF4y2BahgydF4y2Ba)。gydF4y2Ba一个gydF4y2Ba随机插入pcircGFP-BsmBI decamers,由此产生的图书馆转染293 t细胞和绿色细胞流式细胞仪排序。插入序列是恢复与rt - pcr和测序。RNA-seq库的引物生产蓝色箭头所示。丰富五个一识别计算。gydF4y2BabgydF4y2Ba流式细胞仪的细胞转染和circRNA记者包含十米级图书馆。细胞被分为四组根据他们的GFP荧光(GFP负,低、中或高GFP细胞)。中等和高荧光的细胞被分类为“绿色电池”。gydF4y2BacgydF4y2Ba单核苷酸频率开始图书馆(上)和序列丰富在绿色细胞(底部)。gydF4y2BadgydF4y2Ba频率和奇怪的比率的二核苷酸序列在绿色细胞丰富。奇怪的比率被定义为二核苷酸的概率除以每个基地的概率的乘积。gydF4y2BaegydF4y2Ba97年的六聚体丰富(即。,IRES-like elements, z score >7) were clustered into 11 groups with the consensus motifs shown as pictogram (top). Representative hexamers in each cluster were inserted back into the circRNA reporter, which were transiently transfected into 293T cells. The GFP was assayed by western blot at 48 h after transfection (bottom).fgydF4y2Ba122年的六聚体耗尽(即。,negative control, z score < -7) were clustered into 11 groups and the consensus motifs were shown as pictogram (top). Representative hexamers in all clusters were tested using the same condition as panel (egydF4y2Ba),与AAAAAA积极控制。gydF4y2BaggydF4y2Ba比较新发现IRES-like元素m6A网站(RSV和m6A)的活动来推动circRNA翻译小组(使用相同的条件gydF4y2BaegydF4y2Ba)。gydF4y2BahgydF4y2Ba邻近序列对circRNA翻译的影响。的丰富和耗尽五个一插入circRNA记者有或没有ATC三聚物(部分像科扎序列)。分析了样品使用相同的条件作为面板(gydF4y2BaegydF4y2Ba)。circRNA记者与多聚腺苷酸序列插入加载控制的两倍。gydF4y2Ba

达到完全覆盖整个图书馆,> 1亿细胞转染(无花果。gydF4y2Ba1gydF4y2Ba)。我们从黑暗和插入片段测序绿色细胞使用高通量测序,并提取绿色和黑色的五个一细胞(图gydF4y2Ba1 bgydF4y2Ba和补充图。gydF4y2Ba1 bgydF4y2Ba六聚体)来识别97显著富集在绿色细胞(补充数据gydF4y2Ba2gydF4y2Ba)。这些丰富序列一般,甚至U-rich尽管预先图书馆大约碱基组成(图gydF4y2Ba1 cgydF4y2Ba和补充图。gydF4y2Ba1 cgydF4y2Ba),有很强的二核苷酸对AC偏见,AG),和GA(无花果。gydF4y2Ba1 dgydF4y2Ba)。基于序列相似性,97丰富五个一进一步聚集成图案(图11组产生共识。gydF4y2Ba1 egydF4y2Ba,最高)。多数共识图案AU-rich图案,丰富3′utr线性mRNA(补充图。gydF4y2Ba1 dgydF4y2Ba)。与以前的报告一致,m6A修改可以推动circRNA翻译gydF4y2Ba13gydF4y2Ba六聚体,一些丰富包含RRACH m6A修改签名;然而,他们还不够普遍聚集成一个一致的主题。gydF4y2Ba

每个集群的IRES-like活动进一步验证了六聚体插入代表(或六聚体耗尽控制)到circRNA记者检查circRNA翻译(图。gydF4y2Ba1 egydF4y2Ba,底部)。所有包含丰富五个一显示强劲的记者从circRNAs GFP的翻译,而难以觉察的GFP作品从六聚体控制(图。gydF4y2Ba1 fgydF4y2Ba)。此外,丰富五个一显示类似的活动两个短m6A-containing序列以前报道circRNA翻译(无花果。gydF4y2Ba1克gydF4y2Ba)gydF4y2Ba13gydF4y2Ba。此外,circRNA水平相似的所有记者包含不同序列根据rt - pcr和北部污点(无花果。gydF4y2Ba1比gydF4y2Ba和补充图。gydF4y2Ba1 egydF4y2Ba),这表明GFP生产的差异是由于不同的活动在推动翻译而不是影响back-splicing。gydF4y2Ba

我们circRNA记者包含3 nt ATC序列起始密码子和图书馆之间(图gydF4y2Ba1 hgydF4y2Ba)。检查如果这ATC可能影响六聚体丰富的活动,我们删除ATC三核苷酸和发现所有六聚体丰富测试仍然可以直接circRNA翻译变异的记者,而没有观察到翻译的六聚体耗尽(无花果。gydF4y2Ba1 hgydF4y2Ba六聚体),这表明这些丰富能独立开车circRNA翻译。gydF4y2Ba

我们进一步检查的活动丰富五个一使用体外合成circRNA,使用高效液相色谱法进一步纯化gydF4y2Ba27gydF4y2Ba(补充图。gydF4y2Ba1 fgydF4y2Ba)。与候选人控制相比,所有测试circRNAs ires可以翻译成荧光素酶在两个细胞系(补充图。gydF4y2Ba1克gydF4y2Ba),和我们的新发现的元素也有类似的活动作为已知的内生ires (5 'utr Hsp70, CCGGCGG Gtx公司,并从OR4F17 UACUCCC)gydF4y2Ba28gydF4y2Ba,gydF4y2Ba29日gydF4y2Ba。然而,病毒ires EMCV和CSFV显示更高的活动,可能是因为他们的活动更少依赖于核RNA结合蛋白或体外合成RNA的修改gydF4y2Ba30.gydF4y2Ba,gydF4y2Ba31日gydF4y2Ba。总的来说,这些结果表明,我们的屏幕可以可靠地识别短序列驱动circRNA翻译,因此我们称这组97五个一IRES-like五个一。gydF4y2Ba

IRES-like五个一浓缩在内源性circRNAs翻译gydF4y2Ba

我们进一步的六聚体的平均频率IRES-like相比gydF4y2BavsgydF4y2Ba。六聚体的控制设置在不同类型的rna。在线性mrna(从RefSeq注释mrna),的平均频率IRES-like五个一是六聚体类似于随机五个一耗尽在绿色细胞(图。gydF4y2Ba2gydF4y2Ba左面板)。令人惊讶的是,六聚体IRES-like的平均频率显著高于circRNA测试数据集gydF4y2Ba4 gydF4y2Ba,gydF4y2Ba7gydF4y2Ba,gydF4y2Ba32gydF4y2Ba,gydF4y2Ba33gydF4y2Ba相对于控制六聚体集(无花果。gydF4y2Ba2gydF4y2Ba),这表明内生circRNAs富含短IRES-like元素。因为这些IRES-like五个一是独立随机序列的识别从公正的屏幕,这样浓缩强烈表明,circRNAs可能积极选择他们被翻译的能力。gydF4y2Ba

图2:CircRNAs包含许多IRES-like元素开始翻译。gydF4y2Ba
图2gydF4y2Ba

源数据的源数据文件提供面板(gydF4y2BabgydF4y2Ba)和(gydF4y2BacgydF4y2Ba)。gydF4y2Ba一个gydF4y2Ba在circRNAs IRES-like元素明显富集。平均频率的不同类型的五个一(五个一,IRES-like五个一和六聚体耗尽)内部线性mrna的外显子与circRNAs绘制。护士:RNA序列在每个数据集的数量。的gydF4y2BapgydF4y2Ba值计算与双边Kolmogorov-Smirnov测试。gydF4y2BabgydF4y2Ba翻译circRNAs可以由内部编码序列。左面板,原理图的线性mRNA表达记者和四个circRNAs GFP的代码。从上到下:线性GFP信使rna;circRNA m6A站点在起始密码子的上游;与上游m6A circRNA站点并没有终止密码子;circRNA启动密码子后立即停止密码子;circRNA只包含编码序列(没有终止密码子或UTR)。红线,终止密码子。circRNA质粒转染293 t细胞,和样品分析免疫印迹在转染后2天(右面板)。GAPDH是测量水平加载控制。 The green arrow indicates the full-length GFP, and the asterisks indicate the truncated GFP proteins translated using internal start codons. The bar graph represents the quantification of GFP protein levels relative to GAPDH. The protein levels were also normalized to the RNA.cgydF4y2Ba翻译的circRNA-coded Renilla荧光素酶(Rluc)使用内部IRES-like元素。:原理图的两个Rluc circRNAs,其中Rluc ORF分成两部分,这样全身Rluc ORF只能通过back-splicing产生。cRluc包含一个序列编码T2A肽的翻译产品可以裂解成完整Rluc蛋白质。rcRluc不包含终止密码子。底部:双荧光素酶检测cRluc rcRluc。控制和循环Rluc质粒与美国co-transfected(萤火虫荧光素酶)参考记者到293 t细胞。细胞转染后细胞溶解在48小时发光测量使用发光读者,和相对发光信号绘制。gydF4y2Ba

97年IRES-like五个一占整个人口六聚物(4 ~ 2%gydF4y2Ba6gydF4y2Ba= 4096),表明许多序列可能包含一个IRES-like六聚体的机会。换句话说,会有一个IRES-like元素在大约每50五个一(97/4096)。由于一个长度为N的序列可以分为连续存在五个一,和> 99% circRNAs超过100元gydF4y2Ba20.gydF4y2Ba(补充图。gydF4y2Ba2gydF4y2Ba),大多数circRNAs应该包含内部IRES-like短元素的机会。因此,几乎所有的开放阅读框(orf)在circRNAs可能从IRES-like翻译简短的元素,这意味着大多数circRNAs可能不需要额外IRES驱动它的翻译。gydF4y2Ba

直接测试这个惊人的假说,我们生成一系列circRNA记者含有GFP的编码序列(717 nt ORF, 4 IRES-like元素)但是没有规范IRES的上游(图。gydF4y2Ba2 bgydF4y2Ba)。我们证实了高效circRNA表达所有的RNA样品使用可选的核糖核酸酶的污点北部R治疗(补充图。gydF4y2Ba2 bgydF4y2Ba),并测量了GFP生产与西方的屁股。试验在293年进行了t细胞(图gydF4y2Ba2 bgydF4y2Ba)和细胞缺乏大T抗原(补充图。gydF4y2Ba2摄氏度gydF4y2Ba)。控制记者包含m6A网站是可靠的翻译gydF4y2Ba13gydF4y2Ba和删除的终止密码子导致生产GFP串联体通过滚动圆翻译circRNA(无花果。gydF4y2Ba2 bgydF4y2Ba)。当删除所有翻译起始和终止密码子之间的序列circRNA,完整的GFP翻译是废除,大概是因为没有任何序列函数作为IRES的余地。然而,当删除终止密码子,circRNA只包含GFP-coding序列也可以滚动圆的方式翻译产生GFP串联体,可能通过一个内部函数序列IRES(无花果。gydF4y2Ba2 bgydF4y2Ba补充图。gydF4y2Ba2摄氏度gydF4y2Ba)。有趣的是,滚动圆的翻译可以产生一些巨大的GFP串联体(巨大的蛋白质不能被有效地转移到膜,因此可能被低估)。消除可能的工件滚动圆转录的质粒,这些记者质粒插入基因组稳定使用Flp-In系统,和类似的滚动圆的翻译这些稳定转染细胞的观察(补充图。gydF4y2Ba二维gydF4y2Ba)。gydF4y2Ba

滚动圆翻译开始从内部编码序列并不局限于GFP基因,随着circRNAs只包含两个不同的荧光素酶基因的ORF序列也可以翻译的内部编码序列(图。gydF4y2Ba2摄氏度gydF4y2Ba补充图。gydF4y2Ba2比gydF4y2Ba)。有趣的是,滚动圆翻译circRNAs明显产生更多的蛋白质比circRNAs停止密码子(无花果。gydF4y2Ba2 bgydF4y2Ba和补充图。gydF4y2Ba2摄氏度gydF4y2Ba),这表明起始circRNA翻译可能病原反应步骤的核糖体回收和重新启动是不必要的滚动圆的翻译gydF4y2Ba22gydF4y2Ba,gydF4y2Ba34gydF4y2Ba,gydF4y2Ba35gydF4y2Ba。gydF4y2Ba

反式gydF4y2Ba行为因素,结合IRES-like短元素促进circRNA翻译gydF4y2Ba

我们下一个寻求确定这些IRES-like短元素的分子机制启动cap-independent circRNA翻译。早些时候的报告显示,短序列可以通过配对函数作为IRES与某些地区18 s rRNA(即活跃区域)gydF4y2Ba19gydF4y2Ba。然而,我们没有发现我们的新发现的IRES-like元素之间的相关性对这些“活跃的18 s rRNA区域”(补充图。gydF4y2Ba3gydF4y2Ba),说明这些元素可能不是函数通过削18 s rRNA。gydF4y2Ba

以前我们发现m6A读者YTHDF3可以识别N6-methyladenosine circRNA直接招募翻译起始因子gydF4y2Ba13gydF4y2Ba。通过类比我们假设IRES-like短元素也可能作为监管gydF4y2Ba独联体gydF4y2Ba元素招募gydF4y2Ba反式gydF4y2Ba行为因素,促进翻译gydF4y2Ba36gydF4y2Ba。识别等gydF4y2Ba反式gydF4y2BaIRES-like元素的作用因素,我们使用共识序列作为特定的绑定蛋白的亲和纯化的诱饵。化学合成20-nt RNA寡核苷酸包含三份IRES-like五个一和5′末端生物素改性与海拉细胞提取物、孵化和RNA蛋白质复合物与链霉亲和素纯化珠子gydF4y2Ba23gydF4y2Ba,gydF4y2Ba24gydF4y2Ba,gydF4y2Ba25gydF4y2Ba(无花果。gydF4y2Ba3gydF4y2Ba)。我们发现所有的五个RNA探针由IRES-like元素显示强劲的绑定的多个蛋白质,而负序(ACCGCG)弱非特异性背景RBP绑定(图。gydF4y2Ba3 bgydF4y2Ba)。每车道的特定蛋白质乐队随后与质谱分析(质/ MS),和热门候选人确定为候选人gydF4y2Ba反式gydF4y2Ba行为因素(无花果。gydF4y2Ba3 bgydF4y2Ba)。gydF4y2Ba

图3:系统地识别gydF4y2Ba反式gydF4y2Ba因素,识别IRES-like元素。gydF4y2Ba
图3gydF4y2Ba

源数据的源数据文件提供面板(gydF4y2BadgydF4y2Ba)和(gydF4y2BaegydF4y2Ba)。gydF4y2Ba一个gydF4y2Ba原理图的RNA亲和纯化。Biotin-labeled rna含有共识IRES-like元素的图案与海拉细胞溶解产物,孵化和rna蛋白质复合物被链霉亲和素纯化珠子。蛋白质被质谱进一步确认。gydF4y2BabgydF4y2Ba的识别gydF4y2Ba反式gydF4y2Ba因素受每个RNA探针。探针呈现五个共识IRES-like元素的图案(红色)和控制探针(蓝色)(全序列用于补充数据gydF4y2Ba2gydF4y2Ba)。总躲避与sds - page分离的蛋白质,并且每个乐队被切断,质谱分析。每个乐队的三大发现的蛋白质标记。gydF4y2BacgydF4y2Ba蛋白质相互作用网络的识别gydF4y2Ba反式gydF4y2Ba因素。受所有RNA探针(即最高蛋白质。,IRES-like elements) were analyzed by STRING and clustered into two main groups by MCODE tool.dgydF4y2Ba验证的活动gydF4y2Ba反式gydF4y2Ba因素。circRNA记者和两个六聚体耗尽串联co-transfected插入293 t细胞与不同Puf-fusion蛋白质,特别是认识的8-nt目标插入序列。结果收集细胞转染后2天通过免疫印迹和rt - pcr分析。不同对Puf蛋白质和8-nt目标作为特异性控制。Puf-N2具体结合AGUGUCAG,而Puf-N8专门GCGUCUGC结合。条形图表示相对于GAPDH GFP的量化水平。蛋白质含量也归一化到RNA (n。不重要)。gydF4y2BaegydF4y2BaPABPC1活动的验证。PABPC1的表达载体和各种控制RBPs co-transfected circRNA翻译记者包含(A)gydF4y2Ba10gydF4y2Ba或(G)gydF4y2Ba10gydF4y2Ba在起始密码子序列,蛋白质在转染后48 h产品化验。条形图代表了GFP的量化水平相对于GAPDH使用免疫印迹。RNA蛋白质含量也正常化,和相对数量的翻译除以模拟计算转染GFP。gydF4y2Ba

共58蛋白质高的候选人被确定的信心,有许多重叠的蛋白质在不同的鱼饵(补充数据gydF4y2Ba3gydF4y2Ba)。众所周知,大多数的这些蛋白质绑定RNA和集群基于蛋白质相互作用可以分为两大组,参与的RNA加工(如hnRNPs)或在信使核糖核酸的翻译(例如,核糖体蛋白)(图gydF4y2Ba3 cgydF4y2Ba)。确定监管功能富集RBPs RNA加工、拼接、运输和稳定根据基因本体论(补充图。gydF4y2Ba3 bgydF4y2Ba)。gydF4y2Ba

为了验证这些蛋白的功能,我们融合了候选人RBPs可编程RNA绑定域(即。Puf域),可以用来绑定任何8-nt RNA序列gydF4y2Ba37gydF4y2Ba,gydF4y2Ba38gydF4y2Ba,gydF4y2Ba39gydF4y2Ba,gydF4y2Ba40gydF4y2Ba,发生的融合蛋白circRNAs含有同源的目标。我们选择测试几个因素已知具体AU-rich元素绑定(ELAVL1, PABPC1 hnRNP A1, hnRNP U),但排除的因素,结合所有RNA序列特异性较低的鱼饵(例如,RBMXL1和RBMX)。我们发现的具体拘束PABPC1 circRNA翻译,hnRNP U明显提升,而ELAVL1(虚)和hnRNP A1没有拴在同一地点(图时大脑的活动。gydF4y2Ba3 dgydF4y2Ba)。这种translation-promoting活动需要特定的绑定gydF4y2Ba反式gydF4y2BacircRNAs作用因素,扰乱Puf-RNA交互可以废除监管效果和恢复特定的交互可以拯救活动(图。gydF4y2Ba3 dgydF4y2Ba)。gydF4y2Ba

PABPC1是一个丰富的蛋白质,它将多聚腺苷酸或AU-rich序列gydF4y2Ba41gydF4y2Ba。我们进一步检查PABPC1的作用在调节circRNA使用记者含有短IRES-like元素(多聚腺苷酸)(无花果。gydF4y2Ba3 egydF4y2Ba左面板)。我们发现PABPC1表达及其paralogue PABPC4确实可以促进circRNA-coded GFP的翻译,而circRNA翻译略受另一个polypyrimidine结合蛋白PTBP1之前报道加强IRES的活动。有趣的是,由于未知的原因,co-expression U2AF2似乎抑制circRNA翻译。作为一个控制,这些蛋白质的表达显示没有影响circRNA包含(G)的记者gydF4y2Ba10gydF4y2Ba序列(图。gydF4y2Ba3 egydF4y2Ba右面板)。此外,我们使用RNA-IP检查与circRNAs PABPC1之间的绑定。正如所料,PABPC1确实结合更为紧密circRNAs包含IRES-like短元素相比控制序列(补充图。gydF4y2Ba3 cgydF4y2Ba),支持其作用促进circRNA翻译通过直接招募circRNAs IRES-like元素。在一起,我们的结果表明,某些RBPs能够识别这些IRES-like元素促进cap-independent circRNAs翻译,举例的新模式circRNA翻译起始规范ires独立的。gydF4y2Ba

内源性circRNA-coded蛋白质的识别gydF4y2Ba

我们进一步研究了假定的circRNA-coded蛋白质的分子特征。按照先前的观察gydF4y2Ba15gydF4y2Ba,我们发现外显子5′末端的pre-mRNA更有可能被包括在circRNAs(无花果。gydF4y2Ba4gydF4y2Ba),这表明许多circRNAs可能代码n端截断他们的宿主基因亚型。,79%的circRNA外显子编码区,而17%的circRNA外显子跨越5′utr生成编码,编码区和4%和3′utr区域(图。gydF4y2Ba4gydF4y2Ba插图)。gydF4y2Ba

图4:circRNA-coded蛋白质的识别。gydF4y2Ba
图4gydF4y2Ba

一个gydF4y2Ba第一circRNA位置分布在宿主基因外显子。全身circRNA序列根据以往的数据集进行分析,根据外显子和直方图绘制的第一circRNA在宿主基因外显子。插入的饼图介绍了circRNAs的百分比与mRNA不同区域重叠。gydF4y2BabgydF4y2Ba调查的潜在circRNA-coded产品。离开时,百分比的内生circRNAs ORF > 20 aa。紫色的饼图分区:circRNAs翻译经常(养鱼槽、深紫色)或滚动圆的方式(rcORF,浅紫色)与宿主蛋白质部分重叠基因至少7 aa;布朗片:circRNAs翻译以常规方式(养鱼槽、深棕色)或滚动圆的方式(rcORF,浅棕色)与宿主基因但不重叠的蛋白质同源其他已知的蛋白质;蓝色饼图分区:circRNAs翻译成蛋白质不是任何已知的同源蛋白质(养鱼槽和rcORF总和);灰色片:circRNAs不包含任何潜在的ORF超过20 aa。右面板:相同的假定的分析从两套控制circRNA编码产品:逆转序列或随机打乱的内生circRNAs序列。gydF4y2BacgydF4y2Ba原理图来识别circRNA-coded蛋白质使用蛋白质组学数据集。gydF4y2BadgydF4y2Ba离开时,计算顺序过滤器应用于识别可翻译circRNAs和circRNAs通过每个过滤器的数量。对的,不同类型的的百分比circRNA-coded orf circRNAs通过每个过滤器。不同的定义circRNA-coded羊痘疮是一样的面板(gydF4y2BabgydF4y2Ba)。gydF4y2BaegydF4y2Ba为每个可翻译circRNA支持光谱分布。gydF4y2BafgydF4y2Ba分布的细胞系和组织的数量为每个可翻译circRNA在两个蛋白质组学数据集。gydF4y2BaggydF4y2Ba比较数量的光谱的线性mrna和circRNAs。缩写词的不同组织和细胞系中列出补充数据gydF4y2Ba4 gydF4y2Ba。从Bekker-Jensen蛋白质组学数据,DB, et al(蓝色)和金女士,et al . &平托,SM, et al(红色)。绿色字表明了39个分数,46 70分数分数和海拉细胞使用高容量离线HpH反相LC。gydF4y2Ba

使用的数据集人类circRNAs全身gydF4y2Ba33gydF4y2Ba,我们检查了假定的circRNA-coded orf超过20种氨基酸。的大部分内生circRNAs(67%)可以编码蛋白质与宿主基因(即重叠。,反式lated in the same reading frame), including 14% of circRNAs that can be translated in a rolling circle fashion (named as overlapped cORF and rcORF, respectively, purple pie slices in the left panel of Fig.4 bgydF4y2Ba)。此外,16%的人类circRNAs可以编码蛋白质与其他已知的同源蛋白质(同源养鱼槽和rcORF,布朗在无花果饼图分区。gydF4y2Ba4 bgydF4y2Ba左面板),而10% circRNA-coded蛋白质不是任何已知的蛋白质同源。只有7%的circRNAs没有ORF超过20 aa。相比之下,更大一部分circRNAs从两个不同的控制(逆转或重组序列)不包含子超过20 aa(图。gydF4y2Ba4 bgydF4y2Ba右),其余控制circRNAs更容易不编码蛋白质同源任何已知的蛋白质。gydF4y2Ba

系统地识别circRNA-coded蛋白质,我们从公开数据集搜索原始质谱串联质谱肽(MS-MS)可能在back-splice circRNAs连接gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba33gydF4y2Ba(无花果。gydF4y2Ba4摄氏度gydF4y2Ba)。两组高分辨率的人类蛋白质组数据来自30个组织和选择6细胞株gydF4y2Ba42gydF4y2Ba,gydF4y2Ba43gydF4y2Ba。由于综合数据集circRNAs缺乏在不同的人体组织,我们从不同的细胞系/合并所有circRNAs组织,这可能会增加假阳性。然而,我们使用一系列严格的过滤器在蛋白质组学数据的分析和统计测试减少假阳性发现(见“方法”)。gydF4y2Ba

我们确认2721质谱在990 back-splice连接从646年人类基因,所有这些包含假定的养鱼槽或rcORF超过20种氨基酸(无花果。gydF4y2Ba4 dgydF4y2Ba补充数据gydF4y2Ba4 gydF4y2Ba)。这些新发现光谱没有以前分配给已知的蛋白质或亚型。有趣的是,circRNAs与滚动圆的一部分翻译增加额外的过滤器被应用在我们的搜索(图中。gydF4y2Ba4 dgydF4y2Ba)。这样符合更高的转换效率增加时,不需要重新启动(图。gydF4y2Ba2 bgydF4y2Ba)。或者,增加了rcORFs检出率可能部分由于固有的偏见检测包含相同的多个副本肽的蛋白质。gydF4y2Ba

超过80%的确定circRNA-coded肽重叠与宿主基因的翻译产品(无花果。gydF4y2Ba4 dgydF4y2Ba),这表明circRNAs最好是产生不同的翻译的宿主基因亚型。有趣的是,他们的宿主基因显著富集与RNA的功能翻译,RNA拼接/处理和血小板脱粒(补充图。gydF4y2Ba4 gydF4y2Ba),这意味着许多circRNAs代码为新蛋白亚型与潜在角色在调节这些过程。浓缩的血小板脱粒也可能提供一个功能含义之前的观察,circRNAs血小板中高度表达gydF4y2Ba44gydF4y2Ba,gydF4y2Ba45gydF4y2Ba。gydF4y2Ba

对于许多circRNAs,我们确定了多个光谱支持同一back-splice连接,其中包括80 circRNAs > 10不同光谱back-splice连接(图。gydF4y2Ba4 egydF4y2Ba)。circRNA-coded肽大多是在一个小的细胞或组织,有60 - 80%的circRNA-coded肽两MS-MS只能从单一样本数据集(无花果。gydF4y2Ba4 fgydF4y2Ba蓝色酒吧)。相比之下,相邻拼接连接的线性编码的多肽mrna更广泛表达,与一些肽被发现在所有样品(图。gydF4y2Ba4 fgydF4y2Ba灰色酒吧)。gydF4y2Ba

circRNA-coded蛋白质丰度较低,由于快速退化gydF4y2Ba

我们下一个支持circRNA-coded肽的质谱分析和比较他们已知的蛋白质编码规范线性mrna。正如预期的那样,新发现的数量circRNA-coded肽与总肽的数量呈正相关,两个独立的数据集(图。gydF4y2Ba4 ggydF4y2Ba)。此外,申请额外的分离在同一样本(例如,39岁,46岁,和70年分数的海拉细胞)的数量增加circRNA-coded肽(无花果。gydF4y2Ba4 ggydF4y2Ba),这表明circRNA-coded蛋白质的蛋白质组识别未达到饱和度和支持肽大致相关的光谱数量丰富的这些“新蛋白质”。gydF4y2Ba

估计的相对丰度circRNA-coded蛋白质,我们比较了肽back-splice结gydF4y2BavsgydF4y2Ba。那些在相邻拼接连接主机的线性mRNA。circRNA-coded肽通常有一个小数量的支持线性光谱编码的肽相比相邻拼接连接(补充图。gydF4y2Ba5gydF4y2Ba),这表明circRNA-coded肽通常有一个低丰度比线性同行。始终如一,gydF4y2Ba问gydF4y2Ba支持circRNA-coded肽的质谱值都高于线性同行(补充图。gydF4y2Ba5gydF4y2Ba)。自从女士更丰富的蛋白质通常由数据与更高的信心,这个结果再次表明,circRNA-coded通常比蛋白质编码的低丰度蛋白质的线性mrna。gydF4y2Ba

通过分析序列拼接连接组成,我们发现,赖氨酸和精氨酸丰富−1位置的所有拼接连接(补充图。gydF4y2Ba5 bgydF4y2Ba)。具体来说,> 70%的接头连接包含至少一个赖氨酸或精氨酸不管线性或back-splice连接。因为当前蛋白质组样品主要是细胞溶解胰蛋白酶裂解位点的赖氨酸或精氨酸,这种序列的偏见会导致很大的损耗在接头连接肽,它与早期的报告是一致的gydF4y2Ba46gydF4y2Ba。与蛋白质由线性编码mrna, circRNA-coded蛋白质只能被跨back-splice连接肽,这可以部分解释为什么circRNA-coded肽是很难确定的。进一步优化MS-MS使用不同蛋白酶可能确定额外circRNA-coded蛋白质。gydF4y2Ba

除了这些技术上的困难,多种因素可能也有助于circRNA-coded的低丰度蛋白质。首先,大量的大多数circRNAs通常低于线性同行gydF4y2Ba47gydF4y2Ba,gydF4y2Ba48gydF4y2Ba,gydF4y2Ba49gydF4y2Ba部分,这应该有助于circRNA-coded肽的低丰度。此外,circRNA-coded低丰度的蛋白也可能由于缓慢的蛋白质合成和/或快速退化。众所周知,cap-independent翻译的效率相对较低gydF4y2Ba50gydF4y2Ba,gydF4y2Ba51gydF4y2Ba;然而,circRNA-coded蛋白质的稳定性尚不清楚。虽然大多数circRNA-coded蛋白与宿主基因编码的蛋白质序列重叠,可能是额外的肽具体由back-splicing结可能使蛋白质编码不稳定。gydF4y2Ba

直接解决这个问题的可能性,我们选择三个c端肽具体编码circRNAs back-splice连接的不同,并融合GFP的糖基circGFP记者(补充图。gydF4y2Ba5度gydF4y2Ba)。拘束的潜在degron到记者蛋白质是一种常规分析方法来衡量蛋白质降解gydF4y2Ba52gydF4y2Ba,gydF4y2Ba53gydF4y2Ba。我们发现不同circRNA-coded反面的gfp表达水平低得多的比一个没有这些反面(补充图。gydF4y2Ba5 dgydF4y2Ba)。此外,融合蛋白的表达水平与circRNA-coded尾巴在蛋白酶体抑制增加了MG132治疗,而GFP没有这样的反面或控制肽反面(n端肽的基因或V5表位标记)在本质上是不受影响(补充图。gydF4y2Ba5 egydF4y2Ba)。相比之下,所有绿色荧光蛋白融合蛋白的水平没有影响氯喹治疗,抑制自噬蛋白降解(补充图。gydF4y2Ba5 egydF4y2Ba)。这些观察表明,circRNA-coded c端尾巴确实可以破坏很多circRNA-coded蛋白质,和这样的退化主要是由水解酶。gydF4y2Ba

翻译产品来自circRNAsgydF4y2Ba

虽然内生circRNAs被发现含有更多的养鱼槽(养鱼槽:rcORF ~ 3.4的比例,无花果。gydF4y2Ba4 bgydF4y2Ba),circRNA-coded肽的进一步分析表明,~ 50%源于内生circRNAs包含rcORFs(无花果。gydF4y2Ba4 dgydF4y2Ba),建议从circRNAs rcORFs更有效地翻译(符合观测在无花果。gydF4y2Ba2 b, cgydF4y2Ba)。自内生circRNAs没有报道进行滚动圆翻译,我们寻求进一步确定这些标识circRNAs rcORFs确实是翻译在不同的细胞。gydF4y2Ba

检测内源性circRNAs翻译产品技术上是困难的,因为他们不同于规范的产品只有在back-splice连接。产生新的抗体back-splice连接短片段编码的耗时,有时不可靠,因此我们标记抗原决定基的候选人circRNA产品标签。我们选择三个circRNAs (circPSAP、circPFAS circABHD12)与高质量的女士证据(无花果。gydF4y2Ba5gydF4y2Ba和补充图。gydF4y2Ba6gydF4y2Ba),并构建back-splicing记者ectopically表达这些circRNAs在两个不同的细胞类型gydF4y2Ba26gydF4y2Ba。一个在坐标系V5抗原决定基标签被插入到rcORFs促进翻译产品的检测(图。gydF4y2Ba5 bgydF4y2Ba)。我们发现多个蛋白质乐队在293 t和SH-SY5Y细胞转染circRNAs测试,表明这些circRNAs经历强劲滚动圆翻译产生蛋白质串联体(无花果。gydF4y2Ba5度gydF4y2Ba和补充图。gydF4y2Ba6 bgydF4y2Ba)。有趣的是,细胞转染circPSAP产生一个微弱的乐队的蛋白质串联体以及一个更加强大的带对应于一个周期的产品circRNA翻译,暗示这个circRNA翻译持续较低。gydF4y2Ba

图5:内生circRNAs滚动圆的翻译。gydF4y2Ba
图5gydF4y2Ba

源数据的源数据文件提供面板(gydF4y2BacgydF4y2Ba- - - - - -gydF4y2BaggydF4y2Ba)gydF4y2Ba。一个gydF4y2Ba碰撞离解的MS / MS谱肽在back-splice连接人类circPSAP (MMMHMEEILVYLEK) circPFAS (LLEVGPRNL)和circABHD12 (LPRILSVK)。带注释的b -和y-ions标记为红色和绿色,分别。gydF4y2BabgydF4y2BarcORF翻译记者。内生rcORF的编码区是插入到back-splicing记者,在坐标系V5抗原决定基检测。gydF4y2BacgydF4y2Ba三rcORF记者转染293细胞,细胞转染48 h后收集,并通过免疫印迹和rt - pcr分析。蓝色箭头表示的单周期的预测MW翻译产品从cPSAP (22.4 kd), cPFAS (15.6 kd),或cABHD12 (10.5 kd)。gydF4y2BadgydF4y2BarcORF翻译记者被转染293 t细胞,然后处理10µM MG132 2 h,或10µM氯喹4 h后收集细胞。条形图表示相对于GAPDH蛋白质含量的量化,也归一化的RNA (n。不重要)。gydF4y2BaegydF4y2BacircPFAS包含两个IRES-like五个一(AATTCA和AAGAAG),这些突变为中性的序列(mut1和mut2)。下游AUG密码子突变到中联科利(开始狗# 1和# 2),和非规范开始密码子在下游CUG AAGAAG五个一进一步突变为中联科利(开始狗# 3)。这些突变对蛋白的影响生产与西方墨点法测定使用类似的过程作为面板gydF4y2BacgydF4y2Ba,相对蛋白质变化由酒吧图表(n。不重要)。gydF4y2BafgydF4y2Baback-splicing记者rcPFAS co-transfected到293 t细胞的表达向量不同gydF4y2Ba反式gydF4y2Ba代理绑定到新发现的因素IRES-like元素。这些细胞被收集和分析使用相同的程序面板(gydF4y2BacgydF4y2Ba)。gydF4y2BaggydF4y2Ba突变的circRNA IRES-like六聚体AAGAAG (Mut2)与同一组中的gydF4y2Ba反式gydF4y2Ba行为因素,测量和滚动圆的生产翻译使用在面板(描述相同的实验条件下gydF4y2BafgydF4y2Ba)。gydF4y2Ba

自rcORFs可以生成蛋白质的翻译串联体与重复序列,它们可能会引起蛋白质包膜和聚合,常常会导致快速退化。衡量这些蛋白质的稳定性从rcORF翻译,我们把细胞短曝光MG132或氯喹,并发现两个circRNAs的翻译产品(circPSAP和circPFAS)被氯喹治疗增加了MG132但不同时控制蛋白GFP(图未受到影响。gydF4y2Ba5 dgydF4y2Ba)。这些发现表明一些滚动圆的翻译产品迅速退化细胞通过蛋白酶体通路,这符合观察circRNA-coded蛋白质丰富的细胞内普遍偏低(补充图。gydF4y2Ba5克ydF4y2Ba)。有趣的是,翻译产品circABHD12似乎相对稳定,尽管包含重复序列。gydF4y2Ba

我们下一个检查是否滚动圆内生circRNAs翻译确实是由新发现IRES-like短元素。circPFAS包含两个IRES-like五个一,我们做出了个人的六聚体突变在审视自己对circPFAS翻译(图的影响。gydF4y2Ba5 egydF4y2Ba(左)。突变在IRES-like六聚物(AAGAAG)大大降低circPFAS的翻译,而其它元素(AATTCA)上的突变没有影响,这表明AAGAAG六聚物是主要的翻译起始元素circPFAS(无花果。gydF4y2Ba5 egydF4y2Ba和补充图。gydF4y2Ba6摄氏度gydF4y2Ba)。有趣的是,跟踪观察的翻译产品即使变异IRES-like两大元素,这表明其他未知gydF4y2Ba独联体gydF4y2Ba元素也可以帮助促进circPFAS翻译。这个观察并不意外,因为我们使用一个强大的截止(浓缩z分数> 7)97年的识别IRES-like五个一,因此可能会错过一些元素活动较弱。我们进一步突变下游8月开始基码确认第二个8月是主要的翻译开始网站circPFAS,作为其突变显著降低转换效率(无花果。gydF4y2Ba5 egydF4y2Ba,对吧)。有趣的是,circRNA翻译是减少但不能完全废除了8月突变,突变和额外的附近在坐标系CUG网站可以进一步减少翻译(图。gydF4y2Ba5 egydF4y2Ba)。这个结果表明cap-independent翻译由IRES-like五个一还可以使用非规范起始密码子(例如,CUG),这与先前的报道是一致的gydF4y2Ba54gydF4y2Ba。gydF4y2Ba

我们下一个检查如果滚动圆的翻译内生circPFAS也可以影响gydF4y2Ba反式gydF4y2Ba行为因素,促进翻译circRNA记者(无花果。gydF4y2Ba3 d, egydF4y2Ba)。我们中的circPFAS PABPC1 hnRNP A1, hnRNP U,或在两个不同的细胞类型ELAVL1 (293 t和SH-SY5Y细胞),并发现所有的测试gydF4y2Ba反式gydF4y2Ba行为因素显著增加滚动圆翻译产品circPFAS(无花果。gydF4y2Ba5 fgydF4y2Ba和补充图。gydF4y2Ba6 dgydF4y2Ba)。这一观察表明,gydF4y2Ba反式gydF4y2Ba行为因素(图。gydF4y2Ba3gydF4y2Ba)也可能促进内源性circRNA滚动圆的翻译,翻译产品的单个circRNA可能会影响到多个gydF4y2Ba反式gydF4y2Ba因素。此外,突变的同源IRES-like元素(AAGAAG)降低了翻译PABPC1加强活动,hnRNP A1和ELAVL1 circPFAS,而hnRNP U的影响是独立于这个IRES-like元素(图。gydF4y2Ba5克gydF4y2Ba和补充图。gydF4y2Ba6 egydF4y2Ba)。这种差异可能是因为这些因素结合IRES-like六聚体不同的特异性和亲和力,或由于细微的差别在各种因素影响的机制circRNA翻译。gydF4y2Ba

讨论gydF4y2Ba

最近的一些研究表明,circRNAs可以作为模板指导蛋白质合成;然而,circRNA翻译的本质仍在辩论,因为其他研究未能发现重大协会circRNA多核糖体gydF4y2Ba4 gydF4y2Ba,gydF4y2Ba55gydF4y2Ba,gydF4y2Ba56gydF4y2Ba。此外,circRNA翻译的机制还不清楚。而circRNA cap-independent翻译通常需要一个病毒或内源性忿怒,我们已经表明,短元素包含m6A修改足以驱动circRNA翻译gydF4y2Ba13gydF4y2Ba。我们惊讶地发现,ires的要求很容易满足,和许多短序列六聚体(~ 2%)有能力驾驶cap-independent circRNAs的翻译。这一发现也符合早期报告体外合成circRNAs科扎克与突变序列仍然可以翻译gydF4y2Ba22gydF4y2Ba。结果,成千上万的细胞质circRNAs可能翻译,其中数百circRNA-coded肽被质谱证据支持。我们进一步发现很多RNA结合蛋白,特别是认识到这些IRES-like短元素和功能gydF4y2Ba反式gydF4y2Ba因素促进cap-independent翻译提供一个新的范例circRNA翻译机制。gydF4y2Ba

许多识别IRES-like短元素AU-rich序列类似规范聚腺苷酸化信号(AAUAAA),提高担心他们可能会导致circRNA乳沟其次是后续re-caping和聚腺苷酸化产生一个线性整个GFP的信使rna。这个问题被我们屏幕的设计缓解。丰富序列从绿色细胞,恢复我们纯化总RNA,用rt - pcr扩增与特定的引物(图插入地区。gydF4y2Ba1gydF4y2Ba)。因此,如果插入的序列导致乳沟和poly-adenylation,他们将不会恢复了rt - pcr,从而将耗尽(而不是丰富)在屏幕上。一直,我们不能捕获任何免费的5 '端附近GFP起始密码子使用5 '运动中。此外,规范应该导致RNA多聚腺苷酸信号乳沟AAUAAA图案的下游~ 20元,这将是启动后ATG密码子,因此会破坏一个功能性的ORF GFP。总的来说,完整的翻译产品的关注来自裂解circRNA 5帽和3聚尾巴是不可能的。gydF4y2Ba

我们还研究了IRES活动使用传统bicistronic记者和两个串联orf编码萤火虫Renilla荧光素酶gydF4y2Ba57gydF4y2Ba。两个已知的短ires从内源性基因(CCGGCGG Gtx公司,从OR4F17 UACUCCC)和短期IRES-like元素测试几乎没有,如果有的话,翻译活动直接cap-independent bicistronic向量(补充图。gydF4y2Ba7一个gydF4y2Ba),尽管他们都工作在circRNA记者(补充图。gydF4y2Ba7 bgydF4y2Ba)。唯一的例外是长IRES序列从Hsp70运行在这两个记者。可能原因的低灵敏度bicistronic记者是线性的mrna有较高的翻译背景比circRNAs空控制(~ 400倍高,补充图。gydF4y2Ba7 cgydF4y2Ba),从而减少其检测的灵敏度。规范bicistronic向量以前报道,持续产生高背景由于各种工件,包括神秘的推动者,神秘的拼接网站,核糖体分流,或重新启动gydF4y2Ba16gydF4y2Ba,gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba,gydF4y2Ba58gydF4y2Ba。因此,许多数据使用这样的一个系统受到挑战gydF4y2Ba17gydF4y2Ba,gydF4y2Ba18gydF4y2Ba。因为circRNAs没有免费5或3的结束,他们可能是一个更可靠的IRES系统未来的测试活动。gydF4y2Ba

大多数新的亚型的识别可翻译circRNAs代码重叠与规范基因产物,其中50%可以产生蛋白质串联体通过滚动圆的翻译。这一发现提出了一个有趣的问题关于他们的生物功能。因为这些circRNA-coded亚型与规范化宿主基因有很大的重叠,在circRNA-coded亚型可能作为竞争监管机构规范亚型或类似的功能在不同的亚细胞位置。蛋白质串联体从circRNAs翻译也可以作为支架组装大型复合体,或形成蛋白质聚合,对细胞有毒害作用。gydF4y2Ba

与线性mrna相比,相对较少的circRNAs据报道多核糖体gydF4y2Ba55gydF4y2Ba,gydF4y2Ba56gydF4y2Ba。此外,最小要求circRNAs cap-independent翻译和困难来检测circRNA-coded产品提出了一个有趣的悖论。虽然没有明确的解释,有几个因素可能有助于调和这种矛盾。首先,尽管大多数circRNAs有能力翻译,这并不一定意味着他们确实是翻译有效的体内产生稳定的蛋白质。一些产品从普遍circRNAs翻译可能不正确折叠,从而迅速退化。这个场景是在概念上类似于普遍发生在许多基因转录区域在两个方向上,大多数的转录产品退化,只有一小部分是稳定的和功能性的产品gydF4y2Ba59gydF4y2Ba,gydF4y2Ba60gydF4y2Ba。支持这一概念,我们发现短c端尾专门由circRNA编码序列在back-splice网站会导致快速蛋白质退化(补充图。gydF4y2Ba5 dgydF4y2Ba)。换句话说,蛋白质折叠和稳定性可能函数作为circRNA翻译的质量控制步骤。gydF4y2Ba

另一种可能性是,cap-independent翻译的起始circRNAs比线性mrna效率较低,但翻译伸长速率应该循环之间的可比性gydF4y2BavsgydF4y2Ba。线性rna。因此,大多数circRNAs的翻译可能是由monoribosomes而不是多核糖体,这就可以解释缺乏circRNAs polysome-associated rna。一致,滚圈记者circRNA翻译产生了更多的产品比相同的circRNA包含终止密码子(无花果。gydF4y2Ba2gydF4y2Bab和gydF4y2Ba2摄氏度gydF4y2Ba),后者需要重新启动在每一轮的翻译。circRNA-coded此外,我们观察到一个更大的部分肽从滚动圆的翻译分析的质谱数据集(无花果。gydF4y2Ba4 gydF4y2Bad和无花果。gydF4y2Ba4 bgydF4y2Ba),这表明产品滚动圆的翻译相对更加丰富。gydF4y2Ba

我们第一次确定了轧制圆翻译产品的几个细胞circRNAs使用质粒表达系统(图和验证它们。gydF4y2Ba5克ydF4y2Ba)。因为这样的蛋白质含有concatemeric重复,他们可能是错误折叠形成蛋白质总量与致病性属性。另一方面,错误折叠蛋白产品常常引起的蛋白质反应,导致蛋白质降解和细胞凋亡。我们认为的生物功能包含rcORFs circRNAs将是未来研究的一个重要课题。gydF4y2Ba

通过cap-independent途径广泛接受,翻译是在正常的生理条件下效率较低。然而,某些细胞应激条件下(如热应力)或在某些类型的细胞(如肿瘤细胞),规范化帽依赖翻译是抑制和cap-independent翻译可能变得更突出gydF4y2Ba61年gydF4y2Ba,gydF4y2Ba62年gydF4y2Ba。始终我们发现从circRNA GFP的翻译是在热休克条件下推广gydF4y2Ba13gydF4y2Ba,这表明circRNA-coded蛋白质可能诱导在这种情况下(或者在某些细胞规范翻译是抑制),这意味着潜在的角色circRNA-coded蛋白质在细胞应激反应和癌症进展。gydF4y2Ba

发现许多短IRES-like元素可以推动普及circRNA翻译也有深远影响:许多内部子在线性mrna可以通过丰富的翻译cap-independent方式IRES-like元素,特别是当帽依赖翻译是在压力条件下抑制。在符合这一假说,一些研究报道,各种“另类orf”或“非编码区域”可以翻译成小肽根据核糖体分析或提高质谱数据的分析gydF4y2Ba63年gydF4y2Ba,gydF4y2Ba64年gydF4y2Ba,gydF4y2Ba65年gydF4y2Ba,gydF4y2Ba66年gydF4y2Ba。这样cap-independent“另类翻译”可以作为一种新的机制类似于人类蛋白质组增加可变剪接的复杂性gydF4y2Ba50gydF4y2Ba。我们推测,一些产品的非规范翻译可能没有一个特定的函数,因为他们可能会迅速退化。类似于“普遍的转录”的基因组,丰富短IRES-like元素可能调解的“普遍的翻译”转录组生成“隐藏”蛋白质组gydF4y2Ba67年gydF4y2Ba。这将是有趣的发现这样的“暗物质”蛋白质组的系统地挖掘女士可用的数据,这可能是技术上困难(但生物学上重要的),因为这些标准肽的水平通常低于标准的蛋白质。gydF4y2Ba

方法gydF4y2Ba

质粒库建设和筛选gydF4y2Ba

以屏幕短元素的起始circRNA翻译,前面描述的pcircGFP记者gydF4y2Ba12gydF4y2Ba被修改以减少循环GFP的停止和启动密码子之间的序列。两个BsmBI限制性位点插入停止和启动密码子之间pcircGFP GFP的记者,叫pcircGFP-BsmBI。gydF4y2Ba

10 mer产生随机序列库,我们延长了监听底漆(ATTCCGTCTCAAGTAA (N10) ATCATGGAGACGCACTGTTTTTTTCAGTGCGTCTCCATGA)与大片段(内),减少由此产生的DNA与BsmBI BsmBI消化pcircGFP-BsmBI和结扎。结扎产品转化为ElectroMax DH-5α(表达载体),我们获得足够数量的gydF4y2Ba大肠杆菌gydF4y2Ba克隆实现~ 2倍覆盖所有可能的DNA decamers(总200万克隆)。生成的库是通过试剂盒提取质粒超级装备,和转染293 t细胞(每15厘米20µg /盘)通过使用lipofectamine 2000(表达载体)。覆盖整个decamer空间,完全10×15厘米的菜肴。gydF4y2Ba

转染后48 h,收集细胞流式细胞仪分选使用BD FACSAria II。选择汗衫,SSC-A vs FSC-A用于选择293 t细胞(不包括非常小和非常大的粒子)。两轮选择使用的汗衫是SSC-W vs FSC-H和FSC-W vs FSC-H。然后FITC-A vs FSC-A被用来选择GFP-positive细胞。circRNA记者插入短多聚腺苷酸和poly-G序列被用作屏幕的正面和负面的控制。总共1.22亿个细胞分类,我们收集了400万个细胞没有GFP荧光(负控制),1300万个细胞GFP荧光较低,500万个细胞中GFP荧光和050万个细胞GFP高。然后提取rna,通过rt - pcr和测序库生成。RNA-seq Hiseq 2500执行。gydF4y2Ba

细胞培养和转染gydF4y2Ba

293 t人类胚胎肾细胞系,SH-SY5Y神经母细胞瘤细胞系,海拉上皮细胞系在DMEM培养(高葡萄糖)中含10%胎牛血清(的边后卫,Hyclone)。瞬时转染质粒进入细胞,2μg mini-gene记者被转染到细胞中6板,使用lipofectamine 3000(英杰公司)根据制造商的指示。48小时后,为进一步分析收集的细胞RNA和蛋白质的水平。转染circRNAs进入细胞,200 ng rna转染到细胞在24-well板,使用lipofectamine 3000(英杰公司)根据制造商的指示。gydF4y2Ba

识别IRES-like丰富图案的元素gydF4y2Ba

2000万多个读取来自细胞有不同程度的GFP荧光,从每个细胞生成十序列分数。插入十序列恢复当侧翼序列的精确匹配mini-gene记者(24-nt上游序列和30-nt下游序列用于比较)。我们使用一个统计富集分析从decamer序列中提取丰富图案在绿色细胞恢复。短暂,每个插入十米级被附加扩展成14-mer 2-nt向量序列两端的允许情况下,IRES活动来源于序列重叠的向量。结果14-nt序列分解成六聚体重叠和六聚体出现不同的计算序列恢复与矮秆、荧光细胞gydF4y2BavsgydF4y2Ba。没有荧光。两个数据集之间的浓缩每一个六分的计算使用z检验。五个一得分大于7被定义为IRES-like元素,而小于7−被定义为枯竭的图案。由此产生的元素与CLUSTALW2保持一致gydF4y2Ba68年gydF4y2Ba产生共识图案,被Weblogo3绘制gydF4y2Ba69年gydF4y2Ba。gydF4y2Ba

circRNA数据集gydF4y2Ba

四个circRNA发布数据集(图。gydF4y2Ba2gydF4y2Ba)从circBase检索(gydF4y2Bahttp://circbase.org/gydF4y2Ba)。使用发表长篇circRNA数据集创建ribominus RNA-seq数据产生的核糖核酸酶R治疗rna的海拉细胞(BioProject基因库的数据库,加入PRJNA266072)。circRNAs被检测到CIRI2 v2.0.6包gydF4y2Ba70年gydF4y2BaGENCODE第二十七节注释gydF4y2Ba71年gydF4y2Ba。随后,选择长篇circRNAs没有内含子的分数,及其序列转换成床为下游分析格式文件。这些circRNAs的全长序列得到使用bedtools getfasta模块。gydF4y2Ba

半定量rt - PCR和实时PCRgydF4y2Ba

从转染细胞总rna分离试剂盒试剂(英杰公司)根据制造商的指示。总rna治疗(1μg) gDNA橡皮擦去除基因组DNA,然后用PrimeScript reverse-transcribed RT试剂盒与gDNA橡皮擦(豆类)使用低聚糖的混合物(dT)和随机六聚物引物(遵循制造商的指示)。然后,RT产品(1μl)被用作PCR扩增的模板(25周期放大)。减少潜在矛盾重复接触不同的凝胶,我们经常混合两种不同的rt - pcr反应的样品(GAPDH和GFP特定引物)在一起,运行在相同的凝胶(大小不同的两个产品,这样他们可以清楚地分开)。PCR产品10%聚丙烯酰胺凝胶电泳分离(页面)凝胶染色SYBR绿色我(热科学)和扫描使用ChemiDoc触摸图像系统(BioRad)。gydF4y2Ba

核糖核酸酶R治疗gydF4y2Ba

核实环状RNA的表达,治疗总RNA核糖核酸酶R .总RNA在95°C加热5分钟,变性核糖核酸(RNA可能是部分成碎片在热处理),然后立即放在冰2分钟,随后10μg变性与核糖核酸酶RNA治疗R (10 U)在37°C(震中)15分钟和15分钟42°C。然后样本分析了北方污点或储存在−80°C。gydF4y2Ba

北部的污点gydF4y2Ba

与2 x RNA RNA样本混合加载缓冲区,在65°C和加热5分钟。样本1%甲醛琼脂糖凝胶分离,然后转移到尼龙膜(Millippore)通过使用Trans-Blot 15 V为60分钟gydF4y2Ba®gydF4y2BaSD半干转移细胞(BioRad)。然后rna被紫外线交联剂与尼龙膜UV-crosslinked(德国耶拿分析仪器公司)120000 microjoules的能源。DIG-labeled RNA探针(探针序列在补充数据gydF4y2Ba1克ydF4y2Ba通过体外转录)生成,混合目标RNA在68°C的夜晚。这些墨迹是可视化挖掘北方starter kit(罗氏)根据制造商的指示。gydF4y2Ba

免疫印迹gydF4y2Ba

细胞细胞溶解与蛋白酶抑制剂鸡尾酒里帕缓冲区(罗氏)和总细胞溶解产物与4 - 20%解决ExpressPlus™页面凝胶(GeneScript)。以下使用抗体:GFP抗体(Clontech: 632381)是由1:20 00稀释;V5抗体(CST: 13202年代)稀释1:20 00;标记抗体(σ:F1804-1MG)稀释了1:20 00;GAPDH抗体(Proteintech:合- 60004)由1:1稀释。HRP-linked二级抗体(CST: 7076年代)1:20 00稀释使用,这些墨迹可视化与ECL试剂(Bio-Rad)。gydF4y2Ba

双荧光素酶检测gydF4y2Ba

记者们被转染293 t细胞在24-well板(200 ng圆形记者和50 ng参考记者/)。在转染后48小时,收集细胞和细胞溶解被动裂解缓冲。Dual-luciferase记者分析系统(Promega)是用于生成发光信号(以下制造商的指令),发光是衡量Bio-Tek协同H1。gydF4y2Ba

的识别gydF4y2Ba反式gydF4y2Ba因素与RNA亲和纯化gydF4y2Ba

RNA亲和纯化方法采用从前面描述的协议gydF4y2Ba23gydF4y2Ba。为每个biotin-labeled RNA样本,约2.5×10gydF4y2Ba8gydF4y2Ba海拉细胞收集和resuspended 2.5毫升冰冷的再悬浮缓冲(50毫米Tris-HCl pH值8.0,150毫米氯化钠)。细胞混合2.5毫升2 x裂解缓冲(50毫米Tris-HCl pH值8.0,150毫米氯化钠,南15毫米gydF4y2Ba3gydF4y2Ba1% (V / V) NP-40 2毫米德勤,PMSF 2毫米,2 x蛋白酶抑制剂混合5分钟)和细胞溶解,然后离心,享年12000岁gydF4y2BaggydF4y2Ba在4°C为20分钟。然后用两个18个原子间距器0.75 nmol生物素化的RNA (Dharmacon)被添加到上层清液和孵化2小时在4°C。接下来,50μl Streptavidin-agarose珠子(热费希尔)被添加到混合和孵化2小时在4°C缓慢旋转。珠子被洗3次使用4毫升裂解缓冲(50毫米Tris-HCl pH值8.0,150毫米氯化钠,南15毫米gydF4y2Ba3gydF4y2Ba德勤0.5% NP-40 1毫米,1毫米PMSF, 1 x蛋白酶抑制剂混合),在40μl resuspended最后体积,与40μl 2 x SDS混合加载缓冲区。4 - 20%的蛋白质被分离ExpressPlus™页面凝胶(GeneScript)和沾coomassie蓝色。的凝胶在3%醋酸进一步进行质谱分析。感兴趣的乐队,其中包含的候选人gydF4y2Ba反式gydF4y2Ba因素被质谱仪削减和分析。gydF4y2Ba

体外circRNA合成gydF4y2Ba

circRNAs是生成通过self-splicing组以前的报告中描述我基因内区gydF4y2Ba27gydF4y2Ba。一般来说,线性的体外转录rna合成线性化使用RiboMAX DNA模板gydF4y2BaTMgydF4y2Ba大规模生产System-T7 RNA (Promega)。DNA模板通过DNaseI消化处理后15分钟(在37°C)体外转录。然后,RNA是由RNA清理净化装备(Zymo)。通知RNA,它被加热到70°C 5分钟,然后立即放在冰3分钟,然后孵化反应缓冲区(Tris-HCl 2毫米三磷酸鸟苷,50毫米,10毫米MgClgydF4y2Ba2gydF4y2Ba1毫米德勤,pH值7.5)55°C,持续15分钟。环化后,净化了RNA RNA清理工具(Zymo)和治疗由核糖核酸酶R在37°C(20分钟)。最后,circRNAs纯化了日本岛津公司LC-20系列高效液相色谱使用7.8×300毫米大小,排除列粒径为3.5µm和孔隙大小为450(水域;零件号:186007643)。gydF4y2Ba

平均六聚体频率gydF4y2Ba

我们分析了每种类型的五个一的发行版使用的平均六聚体的频率,这被定义为平均每个六聚物发生某些六聚体设置在不同的文本区域。使用滑动窗口将每种类型的记录为六聚体重叠(5-nt重叠),和每个六聚体的频率计算的数量的次数除以总数量的所有五个一成绩单(mRNA或circRNA)。六聚体的平均频率的平均值六聚体六聚体在每种类型的频率(例如,IRES-like五个一,贫五个一,六聚体或所有)。gydF4y2Ba

识别circRNA-coded蛋白质gydF4y2Ba

所有潜在的orf(即有义链的三个阅读框)circRNAs编码的预测。首先,每个circRNA序列来生成一个串联体序列重复了四次。其次,NTG起始密码子(non-ATG开始在IRES-mediated翻译很常见)和TAA /标签/ TGA终止密码子在每个串联体序列测定。第三,每一帧包含≥20 aa circORF分类。circORF如果没有终止密码子,这羊痘疮是预测蛋白质生成无限产品通过滚动圆翻译定义为滚动圆ORF (rcORF)。gydF4y2Ba

使用一个开放的搜索引擎,pFind (v3.1.3,默认搜索,不能盲目的修改)gydF4y2Ba72年gydF4y2Ba,我们搜查了两次发表人类全面的蛋白质组数据集(22909431光谱)gydF4y2Ba42gydF4y2Ba,gydF4y2Ba43gydF4y2Ba对联合数据库包含所有UniProt人类蛋白质(174392)和潜在circRNA-coded肽(177907)back-splice路口对面三个框架。的收集circRNAs circBase结合全身circRNAs的数据集gydF4y2Ba20.gydF4y2Ba,gydF4y2Ba33gydF4y2Ba。我们选择积极的质谱在back-splice结使用阈值:q < 0.01(频谱级别),肽长度≥8的新序列至少2节aa back-splice结的两侧,错过了乳沟网站≤3,只允许共同修改(蛋氨酸、半胱氨酸carbamidomethylation,氧化蛋白质氨基乙酰化作用,pyro-glutamate形成谷氨酰胺,磷酸化丝氨酸,苏氨酸,和酪氨酸残基)。gydF4y2Ba

一系列的过滤器是用来清除肽可能从已知的蛋白质。(我)我们组合一个数据库包含所有UniProt人类蛋白质和潜在circRNA-coded肽从所有三个框架,和搜索两个综合人类蛋白质组数据集对综合数据库。光谱映射到已知的人类蛋白质UniProt被移除。(2)对于映射到circRNA-coded肽的剩下的光谱,我们使用Blastp 2.6.0 +进一步去除同系物已知蛋白质的肽(允许两个不匹配)在人类蛋白质数据库冗余。(3)我们终于用严格的截止选择积极circRNA-coded肽的光谱分解成碎片离子back-splice结的双方。gydF4y2Ba

控制多肽由相应的线性编码mrna,我们选择了5′和3′接头连接毗邻back-splicing所有circRNAs的连接,并使用相同的管道和截止搜索相同MS-MS肽编码的数据集邻接头连接。由此产生的质谱肽在支持规范化拼接连接毗邻circRNAs进行了进一步的分析。gydF4y2Ba

蛋白质相互作用网络分析gydF4y2Ba

预测protentional circRNA-coded蛋白质的功能,我们选择宿主基因,包括可翻译circRNAs(即circRNAs包含确定back-splice junction-coded肽在质谱仪数据)进行进一步分析。这些宿主基因分为两类基于circORF大小:与有限circORF养鱼槽,滚动圆与无限circORF ORF (rcORF)。分析蛋白质相互作用网络,我们搜索字符串8宿主基因的两个类别的参数高信心,考虑所有的证据和丢弃断开连接的节点进行交互。由此产生的网络集群使用MCODE工具(v1.6.1) Cytoscape (v3.8.0)。每个集群的功能是使用大卫基因本体论注释工具。gydF4y2Ba

位置分布IRES-like五个一mrna的不同地区gydF4y2Ba

分析短IRES-like元素的分布mrna(起始密码子和终止密码子附近),我们选择邻近地区(±300核苷酸)带注释的起始密码子和终止密码子编码蛋白质的成绩单(RefGene hg19)。然后,滑动窗口的6-nt步长一个核苷酸从5′,3′端采用的所有记录。在每个窗口中,六聚体频率计算的总出现五个一组(六聚体富集或贫化五个一)在所有序列除以总数量的五个一在这些序列。gydF4y2Ba

相关分析18 s rRNA区域和六聚体识别gydF4y2Ba

据报道短序列函数ires的配对与某些地区18 s rRNA(例如“活动区”)。测试是否IRES-like五个一18 s rRNA活跃区是相似的,我们检查了18 s rRNA区域之间的相关性(活跃的区域,不活跃的区域)和六聚体识别(六聚体丰富和六聚体耗尽)。七聚物(gydF4y2BapgydF4y2Ba值< 0.05)18 s rRNA活跃区和不活跃的区域提取数据集出版gydF4y2Ba19gydF4y2Ba,每七聚物是分成两个五个一。六聚体的分布被浓缩在补充数据计算gydF4y2Ba2gydF4y2Ba。gydF4y2Ba

统计和再现性gydF4y2Ba

所有独立实验重复三次。同一批次的样本来自相同的实验和凝胶/印迹是并行处理。误差棒表示平均数±标准差。gydF4y2BaPgydF4y2Ba值与双边学生的计算gydF4y2BatgydF4y2Ba测试。gydF4y2Ba

报告总结gydF4y2Ba

进一步研究信息设计是可用的gydF4y2Ba自然研究报告摘要gydF4y2Ba与这篇文章有关。gydF4y2Ba