LncRNA专题|ncRNA编码微肽数据库介绍

元莘生物 2024-07-04 11:00:37

引言

近年来的研究表明,部分长链非编码RNA(lncRNA)具有编码功能,可以转译出短的开放性阅读框(smORF)并生成功能性微肽(ncPeps),参与细胞信号传导、细胞周期调控和细胞凋亡等生命活动。本文介绍了几种常见的微肽数据库,包括cncRNAdb、FuncPEP v2.0、LncPep和ncEP等,为研究者提供了丰富的资源,以探索ncPeps在细胞生物过程和疾病中的功能及应用价值。

微肽

肽(peptide)是小分子的蛋白质,ncRNA可以编码蛋白质短肽(ncPeps);某些ncRNA可以编码少于100个氨基酸的短肽,编码这些肽的序列被称为小开放阅读框(smORF),其中许多以传统的AUG起始密码子开始,但以非典型终止密码子结束。ncPeps正逐渐成为一类新的功能分子,参与多种细胞活动过程,并在不同疾病的发病机制中表达失调。

LncRNA编码肽调控的途径

ncPeps数据库

ncPeps相关的数据库资源,有cncRNAdb、FuncPEP、LncPep、ncEP、PepTransDB、SmProt、sORFs.org、SPENCER和TransLnc等这些数据库可以为研究者提供详尽的ncPeps和相关ncRNAs的全面信息,研究者可以借助上述数据库探索ncPeps在细胞生物过程和疾病中的功能,以及挖掘特征性ncPeps的潜在应用价值。如下会简单介绍其中的FuncPEP v2.0、LnPep和ncEP、cncRNAdb。

(1)cncRNAdb

同时具有蛋白质编码和非编码功能的RNA被称为cncRNA(双功能RNA);cncRNAdb是一个有实验验证数据支持的cncRNA数据库。可以进行cncRNA功能条目的浏览和分析,当前版本的cncRNAdb记录了大约2600个人工整理的cncRNA功能条目,并有实验证据,涉及20多个物种的2000多个RNA(包括1300多个翻译的cncRNA和600多个未翻译的mRNA)。

cncRNAdb中cncRNA的分类。

(2)FuncPep v2.0

NcRNA编码的功能性短肽的数据库。

FuncPEP,一个功能性ncPep数据库,包含所有经过实验验证和功能表征的ncPep,目前FuncPEP包含112个功能性ncPep的全面注释以及编码这些肽的ncRNA转录本的具体信息。数据库搭建过程中,利用生物信息学工具和方法,对大量的ncRNA进行深入分析,从中识别出具有功能的短肽,此外,数据库还提供了丰富的注释信息,便于后续的查询和分析。

该数据库对疾病诊断和治疗具有一定意义,通过分析患者样本中的ncRNA短肽表达谱,可以发现与疾病相关的特异性标志物,为疾病的早期诊断和预后评估提供新的依据。此外,针对这些短肽的靶向药物研发也可能为疾病治疗带来新的突破。

Funcpeps数据库中的ncpeps功能概述

3)LncPep

作者使用了Coding Potential Assessment Tool(CPAT)、Coding Potential Calculator v2.0(CPC2)、N6 -甲基腺苷修饰RNA位点(m6A)、Pfam、核糖体分析(Ribo-seq)和翻译起始位点(TISs)6种证据,对39个物种的883,804个lncRNA的编码能力进行了评估。作者构建了lncRNA编码肽的综合数据库LncPep (http://www.shenglilabs.com/LncPep/)。

LncPep提供三个主要功能模块:

1)用户友好的搜索/浏览界面;

2)用于探索新型lncRNA和多肽的预测和BLAST模块;

3) lncRNA、多肽和支持证据的注释。

跨物种的lncRNA编码肽的综合数据库LncPep‍

(4)ncEP

ncEP数据库,该数据库收录了来自已发表文章的ncRNAs编码的低通量实验验证的蛋白短肽。总的来说,ncEP包含80个条目,包括74个蛋白质短肽,22个lncRNA,11个circRNA, 9个pri-miRNA和37个其他ncRNA,这些非编码RNA来自50多篇文章的2000多个候选项目,涉及18个物种。作者提供了一个用户友好的界面来搜索、浏览、可视化、下载和提交数据。ncEP可在http://www.jianglab.cn/ncEP/免费使用。

ncEP数据库中的拟南芥微肽注释

(5)CodLncScape

研究团队成功挖掘出353条低通量实验验证的coding lncRNA数据,确保了数据的高准确性和可靠性。这些高质量的数据不仅为coding lncRNA在癌症和精子发育中的潜在作用提供了新的视角,还为开发新的治疗策略和诊断技术奠定了基础。此外,作者还开发了基于图结构的预测模型、并比较预训练模型和大型语言模型在生物自然语言处理领域的性能。Coding lncRNA的转录本,开放阅读框以及多肽序列提供了大量经过验证的coding lncRNA数据及其功能注释,包括每个lncRNA翻译过程中涉及的转录本、smORF和多肽。涵盖了从知识库构建,生物学分析到临床诊断模型的构建及对大型语言模型的应用,为coding lncRNA的研究和实际应用开辟了新的路径。解析了泛癌研究中coding lncRNA的重要作用。进一步针对coding lncRNA的肿瘤分类、分型和分级,并探索了与精子生成相关的coding lncRNA。

参考文献

1) FuncPEP v2.0: An Updated Database of Functional Short Peptides Translated from Non-Coding RNAs

2) Liu T.Y., Qiao H.Y., and Wang Z.X. et al. CodLncScape Provides a Self-Enriching Framework for the Systematic Collection and Exploration of Coding LncRNAs. Advanced Science (2024).

3) Pei, Hailong, et al. "The Tumorigenic Effect of lncRNA AFAP1‐AS1 is Mediated by Translated Peptide ATMLP Under the Control of m6A Methylation." Advanced Science 10.13 (2023): 2300314.

4) Huang, Yan et al. “cncRNAdb: a manually curated resource of experimentally supported RNAs with both protein-coding and noncoding function.” Nucleic acids research vol. 49,D1 (2021): D65-D70. doi:10.1093/nar/gkaa791

0 阅读:2

元莘生物

简介:专注于分子生物学好和高性能计算在医学领域的应用