microRNA | microRNA网络资源
王秀英 (mary at labome dot com)
美国新泽西州普林斯顿合原研究有限责任公司 (Synatom Research)
译者
潘海建
上海交通大学农业与生物学院食品科学与工程系
DOI
http://dx.doi.org/10.13070/mm.cn.2.131
日期
更新 : 2015-02-17; 原始版 : 2012-10-20
引用
实验材料和方法 2012;2:131
摘要

一个microRNA研究网络资源中心,包括microRNA数据库、microRNA预测及microRNA靶点预测、microRNA表达谱和microRNA功能。

英文摘要

A central web resource for microRNA research, including microRNA databases, microRNA prediction and microRNA target prediction tools, microRNA expression profiling, functions

microRNA数据库
miRBase

miRBase (www.mirbase.org) 序列数据库是一个提供包括已发表的miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一 [1] 。miRBase提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的miRNA和靶标信息。miRBase设在英国曼彻斯特大学生命科学学院, 由英国研究理事会资助, 前期由威康信托基金会桑格研究所资助。

截止2015年2月,目前的版本是第二十一版(发布于2014年6月)。这个版本包含了223个物种中28645条发夹结构前体miRNA,可表达35828条成熟的miRNA。该数据库得到积极维护和实时更新。

miRBase也是 RNAcentral的专家数据库之一 [2] 。

PMRD/PNRD

PMRD: 植物microRNA数据库。 2014年11月的更新版本被称为PMRD (植物非编码RNA数据库)。

PMRD (bioinformatics.cau.edu.cn/PMRD/)是一个植物microRNA的专业数据库。它包含microRNA序列及其靶基因、二级结构、表达谱、基因组浏览器等,致力于将植物microRNA序列信息整合起来 [3] 。截止2012年10月20日,它包含了超过130个植物品种,包括水稻,番茄,棉花,大豆,花生和拟南芥(Arabidopsis thaliana)。来自中国北京中国农业大学。

2014年11月的更新版本被称为PNRD(植物非编码RNA数据库) [4], 拓展到不仅包含miRNA也包含其他非编码RNA。它包含了150种植物中的11种非编码RNA共25739条,有拟南芥(Arabidopsis thaliana)的1581条miRNA、2579条lncRNA、23条tasiRNA和1432条其他RNA,水稻(Oryza sativa)的2819条miRNA、752条lncRNA、9条tasiRNA和1313条其他RNA,以及杨树(Populus trichocarpa)的2944条miRNA 和538条lncRNA [4] 。

miRWalk 2.0: microRNA靶基因数据库

miRWalk (www.ma.uni-heidelberg.de/apps/zmf/mirwalk/)是一个综合性数据库,提供人类、小鼠和大鼠的miRNA的预测和验证的靶基因以及预测的靶基因结合位点的信息 [5, 6] 。来自德国Ruprecht-Karls-Universität Heidelberg, Medizinische Fakultät Mannheim。

验证靶点:在2014年9月做了更新,该更新基于7000多篇文献,包含了2044条人、小鼠、大鼠的miRNA,以及这些miRNA与3821个基因、375个信号通路、549种疾病、468个器官、74个细胞系和2033个孟德尔遗传疾病相关的67598种相互作用关系。

预测的目标数据库是根据12个microRNA靶标预测软件来建立的:DIANA-microTv4.0, DIANA-microT-CDS, miRanda-rel2010, mirBridge, miRDB4.0, miRmap, miRNAMap, doRiNA, PicTar2, PITA, RNA22v2, RNAhybrid2.1和Targetscan6.2。这一模块是基于miRBase第二十版。

doRiNA 2.0

doRiNA是一个在转录后水平RNA相互作用的数据库 [7, 8] 。 "在动物中,RNA结合蛋白 (RBPs)和小RNA(miRNAs)实际上可以在转录后水平通过结合RNA调控几乎所有基因。实验和计算机方法中的最新进展实现了对这些相互作用通路的绘制。RNA结合蛋白和小RNA在靶mRNA的协调作用形成了转录后调控的密码。我们提供了一个支持解开这一调控密码的数据库。在doRiNA中,我们系统性的整理储存和整合了RNA结合蛋白和小RNA的结合位点数据。用户可以免费查看靶点(mRNA)或调控元件(RNA结合蛋白和/或小RNA)。我们植入了一个复杂搜索快速条目反应的数据库架构(比如要求搜索某一特定调控子的所有靶点)。由于我们的数据库是与UCSC基因组浏览器的本地拷贝直接链接的,所有的搜索结果都能够结合其他基因组水平数据库筛选被浏览、检查和分析。截止写文章的时刻, doRiNA 包含了人、小鼠和蠕虫的RNA结合蛋白数据。我们还提供了PicTar预测软解用于计算机miRNA靶位点的预测分析。"

DIANA-TarBase v7.0

TarBase数据库人工搜集了实验验证过的miRNA的靶基因,包括在人、小鼠、果蝇、蠕虫和斑马鱼中的miRNA的靶基因,并区分出这些miRNA靶基因中的阳性和阴性的结果 [9] 。TarBase 7.0版本包含50多万条miRNA:从发表文章中收集的24个物种356种不同细胞的基因相互作用 [10] 。 来自希腊色萨利大学。

拟南芥小RNA数据库

拟南芥的小RNA数据库(mpss.udel.edu/at_sbs/)包括拟南芥小RNA相关的信息以及其它小RNA元件 [11] 。最新版本于2013年6月13日发布。

InsecTar: 昆虫microRNA靶基因数据库

InsecTar (insectar.sanbi.ac.za/index.html)维护了一个包含三种可导致疾病的microRNA数据库:Anopheles gambiae(疟疾,有65个miRNA), 埃及伊蚊(登革热,黄热病等疾病,超过100个miRNA基因), 冈比亚按蚊 致倦库蚊(许多人类和野生动物疾病,包括西尼罗河病毒,裂谷热和圣路易斯脑炎,有超过90个miRNA基因)。此外,还包括这些miRNA的预测靶基因。由南非国家生物信息学研究所提供。

miRGen

miRGen (diana.cslab.ece.ntua.gr/mirgen/index.php?r=mirgen/downloads) 是一个整合型数据库,包括:(i)动物miRNA和基因组元件之间的位置关系;(ii)通过结合广泛使用的靶基因预测程序得到动物miRNA靶基因 [12] 。该课题组的研究员也提供TarBase和microT。最近的能批量下载数据是在2009年。

STarMirDB

STarMirDB来自纽约州的沃兹沃思(Wadsworth),包含microRNA结合位点的集合、预测的STarMir 算法(见下面) [13] 。此外,还有一些由精确CLIP数据支持的预测。

Vir-Mir:

Vir-Mir (alk.ibms.sinica.edu.tw/cgi-bin/miRNA/miRNA.cgi) 数据库包含了一些预测的病毒miRNA发卡结构 [14] 。 台湾台北中央研究院生物医学科学研究所。该网站似乎最后更新于2007年。

Vita

ViTa (vita.mbc.nctu.edu.tw) ViTa数据库搜集来自miRBase、ICTV、VirGne、VBRC等数据库的病毒数据,包括了已知的病毒的miRNA以及相应的由miRanda和TargetScan预测的宿主miRNA靶基因 [15] 。 ViTa还提供有效的注释,包括人类miRNA的表达情况,病毒感染的组织等。台湾新竹国立交通大学生物信息学研究所。该网站似乎最后更新于2007年。

miRGator 3.0

miRGator (http://mirgator.kobic.re.kr/) miRGator数据库是miRNA功能阐述的指导数据库 [16, 17] 。 功能分析和表达谱与靶基因预测相结合来推断miRNA功能。3.0版本包含73个GEO、SRA和TCGA的人类深度测序数据集,以及41亿短的读长和25亿线性读长。来自韩国首尔梨花女子大学。

PolymiRTA 3.0: microRNA靶位点多态性

PolymiRTS 位于美国田纳西健康科学中心大学,是一个涵盖预测和验证的miRNA结合位点的DNA片段自然突变的数据库 [18] 。 这些数据可被搜索或者下载。

TransmiR

TransmiR (cmbi.bjmu.edu.cn/transmir) TransmiR 是一个转录因子对microRNA进行转录水平调控的数据库 [19] 。 来自中国北京大学。最新版本1.2, 更新于2013年1月30日,包含735条序列,其中包括从268篇文献摘录的201个转录因子和16个物种。

miR2Disease

miR2Disease (www.mir2disease.org) 数据库对microRNA与疾病关系进行了整理汇总 [20] 。 它是一个人工收集的与人类疾病相关microRNA信息的数据库。来自中国哈尔冰工业大学。该数据库最后更新于2011年3月14日,包含349个miRNA、163种疾病和3273个条目。

CoGeMiR: microRNA比较基因组分析

CoGeMiR (cogemir.tigem.it/) CoGeMiR 对不同物种进化中microRNA的保守性提供了视角 [21] 。 该数据库对已知和预测的microRNA的基因组位置、保守性和表达数据进行了汇总。来自意大利那不勒斯基因医学研究所。最新发布是在2008年6月。在评估之日,该网站不能做任何操作。

S-MED: 肿瘤- microRNA 表达数据库

S-MED (www.oncomir.umn.edu/SMED/index.php) 是一个集合人类不同肿瘤和选择的正常组织中microRNA表达的数据库。来自美国密尼苏达大学。

其他
  • ChIPBase: 通过ChIP-Seq数据解码长的非编码RNA和小RNA基因的数据库 [22] 。
  • miRCancer: 通过文献发掘整理的microRNA-癌症关系的数据库 [23] 。
  • YM500: 一个小RNA测序(smRNA-seq) 数据,用于microRNA查找 [24] 。
  • HMDD v2.0: 实验支持的人类microRNA与疾病关联的数据库 [25] 。
  • starBase v2.0: 从大尺度CLIP-Seq数据解码miRNA-ceRNA, miRNA-ncRNA以及蛋白质–RNA 相互作用网络的数据库 [26] 。
  • PMTED: 植物microRNA靶点表达数据库 [27] 。
  • PASmiR: 一个文献整理的植物对非生物压力反应中miRNA分子调控的数据库 [28] 。
  • OncomiRDB: 实验验证的致肿瘤性和肿瘤抑制microRNA数据库 [29] 。
microRNA靶点预测软件
miRSystem

miRSystem 整合了其他的预测软件: DIANA, miRanda, miRBridge, PicTar, PITA, rna22和TargetScan,包含TarBase和miRecords的验证数据 [30] 。 该数据库仅支持人类和小鼠的数据。最新版本发布于2014年5月。

STarMir

STarMir来自纽约州的沃兹沃思(Wadsworth)的软件程序 [31], 该软件程序是根据CLIP数据的序列,热力学和目标结构特点而建立的 [13] 。

miRDB

miRDB (mirdb.org/miRDB/)是一个在线的microRNA靶标预测数据库。所有的预测目标都是采用SVM的MirTarget2分析数以千计的miRNA与靶标相互作用的预测的 [32] 。 当前版本是5.0, 发布于2014年8月,基于miRBase 21版本和MirTarget V3版本,包含6709条来自人、小鼠、大鼠、狗和鸡的microRNA,共2,105,008个预测的靶位点。所有数据都可以下载下来。

TargetScan

TargetScan (www.targetscan.org/) 是通过搜索与miRNA特定区域匹配的保守8碱基和7碱基位点来预测靶基因的 [33] 。 来自美国Whitehead生物医学研究所信息和研究计算中心。最新版本是6.2,于2012年6月发布。主网页是哺乳动物靶标预测。在主页上有鼠,线虫,果蝇,斑马鱼有不同的搜索页的链接。

PICTAR

PicTar (www.pictar.org/)是一种对microRNA的目标基因进行鉴定的一种算法 [34] 。 这个可搜索的网站涵盖脊椎动物,7种果蝇,3种线虫。 另外针对那些非进化保守, 但共表达(即微RNA和mRNA表达于同一组织)的人的基因进行预测。 来自于纽约大学的中心比较功能基因组学和德国柏林马克斯·德尔布吕克中枢的Rajewsky实验室。

Diana-microT

Diana-microT目前在其第5版 [35] 。 该网站显示它拥有“同类程序中最灵敏的特异性”。“它提供了一些网上服务器如IHOP的超链接,以及选择的microRNA在组织和细胞系中的表达数据”。该数据库也可以连接到KEGG。可以下载完整的预测人类和小鼠靶点数据集。最新的版本发布于2012年7月。

RNA22

RNA22 [36, 37] 可在 美国托马斯杰斐逊大学计算医学中心获得。

RNA22 (cbcsrv.watson.ibm.com/rna22.html) 最早是从IBM沃森计算生物中心分离出去的。截止2012年10月20日,该网站可能已经不能使用了。

TripletSVM

TripletSVM (bioinfo.au.tsinghua.edu.cn/mirnasvm/)是一个预测一个具有发夹结构的序列是否为真正的miRNA前体物的程序 [38] 。该程序擅长识别一组真正的miRNA前体(miRNA precursor)的三元特点和一组原miRNA发卡结构(pseudo-miRNA hairpin)。来自中国北京清华大学。该程序可免费下载。

miRanda - microRNA.org

miRanda 是 microRNA.org (www.microrna.org/)的一部分。 miRanda数据库提供了关于人类、果蝇和斑马鱼基因组的microRNA靶目标的预测信息以及miRNA在不同组织的表达谱 [39] 。 来自美国Memorial Sloan - Kettering癌症中心(MSKCC计算生物学中心)。该网站最后更新于2010年8月。

RNAhybrid

RNAhybrid (bibiserv.techfak.uni-bielefeld.de/rnahybrid/)是一种用于寻找一条长链RNA和一条短链RNA的最小配对自由能的工具 [40] 。通过一种域码实现,即一条短链序列往往结合到长链的最适位置上。这一工具可以作为microRNA靶点预测的软件。来自德国Bielefeld大学。

PITA

PITA (genie.weizmann.ac.il/pubs/mir07/mir07_prediction.html) 是一个靶点预测平台 [41] 。最新的预测microRNA靶点基于miRBase第11版,在2008年8月31日发布。

用户可以将非编码器(UTR)的序列输入进网站表格中搜索预测的靶点,或者下载可执行版本离线使用。

其他的microRNA相关软件
DIANA-mirExTra

DIANA-mirExTra 亚历山大·弗莱明B.S.R.C.戴安娜实验室。该算法比较两个样板的mRNA基因谱,一个改变的和一个不变的,并设法鉴定在3'非翻译区的六聚物,它们在改变的基因列表中有统计学意义 [42] 。miRNA的进化可以通过这些六聚物作出鉴定。另一种使用基于miRNA的靶标预测分数来代替六聚体频率的方法也可以被使用。

WMD3: Web MicroRNA Designer

WMD3 (wmd3.weigelworld.org) 设计人工microRNA (amiRNAs) [43, 44] 。 21聚体的amiRNA21mers能够特异沉默90多种植物中单个或多个目的基因。来自德国蒂宾根马克斯普朗克研究所发育生物学。最后更新于2009年。

参考文献
  1. Kozomara A, Griffiths-Jones S. miRBase: annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Res. 2014;42:D68-73 pubmed publisher
  2. RNAcentral: an international database of ncRNA sequences. Nucleic Acids Res. 2015;43:D123-9 pubmed publisher
  3. Zhang Z, Yu J, Li D, Zhang Z, Liu F, Zhou X, et al. PMRD: plant microRNA database. Nucleic Acids Res. 2010;38:D806-13 pubmed publisher
  4. Yi X, Zhang Z, Ling Y, Xu W, Su Z. PNRD: a plant non-coding RNA database. Nucleic Acids Res. 2015;43:D982-9 pubmed publisher
  5. Dweep H, Sticht C, Pandey P, Gretz N. miRWalk--database: prediction of possible miRNA binding sites by "walking" the genes of three genomes. J Biomed Inform. 2011;44:839-47 pubmed publisher
  6. Dweep H, Gretz N, Sticht C. miRWalk database for miRNA-target interactions. Methods Mol Biol. 2014;1182:289-305 pubmed publisher
  7. Anders G, Mackowiak S, Jens M, Maaskola J, Kuntzagk A, Rajewsky N, et al. doRiNA: a database of RNA interactions in post-transcriptional regulation. Nucleic Acids Res. 2012;40:D180-6 pubmed publisher
  8. Blin K, Dieterich C, Wurmus R, Rajewsky N, Landthaler M, Akalin A. DoRiNA 2.0--upgrading the doRiNA database of RNA interactions in post-transcriptional regulation. Nucleic Acids Res. 2015;43:D160-7 pubmed publisher
  9. Vergoulis T, Vlachos I, Alexiou P, Georgakilas G, Maragkakis M, Reczko M, et al. TarBase 6.0: capturing the exponential growth of miRNA targets with experimental support. Nucleic Acids Res. 2012;40:D222-9 pubmed publisher
  10. Vlachos I, Paraskevopoulou M, Karagkouni D, Georgakilas G, Vergoulis T, Kanellos I, et al. DIANA-TarBase v7.0: indexing more than half a million experimentally supported miRNA:mRNA interactions. Nucleic Acids Res. 2015;43:D153-9 pubmed publisher
  11. German M, Pillay M, Jeong D, Hetawal A, Luo S, Janardhanan P, et al. Global identification of microRNA-target RNA pairs by parallel analysis of RNA ends. Nat Biotechnol. 2008;26:941-6 pubmed publisher
  12. Alexiou P, Vergoulis T, Gleditzsch M, Prekas G, Dalamagas T, Megraw M, et al. miRGen 2.0: a database of microRNA genomic information and regulation. Nucleic Acids Res. 2010;38:D137-41 pubmed publisher
  13. Liu C, Mallick B, Long D, Rennie W, Wolenc A, Carmack C, et al. CLIP-based prediction of mammalian microRNA binding sites. Nucleic Acids Res. 2013;41:e138 pubmed publisher
  14. Li S, Shiau C, Lin W. Vir-Mir db: prediction of viral microRNA candidate hairpins. Nucleic Acids Res. 2008;36:D184-9 pubmed
  15. Hsu P, Lin L, Hsu S, Hsu J, Huang H. ViTa: prediction of host microRNAs targets on viruses. Nucleic Acids Res. 2007;35:D381-5 pubmed
  16. Nam S, Kim B, Shin S, Lee S. miRGator: an integrated system for functional annotation of microRNAs. Nucleic Acids Res. 2008;36:D159-64 pubmed
  17. Cho S, Jang I, Jun Y, Yoon S, Ko M, Kwon Y, et al. MiRGator v3.0: a microRNA portal for deep sequencing, expression profiling and mRNA targeting. Nucleic Acids Res. 2013;41:D252-7 pubmed publisher
  18. Bhattacharya A, Ziebarth J, Cui Y. PolymiRTS Database 3.0: linking polymorphisms in microRNAs and their target sites with human diseases and biological pathways. Nucleic Acids Res. 2014;42:D86-91 pubmed publisher
  19. Wang J, Lu M, Qiu C, Cui Q. TransmiR: a transcription factor-microRNA regulation database. Nucleic Acids Res. 2010;38:D119-22 pubmed publisher
  20. Jiang Q, Wang Y, Hao Y, Juan L, Teng M, Zhang X, et al. miR2Disease: a manually curated database for microRNA deregulation in human disease. Nucleic Acids Res. 2009;37:D98-104 pubmed publisher
  21. Maselli V, di Bernardo D, Banfi S. CoGemiR: a comparative genomics microRNA database. BMC Genomics. 2008;9:457 pubmed publisher
  22. Yang J, Li J, Jiang S, Zhou H, Qu L. ChIPBase: a database for decoding the transcriptional regulation of long non-coding RNA and microRNA genes from ChIP-Seq data. Nucleic Acids Res. 2013;41:D177-87 pubmed publisher
  23. Xie B, Ding Q, Han H, Wu D. miRCancer: a microRNA-cancer association database constructed by text mining on literature. Bioinformatics. 2013;29:638-44 pubmed publisher
  24. Cheng W, Chung I, Huang T, Chang S, Sun H, Tsai C, et al. YM500: a small RNA sequencing (smRNA-seq) database for microRNA research. Nucleic Acids Res. 2013;41:D285-94 pubmed publisher
  25. Li Y, Qiu C, Tu J, Geng B, Yang J, Jiang T, et al. HMDD v2.0: a database for experimentally supported human microRNA and disease associations. Nucleic Acids Res. 2014;42:D1070-4 pubmed publisher
  26. Li J, Liu S, Zhou H, Qu L, Yang J. starBase v2.0: decoding miRNA-ceRNA, miRNA-ncRNA and protein-RNA interaction networks from large-scale CLIP-Seq data. Nucleic Acids Res. 2014;42:D92-7 pubmed publisher
  27. Sun X, Dong B, Yin L, Zhang R, Du W, Liu D, et al. PMTED: a plant microRNA target expression database. BMC Bioinformatics. 2013;14:174 pubmed publisher
  28. Zhang S, Yue Y, Sheng L, Wu Y, Fan G, Li A, et al. PASmiR: a literature-curated database for miRNA molecular regulation in plant response to abiotic stress. BMC Plant Biol. 2013;13:33 pubmed publisher
  29. Wang D, Gu J, Wang T, Ding Z. OncomiRDB: a database for the experimentally verified oncogenic and tumor-suppressive microRNAs. Bioinformatics. 2014;30:2237-8 pubmed publisher
  30. Lu T, Lee C, Tsai M, Chiu Y, Hsiao C, Lai L, et al. miRSystem: an integrated system for characterizing enriched functions and pathways of microRNA targets. PLoS ONE. 2012;7:e42390 pubmed publisher
  31. Rennie W, Liu C, Carmack C, Wolenc A, Kanoria S, Lu J, et al. STarMir: a web server for prediction of microRNA binding sites. Nucleic Acids Res. 2014;42:W114-8 pubmed publisher
  32. Wang X, El Naqa I. Prediction of both conserved and nonconserved microRNA targets in animals. Bioinformatics. 2008;24:325-32 pubmed
  33. Garcia D, Baek D, Shin C, Bell G, Grimson A, Bartel D. Weak seed-pairing stability and high target-site abundance decrease the proficiency of lsy-6 and other microRNAs. Nat Struct Mol Biol. 2011;18:1139-46 pubmed publisher
  34. Chen K, Rajewsky N. Natural selection on human microRNA binding sites inferred from SNP data. Nat Genet. 2006;38:1452-6 pubmed
  35. Paraskevopoulou M, Georgakilas G, Kostoulas N, Vlachos I, Vergoulis T, Reczko M, et al. DIANA-microT web server v5.0: service integration into miRNA functional analysis workflows. Nucleic Acids Res. 2013;41:W169-73 pubmed publisher
  36. Miranda K, Huynh T, Tay Y, Ang Y, Tam W, Thomson A, et al. A pattern-based method for the identification of MicroRNA binding sites and their corresponding heteroduplexes. Cell. 2006;126:1203-17 pubmed
  37. Loher P, Rigoutsos I. Interactive exploration of RNA22 microRNA target predictions. Bioinformatics. 2012;28:3322-3 pubmed publisher
  38. Xue C, Li F, He T, Liu G, Li Y, Zhang X. Classification of real and pseudo microRNA precursors using local structure-sequence features and support vector machine. BMC Bioinformatics. 2005;6:310 pubmed
  39. Betel D, Koppal A, Agius P, Sander C, Leslie C. Comprehensive modeling of microRNA targets predicts functional non-conserved and non-canonical sites. Genome Biol. 2010;11:R90 pubmed publisher
  40. Rehmsmeier M, Steffen P, Hochsmann M, Giegerich R. Fast and effective prediction of microRNA/target duplexes. RNA. 2004;10:1507-17 pubmed
  41. Kertesz M, Iovino N, Unnerstall U, Gaul U, Segal E. The role of site accessibility in microRNA target recognition. Nat Genet. 2007;39:1278-84 pubmed
  42. Alexiou P, Maragkakis M, Papadopoulos G, Simmosis V, Zhang L, Hatzigeorgiou A. The DIANA-mirExTra web server: from gene expression data to microRNA function. PLoS ONE. 2010;5:e9171 pubmed publisher
  43. Schwab R, Ossowski S, Riester M, Warthmann N, Weigel D. Highly specific gene silencing by artificial microRNAs in Arabidopsis. Plant Cell. 2006;18:1121-33 pubmed
  44. Ossowski S, Schwab R, Weigel D. Gene silencing in plants using artificial microRNAs and other small RNAs. Plant J. 2008;53:674-90 pubmed publisher
ISSN : 2329-5147