一个microRNA研究网络资源中心,包括microRNA数据库、microRNA预测及microRNA靶点预测、microRNA表达谱和microRNA功能。
A central web resource for microRNA research, including microRNA databases, microRNA prediction and microRNA target prediction tools, microRNA expression profiling, functions
miRBase (www.mirbase.org) 序列数据库是一个提供包括已发表的miRNA序列数据、注释、预测基因靶标等信息的全方位数据库,是存储miRNA信息最主要的公共数据库之一 [1] 。miRBase提供便捷的网上查询服务,允许用户使用关键词或序列在线搜索已知的miRNA和靶标信息。miRBase设在英国曼彻斯特大学生命科学学院, 由英国研究理事会资助, 前期由威康信托基金会桑格研究所资助。
截止2015年2月,目前的版本是第二十一版(发布于2014年6月)。这个版本包含了223个物种中28645条发夹结构前体miRNA,可表达35828条成熟的miRNA。该数据库得到积极维护和实时更新。
miRBase也是 RNAcentral的专家数据库之一 [2] 。
PMRD: 植物microRNA数据库。 2014年11月的更新版本被称为PMRD (植物非编码RNA数据库)。
PMRD (bioinformatics.cau.edu.cn/PMRD/)是一个植物microRNA的专业数据库。它包含microRNA序列及其靶基因、二级结构、表达谱、基因组浏览器等,致力于将植物microRNA序列信息整合起来 [3] 。截止2012年10月20日,它包含了超过130个植物品种,包括水稻,番茄,棉花,大豆,花生和拟南芥(Arabidopsis thaliana)。来自中国北京中国农业大学。
2014年11月的更新版本被称为PNRD(植物非编码RNA数据库) [4], 拓展到不仅包含miRNA也包含其他非编码RNA。它包含了150种植物中的11种非编码RNA共25739条,有拟南芥(Arabidopsis thaliana)的1581条miRNA、2579条lncRNA、23条tasiRNA和1432条其他RNA,水稻(Oryza sativa)的2819条miRNA、752条lncRNA、9条tasiRNA和1313条其他RNA,以及杨树(Populus trichocarpa)的2944条miRNA 和538条lncRNA [4] 。
miRWalk (www.ma.uni-heidelberg.de/apps/zmf/mirwalk/)是一个综合性数据库,提供人类、小鼠和大鼠的miRNA的预测和验证的靶基因以及预测的靶基因结合位点的信息 [5, 6] 。来自德国Ruprecht-Karls-Universität Heidelberg, Medizinische Fakultät Mannheim。
验证靶点:在2014年9月做了更新,该更新基于7000多篇文献,包含了2044条人、小鼠、大鼠的miRNA,以及这些miRNA与3821个基因、375个信号通路、549种疾病、468个器官、74个细胞系和2033个孟德尔遗传疾病相关的67598种相互作用关系。
预测的目标数据库是根据12个microRNA靶标预测软件来建立的:DIANA-microTv4.0, DIANA-microT-CDS, miRanda-rel2010, mirBridge, miRDB4.0, miRmap, miRNAMap, doRiNA, PicTar2, PITA, RNA22v2, RNAhybrid2.1和Targetscan6.2。这一模块是基于miRBase第二十版。
doRiNA是一个在转录后水平RNA相互作用的数据库 [7, 8] 。 "在动物中,RNA结合蛋白 (RBPs)和小RNA(miRNAs)实际上可以在转录后水平通过结合RNA调控几乎所有基因。实验和计算机方法中的最新进展实现了对这些相互作用通路的绘制。RNA结合蛋白和小RNA在靶mRNA的协调作用形成了转录后调控的密码。我们提供了一个支持解开这一调控密码的数据库。在doRiNA中,我们系统性的整理储存和整合了RNA结合蛋白和小RNA的结合位点数据。用户可以免费查看靶点(mRNA)或调控元件(RNA结合蛋白和/或小RNA)。我们植入了一个复杂搜索快速条目反应的数据库架构(比如要求搜索某一特定调控子的所有靶点)。由于我们的数据库是与UCSC基因组浏览器的本地拷贝直接链接的,所有的搜索结果都能够结合其他基因组水平数据库筛选被浏览、检查和分析。截止写文章的时刻, doRiNA 包含了人、小鼠和蠕虫的RNA结合蛋白数据。我们还提供了PicTar预测软解用于计算机miRNA靶位点的预测分析。"
TarBase数据库人工搜集了实验验证过的miRNA的靶基因,包括在人、小鼠、果蝇、蠕虫和斑马鱼中的miRNA的靶基因,并区分出这些miRNA靶基因中的阳性和阴性的结果 [9] 。TarBase 7.0版本包含50多万条miRNA:从发表文章中收集的24个物种356种不同细胞的基因相互作用 [10] 。 来自希腊色萨利大学。
拟南芥的小RNA数据库(mpss.udel.edu/at_sbs/)包括拟南芥小RNA相关的信息以及其它小RNA元件 [11] 。最新版本于2013年6月13日发布。
InsecTar (insectar.sanbi.ac.za/index.html)维护了一个包含三种可导致疾病的microRNA数据库:Anopheles gambiae(疟疾,有65个miRNA), 埃及伊蚊(登革热,黄热病等疾病,超过100个miRNA基因), 冈比亚按蚊 致倦库蚊(许多人类和野生动物疾病,包括西尼罗河病毒,裂谷热和圣路易斯脑炎,有超过90个miRNA基因)。此外,还包括这些miRNA的预测靶基因。由南非国家生物信息学研究所提供。
miRGen (diana.cslab.ece.ntua.gr/mirgen/index.php?r=mirgen/downloads) 是一个整合型数据库,包括:(i)动物miRNA和基因组元件之间的位置关系;(ii)通过结合广泛使用的靶基因预测程序得到动物miRNA靶基因 [12] 。该课题组的研究员也提供TarBase和microT。最近的能批量下载数据是在2009年。
STarMirDB来自纽约州的沃兹沃思(Wadsworth),包含microRNA结合位点的集合、预测的STarMir 算法(见下面) [13] 。此外,还有一些由精确CLIP数据支持的预测。
Vir-Mir (alk.ibms.sinica.edu.tw/cgi-bin/miRNA/miRNA.cgi) 数据库包含了一些预测的病毒miRNA发卡结构 [14] 。 台湾台北中央研究院生物医学科学研究所。该网站似乎最后更新于2007年。
ViTa (vita.mbc.nctu.edu.tw) ViTa数据库搜集来自miRBase、ICTV、VirGne、VBRC等数据库的病毒数据,包括了已知的病毒的miRNA以及相应的由miRanda和TargetScan预测的宿主miRNA靶基因 [15] 。 ViTa还提供有效的注释,包括人类miRNA的表达情况,病毒感染的组织等。台湾新竹国立交通大学生物信息学研究所。该网站似乎最后更新于2007年。
miRGator (http://mirgator.kobic.re.kr/) miRGator数据库是miRNA功能阐述的指导数据库 [16, 17] 。 功能分析和表达谱与靶基因预测相结合来推断miRNA功能。3.0版本包含73个GEO、SRA和TCGA的人类深度测序数据集,以及41亿短的读长和25亿线性读长。来自韩国首尔梨花女子大学。
PolymiRTS 位于美国田纳西健康科学中心大学,是一个涵盖预测和验证的miRNA结合位点的DNA片段自然突变的数据库 [18] 。 这些数据可被搜索或者下载。
TransmiR (cmbi.bjmu.edu.cn/transmir) TransmiR 是一个转录因子对microRNA进行转录水平调控的数据库 [19] 。 来自中国北京大学。最新版本1.2, 更新于2013年1月30日,包含735条序列,其中包括从268篇文献摘录的201个转录因子和16个物种。
miR2Disease (www.mir2disease.org) 数据库对microRNA与疾病关系进行了整理汇总 [20] 。 它是一个人工收集的与人类疾病相关microRNA信息的数据库。来自中国哈尔冰工业大学。该数据库最后更新于2011年3月14日,包含349个miRNA、163种疾病和3273个条目。
CoGeMiR (cogemir.tigem.it/) CoGeMiR 对不同物种进化中microRNA的保守性提供了视角 [21] 。 该数据库对已知和预测的microRNA的基因组位置、保守性和表达数据进行了汇总。来自意大利那不勒斯基因医学研究所。最新发布是在2008年6月。在评估之日,该网站不能做任何操作。
S-MED (www.oncomir.umn.edu/SMED/index.php) 是一个集合人类不同肿瘤和选择的正常组织中microRNA表达的数据库。来自美国密尼苏达大学。
- ChIPBase: 通过ChIP-Seq数据解码长的非编码RNA和小RNA基因的数据库 [22] 。
- miRCancer: 通过文献发掘整理的microRNA-癌症关系的数据库 [23] 。
- YM500: 一个小RNA测序(smRNA-seq) 数据,用于microRNA查找 [24] 。
- HMDD v2.0: 实验支持的人类microRNA与疾病关联的数据库 [25] 。
- starBase v2.0: 从大尺度CLIP-Seq数据解码miRNA-ceRNA, miRNA-ncRNA以及蛋白质–RNA 相互作用网络的数据库 [26] 。
- PMTED: 植物microRNA靶点表达数据库 [27] 。
- PASmiR: 一个文献整理的植物对非生物压力反应中miRNA分子调控的数据库 [28] 。
- OncomiRDB: 实验验证的致肿瘤性和肿瘤抑制microRNA数据库 [29] 。
miRSystem 整合了其他的预测软件: DIANA, miRanda, miRBridge, PicTar, PITA, rna22和TargetScan,包含TarBase和miRecords的验证数据 [30] 。 该数据库仅支持人类和小鼠的数据。最新版本发布于2014年5月。
STarMir来自纽约州的沃兹沃思(Wadsworth)的软件程序 [31], 该软件程序是根据CLIP数据的序列,热力学和目标结构特点而建立的 [13] 。
miRDB (mirdb.org/miRDB/)是一个在线的microRNA靶标预测数据库。所有的预测目标都是采用SVM的MirTarget2分析数以千计的miRNA与靶标相互作用的预测的 [32] 。 当前版本是5.0, 发布于2014年8月,基于miRBase 21版本和MirTarget V3版本,包含6709条来自人、小鼠、大鼠、狗和鸡的microRNA,共2,105,008个预测的靶位点。所有数据都可以下载下来。
TargetScan (www.targetscan.org/) 是通过搜索与miRNA特定区域匹配的保守8碱基和7碱基位点来预测靶基因的 [33] 。 来自美国Whitehead生物医学研究所信息和研究计算中心。最新版本是6.2,于2012年6月发布。主网页是哺乳动物靶标预测。在主页上有鼠,线虫,果蝇,斑马鱼有不同的搜索页的链接。
PicTar (www.pictar.org/)是一种对microRNA的目标基因进行鉴定的一种算法 [34] 。 这个可搜索的网站涵盖脊椎动物,7种果蝇,3种线虫。 另外针对那些非进化保守, 但共表达(即微RNA和mRNA表达于同一组织)的人的基因进行预测。 来自于纽约大学的中心比较功能基因组学和德国柏林马克斯·德尔布吕克中枢的Rajewsky实验室。
Diana-microT目前在其第5版 [35] 。 该网站显示它拥有“同类程序中最灵敏的特异性”。“它提供了一些网上服务器如IHOP的超链接,以及选择的microRNA在组织和细胞系中的表达数据”。该数据库也可以连接到KEGG。可以下载完整的预测人类和小鼠靶点数据集。最新的版本发布于2012年7月。
RNA22 [36, 37] 可在 美国托马斯杰斐逊大学计算医学中心获得。
RNA22 (cbcsrv.watson.ibm.com/rna22.html) 最早是从IBM沃森计算生物中心分离出去的。截止2012年10月20日,该网站可能已经不能使用了。
TripletSVM (bioinfo.au.tsinghua.edu.cn/mirnasvm/)是一个预测一个具有发夹结构的序列是否为真正的miRNA前体物的程序 [38] 。该程序擅长识别一组真正的miRNA前体(miRNA precursor)的三元特点和一组原miRNA发卡结构(pseudo-miRNA hairpin)。来自中国北京清华大学。该程序可免费下载。
miRanda 是 microRNA.org (www.microrna.org/)的一部分。 miRanda数据库提供了关于人类、果蝇和斑马鱼基因组的microRNA靶目标的预测信息以及miRNA在不同组织的表达谱 [39] 。 来自美国Memorial Sloan - Kettering癌症中心(MSKCC计算生物学中心)。该网站最后更新于2010年8月。
RNAhybrid (bibiserv.techfak.uni-bielefeld.de/rnahybrid/)是一种用于寻找一条长链RNA和一条短链RNA的最小配对自由能的工具 [40] 。通过一种域码实现,即一条短链序列往往结合到长链的最适位置上。这一工具可以作为microRNA靶点预测的软件。来自德国Bielefeld大学。
PITA (genie.weizmann.ac.il/pubs/mir07/mir07_prediction.html) 是一个靶点预测平台 [41] 。最新的预测microRNA靶点基于miRBase第11版,在2008年8月31日发布。
用户可以将非编码器(UTR)的序列输入进网站表格中搜索预测的靶点,或者下载可执行版本离线使用。
DIANA-mirExTra 亚历山大·弗莱明B.S.R.C.戴安娜实验室。该算法比较两个样板的mRNA基因谱,一个改变的和一个不变的,并设法鉴定在3'非翻译区的六聚物,它们在改变的基因列表中有统计学意义 [42] 。miRNA的进化可以通过这些六聚物作出鉴定。另一种使用基于miRNA的靶标预测分数来代替六聚体频率的方法也可以被使用。
WMD3 (wmd3.weigelworld.org) 设计人工microRNA (amiRNAs) [43, 44] 。 21聚体的amiRNA21mers能够特异沉默90多种植物中单个或多个目的基因。来自德国蒂宾根马克斯普朗克研究所发育生物学。最后更新于2009年。
- Li S, Shiau C, Lin W. Vir-Mir db: prediction of viral microRNA candidate hairpins. Nucleic Acids Res. 2008;36:D184-9 pubmed
- Hsu P, Lin L, Hsu S, Hsu J, Huang H. ViTa: prediction of host microRNAs targets on viruses. Nucleic Acids Res. 2007;35:D381-5 pubmed
- Nam S, Kim B, Shin S, Lee S. miRGator: an integrated system for functional annotation of microRNAs. Nucleic Acids Res. 2008;36:D159-64 pubmed
- Wang X, El Naqa I. Prediction of both conserved and nonconserved microRNA targets in animals. Bioinformatics. 2008;24:325-32 pubmed
- Chen K, Rajewsky N. Natural selection on human microRNA binding sites inferred from SNP data. Nat Genet. 2006;38:1452-6 pubmed
- Miranda K, Huynh T, Tay Y, Ang Y, Tam W, Thomson A, et al. A pattern-based method for the identification of MicroRNA binding sites and their corresponding heteroduplexes. Cell. 2006;126:1203-17 pubmed
- Xue C, Li F, He T, Liu G, Li Y, Zhang X. Classification of real and pseudo microRNA precursors using local structure-sequence features and support vector machine. BMC Bioinformatics. 2005;6:310 pubmed
- Rehmsmeier M, Steffen P, Hochsmann M, Giegerich R. Fast and effective prediction of microRNA/target duplexes. RNA. 2004;10:1507-17 pubmed
- Kertesz M, Iovino N, Unnerstall U, Gaul U, Segal E. The role of site accessibility in microRNA target recognition. Nat Genet. 2007;39:1278-84 pubmed
- Schwab R, Ossowski S, Riester M, Warthmann N, Weigel D. Highly specific gene silencing by artificial microRNAs in Arabidopsis. Plant Cell. 2006;18:1121-33 pubmed