基因组工程是一项强大的技术,利用它可以特异性地对内源性染色体DNA进行改造。这一途径可被用于破坏或失活一个基因,修复不利突变,或增加微生物种群的多样性。基因组工程技术的研究进展迅速增强了这一改造的精度、速度和易用性。基因组编辑应用领域广泛,包括基因治疗,疾病模型建立和农药抗性植物技术的发展。过去十年,人们看到了基因组编辑技术和方法的不断进步而大大推进成果的一系列进展。基因组编辑技术和工程核酸酶在2011年被Nature研究方法被评为年度最佳方法。此外,一些短期课程例如2012年EMBL的一个高级课程,锌指核酸酶及随后的精确基因工程和合成生物学:设计的基因组和代谢途径的专题讨论会,也是不断增长的基因组工程领域的证据。本文综述了基因组工程中使用的常见方法,探讨了各自的优缺点,并特别介绍了基因组工程的应用。
基因组编辑方法利用结合到特定DNA序列的蛋白质或RNA,识别邻近核酸酶作用于基因组上。核酸酶在靶核酸序列引入双链DNA断裂(DSB)。随后,细胞自身的DNA修复机制会修复断裂。同源重组修复的一种方式,这就需要一个模板,该模板可能是内源性的也可能是外源性的(图1)。双链DNA断裂也可以通过不需要模板的机制,如非同源末端连接(NHEJ)(图1)或微同源介导的末端连接(MMEJ) [2] 。这些细胞的DNA修复机制被用于实现不同的基因编辑目标。 非同源末端连接在切除基因组的一部分或失活基因方面是更有用的,而利用外源模板同源重组可用于构建基因插入或碱基置换,并且更适用于修复基因突变。近年来,我们见证了定向基因组编辑取得的长足进步,Perez-Pinera等人最近对这一领域写了一篇综述 [3] 。基因组编辑可以操纵单个或多个位点,但极其重要的是特异性问题,因为非靶位点的DNA双链断裂可能会导致显著的细胞毒性。
有几个可行的办法可以实现定向基因组编辑。 大范围核酸酶是一种归巢核酸内切酶,在酵母中发现,能够识别相当长的DNA序列,可构建双链断裂,通过激活同源重组修复 [4] 。其他的基因组编辑系统则采用了非同源末端连接的内源性DNA修复机制。这些包括将核酸酶连接到锌指蛋白结构域构建锌指核酸酶 [5] ,或转录激活因子样效应器(TALE)结构域构建转录激活效应核酸酶S [6] 。虽然这些系统是有效的并且能够在市场上买到,但它们却有点昂贵和费时,因为每个新的DNA靶标都需要重新设计DNA结合蛋白结构域。最新的基因组编辑方法采用了原核细胞免疫防御系统基础上的成簇的规律间隔短回文重复序列(CRISPR)和CRISPR相关基因(cas) [7, 8] 。该系统依赖于CRISPR转录生成的RNA与靶核酸序列之间的碱基互补配对 [9] 。与原来的DNA结合蛋白方法相比,CRISPR系统的一个很大优势是它利用RNA分子识别系统的核酸酶来定位于特定的靶核苷酸位点,而且RNA比DNA结合蛋白更容易合成,价格更便宜。
大范围核酸酶(MGN)是能够识别14-40碱基长度的核酸序列的归巢核酸内切酶。一些大范围核酸酶可以容忍小的归巢位点序列差异,大的识别区域仍然能够保证这些酶的高度特异性,而这反过来又可保持低水平的基因组内非特异性裂解和较低的毒性。归巢核酸内切酶是自然发生的可移动DNA序列,存在于多个生物体内,包括细菌,真菌和一些植物。迄今已经有数百个得到确定。大范围核酸酶由自我剪接RNA内含子或自我剪接蛋白内含子序列的移动序列内的开放阅读框架编码。
大范围核酸酶识别的序列被称为归巢位点,由内含子间或内含子侧翼的DNA片段组成 [10] 。归巢核酸内切酶识别并切割不含内含子的同源等位基因,启动的归巢作用,插入序列就转移到缺少该序列的同源等位基因上了。当一个DNA序列被归巢核酸内切酶切割后,可以通过同源重组对其进行修复。这样就实现了归巢核酸内切酶的转移,以及内含子和归巢位点序列的阻断。
有几个家庭的归巢核酸内切酶,Chevalier和Stoddard很好地综述了它们的特异性和催化机制 [10] 。 LAGLIDADG归巢核酸酶家族在基因工程中使用最频繁。常用的LAGLIDADG家族成员包括I-SceI和I-CreI。这一归巢核酸内切酶家族包含一个或两个LAGLIDADG片段的拷贝。只有一个拷贝的酶作为二聚体识别多数回文的归巢位点,这包括I-CreI和I-CeuI。含有两个LAGLIDADG片段拷贝的酶被100个残基分隔开,以单体的形式发挥作用,包括如I-DMO1和Pi-SceI。
大范围核酸酶的大识别位点能够使它们拥有很强的特异性,这降低了潜在的细胞和生物体毒性。自然发生的大范围核酸酶使用的一个主要限制因素是每个大范围核酸酶切割位点在生物体基因组中可能只有一个切割位点,甚至没有切割位点。如果在基因组中没有自然发生的DNA归巢位点,我们就必须首先引入靶序列,然后才能利用归巢核酸酶切割DNA。为了在选定的DNA序列上使用大范围核酸酶,科学家已经通过诱变或创造嵌合体酶的形式,修改现有的大范围核酸酶识别位点。例如,Seligman人就突变了I-CreI大范围核酸酶的识别位点 [11] 。
大范围核酸酶有几个潜在的应用。由于其高度特异性,相比特异性不强的编译工具而言,大范围核酸酶在用于疾病治疗的发展中优势更大。归巢核酸内切酶有可能发展为为多种移码突变或无义密码子导致的遗传疾病提供治疗 [12] 。比如,有一个大范围核酸酶能够抑制由单纯疱疹病毒1型病毒感染培养的哺乳动物细胞 [13] 。Duchene肌营养不良症的治疗也是基于大范围核酸酶,它可以恢复突变的肌营养不良基因的开放阅读框 [14] 。Silva等人很好地综述了大范围核酸酶用于基因治疗的应用 [15] 。
科学家们能够利用购买的自然发生或从Cellectis等供应商那里订购的预先设计大范围核酸酶进行基因组编辑。也有一些数据库整理了改造LAGLIDADG归巢核酸内切酶 [16] 。表1列出了相关资源的链接
锌指核酸酶(ZFNs)是含有锌指结构域的人工制造蛋白质,能够识别结合核酸酶结构域的DNA序列(通常来自细菌限制性内切酶FokI)。锌指结构域是一种DNA结合结构域,每个识别3bp的DNA序列。多个锌指结构域连接在一起组成DNA结合结构域集,识别特定的DNA目标,而两个结构域集识别它们之间结合序列的核酸酶结构域。结构域集的长度会影响锌指核酸酶的活性。一项研究表明,六个结构域集造成目标位点71%的DNA双链断裂,而结构域集长度较短只有25%的成功可能 [17] 。锌指核酸酶造成的双链断裂(DSBs)能够被内源性的细胞修复机制通过非同源末端连接(NHEJ)(图2)或同源重组修复。锌指核酸酶的锌指部分可以设计为识别特异性DNA序列。然而,不幸的是,锌指核酸酶由于可能非特异性裂解确实会对细胞造成明显的毒性。
锌指核酸酶一个令人兴奋的应用是斑马鱼基因突变。 Foley等人最近使用低聚池工程方法(OPEN)改造的锌指核酸酶在斑马鱼中有很好的效果 [18] 。另一个研究小组利用锌指核酸酶修复突变的Duchene基因的碱基序列,并已证明,在哺乳动物细胞中锌指核酸酶处理可以诱导正常蛋白的表达 [19] 。目前锌指核酸酶的另一个应用是体外抗HIV病毒T细胞的构建 [20] 。
获取识别特定DNA序列的锌指核酸酶的方法包括商品化供应商和最近Perez-Pinera等人详细描述的几种方法 [3] (表1)。客户定制锌指核酸酶的主要供应商是Sigma-Aldrich的CompoZr锌指核酸酶服务,它跟Sangamo Biosciences公司合作,利用其特有的创建锌指蛋白的方法。另一种资源被称为锌指工具(Zinc Finger Tools),这是一个开放的网站,允许用户在一个感兴趣的DNA序列上查找靶核酸位点 [5] 。这一位点为科学家提供了标定好的锌指结构域的数据库,以及为已知锌指蛋白反向预测结合位点的办法。锌指联盟(Zinc Finger Consortium)现在对那些希望使用锌指核酸酶开始基因组编辑工作的研究人员来说是也是一大资源。这个网站包括一些改造锌指结构域的公开可用的方法,包括环境依赖组装(CoDA) [21] ,低聚池工程(OPEN) [22] ,和模块化装配 [17] 。
转录激活因子样效应器(TALEs)是一种DNA结合结构域,可以被模块化连接在一起并与核酸酶结构域融合,从而创造出转录激活因子样效应器或转录激活效应核酸酶 [23] 。每个转录激活因子样效应器都包含一个34个氨基酸的重复,并能识别目标DNA分子的一个碱基对。因此,几个转录激活因子样效应器必须连接在一起组成蛋白质,来识别特定的DNA序列。和锌指核酸酶一样,两个集合识别DNA序列的一个核酸,每个集结合一个半位点的目标(图3)。转录激活因子样效应器集合首先与Fok1核酸酶结构域融合,切割两个半位点间的间隔区的DNA。
锌指核酸酶和转录激活效应核酸酶都是模块化的,具有天然的DNA结合特异性。它们的不同之处在于,一个锌指结构域识别三个碱基对,而一个转录激活效应核酸酶结构域只能识别一个碱基对。这种差异使得构建识别多个目标序列的转录激活效应核酸酶系统更容易一些。转录激活效应核酸酶相比锌指核酸酶在基因组编辑上的好处是,它们对人类细胞系和斑马鱼的毒性较低 [24] 。转录激活效应核酸酶的另一个好处是,通过在家畜胚胎细胞质中注射转录激活效应核酸酶mRNA进行基因组编辑操作的成功率比锌指核酸酶诱导更高 [25] 。
转录激活效应核酸酶的应用包括构建转基因小鼠,这可用于作为人类疾病研究的模型。例如Sung等人利用一个转录激活效应核酸酶途径构建了孕激素免疫调节结合因子1基因敲除小鼠 [26] 。在人类干细胞中,转录激活效应核酸酶已被用于创建多种疾病状态,包括胰岛素抗性和低血糖,这可用来作为模型研究疾病 [27] 。转录激活效应核酸酶在植物基因组工程中也有很好的使用 [28] 。
也有一些购买或构建自己的转录激活效应核酸酶的资源(表1)。转录激活效应核酸酶可以从Cellectis Bioresearch和Life Technologies购买。模块化装配包括Voytas试剂盒 [23] 和Zhang试剂盒 [29] 。这些试剂盒采用多种方法来创建转录激活效应核酸酶库和集。FLASH组装是一种快速高通量的装配系统,可以利用预制转录激活效应核酸酶库创建定制的转录激活效应核酸酶 [30] 。一个在短短两天时间内在哺乳动物表达质粒上组装转录激活效应核酸酶的自己动手做组装协议最近发表了 [31] 。另一研究小组报道了他们构建的一个大型转录激活效应核酸酶质粒库,涵盖超过18,000个人的蛋白质编码基因 [32] 。转录激活因子样效应器的资源还包括Zhang博士实验室旗下的网站www.genome engineering.org。这个网站包括实验方法和一个谷歌的讨论小组的链接,人们可以在这个网站上发布问题(表1)。
成簇的规律间隔短回文重复,或称CRISPR,是由短的DNA重复和间隔的空白区组成的基因座。CRISPR最初在大肠杆菌中被发现 [7] ,这些基因位点存在于各种古菌和细菌基因组中。 CRISPR位点从噬菌体或质粒获得外源DNA片段,这些DNA片段被插入到它们的重复序列中 [33] 。外源DNA整合到CRISPR重复片段的基因组内,但随后CRISPR间隔区可以帮助细胞识别和阻止这些外源DNA在以后攻击细胞 [34] 。2006年Makarova等人首次提出CRISPR-CAS系统是通过RNA干扰来发挥作用的 [33] ,这一观点已得到许多研究报告的支持,并且已经被同一研究小组写进综述中 [33] 。
CRISPR基因簇包括重复序列、间隔序列、一段前导序列和CRISPR关联基因(CAS) [8] 。有几种不同的Cas基因,能够产生不同功能的蛋白质,包括核酸内切酶、解旋酶、核酸结合和转录调控作用的酶 [35] 。 CRISPR-Cas系统分为几种类型 [36] 。 II型CRISPR系统最简单的,包含的相关的基因也最少,其中包括核酸酶Cas9,以及蛋白质Cas1和Cas2。一些Cas蛋白可以将CRISPR基因产物 [8] 加工为成熟的CRISPR RNA(crRNA)和反式crRNA分子(tracrRNA)。成熟的crRNA能够与靶序列互补,这段靶序列通常是外来病毒或接合质粒的核酸片段。CRISPR RNA和Cas蛋白一起形成复合物,来识别外源或靶核酸序列并导致其降解。该系统提供了以RNA基础的对外源DNA的免疫作用 [37-39] 。 CRISPR-CAS系统根据CRISPR位点和相关CAS蛋白类型,可导致目标DNA和目标RNA的降解 [40, 41] 。
II型CRISPR / Cas系统已被用于指示序列特异性的新核酸靶标。该系统包括Cas9核酸酶,非编码的反式crRNA分子(tracrRNA)和一系列包含引导靶核酸的序列的crRNA前体。根据Jinek等人报道,Cas9核酸酶能够通过合成引导RNA(sgRNA),这就取代了通常在CRISPR-CAS系统中发现的两种RNA(CRISPR RNA或称crRNA以及反式激活crRNA或称tracrRNA) [9] 。今年一月,Zhang [42] 和Church [43] 研究小组在Science上报道了他们的研究成果,他们成功地利用了哺乳动物细胞中的一段RNA介导的内源性核酸酶。Cong等人报道Cas9能够介导小鼠和人类细胞的内源性基因组位点的裂解 [42] 。他们还报告说Cas9也可以作为一个切口酶,比双链断裂更能促进同源重组修复的频率。Mali等人利用定制的引导RNA来识别 Cas9酶在多种人类细胞中结合AAVS1位点,并报道了近二十万独特的引导RNA序列的计算资源,可以识别约40%的人类基因组外显子 [43] 。这两个研究团队利用多个合成的RNA同时研究了多个位点的裂解。
最近,Jinek等人报告了他们成功利用修饰Cas9蛋白在人体细胞中促进NHEJ [44] 。 Hwang等人已经证明他们成功的运用基于CRISPR的sgRNA-Cas9途径在斑马鱼胚胎中实施基因组编辑,这一途径介导的修饰作用与使用锌指核酸酶和转录激活效应核酸酶的效率差不多 [45] 。有趣的是,至少在细菌中,CRISPR-Cas9系统能够介导核酸酶诱导的DNA双链断裂与目标序列5'端最小错配的情况差不多 [46] 。这一发现还有待在哺乳动物细胞中证实。 CHO等人也利用CRISPR-Cas9系统在人类细胞系中定位了艾滋病病毒受体基因CCR5 [47] 。这种定位的成功是令人鼓舞的,或许有一天CRIPSR-Cas9系统能发展到用于人类艾滋病病毒治疗上来。
相比之前的DNA结合蛋白方法,CRISPR-Cas9系统一个很大的优势是,它利用RNA分子来锁定某一核酸的特定核苷酸目标。 与利用锌指核酸酶和转录激活效应核酸酶途径的蛋白结构域相比,RNA更容易合成,价格更便宜。而且CRISPR-Cas9系统的应用范围跟锌指核酸酶、转录激活效应核酸酶和大范围核酸酶同样丰富。例如,CRISPR系统可以用于改造噬菌体抗性细菌。近日,一个研究团队报告了他们在酵母中运用CRISPR-Cas系统成功实现定点突变和等位基因置换的研究成果 [48] 。 CRISPR系统与其它方法相比是非常新的,所以报道应用的文献也不多。除此以外,在将基于CRISPR的基因组编辑的方法运用于临床前,还需要开展更多对其潜在毒性的研究。鉴于此,一个令人兴奋的可能是,CRISPR识别目标CCR受体来治疗艾滋病,可能通过移除淋巴细胞,突变CCR5受体,然后将淋巴细胞注射回病人体内。
有关CRISPR-Cas9系统的资源包括几个网站和谷歌小组,如表1所示。张博士作为其中一个组的领导者最近在发表在Science上发表了一篇文章,他们建立了一个网站里面有大量关于CRISPR研究方法的有价值信息(www.genome-engineering.org)。Cong博士和Zhang的实验室最近在这个网站上发布了一个他们CRISPR克隆方法的链接。此外,名为“利用CRISPR / CAS系统的基因组工程”的谷歌小组最近也创立了,允许任何人阅读公告以及成员提问和回复。Feng Zhang博士在这个论坛上很积极,定期回答提问。
定向核酸酶基因组工程是一个很有前景的研究领域。各种技术和应用空前扩大。这种方法的巨大好处是改变了传统的克隆和突变的基因组研究方法,快速、精确、低毒性。基因组编辑技术的在临床上单基因疾病的治疗上很有潜力,基因组编辑在生物科技领域的广泛应用也很令人兴奋。此外,在植物中,核酸酶基因组工程增强除草剂耐受性和抗病性,而不需要导入其他生物体的DNA这一事实有助于减少监管审查。使用核酸酶进行基因组编辑的科学家团队不断壮大,彼此支持。多个公开可用的资源,如AddGene,在这里科学家们可以分享质粒和实验方案,对即使是入门的分子生物学家成功进行基因组工程实验也能提供非常有帮助的指导。
虽然在过去的几年里基因组工程的特异性和易用性已经得到很大改善,但挑战依然存在。非特异性核酸酶引起DNA双链断裂造成的细胞毒性阻碍了这些核酸定位系统在人体的广泛使用。未来的研究,旨在更好地了解内源性DNA修复机制,核酸酶目标表观遗传修饰效应,以及如何提高核酸酶在体内的转运可以带来该领域更大的进步。
上述基于该系统的更多应用和技术已有报道。Qi等人刚刚描述了一个未激活Cas9蛋白,与合成的引导RNA共表达,构建识别复合物,通过RNA聚合酶或转录因子成功绑定到DNA上,干扰转录延伸 [49] 。该系统被称为CRISPR干扰(CRISPRi),在大肠杆菌模型中它可以一次抑制多个基因的表达,在哺乳动物细胞中也有成功应用。此外,旨在优化工程核酸酶在基因组编辑技术中应用的第二代技术也正在开发中。例如,Kim等人最近报道基于抗生素筛选和磁分离的富集策略,使他们的成功率从2%增加到25% [50] 。
资源类型 | Link |
---|---|
大范围核酸酶 | |
LAGLIDADG归巢内切酶的数据库和改造服务 [16] | homingendonuclease.net/ |
商业化供应大范围核酸酶和提供定制服务的公司 | www.cellectis.com/science/nucleases/meganucleases |
锌指核酸酶 | |
锌指核酸酶供应商: Sigma-Aldrich CompoZr 锌指核酸酶服务 | www.sigmaaldrich.com/life-science/zinc-finger-nuclease-technology.html |
锌指协会(Zinc Finger Tools)是一个开放的网站,提供靶位点的数据 [5] | zincfingertools.org |
锌指协会(Zinc Finger Consortium) 包含一些软件工具和使用方案 | www.zincfingers.org |
锌指核酸酶 Genome 2.0:可用于在模式生物中帮助定位锌指核酸酶识别位点 [51] | bindr.gdcb.iastate.edu:88/ |
致力于改造包括锌指核酸酶和转录激活效应核酸酶在内的核酸内切酶的网址。包括许多实验方案、材料、核酸酶设计资源的链接。 | eendb.zfgenetics.org/index.php |
转录激活效应核酸酶(TALEN) | |
转录激活效应核酸酶供应商:Cellectis Bioresearch和Life Technologies | www.cellectis.com/science/nucleases/TALENs |
Zhang博士实验室旗下的转录激活效应核酸酶(和CRISPR)相关网站 | www.genome-engineering.org |
可供人们提出关于转录激活效应核酸酶使用和设计问题的谷歌小组 | groups.google.com/forum/#!forum/taleffectors. |
Joung 博士小组所有的一个关于转录激活效应核酸酶新闻的谷歌小组 | groups.google.com/forum/?fromgroups#!forum/ talengineering |
CRISPR | |
Zhang博士实验室旗下的CRISPR 使用和设计网站 | www.genome-engineering.org |
可供人们提出关于CRISPR使用和设计问题的谷歌小组 | groups.google.com/forum/?fromgroups=#!forum/crispr |
多平台 | |
基因组改造质粒的网站 | www.addgene.org/ |
- Moore J, Haber J. Cell cycle and genetic requirements of two pathways of nonhomologous end-joining repair of double-strand breaks in Saccharomyces cerevisiae. Mol Cell Biol. 1996;16:2164-73 pubmed
- Epinat J, Arnould S, Chames P, Rochaix P, Desfontaines D, Puzin C, et al. A novel engineered meganuclease induces homologous recombination in yeast and mammalian cells. Nucleic Acids Res. 2003;31:2952-62 pubmed
- Mandell J, Barbas C. Zinc Finger Tools: custom DNA-binding domains for transcription factors and nucleases. Nucleic Acids Res. 2006;34:W516-23 pubmed
- Ishino Y, Shinagawa H, Makino K, Amemura M, Nakata A. Nucleotide sequence of the iap gene, responsible for alkaline phosphatase isozyme conversion in Escherichia coli, and identification of the gene product. J Bacteriol. 1987;169:5429-33 pubmed
- Jansen R, Embden J, Gaastra W, Schouls L. Identification of genes that are associated with DNA repeats in prokaryotes. Mol Microbiol. 2002;43:1565-75 pubmed
- Chevalier B, Stoddard B. Homing endonucleases: structural and functional insight into the catalysts of intron/intein mobility. Nucleic Acids Res. 2001;29:3757-74 pubmed
- Seligman L, Chisholm K, Chevalier B, Chadsey M, Edwards S, Savage J, et al. Mutations altering the cleavage specificity of a homing endonuclease. Nucleic Acids Res. 2002;30:3870-9 pubmed
- Silva G, Poirot L, Galetto R, Smith J, Montoya G, Duchateau P, et al. Meganucleases and other tools for targeted genome engineering: perspectives and challenges for gene therapy. Curr Gene Ther. 2011;11:11-27 pubmed
- Makarova K, Grishin N, Shabalina S, Wolf Y, Koonin E. A putative RNA-interference-based immune system in prokaryotes: computational analysis of the predicted enzymatic machinery, functional analogies with eukaryotic RNAi, and hypothetical mechanisms of action. Biol Direct. 2006;1:7 pubmed
- Jan J, Good W, Freeman R, Espezel H. Eye-poking. Dev Med Child Neurol. 1994;36:321-5 pubmed