1.3 2类CRISPR-Cas系统
迄今为止,大多数研究人员使用的都是2类CRISPR-Cas系统,因为这类系统只需要一种蛋白质[4,7]。在该类中,研究最多的是Ⅱ型,其中发现了著名的Cas9效应蛋白。Cas9是具有两个核酸酶结构域(RuvC和HNH)的蛋白质[6],在两条RNA的介导下目标DNA产生带有平末端的双链断裂(DSB)。这两种RNA分子分别是crRNA和tracrRNA,它们共同引导干扰。研究人员已经将这两种RNA分子进行了生物工程改造,组合成为一个具备crRNA和tracrRNA功能的向导RNA分子(gRNA),从而使CRISPR系统更易于使用[9]。化脓链球菌的Cas9(spCas9)是最广泛使用的效应蛋白,它可以高效产生DSB。但是,spCas9有三个主要限制。首先,其PAM是NGG,需要序列包含两个连续的G(GG)才能生成DSB,使得它在富含AT序列中的使用成为问题[10]。其次,该蛋白质包含1368个氨基酸,当将它的序列引入病毒载体时可能遇到困难[11]。再次,spCas9容易产生脱靶效应,这意味着DSB可能在不正确的位置产生[12]。人们已经尝试了针对这些问题的几种解决方案,其中一种可能的解决方案是修饰spCas9编码序列以获得具有较少脱靶效应的更好突变体。这方面研究已经通过产生高度特异性的Cas9取得了进展,这一Cas9包含了使核酸酶结构域与非特异性DNA之间相互作用减少的突变:spCas9 HF(高保真)[13]。为了克服PAM的限制,对spCas9进行了工程设计以获取不同的PAM基序,从而使该工具更适合不同类型的DNA序列,如VQR、EQR和VRER[14]。另一种对spCas9的改造是去除了一个核酸酶结构域,结果生成了缺刻酶Cas9(nCas9)。nCas9能够诱导单链断裂,可以选择使用两种酶和两个gRNA,从而实现了在诱导缺失或其他改变时减少脱靶效应[15]。为了解决spCas9的尺寸问题,可以使用其他生物体的Cas9同源物。例如,saCas9(金黄色葡萄球菌Cas9)较小,并具有不同的PAM位点[16]。Cas9蛋白不断地被改造以获得更多在尺寸、识别位点和靶效应方面的改进。
2类CRISPR-Cas系统的第二种类型是Ⅴ型,该型具有与Ⅱ型相同的RuvC核酸酶结构域特征,但HNH结构域不相同。Ⅴ型分为多种亚型(A~K),应用最广泛的是亚型A, Cpf1效应核酸酶(也称为Cas12a)属于此亚型[6]。这种类型的核酸酶具有四个独特的特征,使其能够发展成为Cas9效应蛋白的互补因子。第一,这种核酸酶不需要一个有效的tracrRNA序列,从而使设计更容易且更具成本效益。第二,这种蛋白质的尺寸比Cas9小,从而更容易插入病毒载体。第三,这种酶切割时会留下交错的末端,增加了非同源末端连接(NHEJ)敲入基因的机会。第四,它可以识别AT富集的PAM位点,使该酶与Cas9(CG富集区)互补。由于以上这些功能,Cpf1已成为基因组编辑领域极为有用的工具[12,17]。Cpf1不断被改造以提高效率,据报道它已成为植物编辑的出色工具,甚至比Cas9都好用[18]。CRISPR-Cas系统的高效及其相对易用性使其有可能创造出基因组中包含多个突变的生物。一种快速获得多突变生物的方法是使用慢病毒gRNA文库,文库中任何gRNA都可以整合到上述Cas中。这样,一种生物就可以在一个世代内产生多个突变[18,19]。2类的最后一个成员是最近发现的Ⅵ型,它最不寻常的特征在于可以编辑RNA而不是DNA。下文将进一步与其他非基因组编辑的CRISPR-Cas系统一并进行讨论。