4.4 CRISPR-Cas9效应复合物的组装
要实现位点特异性的DNA识别和切割,需要将Cas9与向导RNA(天然的crRNA-tracrRNA或sgRNA)组装在一起以形成活性的DNA监测复合物[20,29]。crRNA的20nt间隔区序列赋予DNA靶向特异性,tracrRNA在Cas9募集和crRNA成熟过程中起关键作用[25]。遗传和生物化学实验确定了crRNA间隔区中RNA的所谓种子区域的作用,该区域对于靶标特异性非常重要[33,34]。在Ⅱ型CRISPR系统中,种子区域被定义为位于20nt间隔序列3′末端、PAM近端的10~12个核苷酸[3,20,30]。种子区域的错配会严重影响或完全解除靶DNA的结合和切割,而种子区域的高度同源性会导致脱靶结合[35]。
4.4.1 sgRNA结合后的构象重排
在靶标识别之前进行的Cas9-sgRNA组装和向导RNA排列,其原理在结合sgRNA的晶体结构中得到了阐释[36]。结合sgRNA的Cas9与Apo-Cas9的结构比较准确地揭示了向导RNA结合如何驱动Cas9从无活性构象到有DNA识别能力构象的实质性结构重排。最显著的构象变化发生在REC叶中,尤其是Hel-Ⅲ,它在sgRNA结合后向HNH结构域移动约65°。相反,Cas9结合靶DNA和PAM序列后的构象变化要小得多,这表明大多数的结构重排发生在靶DNA结合之前,强化了向导RNA装载是Cas9酶功能关键调节因子的观点[29]。
4.4.2 Cas9与sgRNA的相互作用
Cas9与sgRNA之间存在广泛的相互作用。具体来讲,sgRNA的部分碱基相互配对形成双链和茎环结构,Cas9与重复-反重复序列双链、茎环1以及茎环1和2之间的连接区(通过Hel-Ⅰ,富含精氨酸的桥螺旋和CTD结构域)直接接触。相比之下,Cas9通过其RuvC和CTD结构域与sgRNA的茎环2建立的相互作用要少得多。由于用于晶体结构分析的sgRNA中缺少tracrRNA 3′尾部,在Cas9-sgRNA结构中未见到茎环3的蛋白质-RNA相互作用。但是,结合靶标DNA的结构显示Cas9与茎环3的接触很少[31,37]。生化研究表明,尽管效率很低,缺失茎环1和2之间的接头区域,茎环2和茎环3的sgRNA仍然能够触发Cas9介导的DNA切割,而缺失茎环1则使Cas9-sgRNA完全丧失了切割能力[20]。功能研究表明,茎环2和/或3对于Cas9在体内发挥活性是必需的[31]。综上所述,Cas9-sgRNA复合物的形成不可缺少重复-反重复序列双链和茎环1,而茎环1和茎环2的连接子、茎环2和茎环3不是监测复合物发挥功能所必需的[38],但可以通过稳定向导RNA结合促进活性复合物的形成,从而提高体内的催化效率[3,31,38]。
4.4.3 预排序种子RNA以及Cas9与PAM的相互作用
Cas9与向导RNA的核糖-磷酸骨架广泛接触,从而以某种构象形式对起始DNA识别所需的10nt RNA种子序列进行了预排序。这种预排序被认为使靶标结合在热力学上变得有利,这与在其他小调节性RNA通路中观察到的向导RNA定位类似,包括细菌Hfq蛋白-RNA复合物和真核Argonaute介导的RNA沉默相似[39]。值得注意的是,在被称为Cascade的Ⅰ型CRISPR干扰复合物中,向导RNA在整个crRNA中被预排序而不局限于种子区域。这可能是由两方面所致:一是复合物的螺旋组装方式,二是在每六个核苷酸位置处完全翻转出核苷酸释放了拓扑约束[40]。除了预排序的种子向导RNA序列外,Cas9上负责识别5′-NGG-3′PAM的关键位点R1333和R1335在与靶DNA接触之前也已被预先定位,表明sgRNA装载使Cas9形成了能识别DNA的结构特征。值得注意的是,尽管5′端的10nt非种子RNA序列在sgRNA结合的晶体结构中完全无序[36],但结合全长sgRNA的SpCas9的电子显微镜(EM)结构(EMD3276)显示向导RNA的5′末端位于HNH和RuvC结构域之间形成的腔内[37]。此结构表明sgRNA的5′末端受到保护免于降解,而在靶DNA结合的过程中,需要进一步的构象变化才能从原先的限制中释放出来。