CRISPR基因编辑技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.2 CRISPR-Cas9生物学

簇状规则间隔短回文重复序列-CRISPR相关蛋白9(CRISPR-Cas9)系统是自然界中细菌针对噬菌体感染和质粒转移而采取的一种防御机制,现已被用作功能强大的RNA引导的DNA靶向平台,用于基因组编辑、转录扰动、表观遗传调控和基因组成像。这项技术使人们可以精确地操纵由一小段向导RNA指定的任何基因组序列[1],从而阐明涉及疾病发展和进程的基因的功能;通过使用核酸酶缺陷的Cas9和效应子结构域的融合蛋白,纠正引起疾病的致癌基因的激活突变以及抑癌基因的失活[2]。此外,这项可编程的核酸内切酶技术使研究人员可以通过在单个实验中同时靶向多个基因组位点从而一次性检查多个基因的功能[3],这极大地加快了人们对涉及大量基因或突变的病理过程的理解。使用sgRNA文库,基于CRISPR的全基因组筛选可用于鉴定新型药物靶标或抗病基因(例如新型肿瘤抑制因子或致癌基因),并快速评估药物靶标[4]。不仅如此,CRISPR-Cas9介导的基因组工程有望治疗甚至治愈遗传性疾病,包括多种形式的癌症、神经退行性疾病、镰状细胞贫血、囊性纤维化、杜氏肌营养不良症、病毒感染、免疫性疾病和心血管疾病[5,6]。尽管有其优点和广阔前景,但是CRISPR-Cas9与充分发挥治疗潜力之间仍存在一些障碍[7]。减少或避免非靶位点上出现不需要的脱靶突变,是在临床应用中有效利用CRISPR介导的基因组工程的关键[8]。因此,Cas9如何定位特定的20个碱基对(bp)(基因组中的靶序列长度达数百万至数十亿个碱基对),并随后诱导序列特异性双链DNA(dsDNA)切割,不仅是CRISPR生物学中的一个关键问题,而且在开发精确高效的Cas9工具过程中也是一个关键问题。在DNA靶标监测的不同阶段对Cas9进行广泛生化和结构研究,以及对识别不同PAM的变体和Cas9直系同源物进行研究,对我们理解CRISPR-Cas9的机制具有重要意义。在本章中,我们将简要介绍CRISPR-Cas9技术的生物学基础,然后重点关注化脓性链球菌的Cas9酶靶向和切割DNA分子机制的最新结构和力学知识。

许多细菌和大多数古菌已经进化出由CRISPR基因位点和伴随的CRISPR相关(cas)基因所编码的复杂的RNA防御系统,以提供针对噬菌体感染和质粒转移的获得性免疫力[9]。在暴露于噬菌体或质粒侵入性遗传元件后的免疫过程中,外来DNA的短片段作为新的间隔子被整合到宿主染色体内的CRISPR重复间隔阵列中[10],从而记录了先前感染的遗传物质,使宿主能够阻止同一入侵者的再次入侵[11]。CRISPR阵列的后续转录及核酸内切酶对前体CRISPR转录本进行的酶切处理,产生了短的成熟CRISPR RNA(crRNA)[12]。在crRNA的5′末端包含间隔子,即与来自外来遗传元件的序列互补的一段RNA短片段,而3′末端则包含一段CRISPR重复序列。crRNA间隔子会与互补的外源靶序列(原间隔子)杂交,在第二次感染时触发Cas核酸酶对入侵的DNA或RNA进行序列特异性破坏[13]。CRISPR-Cas系统的一个特征是成熟的crRNA跟Cas蛋白组装成crRNA效应复合物,以搜寻DNA靶标并破坏其中的匹配序列[14]。值得注意的是,位于靶DNA原间隔序列附近的一个短的保守序列基序(2~5bp),即PAM[15],在靶DNA选择和降解中起着至关重要的作用。目前CRISPR系统分为六种不同的类型(Ⅰ~Ⅵ),每个类型又进一步分为多个亚型,每个亚型都使用一套独特的Cas蛋白和crRNA进行CRISPR干扰[16]。与Ⅰ型和Ⅲ型系统利用大型多亚基Cas蛋白复合物进行crRNA结合和靶序列降解不同[17],Ⅱ型CRISPR系统采用单个效应蛋白Cas9识别双链DNA底物,以其独特的核酸酶结构域(HNH或RuvC)去切割两条链[13,18]。在Ⅱ型Cas9介导的干扰过程中,称为反式激活crRNA(tracrRNA)的小非编码RNA与crRNA中的重复序列碱基配对,形成了独特的双RNA杂交结构[19]。该双RNA引导Cas9切割包含20个核苷酸(nt)互补靶序列和PAM基序的任意DNA[18]。值得注意的是,tracrRNA是Ⅱ型系统中crRNA成熟所必需的[19]。将crRNA和tracrRNA组合成单个sgRNA后简化了系统,但功能仍然保留[20]。通过改变crRNA中的向导RNA序列(间隔子),这个简化的两组分CRISPR-Cas9系统可以被编程,以靶向基因组中几乎所有感兴趣的DNA序列,并进一步产生位点特异的平末端双链断裂(DSB)[20]。然后,通过容错的非同源末端连接[21]修复Cas9切割产生的DSB,从而在切割位点引入小的随机插入和/或缺失(indels),或者通过高保真同源性定向修复在DSB的位点进行精确的基因组修饰[22]。因此CRISPR-Cas9系统可以被用作基因组编辑工具[20],由于其设计简便,使用方便和高效[23],已迅速成为在各种生物体中进行基因组操纵的强大工具。与传统的核酸酶介导的DNA编辑技术锌指核酸酶(ZFN)和类转录激活因子效应物核酸酶(TALEN)不同,CRISPR-Cas9系统对DNA识别的特异性不是由蛋白质决定[24],而是由20nt向导RNA决定[25]。因此无需对核酸酶上的DNA识别结构域进行繁琐的蛋白质工程改造[26],从而极大地扩展了CRISPR-Cas9在大规模基因组操作或筛选中的应用以及在科学界的适用性。