1.1 引言
在基因工程领域,簇状规则间隔短回文重复序列(CRISPR)和CRISPR相关蛋白(Cas)系统的研究和应用近年来取得了巨大进展。现在已经开发出了多种CRISPR-Cas9作为基因组编辑工具。迄今为止,所有CRISPR-Cas系统被归为两类,每个类别又进一步分为几种亚型。由于目前CRISPR-Cas领域还有多种应用工具正处于开发阶段,许多研究团队和公司也正就这些系统的专利权争吵不休。本章将就CRISPR-Cas系统做一个简短的概述。
自从Ishino等在1987年发现CRISPR-Cas系统以来[1],CRISPR-Cas系统已发展成为一种基因编辑的强大工具。Mojica等在20世纪90年代完成了CRISPR-Cas系统的大部分初始表征工作[2],而CRISPR的名字则是由Jansen等在2002年首次提出的[3]。自那时起,人们开始了CRISPR-Cas系统所涉及的蛋白质和分子的发现和表征过程[4]。以2类Ⅱ型的CRISPR-Cas9系统为例[4-6],CRISPR-Cas系统进行基因编辑包括三个过程:表达、干扰和适应(匹配)[4,5]。在表达过程中,与特定靶序列(原间隔序列)同源的CRISPR阵列被转录为许多前CRISPR RNA(pre-crRNA)[4-6][图1.1 (a)],这些pre-crRNA与更小的反式激活crRNA(tracrRNA)通过碱基配对形成复合物[4-6]。这种复合物可以与Cas9蛋白结合,导致较长的pre-crRNA被RNA酶Ⅲ切割,分离成单独的crRNA/tracrRNA复合物[图1.1 (b)]。当crRNA/tracrRNA将Cas9复合物引导至目标序列时,crRNA结合所谓的原间隔序列相邻基序(PAM)后的目标序列,干扰就开始了[图1.1 (c)]。在此阶段靶序列解旋,并被Cas9蛋白的核酸酶结构域(RuvC和HNH)切割[4-6],在靶DNA序列中留下断裂双链,然后Cas9复合物脱离。之后是将所需的DNA修复模板插入,并在干扰的末期通过同源定向修复(HDR)将其连接至经切割的靶DNA的平末端。修复的间隔区序列被转录并匹配嵌入基因组[图1.1 (d)][4-6]。在大多数已知的CRISPR-Cas系统中,适应过程由Cas1和Cas2蛋白(在某些时候为Cas4)控制,这些蛋白质通过整合RNA,然后诱导RNA逆转录成DNA,从而将所需的间隔区序列匹配入CRISPR阵列[4-6]。通过这些过程,某些细菌能够在感染过程中将病毒基因组整合到自己的基因组(即CRISPR阵列)中,从而在将来的感染过程中实现更有效的免疫反应[4-7]。这些过程经过修改,就成为了分子生物学和基因工程领域的强大工具。
图1.1 CRISPR-Cas系统进行基因编辑的过程
(a)来自CRISPR阵列的crRNA与较小的tracrRNA分子结合,成为gRNA复合体;(b)gRNA与Cas9蛋白结合,形成gRNA:Cas9复合物;(c)gRNA指导Cas9蛋白识别PAM基序并靶向特定的DNA序列,RuvC和HNC核酸酶位点切割靶序列,留下两个同源的平末端;(d)所需的DNA修复模板插入所需的基因并通过HDR修复DNA链,然后使产物DNA适应匹配插入生物体的基因组