2.4 免疫球蛋白的基因及其表达
根据克隆选择学说,由于具有不同抗原特异性的淋巴细胞在引入抗原之前就已发育,而产生巨大抗体多样库所需的信息就表达在每一个体的DNA中。人类基因组中有效基因的总数约为3万~5万个,如果每一Ig的重链和轻链都是由单一的基因所编码,人体内B细胞克隆的总数在1012以上,就需要一半以上能编码功能性蛋白质的基因组来产生1012种特异性抗体,很显然并非如此。每一Ig重链和轻链的多肽并非是由胚系基因组中连续的DNA序列所编码的。相反,B细胞已具有特别有效的遗传机制,能从有限数量的Ig基因中产生巨大的多样库。每一个体能产生抗体特异性的总和,称为抗体库(antibody repertoire),它反映了在抗原性刺激的应答中,所有B细胞克隆能够合成和分泌Ig的能力。
免疫球蛋白的V区的氨基酸序列具有独特性,不同的抗体之间彼此不同,C区的氨基酸序列在同一类免疫球蛋白的L链间或者H链间相对保守。这种既具有共享氨基酸序列,又具有独特的氨基酸序列的多肽合成的遗传机制是什么?加州理工学院的William Dreyer和阿拉巴马大学的J.Claude Bennett于1965年提出假设,认为每一条抗体肽链实际上至少由两个分隔存在的基因所编码,一个是可变的,另一个是恒定的,在淋巴细胞发育过程中这两个基因发生易位而重排在一起,并且这两个基因在DNA或信使RNA(mRNA)水平上连接生成功能性免疫球蛋白。1976年,在瑞士巴塞尔研究所工作的美籍日本学者利根川进(Susumu Tonegawa)及其同事进行的一项具有里程碑意义的研究证实了该假说。他们在一种产生抗体的骨髓瘤或浆细胞瘤的研究中,发现其细胞的Ig基因结构与其他不承担Ig合成的胚胎细胞的Ig基因不同。这一发现已由Southern点杂交技术所证明。该技术已被用于检查经酶消化的DNA片段的大小。借助这种方法显示出,在产生和不产生抗体的细胞中,Ig基因的DNA片段大小不同(图2.17)。对这种DNA片段大小不同的解释是,任何Ig轻链或重链的V区和C区均由不同的基因片段所编码。这些基因片段在胚胎细胞中的定位相隔较远,而在承担抗体合成的细胞,如B细胞中却连接在一起。这样,Ig基因在B细胞的个体发育中经历了DNA的重排或重组的过程。
图2.17 利根川进用实验证明B细胞发育过程中,V基因和C基因的重排
Ig的分子由IGK, IGL和IGH基因编码。人IGK, IGL和IGH基因分别定位于不同的2,22和14号染色体。小鼠IGK, IGL和IGH基因分别定位于不同的6,16和12号染色体(表2.4)。编码一条Ig多肽链的基因是胚系中数个分隔开的DNA片段(基因片段)经重排而形成。1965年Dreyer和Bennett首先提出假说,认为Ig的V区和C区由分隔存在的基因所编码,在淋巴细胞发育过程中这两个基因发生易位而重排在一起。Tonegawa因在免疫球蛋白基因结构研究方面有重大突破而获得1987年诺贝尔生理学与医学奖。
表2.4 免疫球蛋白基因定位
2.4.1 免疫球蛋白基因的结构
Ig重链基因是由V, D, J和C四种不同基因片段所组成,Ig轻链基因是由V, J和C三种不同的基因片段所组成(图2.18)。
1.Ig重链可变区(V区)基因
人重链基因座位于14号染色体。重链可变区基因是由V, D, J三种基因片32段经重排后所形成。编码重链V区基因长约1000~2000 kb,包括V, D, J三组基因片段。每个V基因上游有L基因片段,编码约20~30个疏水性氨基酸的先导序列(或称信号肽)。
图2.18 人免疫球蛋白的基因结构
(1)重链V基因片段
根据小鼠VH基因片段核酸序列的相似性(>80%同源性)可分为九个家族(family),每个家族含有2~60个成员不等,小鼠VH家族多为集群分布。人V基因片段65个,至少可分为VH1~VH7七个家族,同一个家族的片段并不在一起,多为与其他家族混杂分布。V基因片段编码重链可变区约98个氨基酸残基,包括互补决定区1和2(CDR1和CDR2)。
(2)重链D基因片段
D(diversity)是指多样性。在Ig基因结构中,DH基因片段在VH基因的3′端,仅存在于重链基因中而不存在于轻链基因。D基因片段编码重链V区大部分CDR3。人类DH片段有27个。
(3)重链J基因片段
J(Joining)指连接,是连接V和C基因的片段,位于DH基因的3′端。JH编码约15~17个氨基酸残基,包括重链V区CDR3中除DH编码外的其余部分和第四骨架区。人有九个JH基因片段,其中六个是有功能的。CDR3对Ig特异性最为重要,可变程度相对也较大。
2.Ig重链恒定区(C区)基因
重链恒定区基因由多个外显子组成,位于J基因片段的下游,至少相隔1.3kb。每个外显子编码一个结构域,铰链区由单独的外显子所编码,但α重链的铰链区是由CH2外显子的5′端所编码。大多分泌的Ig重链C端片段或称尾端(tail piece)是由最后一个CH外显子的3′端所编码,而δ链的尾端是由一个单独的外显子所编码。小鼠CH基因约占2000 kb,其外显子从5′端到3′端排列的顺序是5′-Cμ-Cδ-Cγ3-Cγ1-Cγ2b-Cγ2a-Cε-Cα-3′。人CH基因有功能的片段为九个,排列的顺序是5′-Cμ-Cδ-Cγ3-Cγ1-Cα1-Cγ2-Cγ4-Cε-Cα2-3′。其中基因片段Cγ3-Cγ1-Cε2(ψCε,假基因)-Cα1和基因片段Cγ2-Cγ4-Cε-Cα2可能是一个片段经过复制而得,可为研究C区基因的起源和进化提供有用的依据。每个C基因包括几个外显子,编码C区中相应的结构域。
3.Igκ链基因
人κ基因座位于2号染色体,Vκ基因片段有40个,编码V区N端的1~95位氨基酸,包括CDR1, CDR2和部分CDR3。根据核苷酸序列同源性,Vκ可分VκⅠ~VκⅦ七个家族或亚群(subgroup)。Jκ基因位于Vκ基因的3′端,Jκ片段有五个,编码V区靠近C端的第96~108氨基酸,Jκ与最后一个Vκ基因片段的3′端相距为23kb,但与Cκ外显子靠近。Cκ只有一个,编码C区(109~214氨基酸),所有κ轻链具有同一结构的C区。
4.Igλ链基因
人λ基因座位于22号染色体,Vλ有30个,可分为Vλ1~Vλ10十个家族,其中Vλ1~Vλ3是主要的家族,在进化上比较保守。Jλ基因片段和C基因片段的分布格局不同于H链和κ链基因,即Jλ与Cλ成对排列,四个Jλ和四个Cλ基因片段分别形成Jλ1-Cλ1, Jλ2-Cλ2, Jλ3-Cλ3和Jλ4-Cλ4的排列顺序。
2.4.2 免疫球蛋白基因的重排
1.重组信号序列
Ig胚系基因中重链V, D和J基因片段,以及轻链V和J基因片段是通过基因片段的重排(rearrangement)而形成V基因的。重排过程主要由一组重组酶识别V,(D), J基因片段两侧的重组信号序列,再通过切断和修复DNA而实现的。
(1)重组信号序列
重组信号序列(recombination signal sequence, RSS)是由寡核苷酸组成的七聚体(heptamer)[5′CACAGTG3′]、九聚体(nonamer)[5′ACAAAAACC3′],以两者之间较少保守性的间隔序列(spacer)所组成。间隔序列的碱基数为12或23,此长度恰好允许DNA螺旋绕成一圈或两圈,得以将七聚体和九聚体靠近在一起。在重组酶的识别和作用下,带有12bp间隔序列的RSS基因片段只能和带有23bp间隔序列的基因片段结合,保证了基因片段的正确连接,此现象称为“12-23规则”(图2.19和2.20)。
图2.19 参与Ig基因重排的重组酶识别的DNA序列
图2.20 免疫球蛋白轻链基因重排信号序列
一个IGKV基因和一个IGKJ基因片段通过其两侧的11或12bp RSS和23或24bp RSS被拉拢在一起,它们之间的DNA形成环状并被剪除,IGKV基因和IGKJ基因之间被修复酶连接在一起
(2)重组信号序列与重链VDJ基因片段重排
重链VH基因片段3′端和JH基因片段的5′端都是带有23bp间隔序列的RSS,而DH基因片段在5′和3′端都为带12bp间隔序列的RSS,这种结构特点不允许重链V, J基因片段直接发生重排。现已知,重链V, D, J片段重排的顺序是:先DH-JH重排,然后VH-DHJH重排(图2.21)。
图2.21 免疫球蛋白重链VDJ基因重排
(3)重组信号序列与轻链VJ基因片段重排
以Vλ轻链为例,Vλ基因片段3′端的RSS带有23bp间隔序列,Jλ基因片段5′端是含有12bp间隔序列的RSS。因此轻链基因的V, J片段可实现直接的连接(图2.22)。
2.V(D)J重组酶
重组酶(recombinase)是一组参与V,(D), J基因片段重组的酶,包括以下几种。
(1)重组激活酶RAG-1和RAG-2
重组激活基因(recombination activating gene)编码的重组激活酶RAG-1和RAG-2形成的复合物是一种内切酶,只表达在T和B细胞不成熟阶段,在B细胞主要表达在B细胞前体至前B细胞。RAG-1/RAG-2以二聚体方式特异性识别36 RSS和切断七聚体的一侧。RAG-1/RAG-2基因敲除小鼠,由于淋巴细胞在发育过程中丧失BCR和TCR基因重排能力,因而不能发育成为成熟的B细胞和T细胞。
图2.22 DNA重排导致形成编码免疫球蛋白κ链的功能基因
(a)胚系DNA;(b)V基因和J基因的随机重组决定多肽的氨基酸序列;(c)形成初级RNA转录本;(d)经过加工形成成熟的mRNA;(e)翻译产生免疫球蛋白κ链
(2)末端脱氧核苷酸转移酶
末端脱氧核苷酸转移酶(terminal deoxynucleotidyl transferase, TdT)表达于B细胞前体,此酶可将数个核苷酸通过不需要模板的方式加到DNA的断端。
除RAG-1/RAG-2和TdT外,还有切开发夹结构的内切酶、参与修复DNA双链断端的DNA外切酶、DNA合成酶等,如DNA连接酶Ⅳ(DNA ligase Ⅳ)、DNA依赖的蛋白激酶(DNA-dependent protein kinase, DNA-PK)、与DNA紧密相关的Ku70/Ku86二聚体。DNA-PK缺陷小鼠由于编码V区基因片段之间的连接发生障碍而导致重症联合免疫缺陷(SCID)。
3.V(D)J重排
V(D)J重排的顺序是在B细胞分化过程中,H基因先发生重排,重排成功就能单独表达重链。重链基因重排后方开始轻链重排,一般κ链基因先重排,并表达κ轻链,与μ链组装,在未成熟B细胞上最先出现mIgM;如果κ链重排失败(nonproductive rearrangement),就转为λ链基因的重排。在B细胞发育过程中,祖B细胞(pro-B cell)中就开始重链基因的重排,先D-J重排,后V-DJ重排。在重链基因重排开始时,两条染色体上的D基因片段移位到J基因片段而发生D-J基因的连接。此后,只有一条染色体上的V基因片段与DJ基因片段发生重排。在一条染色体上重排成功后产生μ链,B细胞发育便进入前B细胞(pre-B cell)阶段,此时轻链基因开始重排。只要有一条染色体重排成功表达κ轻链,B细胞膜上就出现单体膜型IgM(mIgM, μ2κ2),进入未成熟B细胞(immature B cell)阶段。如果两条染色体上的κ链基因都重排失败,则启动λ轻链基因的重排。
4.V(D)J与C基因片段的重排和免疫球蛋白类别转换
1964年Nossal等发现B细胞存在着类别的转换。Ig类别转换(class switch)或称同种型转换(isotype switch)是指一个B细胞克隆在分化过程中VH基因(VDJ)保持不变,而按一定顺序与不同的CH基因片段分别发生重排。比较与不同CH基因片段重排后基因编码的重链,它们的V区相同,而C区不同,即识别抗原特异性不变,而Ig类或亚类发生改变。这种类别转换在无明显诱因下可自发产生,当抗原激活B细胞,无论是mIg,或是所分泌的Ig,可从IgM转换成IgG, IgA或IgE等类别或亚类。Ig类别转换可能通过以下两种方式实现。
(1)缺失模型(deletion model)
以小鼠CH基因为例,如Cμ和Cδ基因片段被缺失,那么先前重排的VDJ就会按照顺序与下一个CH基因即Cγ3发生重排,经转录和翻译后,编码γ3重链;如缺失所有的γ链亚类基因片段,依次会产生ε重链。上述模型在被刺激后小鼠B细胞在体外培养中产生Ig类别的顺序得到证实,即先产生IgM,然后依次产生IgG3和IgG1等。转换区(switch region)即S区是重链基因组内含子中的一段重复性DNA序列,与Ig类和亚类的转换有密切的关系。除Cδ外,各个恒定区基因片段上游都有S区,分别命名为Sμ, Sγ1, Sα和Sε等。S区内含有众多串联的高度保守的DNA重复序列,如Sμ的结构为[(GAGCT)nGGGGT]m,其中n一般为2~5,通常为3,有时多达7, m可达150。当B细胞合成IgG1时,Sμ与Sγ1首先发生结合,在两者之间的Cμ, Cδ和Cγ3基因片段被环出(looping out),由先前重排好的V区基因(VDJ)与Cγ1基因片段重排,转录成初级RNA转录本,剪切成mRNA,翻译为γ1重链。在小鼠,B细胞经T细胞非依赖性活化常发生Sμ/Sγ或Sμ/Sγ2b的重组,因而LPS活化小鼠B母细胞,分泌Ig从IgM转换为IgG3和IgG2b。而且在B细胞类别转换时可以不止一次,通过分别转换到不同的C基因,从而表达相应不同的Ig类或亚类(图2.23)。
图2.23 免疫球蛋白重链的类别转换
(a)RNA水平的替代剪切可产生不同的Ig类型;(b)在发生二次重排的情况下,通过缺失模型实现类别转换
(2)RNA的可变剪切
除DNA水平缺失模型使Ig类别发生转换外,RNA水平的替代剪切(alternative splicing)也可产生不同的Ig类型。Cμ和Cδ基因片段之间无S区,IgM和IgD共表达的B细胞系DNA分析表明,Cμ和Cδ基因片段没有发生重排,相同的VH出现在编码μ或δ链的mRNA上,表明它们可能有一个共同的mRNA前体,通过差异剪切(differential splicing)分别形成μ链mRNA和δ链mRNA(图2.22)。初级RNA转录本(primary RNA transcript)是由V区(VDJ)基因连接Cμ和Cδ基因片段经转录后形成。如果在剪切过程中切除初级RNA转录本中的Cδ部分,则经加工后形成μmRNA;如初级RNA转录本中将Cμ部分切除,则加工后形成δmRNA。这两种mRNA分别被翻译,使单个B细胞同时产生μ链和δ链,同时表达IgM和IgD。
5.Ig基因的转录和轻链、重链合成以及装配
在V区基因片段重排连接成完整的V基因后,它和C基因之间还间隔有一段非编码的DNA序列,这段序列仍存在于初级RNA的转录本中,需通过转录后加工去除。首先由位于每个V基因片段上游的启动子启动转录,形成RNA前体或称初级RNA转录物,然后再经过剪切加工成mRNA,即将先导序列、V基因和C基因连接在一起,其中C基因数个外显子间的内含子也被剪切掉。mRNA离开细胞核进入胞质与核糖体结合,翻译成轻链或重链。Ig多肽链的前导序列与信号识别蛋白形成复合物结合在内质网上,前导肽被切除,合成肽链进入内质网。在内质网上轻链和重链配对结合,组装好Ig从内质网移行到高尔基体,进行糖基化,并继续运送到细胞表面,如重链C端侧带有疏水性氨基酸便锚着在膜上成为mIg,如C端无疏水性氨基酸则分泌到细胞外成为分泌型的Ig。
Ig重链重排后,其第一个骨架区(FR1)到FR3都是由VH基因片段所编码,其中包括CDR1和CDR2,而重链可变区中的CDR3则是由VH-DH-JH三种基因片段组合的产物。轻链CDR1和CDR2也由相应的Vκ或Vλ基因片段编码,轻链V区中CDR3是由Vκ-Jκ或Vλ-Jλ两种基因片段组合的产物。CDR3尤其是重链V区的CDR3,由于在VH-DH-JH组合时D-J或V-DJ之间还可能有N区的插入,其变化明显要多于CDR1和CDR2,加之CDR3编码区域体细胞高突变频率也明显高于CDR1和CDR2,因此,在大多数情况下,重链和轻链CDR3在Ig结合抗原的特异性中起着主要的作用。在基因工程抗体的设计时,有重要意义。
6.膜型Ig重链基因
膜表面Ig(mIg)重链基因的外显子结构与分泌型Ig重链的基因外显子结构基本相同,但在基因组的3′端有所差别。作为识别抗原受体的mIg,其重链C端有一段疏水性氨基酸插入到胞膜的脂质双层中,mIg重链的转录本要比分泌型重链转录本多两个外显子,与分泌型Ig重链基因最下游一个外显子至少相隔1.4 kb,这两个外显子编码重链的C端部分,这部分氨基酸残基的数目视重链不同而有所差异。如鼠或人mIgμ链的这一部分约为41个氨基酸残基,而鼠mIgε链这部分却有72个氨基酸残基。这个区域可分为三个部分:①一个酸性间隔子,靠N端侧,与最后一个CH结构域相连,位于细胞膜外侧;②跨膜部分,由26个疏水氨基酸穿过胞膜的脂质双层;③胞浆区C端部分,3~28个氨基酸残基不等。
分泌形式的μ, α和δ重链最后一个结构域后有一段额外延长的、由带电荷氨基酸组成的序列,称为尾片,约含20个氨基酸。在IgM和IgA分子中,单体Ig尾片中半胱氨酸通过二硫键相互连接或与J链连接形成二聚体或多聚体。分泌型μ链的mRNA含有V, D, J, Cμ1, Cμ2, Cμ3和Cμ4的3′端一个小的外显子转录区。
2.4.3 免疫球蛋白基因表达的调节
免疫球蛋白基因的表达受到多方面因素的调节,主要有转录因子和细胞因子40的调节,前者主要调节Ig基因表达的水平,后者主要与Ig类和亚类的转换有关。此外,Ig基因表达过程中存在着等位排斥和同型排斥的规律。
1.核因子对Ig基因转录的调节作用
Ig基因转录活性是由两个顺式作用元件(cis-acting element)即启动子(promoter, P)和增强子(enhancer, E)来调节。而启动子和增强子的功能又由反式作用的核因子(trans-acting nuclear factor)所控制。这些核因子也称为DNA结合蛋白(DNA-binding protein, DBP),结合到启动子或增强子内特异的核苷酸序列,从而抑制或刺激启动子和增强子的活性。DBP又称转录因子(transcription factor)。转录因子通常是细胞受到某些刺激后所诱导表达的,起到连接细胞外刺激和基因表达调控的作用。
2.细胞因子对Ig类别转换的调节
局部微环境和细胞因子可影响和调节免疫球蛋白类型的转换,如在肠道派尔集合淋巴结的B细胞V基因优先转换到Cα1基因片段进行重排,因此主要合成和分泌IgA;在体外向经LPS刺激的小鼠B细胞中加入IL-4,可促进B细胞产生IgG1和IgE,抑制IgM, IgG3和IgG2 a产生;而IFN-γ,则诱导小鼠B细胞合成IgG2 a和IgG3,抑制IgE, IgM和IgG1的产生;TGF-β和IL-5对IgA产生具有促进作用。细胞因子调节B细胞Ig类别转换的机制可能是:①刺激某些细胞的克隆选择性的增殖,使分泌某特定类、亚类抗体的克隆细胞增加,如IL-5促进IgA产生的机制,除通过同种型转换进行调节外,还可选择性促进B细胞定向细胞分化增殖为IgA分泌细胞;②通过诱导特定的两个转换区的重组,诱导B细胞由分泌IgM向某一同种型Ig转换,如高浓度IL-4促进LPS诱导小鼠B细胞产生IgE,主要是使Cε转换区(Sε)与小鼠B细胞Sμ结合,通过同种型转换促进IgE的产生。
3.等位排斥和同型排斥
1)等位排斥(allelic exclusion)是指B细胞中一对同源染色体上的轻链或重链基因,其中只有一条染色体上的基因得到表达。如一条14号染色体上的重链基因发生有效重排后,通过产生反馈控制信号抑制了另一条同源染色体上Ig重链基因的重排,并可能发出信号,使2号染色体上Igκ轻链基因开始发生重排。一个B细胞只能表达一种轻链和一种重链,配对后产生一种特异性Ig。一般来说,两个等位基因表达的概率是相同的,其先后取决于哪个等位基因先重排成功。
2)同型排斥(isotype exclusion)或称轻链同型排斥,是指Igκ和λ轻链中两种型中择一表达。在不同物种中表达κ或λ轻链的概率并不相同,如在小鼠κ∶λ的比值约为95∶5,在人是65∶35。
2.4.4 免疫球蛋白的多样性
一个动物能对大量不同的和以前从未接触过的抗原发生反应,就必须存在着极大量的能与不同抗原结合部位结合的抗体库。每一种抗体由单一克隆B细胞或其后代浆细胞所分泌。因此,抗原结合部位的多样性就意味着要产生大量不同的B细胞克隆,每个B细胞克隆分泌一种与特定抗原结合的抗体。随着机体进化,已能产生大量B细胞克隆,合成含不同抗原结合区的抗体。了解抗体多样性(antibody diversity)或抗体的谱(antibody repertoire)形成的机制具有重要的意义。
机体对外界环境中众多抗原刺激可产生相应的特异性抗体,人体内B细胞克隆的总数在1012以上,估计机体可产生1012不同类型的抗原结合区,即产生1012种特异性抗体。抗体多样性主要由遗传控制,其机制包括:①存在众多基因编码片段,每个基因片段特异性编码不同的抗原结合部位;②不同重链和轻链的随机取用和组合;③VDJ基因片段重组时连接的多样性,促进了产生抗体可变区序列的多样性,连接区核苷酸的随机插入更增加了新的多样性;④体细胞的高突变。其中前三种机制是发生于骨髓B细胞发育早期,而体细胞高突变发生在二级淋巴器官B细胞功能性Ig基因形成之后。轻链和重链可变区形成抗原结合部位。