微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 技术前沿 > 5-羟甲基胞嘧啶(5hmC):哺乳动物DNA第六碱基的多面性

5-羟甲基胞嘧啶(5hmC):哺乳动物DNA第六碱基的多面性

文章来源:健康界发布日期:2024-03-19浏览次数:8

表观遗传学在细胞调控过程中起着关键作用,对于理解复杂人类疾病至关重要。其中,DNA甲基化是被广泛理解的表观遗传机制之一。在哺乳动物基因组中,CpG二核苷酸中的胞嘧啶(C)在嘧啶环的5位发生甲基化(mC)。通过TET家族的2-氧戊二酸依赖性双加氧酶的作用,mC可以被氧化为5-羟甲基胞嘧啶(5-hydroxymethylcytosine,简称5hmC),甚至进一步氧化为5-甲酰基胞嘧啶(fC)和5-羧基胞嘧啶(caC)。这些发现揭示了一种长期难以捉摸的主动DNA去甲基化机制,并推动了哺乳动物表观遗传学调控领域的研究浪潮。本综述对DNA中hmC形成和转化的生化和化学方面新数据进行批判性评估,分析用于检测和绘制哺乳动物基因组中5hmC的分析技术,以及hmC在DNA复制、转录、细胞分化和人类疾病中的表观遗传学作用。

要点:

(1) DNA 5-羟甲基胞嘧啶的发生和转化机制理解。

(2) 研究哺乳动物基因组中5-羟甲基胞嘧啶发生和分布的不同方法的优势和局限性。

(3) 5hmC修饰和相关的表观遗传学修饰在DNA修复、复制、转录和细胞分化中发挥的主要调控作用。

(4) 5-羟甲基胞嘧啶作为疾病标志物和治疗靶点的潜在效用。

1、Introduction

基因组的关键功能是存储、复制和传递编码的遗传信息。通过使用一种(表观)遗传“书签”系统,可以有意义且及时的read不同类型细胞中数十亿(M)重复的G:C或A:T碱基对组成的基因组,这是一种允许生物体在发育过程中或响应环境时保持或重新编程每个细胞身份的机制。此过程中的关键参与者是DNA甲基化,它通过酶催化将甲基基团从普遍存在的辅因子S-腺苷-1-甲硫氨酸(SAM)转到DNA的特定靶标上。DNA甲基转移酶的三个主要产物是N6-甲基腺嘌呤、N4-甲基胞嘧啶或5-甲基胞嘧啶(mC)。值得注意的是,生物体安装的甲基基团不会改变目标核苷酸的配对特异性,从而保留基因组的原始基因组内容。甲基基团暴露在DNA螺旋的主槽中,通过特有的细胞蛋白质、酶或大型多组分复合体read这些“立体”基团。这些特征使修饰碱基非常适合作为生物信号的表观遗传标记,作为基因组“之上”的额外调控层进行生物信号传递。三种类型的DNA甲基化均在微生物中发现,且呈序列特异性。在脊椎动物中,主要的甲基化产物是mC;mC甲基化以序列特异性(主要但不限于CpG二核苷酸)和位点特异性的方式发生。DNA甲基化水平在发育过程中变化很大,但在体细胞组织中,除了在CpG岛(CpG位点高度富集的基因组区域)中的CpG外,大多数(70-80%)CpG均甲基化。当定位于CpG岛时是基因启动子的重要转录沉默子。三种主要类型的DNA甲基转移酶在哺乳动物基因组中具有活性。初始甲基化模式由de novo DNA甲基转移酶Dnmt3a和Dnmt3b建立,而细胞分裂中CpG甲基化标记的保持则由维持甲基转移酶Dnmt1进行。鉴于其重要性,mC通常被称为DNA的第五碱基。

C5 Mtase酶通过将磺基结合的甲基SN2转移到共价活化的靶胞嘧啶残基上进行胞嘧啶甲基化;

哺乳动物TET双加氧酶氧化DNA中的mC产生化学稳定的hmC,hmC进一步氧化为fC或caC,被专用糖基化酶去除;

DNA烷基化损伤产物O6-甲基鸟嘌呤通过将O6-甲基转移到甲基鸟嘌呤DNA甲基转移酶(MGMT)蛋白的半胱氨酸残基上的SN2而直接还原为鸟嘌呤;

DNA中代表性N-烷基化碱基(N3甲基胞嘧啶、N6甲基腺嘌呤)被AlkB双加氧酶家族氧化,产生相应的N-羟甲基衍生物,然后自发水解释放甲醛,直接产生未修饰的碱基。

2、DNA中5-羟甲基化碱基的存在

5-羟甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)在DNA中的存在是在某些噬菌体中观察到的。在T-even噬菌体中,5-羟甲基胞嘧啶在DNA合成过程中被掺入基因组中,随后由噬菌体α-和β-葡萄糖基转移酶修饰,产生含有5-葡糖基氧基甲基胞嘧啶(glc-hmC)残基的高度糖基化DNA。这种DNA对宿主限制性内切酶的切割具有抗性。类似的修饰碱基J(5-(β-d-葡萄糖基)氧甲基尿嘧啶)存在于鞭毛原生动物(包括寄生虫Trypanosoma brucei和Leishmania sp.)的DNA中,以及与之密切相关的单细胞藻类。它取代了高达1%的胸腺嘧啶,主要存在于端粒重复序列中。ba[x]se-J通过JBP1/JBP2 2-氧戊二酸依赖性双加氧酶氧化DNA中的胸腺嘧啶残基,然后通过酶促糖基化产生hmU。ba[x]se-J已被证明对Leishmania及相关锥虫的多顺反子基因簇末端的转录终止至关重要。

在20世纪70年代初,首报道了成年小鼠、大鼠和青蛙大脑基因组DNA中存在hmC。然而在接下来的近40年里,其他实验室未能证实这一发现。2009年,两个独立研究小组重新证实了小鼠脑细胞和小鼠胚胎干细胞(ESC)中hmC的存在。Kriaučionis和Heinz通过薄层色谱法发现,在Purkinje细胞中hmC占总核苷酸的0.6%,在颗粒细胞中约占0.2%。基于上述锥虫蛋白JBP1和JBP2的知识,Rao及其同事确定了哺乳动物的同源蛋白,即ten-eleven转位(TET)蛋白TET1、TET2和TET3作为mC修饰对hmC的潜在修饰酶。这三个同源蛋白包含2-氧戊二酸(2OG)和Fe(ii)依赖性双加氧酶的共同特征。两年后,Zhang和Xu的研究小组证明了TET酶能够在体外和体内将mC和hmC进一步转化为5-甲酰胞嘧啶(fC)和5-羧基胞嘧啶(caC),同时Carell研究小组独立地在小鼠ESC中鉴定出低水平的基因组fC。所有这些证据和随后的研究令人信服地证明了hmC确实是哺乳动物基因组DNA的内源性生物成分(也称为DNA的第六碱基),在长期寻找的主动DNA去甲基化通路中扮演关键中间体的角色。

除了已经确立的TET介导通路外,hmC的另一个可能来源是DNA中胞嘧啶的直接羟甲基化。这一化学先例来自于代表性的SAM依赖性C5-MTases体外实验,这些实验意外地揭示了这些酶能够催化甲醛共价添加到DNA中靶胞嘧啶残基的C5位点,产生hmC。甲醛是哺乳动物细胞、组织和液体中自然存在的必需代谢产物,浓度约为0.1 mM,尽管浓度可能因细胞类型和生理条件而异,然而这种化学-酶促通路在体内的重要意义尚未得到证实。

hmC进入DNA的另一种潜在方式是通过核苷酸补救通路(NSP)。除了de novo合成,细胞还回收DNA分解(DNA修复、细胞凋亡等)或营养摄取产生的核苷酸。类似于脱氧胞苷,修饰的胞嘧啶可以通过酶促磷酸化级联反应进入脱氧核苷酸池,该级联反应涉及脱氧胞苷激酶(DCK)产生单磷酸,然后由胞嘧啶单磷酸激酶(CMPK)转化为二磷酸,再由一系列核苷二磷酸激酶磷酸化为三磷酸。然而,形成5-修饰dCTPs和修饰胞嘧啶进入DNA的关键障碍是CMPK对未修饰dCMP的高选择性,导致排除携带C5修饰的核苷酸。然而与mC一样,hmC在dNMP(或dN,取决于细胞类型)水平上容易脱氨基化为hmU,产生hmU 5'-单核苷酸。由于胸苷酸激酶(DTYMK)对5-修饰具有普适性,hmdUMP可以被磷酸化,然后被掺入DNA中,hmU随后成为SMUG1或TDG靶向切除。为了避免与hmU出现相关的细胞毒性并发症,细胞部署了一种专用酶——2'-脱氧核苷酸5'-单磷酸N-糖苷酶(DNPH1,也称为RCL),该酶可降解hmdUMP,从而将其从核苷酸池中去除。NSP的两个主要的NSP屏障保护哺乳动物DNA免受5-羟甲基化嘧啶的偶发掺入,从而防止它们干扰由mC衍生的表观遗传修饰介导的调控机制。这种保护系统在快速增殖的癌细胞中通常被削弱,使它们易于用修饰的胞嘧啶作为潜在的治疗因子进行治疗。

3、基因组5-胞嘧啶甲基化的可逆性

基因组DNA中5-甲基胞嘧啶(mC)丢失可以通过被动或主动DNA去甲基化发生。在被动去甲基化中,子链上没有甲基化维持活性的情况下,甲基化标记以复制依赖性方式从DNA中稀释。当DNMT1被下调或去除时,这种机制已经在许多情况下得到了证实。另外,mC可以在同一DNA链上“主动”转化成未修饰的C,而不依赖于DNA复制。植物中存在主动DNA去甲基化已被广泛报导。在拟南芥(Arabidopsis thaliana)中,名为Demeter的DNA糖基酶通过切割N-糖基键来切除mC,从而在DNA链上产生一个无碱基位点。随后AP裂解酶和AP内切酶形成一个单核苷酸缺口,随后通过DNA聚合酶和连接酶的作用填充。然而,尚未发现此类糖基酶直接作用于哺乳动物的mC。脊椎动物主动去甲基化的现实长期以来一直难以捉摸,但随着DNA中hmC的发现,一切突然变得清晰起来。

3.1 DNA去甲基化的化学过程

生物甲基化通过DNA MTase进行,DNA MTase催化磺结合甲基从辅因子SAM到DNA上确定位置的SN2转移。尽管理论上所有反应都是可逆的,但迄今为止,只有一个通过SN2反应直接进行DNA去甲基化的例子。O6-甲基鸟嘌呤是外源性或内源性化合物对DNA烷基化损伤的产物,通过将O6-甲基转移到甲基鸟嘌呤DNA甲基转移酶(MGMT)蛋白的半胱氨酸残基上直接还原为鸟嘌呤。这种反应需要化学计量的蛋白质,这对细胞来说是一个昂贵的负担,可能是由于病变的稀有性和严重程度(碱基配对改变)所致。这似乎表明,直接的SN2去甲基化仅对O结合的甲基有帮助,并且由于N–CH3和C–CH3键的高热力学稳定性,在N或C甲基化的情况下可能在化学上不可行。实际上,在所有其他报道的去甲基化情况下,都部署了基于自由基氧化还原化学的多步骤机制。后者的反应是由一大类2OG依赖性双加氧酶进行的。对于N-烷基化碱基(N3-甲基胞嘧啶,N6-甲基腺嘌呤),AlkB家族加氧酶的酶促氧化产生相应的N-羟甲基衍生物,然后从氮中自发水解释放甲醛以直接产生原始的未修饰碱基。组蛋白中生物N-甲基标记的去甲基化通过类似通路发生。然而,事实证明,在胞嘧啶的C5位产生的羟甲基在生理条件下化学上非常稳定且寿命长。在这种情况下,需要额外的酶促羟基化循环才能产生类似DNA损伤“出现”的修饰碱基,并且可以通过修复机制进一步处理以产生未修饰的胞嘧啶。

DNA去甲基化的化学过程涉及多种机制,这些机制在不同的生物体和不同的甲基化位点上有所差异。在哺乳动物中,DNA甲基化由DNA甲基转移酶(DNA MTases)催化,这些酶通过SN2反应将辅因子S-腺苷甲硫氨酸(SAM)中的甲基基团转移到DNA的特定位点(图2a)。尽管理论上所有反应可逆,但目前已知的直接通过SN2反应进行DNA去甲基化的例子只有一个。O6-甲基鸟嘌呤是外源性或内源性化合物对DNA烷基化损伤的产物,通过甲基鸟嘌呤DNA甲基转移酶(MGMT)蛋白的半胱氨酸残基直接转移O6-甲基基团,还原为鸟嘌呤。这种反应需要化学计量的蛋白,对细胞来说是一个昂贵的负担,可能因为这种损伤的罕见性和严重性(bp变化)所致。这似乎表明,直接的SN2去甲基化仅适用于O-甲基基团,而对于N-或C-甲基化,由于N-CH3和C-CH3键的高热力学稳定性,这种化学过程可能不可行。实际上,在所有其他报道的去甲基化案例中,都采用了基于自由基氧化还原化学的多步骤机制。这些反应由一大类2OG依赖性双加氧酶执行。对于N-烷基化碱基(N3-甲基胞嘧啶,N6-甲基腺嘌呤),AlkB家族加氧酶催化的酶促氧化产生相应的N-羟甲基衍生物,然后这些衍生物自发地从氮原子水解释放甲醛,直接生成原始的未修饰碱基。组蛋白中生物N-甲基标记的去甲基化也通过类似通路进行。在胞嘧啶C5位点产生的羟甲基基团在生理条件下化学稳定性很高且寿命长。在这种情况下,需要额外的酶促羟基化循环来产生类似DNA损伤的修饰碱基,这些碱基可以被修复机制进一步加工处理,产生未修饰的胞嘧啶。

如上所述,TET蛋白在哺乳动物中被鉴定为将mC修饰为hmC的酶,并且也被证明能够将形成的hmC氧化为fC和caC(统称为ox-mC)。He等人揭示了mC和hmC几乎完全(90%)被TET1和TET2转化为caC,而没有出现fC,而Ito等人报告说fC相对于caC会积累。随后的酶学和结构研究表明,TET2可以通过与含有mC的DNA单一作用产生fC和caC,而不释放hmC中间体;但一旦释放,hmC是不如mC的底物。总之只有一小部分hmC被进一步氧化为fC/caC,使hmC成为一种相对稳定的胞嘧啶修饰。这些结果表明TET蛋白氧化步骤的效率和产物取决于多种尚未完全理解的条件。

3.2 TET活性调控因子

TET蛋白的酶活性受到其催化反应中的小分子可用性影响,这些小分子包括氧(O2)、2-氧戊二酸(2OG)和Fe(ii)。TET酶活性通常在缺氧环境下降低(但不绝),这是癌症进展和潜在治疗靶点的关键因素之一。同样,外源性2OG可增加培养的小鼠胚胎中的TET活性和hmC/mC比值,在成年小鼠的不同组织中也是如此,并且通过表观遗传调控改善抗癌治疗效果。细胞内2OG水平是诱导胚胎干细胞(ESC)分化的时机。另一方面,某些代谢成分,如N-草酰甘氨酸(NOG)和2-羟基戊二酸(2HG),可以作为2OG依赖性氧酶的强效抑制剂。细胞培养中补充Fe(ii)会导致hmC水平升高。神经发育期间的铁缺乏饮食导致大鼠大脑TET活性降低和整体羟甲基化降低。除了反应底物,研究发现维生素C可以增强各种细胞培养中ox-mC丰度,从诱导多能干细胞(iPSCs)和ESCs到癌细胞系,并且激活Jhdm的组蛋白去甲基化。虽然维生素C被认为在维持Fe(ii)的还原形式中发挥作用,但没有发现其他还原剂对加氧酶活性产生类似的刺激。生化研究表明,这种化合物与TET2的催化域有直接互作。水合形式的维生素C本身可以作为藻类TET同源物CMD1催化的氧化mC修饰的底物。这一发现强调了2OG和抗坏血酸水合物之间的结构相似性(都含有2-氧羧酸基团),可能指出除了维持铁在还原状态之外,抗坏血酸诱导TET刺激的其他机制;例如如果TETs可以直接利用抗坏血酸代替2OG生成活性氧,那么反应将产生将产生5-碳l-lyxonic和/或l-木糖酸(C4的立体异构体),这是很久以前就被确定为维生素C的代谢产物。

3.3 ox-mC修饰加工处理

在去甲基化通路的进一步加工中,原本主要被认为修复mC随机脱氨基产生的T-G错配的胸腺嘧啶DNA糖基酶(TDG)被发现可以直接切除fC和caC,而对mC和hmC不产生影响。DNA中的产生的无碱基位点随后通过碱基切除修复(BER)的酶促级联进行修复,其中核苷酸被新合成的未修饰核苷酸取代。基于这些结果,提出了一种TET蛋白与TDG介导的BER偶联的迭代mC氧化的主动去甲基化通路。但这种机制在密集甲基化位点或在CG/CG位点的双链上发生去甲基化时,可能会产生双链DNA断裂。通过在体外重建的TET-TDG-BER系统中对对称甲基化的CG进行有效的顺序去甲基化,可以避免DNA双链断裂形成。可以确定的是,BER和核苷酸切除修复(NER)通路在小鼠受精卵中的主动DNA去甲基化中起着核心作用。

基于某些DNA糖基化酶切除hmU的能力,提出了hmC加工的另一条通路,这可能通过hmC的脱氨作用发生。一些DNA糖基化酶,单链单功能尿嘧啶DNA糖基化酶1(SMUG1)和MBD4对caC或hmC的切除没有活性,但它们能有效去除hmU。TDG也被证明在双链DNA中对hmU-G错配具有切除活性。该通路依赖于AID/APOBEC脱氨酶(或其他一些未知脱氨酶)可以在体内有效地使双链DNA中的hmC脱氨酶的假设,尽管体外研究表明这些酶对单链DNA中的未修饰胞嘧啶具有强烈的偏好。一些研究表明,hmU可能不是由hmC脱氨产生的,因为DNA中的大多数hmU都来源于TET催化的胸腺嘧啶氧化。因此脱氨介导的通路仍然需要强大的生化支持。

另一种方式是通过C–C键断裂将hmC、fC或caC直接转化为C,从而完全避免了与无碱基位点产生的相关问题。例如,研究表明在某些情况下,TDG丢失可能会发生主动去甲基化。DNA C5 MTase提供了一个早期提示,它不仅能够将甲醛与胞嘧啶偶联,还可以在体外促进hmC或caC的序列特异性转化为未修饰C。Mtase介导的反应通过C6处的共价中间体进行,类似于硫醇介导或亚硫酸盐介导的caU脱羧基化和fC的去甲酰化。这些化学先例表明,某些DNMT或某些专用酶原则上可以去除氧化基团(5-羟甲基,5-甲酰基或5-羧基)以产生未修饰的胞嘧啶残基。在哺乳动物细胞提取物和体内报道了去甲酰化和脱羧活性,似乎在某些情况下是可行的,但目前尚未鉴定出直接负责这些反应的酶或其他细胞成分。

DNA胞嘧啶-5甲基转移酶将hmC转化为DNA中的C残基。

b-d. 亲核基(nucleophile)分别促进fC去甲酰化和caC脱羧。

4、体外DNA中hmC的产生和分析

4.1 体外DNA中hmC的产生

研究这种修饰核苷酸的化学-酶转化以及开发和验证新的分析技术需要生产含有hmC残基的DNA底物。含有hmC的寡脱氧核糖核苷酸的化学合成于1997年首提出,它使用具有可逆2-氰基乙基O-衍生化的5-羟甲基和经典外环胺N-苯甲酰化的磷酰胺前体。基于两个外环基团的N,O-氨基甲酰基桥接的替代策略提高了目标低聚物的产率和纯度。两种类型的磷酰胺前体均可商购并用于DNA合成服务。

类似于细胞反应,理论上可以通过使用TET加氧酶氧化mC残基在从甲基化体外DNA产生hmC修饰的DNA,但应严格调控反应以避免进一步氧化产物。这已经通过人类TET2加氧酶65的催化合成能力的定向工程以及进一步开发一系列允许mC及其氧化形式相互转化以用于分析应用的反应来证明。产生的hmC残基位点将由原始mC位点确定。使用DNA-C5甲基转移酶的非典型化学-酶促反应,可以在DNA中直接序列特异性地组成hmC,在体外催化甲醛与其靶胞嘧啶残基的可逆偶联。该反应对甲基转移酶靶位点具有高度特异性,尽管所用每种酶的羟甲基化效率可能不同。通过在DNA聚合酶依赖性链延伸反应(包括PCR)中提供2'-脱氧核苷-5'-三磷酸(hmdCTP),可以在体外或体内中实现DNA中C与hmC的随机替换。

4.2 hmC的检测和定量

已经开发或改进了几种技术来检测和定量DNA中的hmC。放射性标记核苷酸的薄层色谱法以前已广泛用于分析包括hmC 在内的RNA和DNA修饰。尽管灵敏度很高,但由于在标准实验室中处理和处置放射性物质的风险,其使用越来越受限。

分析未标记DNA样品的整体核苷组成的金标准是液相色谱与UV或MS检测相结合。现代MS/MS检测器可以实现更高的选择性和灵敏度,并且可以使用合成的稳定同位素标记的内标对核苷进行可靠的定量。这些方法非常适合定量基因组DNA中的整体hmC、fC和caC水平,但需要专用设备。已经使用使用直接进样质谱MS开发了一种高通量版本,无需对核苷酸进行色谱分离即可进行定量分析。

由于fC和caC的稀有性,有时还包括hmC,样品处理过程中需要特别注意,可以使用基于碱基的特异性衍生化来提高灵敏度(通过质谱或光学检测),并从大量基因组DNA中富集目标片段。hmC的一种特别有用的分析修饰是使用T4 β-葡萄糖基转移酶(BGT)和尿苷-5'-二磷酸-D-葡萄糖(UDP-glc)辅因子或其类似物,将其酶促糖基化为更大且独有的5-葡萄糖酰氧化基-甲基胞嘧啶残基。BGT反应对hmC(或hmU)的5-羟甲基具有强大和高选择性。这种处理可以用来将UDP-(3H)葡萄糖中的氚标记葡萄糖残基连接到DNA上,通过闪烁计数直接定量hmC。

近年来,已经开发了涉及荧光策略的新hmC检测方法,如荧光共振能量转移、通过酶促和化学功能引入的荧光标签。这些方法具有高灵敏度、特异性、通常无扩增,它们与不同的扩增技术结合,如滚动循环扩增、环介导等温扩增和等温指数扩增,以更高灵敏度、简单省时的方式实现hmC检测。此外,将MTase催化的反应与荧光、电化学发光和光电化学方法相结合,用于在组织中检测hmC的敏感生物传感器。

5、基因组DNA中hmC的检测技术

大量研究表明,尽管所有哺乳动物组织都含有相似水平的mC(来自C的4-6%),但hmC含量是组织依赖性的,从0.03%到1.2%不等。在小鼠Purkinje神经元、负责认知功能的大脑部分(0.6-1.3% hmC/C)和胚胎干细胞(高达0.5%)中检测到hmC富集,而在其他组织中的含量要低得多(0.03-0.3% hmC/C)。hmC水平随年龄增长而增加,且在肿瘤样本中被强烈耗竭,表明hmC作为预后生物标志物的效用。其他形式的ox-mC、fC和caC的含量低100-1000倍,fC含量从0.00002%到0.002%不等,而caC含量不超过C的0.0003%

ox-mC在基因组中的稀疏性给开发通用方法带来了挑战,该方法将具有灵敏性和特异性的检测每个CpG的胞嘧啶修饰状态。在发现hmC后的几年中,已经开发了多种方法来研究其基因组谱,可以分为基于富集的方法和单核苷酸分离方法(图7)。这些方法在基因组覆盖率、实验和分析策略以及成本方面存在很大差异。

黑色方框显示一条泳道上的碱基;红色方框显示通过减去相关信号碱基。ODN,寡脱氧核糖核苷酸。

5.1 基于亲和富集的方法

基于亲和富集的方法依赖于将含有hmC的短DNA片段(通常为200-500 bp)选择性结合到hmC特异性抗体,其他hmC结合蛋白或hmC与报告基团的衍生化,从而允许从其余DNA中物理提取,然后使用定量PCR、DNA微阵列或测序进行分析。片段化基因组DNA长度决定了所有基于富集方法的分辨率极限。类似于甲基化DNA免疫沉淀(MeDIP),针对hmC开发了抗体,用于hmC DNA的免疫沉淀,随后通过hMeDIP(羟甲基化DNA免疫沉淀)方法进行测序。然而,不同研究的结果甚至在相同基因组的分析中也显示出相当大的差异,这可能是由于基于抗体的下拉方法的典型缺陷,如可能与甲基化和未修饰的胞嘧啶发生交叉反应,因为这些碱基几乎在化学上的差异很少。目前DIP方案的可靠性受到了质疑,因为研究表明由于IgG抗体对短的未修饰DNA重复序列的内在亲和会产生差异。

共价hmC修饰的发展提高了基于富集策略的灵敏度和特异性。为了区分mC和hmC,许多这样的方法涉及使用BGT将hmC高选择性地酶促糖基化为更大且独特的残基glc-hmC广泛使用的技术是hMe-Seal,其中BGT通过从化学修饰的辅因子类似物UDP-glc-azide转移叠氮化物修饰的葡萄糖来催化hmC衍生化。随后通过点击化学连接生物素,并用于选择性链霉亲和素-生物素下拉含hmC的DNA并进行测序。这种技术已经在各种细胞系、组织和cfDNA中进行了大量研究以绘制hmC全基因组图谱。其进一步的进展,Nano-hmC-Seal展示了超低量基因组DNA的hmC比对能力。

Liutkevičiūtė等人提出了一种不需要UDP-glc-azide辅因子的hmC替代化学-酶促衍生化方法。发现M.SssI(和其他一些DNA C5 MTase)可以hmCpG位点中5-羟基团与带有功能性氨基基团的烷硫基团的序列特异性替换。连接的脂肪族氨基允许NHS生物素试剂的化学连接,以选择性富集和分析含hmC的DNA。

5.2 束缚寡核苷酸引物测序(Tethered Oligonucleotide-Primed Sequencing, TOP-Seq)

为了将基于富集方法提供的分辨率极限从200-500 bp提高到单核苷酸水平,提出了一种称为TOP-seq(Tethered Oligonucleotide-Primed sequencing,束缚寡核苷酸引物测序)的方法。该方法的特征是,DNA寡核苷酸被共价连接而不是生物素基团,以使DNA聚合酶链合成能够在共价标记的CpG基因组位点进行非同源诱导。在其进一步更新优化中,hmTOP-seq,DNA寡核苷酸通过铜(i)促进的叠氮-炔烃点击化学连接在BGT叠氮衍生的糖基化hmC残基上,然后作为引物生成扩增子,其中起始序列标记基因组中初始hmC的精确位点。hmTOP-seq初步研究表明,该方法在哺乳动物基因组样本和cfDNA中高分辨率和成本效益的hmC分析方面具有广泛的适用性。亦有研究人员独立的提出一种类似的方法,利用无铜点击化学将DNA发夹连接到hmC上,以在修饰的胞嘧啶周围(20 bp窗口)进行序列read;此时产生了更大的束缚基团,与铜(I)促进的标记相比,这似乎对聚合酶引导的精确度和效率产生了负面影响。

5.3 基于化学转化的碱基分辨率方法

多年来,单C分辨率进行全基因组mC(5-甲基胞嘧啶)分析的金标准方法是亚硫酸盐测序(BS-seq)。亚硫酸盐处理下mC和C的差异反应性构成该方法的基础:mC对亚硫酸盐促进的脱氨基作用非常稳定,随后读作为正常的C碱基,而未修饰的C读作为T碱基。随着ox-mCs(氧化甲基胞嘧啶)的发现,标准亚硫酸盐处理的信息量显得不足,因为亚硫酸盐在5-羟甲基基团会产生一种水解稳定的5-磺酰甲基胞嘧啶(smC,也称为胞嘧啶5-亚甲基磺酸盐),无法与mC区分。此外,hmC进一步氧化的产物caC和fC被解释为未修饰的C(T)。mC和hmC或caC和fC在BS中的不可区分行为很可能是ox-mC在DNA修饰分析中长期被忽视的原因。因此,由于标准亚硫酸盐化学仅提供mC + hmC信号与未修饰胞嘧啶(加上非常罕见的fC和caC)的总和,这引发了对特定预处理方法以检测hmC的需求。目前广泛使用的两种方法是基于在标准BS之前对hmC进行酶促或化学氧化。TET辅助的亚硫酸盐测序TAB-seq是一种化学酶法方法,利用糖基化保护hmC,随后通过小鼠TET1酶将mC氧化为caC。在亚硫酸盐测序后,hmC读作为C碱基,而所有其他胞嘧啶形式被解释为未修饰的C(T)。在另一种称为氧化亚硫酸盐测序的方法OxBS中,hmC通过高钌酸钾(KRuO4)氧化为fC,然后转化为T,而mC保持为C。OxBS中hmC的量和基因组位点通过从标准BS信号中减去hmC轨迹来确定,因此,需要并行处理两个样本。在TAB-seq中也需要基于减法分析策略来区分hmC和mC(从BS信号中减去TAB-seq信号),增加了分析成本,因为每种胞嘧啶的测序深度必须非常高才能在两种方法中检测到低水平的hmC。


尽管亚硫酸盐处理是DNA甲基化分析金标准,但也存在一些缺点。亚硫酸盐处理会导致input DNA降解,而所有未修饰胞嘧啶的脱氨基作用会导列复杂度降低,从而带来分析挑战。这促使了替代性的无亚硫酸盐单碱基分析方法的出现。新颖的化学策略被用于一种称为TET辅助吡啶硼烷测序(TAPS)的化学酶法无亚硫酸盐方法:TET蛋白将mC和hmC转化为caC,然后caC被吡啶硼烷(PB)还原为二氢尿嘧啶(DHU),并以T形式进行测序。吡啶硼烷化学的重要进展是直接read修饰碱基,同时保持未修饰C的完整性,其破坏性较小,与BS相比,能够提供更好的序列质量、比对率和覆盖度。尽管TAPS的协议提供了关于mC + hmC信号的信息,但引入的优化方法通过使用高钌酸钾(K2RuO4)处理代替TET介导的氧化,以及在PB(或吡咯基硼烷(pic-borane))转化之前对hmC进行糖基化保护,使得CAPS和TAPSβ方法能够分别独立比对hmC和mC。另一种新颖的无亚硫酸盐化学策略用于检测hmC称为hmC-CATCH,基于使用高钌酸钾(K2RuO4)选择性氧化hmC为fC,然后使用1,3-吲哚二酮衍生物对新生成的fC进行标记,这导致hmC在测序中转化为T,而内源性fC在氧化反应之前被阻断。hmC-CATCH的DNA降解小,并且能够在低input DNA下提供单碱基hmC分析,如在循环游离DNA(cfDNA)分析中的应用所示。

5.4 酶辅助的碱基分辨率方法

与BS(亚硫酸盐测序)相比,ACE-seq(APOBEC-coupled epigenetic sequencing)和EM-seq(Enzymatic Methyl-Seq)方法对DNA的处理更为温和,它们都利用AID/APOBEC家族的DNA脱氨酶将C水解为U。ACE-seq方法提供直接hmC测序,而EM-seq检测常见的mC + hmC信号,并要求通过ACE-seq获得的信号进行减法以定位mC。尽管基于APOBEC脱氨酶的方法都具有非破坏性特征,但它们仍然可能受到C脱氨后碱基含量低复杂度的影响,因此,低DNA量的分析可能会变得复杂。提出的一个测序平台使用了类似的酶促核苷酸转化,可以在不进行泳道减法的情况下推导出四种遗传碱基和两种胞嘧啶的表观遗传状态(mC和hmC)。通过在一个实验工作流程中连接和复杂处理每个基因组片段的两条链来实现。

限制性内切酶切割长期以来一直用于DNA修饰分析,作为一种简单易行且具有成本效益的策略。由于限制性内切酶的严格序列特异性,这些方法提供了碱基分辨率的DNA修饰分析。但是,由于它们的靶位点长于两个核苷酸(通常为4-6 bp),因此该方法只能检测所有基因组CpG位点的一小部分。已经开发了几种hmC分析方法,将限制性内切酶消化与hmC的酶促葡糖基化相结合。其中第一个适用于全基因组分析hmC利用HpaII和MspI限制性核酸内切酶对其靶序列CCGG内胞嘧啶修饰的差异敏感性。BGT介导的糖基化使ChmCGG位点对MspI切割具有抗性,可以通过qPCR、微阵列或下一代测序对其进行富集和分析。

更近期的策略包括Aba-seq方法和Pvu-Seal-seq。在Aba-seq中,AbaSI限制性内切酶在识别的糖基化hmC附近切割一定距离的DNA片段,然后将切割的片段被下拉并测序。Pvu-Seal-seq中的PvuRts1l限制性内切酶识别羟甲基化的目标位点,并在下游11-12bp处切割。PvuRts1l切割进一步与BGT和UDP-叠氮葡萄糖对hmC的共价标记相结合,用于特异性分离修饰DNA,如上述的hmC选择性化学标记方法hMe-Seal所述。尽管所有基于限制性内切酶的方法都无法定量检测全基因组hmC,但它们的固有特征是能够灵敏地检测低度羟甲基化的目标位点,而无需BS方法的深度测序。

5.5 单分子长读长生物物理检测

有几种方法允许在DNA的原始片段上进行表观遗传修饰单分子分析。其中一种方法是在原生染色体DNA中光学比对hmC。该方法使用荧光团对hmC进行两步标记,然后通过纳米通道拉伸DNA链进行荧光图像分析。荧光团沿着线性DNA链的物理定位产生亚兆碱基规模的长DNA分子的表观遗传谱,可以独立解释或与遗传(序列特异性)荧光图谱一起解释。通过检测显微镜技术和纳米通道中DNA链的物理波动来确定1 kb的比对分辨率,如在固体表面上进行DNA拉伸和dSTORM成像的试点实验中表明可以达到10 nm或仅20 bp。

第三代测序技术通常避免DNA衍生化和DNA扩增,直接对DNA片段进行测序。在Oxford Nanopore Technologies(ONT)商业提供的纳米孔测序中,通过读取核酸链通过纳米孔时的离子电流分布来实现测序。Pacific Biosciences提供的单分子实时(SMRT)测序跟踪固定在零模波导中的DNA聚合酶掺入荧光标记的dNTP。在这种情况下,模板链上存在的碱基修饰会改变核苷酸掺入的动力学(dNTP到达和停留时间),从而可以在多个测序轮次中进行鉴定。在这两种情况下,DNA修饰都会导致测量信号的细微和背景相关的偏差。因此使用体外制备的training DNA底物进行广泛的信号处理和机器学习,以破译修饰碱基的存在和身份。尽管已经证明了在某些CpG环境中通过其纳米孔信号特征区分五种胞嘧啶变体的原理,通过将mC和hmC分别酶促转化为caC124和glc-hmC,可以实现选择性信号增强,以改进mC和hmC的SMRT检测。ONT和PacBio都将其工具集成到了默认的测序软件中。对于原生DNA,目前的检测仅限于CpG位点,仅适用于mC和hmC(ONT Remora)或mC(PacBio)。第三代测序的进一步动态发展似乎即将带来单分子灵敏度,可靠的原生胞嘧啶修饰区分,长读长和高通量自动化优势。

6、hmC-DNA的结构和相互作用

hmC(5-羟甲基胞嘧啶)在B型或A型DNA的螺旋结构上不会引起的结构变化,这一点通过X射线晶体学或NMR观察得到证实。一般来说,当C被mC或hmC取代时,存在减少的扭转和增加的滚动角度的趋势,这可能是由于胞嘧啶5位取代基的空间位阻所致。hmC在修饰位点导致主沟槽宽度增加了0.8 Å(4.5%),这与mC或其他C5修饰类似。

上:C和5修饰的胞嘧啶以及碱基对(灰色虚线)和3'邻近(CpG)鸟嘌呤残基的棒状图。hmC有两种主要构象:a(占70-80%)和b(占20-30%)。

下:DNA主沟槽中胞嘧啶变体的空间填充表示。浅灰色–Dickerson Drew dodecamer。(修饰)胞嘧啶第9号位(PDB ID 3u2n,4glg,4i9v,4pwm,4qc7)的C5位灰色(碳原子)、红色(氧原子)。

7、hmC在哺乳动物中的生物学作用

发现的主动和被动mC去除提供了证据,表明DNA甲基化是一个双向的、动态调节的过程;甲基化和去甲基化事件发生在不同的发育程序和环境线索下的不同时间和基因组区域。经过十多年的hmC研究,其生物学意义开始出现,仍在广泛讨论中。尽管hmC是由其前体mC在TET介导的主动去甲基化通路中产生的,但hmC似乎在许多细胞类型中持续存在,反驳了hmC仅是去甲基化中间体的观点。

7.1 hmC在复制、修复和重组中的作用

hmC和DNA修复的密切相互作用源于BER/NER通路参与TET诱导的DNA去甲基化。导致hmC水平提高的TET活性也会产生更多的fC和caC,从而激活BER。与mC相比,这一想法与hmC富集区域突变频率降低一致,mC标记了mC→ T突变导致基因组CpG耗竭热点。与相关碱基hmU、U、fC和caC不同,hmC不是碱基切除机制的底物,因此可以在基因组DNA中积累到相当高的水平。

基因组分析研究检测到DNA损伤位点和停滞的复制叉处的hmC水平升高。在配子减数分裂重组期间的DNA双链断裂处也发现了hmC的存在。有人提出,mC到hmC的转化可能阻止了对mC亲和因子的结合。然而,改变TET活性以改变hmC水平的实验并没有明确指出产生的hmC是否直接参与招募DNA修复组分到问题位点,或者只是与积极切除的fC和caC一起产生的被动旁观者。

哺乳动物的复制起始点没有明显的DNA甲基化、特定组蛋白修饰或共有序列明确标记,已被证明hmC富集。hmC似乎介导G1和M期前体复制复合物的组装,然而在复制起始点的激活之前或期间,hmC必须被移除,然后在新复制的DNA中重新组装。因此,hmC水平升高会延迟G1期的进程,减少细胞分裂。这些观察结果指向hmC在细胞周期调控中的直接参与,并可能解释为什么非分裂神经元群体显示出高的hmC含量,而快速分裂的神经前体细胞几乎没有hmC。

另一方面,有人提出,基因组hmC含量实际上可能取决于细胞周期的持续时间。哺乳动物细胞和组织中对DNA中胞嘧啶衍生物的代谢同位素标记表明,hmC发生在复制期间或复制后,hmC在DNA合成后的30小时内缓慢形成。这种延迟的hmC出现可以解释为什么快速分裂的细胞会含有较少的hmC,这与观察到的hmC整体水平与细胞增殖速率之间的负相关关系一致。

7.2 hmC参与转录

Rausch等人在活细菌、酵母和哺乳动物细胞中检测了mC和hmC全基因组转录和复制的影响。研究结果表明,虽然mC稳定了DNA螺旋并降低了DNA解旋酶和RNA/DNA聚合酶的速度,但hmC将双链稳定和基因组代谢效应恢复到未修饰的胞嘧啶水平。在生化实验中,ICV启动子上的hmC强抑制转录,而其在基因体中的存在几乎对转录没有影响。

不同的hmC分析研究发现其优先分布在活性基因的基因体、3'UTR,活性或待激活的增强子、发育相关基因的启动子以及转录因子结合位点周围。hmC参与表观遗传调控已经表明hmC和fC/caC在全基因组中的差异积累。例如,在小鼠ESC中,>90%的hmCG位点与fC和caC位点存在差异,只有约19%的fC/caC位点与hmC重叠。与可变剪接外显子相比,hmC在外显子-内含子边界的定位及其在组成型外显子中的丰度提出了其在可变剪接中的作用的想法,表明主要的基因组绝缘子和多功能调控甲基敏感蛋白CTCF与替代外显子中的基因内hmC结合,并与替代外显子包含相关。且hmC水平在正义链上更高。基因体hmC与基因表达的关联已得到广泛证实,尽管其影响是双向的:例如,它促进ESC和许多其他细胞类型的基因表达,但与神经元祖细胞的转录负相关。而高表达基因通常在许多细胞类型的启动子上表现出hmC耗竭。

hmC和其他ox-mC作为独立的表观遗传调节因子间接得到了结合蛋白差异的支持,这些结合蛋白主要是转录调节因子。例如,MeCP2可以结合mC和hmC,从而改变染色质结构并促进神经细胞中的基因表达。而MBD1可以特异性结合mC,但不能与ox-mC结合。mC结合的MBD1可以招募组蛋白甲基转移酶SETDB1,从而促进H3K9甲基化和基因抑制。此外,基因体上的hmC分布调节H3K36me3标记沉积,表明活性转录,从而集体改变了异染色质和/或常染色质区域基因活性的染色质构象。

7.3 hmC在细胞分化和重编程中的作用

在定义TET蛋白和hmC在干细胞多能性中的作用方面存在一定争议。在小鼠ESC中,TET1高表达、TET2缺失或TET1/TET2双缺失并未影响多能性或发育,尽管会降低hmC水平并诱导转录变化。然而,TET1/TET2缺失可能会延迟分化过程中的转录变化,或诱导ESC特定谱系。此外,三重突变体(TET1、TET2和TET3)mESC是可行和多能的,尽管显示出hmC缺失、启动子高甲基化和分化潜能受损,支持DNA主动去甲基化在分化中的重要作用。

TET介导的氧化在ESC中的主要作用是维持调节区的去甲基化状态,特别增强子和启动子是重编程的主要靶标。在ESC中,高水平的hmC标记沉默的二价启动子,其分别含有抑制性和活化性组蛋白标记H3K27me3和H3K4me3,并且通常在分化时被激活。TET和DNMT蛋白拮抗以调节增强子和启动子的甲基化状态; TET1可以从TET1优先结合ESC的启动子中排除DNMT3A1。此外,TET蛋白与转录因子紧密结合,介导mC的逐步氧化并调控发育基因的基因表达。例如TET1和TET2与多能性因子Nanog互作以提高重编程效率,或与各种异染色质相关蛋白(如HDAC组蛋白脱乙酰酶)一起重塑染色质并调控转录。

其他研究表明,TET蛋白和ox-mCs对于端粒长度的维持很重要,这对于维持多能性、自我更新和基因组稳定性很重要。例如,TET1/TET2双突变体导致DNMT3b和mC/hmC比率升高,从而导致端粒缩短。

有趣的是,通过突变工程使TET2活性倾向于产生hmC,可以剖析在诱导多能细胞(iPSC)重编程过程中hmC与其他ox-mCs的生物学意义。hmC本身的增加似乎不足以驱动表观遗传变化,而fC/caC的形成对于促进重编程位点的快速变化是必要的。此外,在多能干细胞分化为神经元、胶质细胞和肝细胞的过程中,检测到细胞特异性基因启动子中caC含量的增加,因此,caC通路可能作为一种通用的表观遗传重编程机制,用于建立细胞谱系。

在小鼠合子重编程中,大多数hmC由新生mC产生,表明hmC在早期胚胎发育中具有特定的作用。通常hmC的表观遗传作用在细胞分化的背景下变得明显。在红细胞生成过程中,观察到整体hmC水平下降,但尽管进行了多次DNA复制,某些基因组位点的hmC仍然高度富集。在不对称分裂的干细胞中,较高的hmC已被证明可以鉴定保守的DNA链染色体。在神经元细胞中,TSS的hmC缺失,无论基因表达水平或CpG含量如何。有人提出,在早期发育中,大脑特异性增强子会被羟甲基化,但后来,增强子的羟甲基化和去甲基化阶段都以细胞类型特异性方式受到差异调控。总体而言,这些数据表明需要正确功能的TET介导的DNA去甲基化来进行分化、重编程和细胞命运决定。

7.4 hmC作为诊断和预后标志物

适当的DNA甲基化和去甲基化之间的平衡维持了健康细胞的DNA甲基化谱,而在癌症中这种平衡被严重破坏。有充分证据表明,在许多癌症类型中,hmC的整体水平降低,表明hmC具有潜在的临床相关性。有人可能会认为,在癌细胞等密集分裂的细胞中,hmC降低可能与通过被动DNA去甲基化去除hmC有关。然而,在健康发育的细胞中,尽管进行了多次DNA复制并降低了整体hmC水平,但某些基因组位点的hmC仍然高度富集。在许多癌症中不存在TET遗传变化,因此hmC整体丢失的基础并不清楚。一些肿瘤表现出异柠檬酸脱氢酶活性增加(IDH1或IDH2的功能获得突变),导致产生2HG,一种代谢产物和TET功能抑制剂。此外,在缺乏营养的肿瘤条件下,葡萄糖/谷氨酰胺水平的降低可能会影响细胞内2OG/琥珀酸比,即使没有遗传性TET和IDH突变,细胞内2OG/琥珀酸比也会下调TET并引起hmC丢失。其他因素如缺乏Fe(ii)、抗坏血酸或缺氧也可能会减弱TET活性。用抗坏血酸补充癌细胞可以恢复hmC水平并抑制癌症的生长和迁移。一般来说,癌症中hmC丢失机制可能比TET或IDH酶的异常功能所定义的更具整体性。研究表明简单地重编程hmC和TET酶可能会降低肿瘤的生长和侵袭性。多项研究表明hmC降低与肿瘤侵袭性之间的相关性,提出了hmC水平可用于预测转移、复发和预后。有研究人员尝试通过cfDNA中的hmC数量或hmC组织特异性分布来预测癌症的类型或阶段。除了hmC与癌症之间广泛证实的联系外,组织特异性hmC监测的临床相关性也被证明适用于其他复杂疾病,例如非侵入性诊断胎儿唐氏综合症、阿尔茨海默病和2型糖尿病。

除了作为疾病标志物的价值外,hmC还可能具有一些治疗价值。细胞部署了一个双层保护系统,以避免通过核苷酸补救实验将修饰的核苷零星掺入DNA中。然而,这个系统在快速增殖的癌细胞中更加混杂,这使它们更容易接受修饰的胞嘧啶治疗,从而为调控癌症的潜在治疗选择开辟了新的途径。

8、结论

从生物学角度来看,hmC呈现胞嘧啶的表观遗传状态,其中严格意义的5-甲基标记不再存在,但C5位点上仍存在外环基团,阻止其再甲基化。胞嘧啶的这种化学稳定的表观遗传状态(功能去甲基化)是如何解决的?值得注意的是,hmC不被某些甲基CpG结合结构域蛋白识别,例如转录抑制因子MBD1和MBD2,表明mC向hmC的转化可能会减弱mC的基因沉默效应。在存在维持性MTase如Dnmt1的情况下,hmC模式将部分复制到子链上的mC中(被动还原)。可以合理地假设,尽管由主要表观遗传标记mC产生,但hmC可能作为次要表观遗传标记发挥其独特的调节作用;在许多情况下,它可能表现为DNA中的减弱(部分沉默,降低)甲基基团。

需要考虑的其他几个因素如下。hmC在全基因组中的分布不均匀,与其他修饰胞嘧啶的分布不同。hmC的丰度低于mC,但在某些细胞类型和遗传位点上,其丰度相当高,足以作为致病的表观遗传标记持续存在。一个严格的保护系统防止了hmC核苷酸通过NSP在哺乳动物DNA中的零星掺入。所有这些都表明,在某些位点和某些时间点上,hmC的存在或缺失(而不是mC丢失)具有功能重要性。有多个已经确立的例子表明,hmC与细胞机制的直接互作导致了对细胞的明确后果。因此似乎可以公平地得出结论,除了作为去甲基化通路中的中间体的明确作用外,hmC还用来作为哺乳动物细胞中生物过程的生物标记和/或调控因子发挥其他表观遗传作用。