微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 技术前沿 > IF38!DNA甲基化相关癌症的诊断与预后分析~

IF38!DNA甲基化相关癌症的诊断与预后分析~

文章来源:健康界发布日期:2022-12-06浏览次数:64

01 ESCC中差异甲基化CpG位点概述

在通过质量控制的 429,717 探针中(92%),35,577 个(8.28%)在肿瘤和邻近的正常样本之间存在差异甲基化(DMC )(FDR q < 0.05,中位甲基化差异 |MMD | > 0.20 ),其中 56.54% (20,114/35,577) DMC 是低甲基化的。DMC 的分布在染色体之间不同,主要富集于 8 号染色体,在 22 号染色体中大部分不存在。高甲基化位点主要富集在 18 号和 19 号染色体中,而低甲基化位点主要富集于 8 号染色体中。

此外,DMCs 在基因间和增强子区域富集,在基因间区域具有比超甲基化 CpG 位点更多的低甲基化位点,在增强子区域同样具有丰富的超甲基化和低甲基化位点。超甲基化 CpG 位点也富集在 CpG 岛和 DNase I 超敏位点,而低甲基化位点也富集在开放海区域,在启动子区域内的超甲基化位点多于低甲基化位点。在染色体水平上,8号染色体富含低甲基化位点,主要存在于公海、基因间和增强子区域;18 号和 19 号染色体富含高甲基化位点,主要分布在 CpG 岛、启动子和 DNase I 超敏反应位点中。 本研究的 ESCC 样本的基因组在启动子和邻近区域包含了超出预期的高甲基化,而低甲基化在整个基因组中占主导地位。73241 (9.11%) 启动子或基因体 DMCs 与其宿主基因在 ESCC 中的表达水平相关。这些 DMCs大多在 7 号染色体中并且更有可能驻留在基因体中而不是启动子和邻近区域。

因为启动子和基因体上的 DMCs通常以不同方式影响宿主基因表达,本研究使用在之前研究中获得的相同患者的基因表达谱,研究了启动子-DMC 与负表达-甲基化的相关性和基因体-DMCs与正表达-甲基化的相关性。在肿瘤和邻近正常样本之间差异表达的蛋白质编码基因中,90 个下调基因和 44 个上调基因分别与其启动子区域的 224 个高甲基化和 70 个低甲基化 CpG 位点相关;274 个下调基因和 70 个上调基因分别与其基因体中的 764 个低甲基化和 221 个高甲基化 CpG 位点相关。

负相关启动子-DMCs可能调控异常的宿主基因在金属离子结合、转录因子活性和转录调控的GO类中富集,而正相关基因体-DMCs可能调控异常的宿主基因在系统发育和细胞部分形态发生的GO类中富集。根据这一结果,本研究检测了这些DMCs相关基因与已知的人类转录因子(TF)之间的重叠,发现TF在高甲基化相关基因中富集,包括与启动子高甲基化相关的90个下调基因中的32个和与基因体高甲基化相关的70个上调基因中的39个。前一组(32个下调的转录因子)大多是锌指基因家族的成员,如ZNF38228,而后一组(39个上调的转录因子)包括29个潜在的致癌同源盒子基因,如HOXB13DLX129,这表明全基因组DNA甲基化异常可能导致参与多种分子过程的多个转录因子的失调,有助于ESCC的发生和发展。

02 差异甲基化的CpG位点与ESCC特异性遗传变异相关

本研究在之前发现的 9 ESCC 驱动基因 FAT1NOTCH1JUBMLL2PIK3CATGFBR2NFE2L2NOTCH3 ZNF75025 中发现了复发性启动子或基因体 DMC(每个在 >51% (46/91) 患者中)。多达 97% (88/ 91) 的患者在这些基因中具有启动子或基因体 DMC

然后本研究将差异甲基化事件的频率与之前发现的复发ESCC基因组变异相关联。结果发现高甲基化事件与基因RB1NOTCH1CDKN2APIK3CA的体细胞突变、3q26.327p22.314q13.3的扩增和2q22.1的缺失相关;低甲基化事件与基因CREBBPNOTCH3的体细胞突变、19q13.12的扩增和3p14.213q14.3的缺失相关CismeQTL分析表明,ESCC组织中292DMC4864个邻近SNPs相关,相邻正常组织中2064DMC29321SNPs相关。与相邻正常相比,1974DMCs在肿瘤基因组中失去了遗传控制,202DMCs获得了新的相关性。

03 差异甲基化的CpG位点是ESCC的有效诊断/预后标志物

不仅已鉴定的 DMC ESCC 的各种分子特征相关,它们还可以将 ESCC 与正常食管组织区分开来。首先本研究假设相对少量的 DMC 标记物足以用于 ESCC 诊断。为了识别此类标记,本研究将患者随机分为训练集 (n = 60) 和验证集 (n = 31),并从1034个甲基化水平与其宿主基因表达水平呈负相关(或正相关)的启动子/基因体DMC 开始。训练集中的肿瘤和相邻的正常样本被 1034 DMC 充分分离。将随机森林和 LASSO 应用于这些 DMC 生成了一个包含 12 DMC 的模型。

该模型在训练集中达到了 98.33% 的灵敏度和 93.33% 的特异性,在验证集中达到了 96.77% 的灵敏度和 特异性。本研究还计算了ROC曲线,曲线下面积 (AUC) 在训练集和验证集中分别为 99.6% 97.1%。当在其他 ESCC 数据集中进行测试时,该诊断模型始终显示出高灵敏度、特异性和 AUC(图 4cf )。基于这些 DMC 的无监督层次聚类清楚地将 ESCC 与正常组织样本区分开来。

接下来本研究根据 DMC 与样本和 TCGA ESCC 样本中 ESCC 患者总生存 (OS) 时间的相关性,在 DMC 中寻找潜在的预后标记。对于每个 DMC,本研究构建了一个 Cox 回归模型,将该 DMC 作为单一预测因子,并将年龄、性别、吸烟状况、饮酒状况和肿瘤 TNM 分期作为协变量。结果四个 DMC与样本中的患者生存期相关。然后,本研究通过对这 4 DMC 的甲基化水平求和构建了一个预后模型,每个 DMC 均由相应 Cox 回归结果中的风险比 (HR) 加权。该模型将患者分类为具有高或低预后风险,其中高风险患者的中位 OS 明显短于其他患者。将该模型应用于 TCGA ESCC 样本产生了类似的结果:预测的高风险患者的中位 OS 短于低风险患者。

接下来本研究进一步对不同肿瘤阶段的患者进行了生存分析,以评估预后小组的鉴别能力。在早期(I II)患者中,低风险组的 OS 时间比高风险组长,模型在 TCGA ESCC 队列的早期患者中表现不佳。对于晚期疾病患者(III 期和 IV 期),本研究的模型特别强大。晚期 ESCC 患者的中位 OS 时间对于高风险组为 12 个月,而对于低风险组为 23.5 个月。同样,在 TCGA ESCC 样本中,晚期 ESCC 患者的中位 OS 时间对于高风险组和低风险组分别为 13 个月和 42 个月。本研究还检查了 TCGA ESCC 数据中上述 16 种诊断/预后标志物的差异甲基化状态。与正常样本相比,其中 10 个在 TCGA ESCC 样本中显示出类似的甲基化变化。其余六个标记表现出相似但不太强烈的甲基化变化。

04 确定的诊断和预后标志物的功能意义

本研究所发现的一些 DMC 标记位于蛋白质编码基因的启动子或基因体中,可能通过影响这些基因的表达而促进 ESCC 的发展或进展。为了检验这个假设,本研究首先寻找甲基化水平与宿主或附近基因的表达水平相关的标记。结果发现标记的甲基化状态与相应宿主基因的表达水平呈负相关或者正相关。

接下来,本研究将重点放在ESCC样本中表达水平增加并与相应DMC标记的甲基化水平相关的标志宿主基因上,假设在体外降低这些基因的表达将降低ESCC细胞的恶性程度。选择启动子中带有DMC标记的MMP13YEATS2HOXC10以及带有基因体DMC标记的NECAB2用于功能实验。与匹配的正常组织样本相比,这四个基因在 ESCC 样本中过表达,并且表达水平与相应 DMC 的甲基化水平密切相关。本研究还敲低了这些基因在 ESCC 细胞系中的表达。结果发现siRNA沉默YEATS2HOXC10NECAB2表达可抑制ESCC细胞增殖、迁移和侵袭;沉默 MMP13 的表达抑制 ESCC 细胞迁移和侵袭,但不抑制增殖。

小编总结

本研究使用多组学方法对 91 名中国 ESCC 患者的全基因组 DNA 甲基化异常进行了表征,支持了异常 DNA 甲基化是 ESCC 发展和进展的重要组成部分。该研究还针对少量具有潜在功能的甲基化 CpG 位点,这些位点能够将肿瘤与正常组织区分开来,或将患者分为高危或低危组。使用这些 CpG 位点,本研究构建了用于 ESCC 分子诊断和预后的 DNA 甲基化面板,并在多个公共数据集中对其进行了验证。

本研究有几个局限性。首先,DNA甲基化分析受到微阵列固定设计的限制。其次,标记筛选和功能验证仅限于主要以顺式方式影响宿主蛋白编码基因的DMCs,而DMCs可以远距离(即反式)影响,也可以对非编码元件产生影响。此外,这些影响可能不是严格的一对一的,而是形成一个相互关联的网络。