微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 技术前沿 > 全基因组测序在病原菌耐药基因分型中的应用研究进展

全基因组测序在病原菌耐药基因分型中的应用研究进展

文章来源:健康界发布日期:2022-11-15浏览次数:53

细菌耐药性日益严重,了解细菌的耐药机制,有助于临床治疗,同时也可延缓耐药性的产生。随着全基因组测序技术的日益兴起,研究者可借助此技术充分认识和理解细菌耐药基因的分型。本文主要对多种全基因组测序平台的技术特点与常用耐药基因分型工具进行综述。

全基因组测序平台的介绍

高通量、短周期和低成本是新兴测序技术的关键词。大多数全基因组测序技术是将DNA随机片段化,从DNA片段的一端或两端进行测序,所得到的片段称为读段(reads)。第二代高通量测序技术平台主要由454(2005年)、Illumina(2006年)、SOLiD(2007年)与Ion Torrent(2010年)等组成。目前454和SOLiD平台已逐渐退出市场,现有的二代测序平台主要有Illumina和Thermo Fisher开发的一系列测序仪,如NovaSeq 6000、HiSeq X Ten、Ion PGM与Ion S5等。Illumina测序平台的工作原理为边合成边测序技术,通过预先建立的样本测序文库,使用荧光标记核苷酸(脱氧核苷三磷酸)来检测DNA序列。Ion Torrent测序仪是不依赖光学系统的测序平台,通过集成的互补金属氧化物半导体(CMOS)和离子敏感场效应晶体管(ISFET)捕获DNA合成时碱基延伸释放的H+,检测溶液pH的变化,将化学信号转化为数字信号,实时判读碱基,获得每个DNA片段的碱基序列。Ion Torrent平台提供了多种类型的芯片和仪器,可满足不同研究人员的需求。与其他测序技术相比,Ion Torrent测序技术不依赖荧光标记以及光学图像采集技术,使其在测序的成本、速度和费用上具有不可比拟的优势。

近年来,我国华大基因研发的DNBSEQ平台采用联合探针锚定聚合(combinatorial probe-anchor Synthesis,cPAS)和DNA纳米球(DNA nanoball,DNB)等核心技术,通过DNA分子锚和荧光探针在纳米球上进行聚合,并经高分辨率成像系统采集与数字化处理光信号后即可获得DNA序列。

以单分子实时定量(single molecule, real-time,SMRT)测序为特点的第三代测序技术,改善了测序读长偏短的问题。第三代测序的主流平台是Pacific Biosciences公司于2011年推出的PacBio RS系统(2015年推出RSII系统),其核心在于零级波导技术(zero-mode waveguide,ZMWs),支持边合成边测序。借助该技术,系统可实时记录光信号,同时可检测数千个高速进行的单分子测序反应。随着电子和信息化技术的不断革新,孕育出第三代测序技术的新起之秀——Oxford Nanopore公司的MinION。其核心技术是整合于测序芯片的蛋白质纳米孔,具体原理是将蛋白质纳米孔嵌入电阻聚合物膜中,特异的马达蛋白携带已标记的单个DNA片段,通过测量DNA单链穿过纳米孔所引起的电导率变化,从而检测单个核苷酸序列。由于该系统支持边测序边实时读取数据,从而可大幅缩短测序与数据分析的流转时间。在每张测序芯片上,系统能有较长的时间读取接近原始输入长度的DNA片段,保证了芯片的高输出量。随着Nanopore测序芯片的升级,如2019年初发布的新型纳米孔R10,配有两对读取头(dual reader head),能够对同一碱基进行两次信号识别,准确度可达99.995%。

全基因组测序在病原菌耐药基因分型中的应用

在细菌全基因组水平上,利用生物信息学分析方法,研究者能在基因组水平识别细菌携带的耐药基因与毒力基因。细菌的耐药机制可分为两大类:固有耐药和获得性耐药。细菌对抗菌药物的耐药性通常是由耐药基因编码的,可通过多种机制介导,如基因的点突变、插入、丢失或通过基因水平转移(horizontal gene transfer,HGT)的方式获得外源耐药基因。从全基因组测序数据中识别耐药基因主要分为2种分析模式:一种是序列组装后比对分析(assembly-ba[x]sed),另外一种是直接利用测序读段映射分析(read-ba[x]sed)。

研究者可利用比对工具(例如BLAST、USEARCH或DIAMOND)将细菌基因组草图中的蛋白质编码区与耐药基因参考数据库进行比对,得到耐药基因的注释结果。不同数据库对同一耐药基因不同亚型的注释结果可能会存在差异,这导致了部分耐药基因的别名不统一。目前,NCBI正在积极开发细菌耐药基因参考数据库(NDARO),并提供离线版的耐药基因识别工具(AMRFinderPlus)供用户使用。另一种分析策略则是略过组装过程,直接将测序读段与耐药基因参考数据库进行映射比对(Bowtie2或BWA),先将读段拆分成若干大小相等的k-mer,再映射到参考数据库。SRST2是一种常用的耐药基因识别工具,其原理是使用Bowtie2将测序读段映射到耐药基因参考数据库,检索菌株携带的耐药基因。KmerResistance通过将测序读段拆分为若干个k-mer短片段后,映射到耐药基因参考数据库来识别耐药基因。若测序数据中存在其他数据干扰或者无法进行从头组装时,上述2种工具都可识别出测序数据中的耐药基因是否存在以及其与参考序列的相似度,但却无法识别耐药基因中的点突变。ARIBA工具则解决了这个问题,该工具利用CD-HIT聚类耐药基因参考数据库中的序列,然后分别组装每个聚类的序列,再与测序读段进行映射分析,从而能显示耐药基因序列是否完整,同时报告碱基突变位点。

上述2种耐药基因分析模式各有优缺点。测序读段映射分析方法绕过了从头组装步骤,对计算资源需求较少、耗时较短,有利于临床诊断中实时耐药基因检测;可检出复杂环境中的低丰度基因,比组装后注释的策略灵敏度更高。另外,使用当前主流的几个耐药基因数据库ARG-ANNOT、CARD、ResFinder及NCBI-AMRFinder数据库识别耐药基因时,相同序列可能会对应不一致的耐药基因亚型注释结果。此外,基于WGS数据可利用一些机器学习方法来预测菌株的耐药性表型,其中包括深度学习模型(Deep learning)、随机森林模型(Random Forest)和Logistic回归模型等。这些算法利用已知的耐药基因数据结合其对应的药敏试验数据进行训练,因此实验室检测的AST数据集及耐药数据库信息的丰富度和标准化是开发机器学习方法的主要挑战之一。

尽管全基因组测序技术在鉴定病原菌耐药表型方面具有一定的优势,但在研究某个具体基因型与表型的相关性时,为避免假阳性,通常还需结合分子生物学实验验证。实验设计需遵守1988年Falkow提出分子科赫法则,即“基因失活造成表型消失,重建则表型恢复”。

结语与展望

目前,WGS在微生物学中已有许多临床应用场景,可为如何有效监测、预警与防控多重耐药菌感染这一重要临床问题提供可行的解决方案,但这个技术仍依赖生物信息学家的信息挖掘。缺少标准化的分析流。大数据时代,开发用户友好型的分析软件,扩充、标准化,实时更新公共数据库,登记详细的病原菌基因组信息与表型信息,这些都将有利于WGS的临床研究和实践。