微信公众号 联系我们 关于我们 3618客服热线:020-32784919   推广热线:020-32780069
资讯
频道
当前位置:首页 > 医疗器械资讯 > 技术前沿 > 宏基因组学支持的微生物监测

宏基因组学支持的微生物监测

文章来源:健康界发布日期:2022-07-28浏览次数:48

病原体监测策略的目标各不相同,从确定物种和菌株到检测抗生素耐药基因或质粒。从这个角度来看,我们关注宏基因组学在改善公共卫生决策病原体监测方面的应用潜力。这与临床诊断的宏基因组学不同,后者的主要目的是为了临床管理,确定个体(或多个)样本中是否存在致病病原体。公共卫生病原体监测通常在医院、净水厂和农场进行,并特别应用于被认为可能是紧急疾病来源的地点。公共卫生病原体监测的总体目标是监测已知和尚未出现的病原体,推动早期风险缓解方案,以保护人类和动物健康。

2 公共卫生的传统病原体监测

现有的公共卫生病原体监测方法包括基于综合征的感染事件监测、对特定病原体(例如耐甲氧西林金黄色葡萄球菌Staphylococcus aureus)的主动监测以及基于实验室的监测。大多数以实验室为基础的监测工作侧重于监测临床相关特征,如培养分离株中的抗菌素耐药性(AMR)和致病血清型。此外,医院的特定房间或病房,例如强化护理病房,经常使用基于培养的方法对预先确定的病原体清单进行调查。如果在疫情调查中涉及到环境污染物的流行病学问题,则建议对空气、水和表面进行有针对性的采样,以确定潜在来源。从疫情调查中培养的分离株通常采用各种分型方案(如多位点序列分型(MLST)),以确定疾病传播。因此,需要各种各样的实验室技术、设备、试剂和相关的专业技能来对医院中已知的人类病原体子集进行监测。社区病原体监测主要在医院、净水厂和农场进行,并使用多种策略。这些常规方法总结如下。

2.1 预防和管理暴发

公共卫生和定点实验室通过参与疾病通报、监测已知人类病原体和检测患者样本中的病原体来支持传染病监测和疫情调查(1)。除了通过培养和分子检测进行病原体鉴定外,监测还可包括使用不同的分析方法进行菌株分型,例如脑膜炎奈瑟菌(Neisseria meningitidis)的血清分型、金黄色葡萄球菌的MLST和抗生素耐药性检测。传统的监测方案通常需要广泛的实验室能力和分析(1),这使得在地方或国家层面整合信息具有挑战性,更不用说在全球范围内,尽管试图标准化流程(WHO/CDS/CSR/ISR/99.2)。此外,血清分型等技术需要对活的细菌培养物进行操作,其中一些会造成实验室获得性感染(LAI)的重大风险,例如脑膜炎奈瑟菌或伤寒沙门氏菌(Salmonella enterica)血清型。使用全基因组测序(WGS)对细菌、病毒以及在一定程度上对真菌进行检测正在获得越来越多的关注,但尚未成为大多数定点实验室的标准。虽然WGS非常适合这一目的,但前期资源和人力资本要求一直是采用该体系的障碍,特别是在低收入和中等收入国家。

2.2 食品和水安全

传统的食品微生物安全监测依赖于风险评估以及随后有针对性地检测食品中的病原体和卫生或安全指示生物。从复杂的食物基质中富集和选择特定物种需要多种培养方法(1)对食源性AMR的监测基于对选定的食源性致病菌的敏感性测试。对于饮用水,微生物污染的监测也同样基于风险评估。虽然广泛采用了对指示性细菌生物(例如大肠杆菌)的监测,但对水传播病毒和原生动物病原体的监测并未得到一致解决。自2010年代初以来,WGS也已在高收入国家有效部署,以追踪食源性病原体来调查疫情。值得注意的是,尽管低收入国家的食源性疾病负担高,但这些国家往往缺乏采用WGS来缓解疫情的资源。

显示了感兴趣的病原体和特定应用要求的选定示例。 ELISA,酶联免疫吸附测定; MAST,多抗原序列分型; MLVA,多位点可变数目串联重复序列分析; NAATs,核酸扩增检测; PFGE,脉冲场凝胶电泳; RT-PCR,逆转录-聚合酶链反应。 a 通常涉及基质辅助激光解吸电离飞行时间质谱(MALDI-TOF)鉴定、生化测试、抗菌药物敏感性检测和通过乳胶凝集等方法进行的血清分型。

2.3 -动物-生态系统界面

牲畜与各种人畜共患传染病暴发有关,包括由禽流感、猪流感和尼帕病毒引起的暴发。随着畜牧业的集约化,监测可能会在我们防范流行病和大流行病方面发挥越来越重要的作用。监测人畜共患疾病需要人类卫生、动物卫生和农业部门就疾病趋势进行有效沟通,并参与对人类、动物(野生动物、牲畜和宠物)、环境(土壤和水)、媒介和食物来源样本的协作检测。例如,人畜共患的甲型流感病毒、在家禽和野生鸟类中流行的高致病性禽流感病毒株H5N1,是重点病原体。全球流感监测和应对系统(GISRS)支持对世界各地人类临床样本中流感的检测和全基因组表征,这些数据由世界卫生组织(WHO)进行整合以监测流感活动并指导疫苗研发。对于动物流感病毒,全球主要动物疾病预警系统(GLEWS)结合并协调WHO、联合国粮食及农业组织(FAO)和世界动物卫生组织(OIE)的预警机制,以监测野生动物、牲畜、家禽和环境。然而,在大多数国家,覆盖范围仍然不确定,而且没有足够的资源(1)正在进行的新型冠状病毒(COVID-19)大流行进一步突显了人畜共患病和新发疾病构成的公共卫生威胁,据报道被反向人畜共患病感染的动物种类越来越多,证明了跨物种传播的低障碍。

2.4 社区卫生

监测废水(污水)处理系统经常被认为是评估社区健康的一种有前景的方法,并已在埃及、印度、以色列、巴基斯坦、阿富汗和尼日利亚等多个国家的脊髓灰质炎计划中得到采用(1)COVID-19大流行加速了改善样本处理和检测灵敏度的研究,并有助于进一步强调废水监测在发现和阻断暴发集群方面的有效性(1)。然而,从废水中分离病毒需要专门的实验室设置和专业人员。对于高风险病原体,例如严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2),对超出常规临床诊断范围的样本进行操作需要生物安全3级控制,只有资源充足且拥有高技能人员的研究中心才能做到这一点。

现有的基于实验室的监测工作侧重于监测培养分离株的特征,如AMR、血清型和毒力因子。通常,培养步骤之后是各种分型和表型分析,需要专门的设备和技术以及大量的时间和资源。获得纯分离物所需的时间根据每个物种的生长速度而有所不同(两天到几周),并根据每个部门和物种的具体要求,对所得分离物进行下游表型和分子分析。BSL-3,生物安全三级。

2.5 医疗相关感染

除了对临床相关的细菌和真菌分离物进行监测外,还对医疗卫生环境(特别是空气和水)进行定期采样,以检查病原体和其他微生物污染(1)。例如,在强化护理病房,定期培养军团菌属(Legionella)物种的饮用水,并监测用于血液透析的水的活细胞总数和内毒素水平。一些医疗指南主张,如果所用的水与强化护理病房中的患者直接接触,则应对铜绿假单胞菌(Pseudomonas aeruginosa)进行监测。医疗机构用水的常规监测可能对技术要求很高,需要各种培养基和培养条件以及专业人员(1)

2.6 AMR监测

全球抗菌素耐药性监测系统(GLASS)网络促进了AMR监测,并使世界各地参与国能够收集、综合分析和共享标准化的人类细菌病原体AMR数据。当前状态下的AMR监测依赖于目标病原体的成功培养和分离(1)。然后对培养分离物进行标准化的抗菌药敏试验,以检测预先确定的抗生素组。存在于食物链、农作物、动物和环境中的AMR可以通过水平基因转移转移到人和动物的细菌病原体中,从而影响人和动物的健康。然而,这些非医疗保健领域的AMR监测还不够完善和标准化。

2.7 整合病原体监测

当前的综合监测举措,包括指南、实验室方法、数据收集和分析,仍然被“同一健康”部门(如人类健康、动物健康和植物健康)分开。鉴于样品类型和目标微生物种类的多样性,需要一系列的处理和培养方法来实现的回收和分离。由于在培养过程中对已知的人类病原体进行了优先排序和选择,因此可能不会检测到任何新的、新出现的或非典型病原体及其相关的AMR决定因素。总体费用、缺乏一致的工作流程和结果、许多检测的靶向性(只能找到所寻找的物质)以及缺乏偏颇较小的成本效益方案仍然是成功的主要障碍。相应地,病原体监测,特别是对医疗保健部门以外的监测资源仍然不足,多重检测的复杂性和要求可能会导致病原体监测总体欠佳。

价格低廉的高通量测序技术的可用性为开发新一代病原体监测方法铺平了道路。宏基因组学对包含多个物种的样本的遗传物质进行研究,可以使检测已知和未知病毒、细菌和真菌的无需培养的方法和工作流程成为可能。宏基因组研究通常使用基于标记基因的靶向扩增子方法(例如,16S rRNA基因测序)或鸟枪法宏基因组测序来探测样本的整个遗传内容。样本的宏基因组测序还可以检测其基因组范围之外的毒力和耐药性决定因素。随着分析的简易性和成本的改善,各个部门的大多数生物监测工作都将受益于宏基因组方法的采用。尽管前景广阔,但宏基因组工作流程中仍存在技术和分析上的复杂性,在纳入实验室常规监测之前,需要解决或考虑这些复杂性。接下来,我们将回顾宏基因组学在样品制备、测序和生物信息学分析方面的挑战,研究宏基因组学在病原体监测中的实际应用示例,并评估采用这些方法所需的进展。我们还讨论了基于宏基因组学的监测的潜力,以加速和改变全球努力,在“同一健康”框架内检测人类健康风险。

3 用于病原体监测的宏基因组学

病原体监测的宏基因组工作流程通过使用测序作为读数来统一。长读长和短读长测序技术都已用于宏基因组学,其中可以使用计算方法筛选序列数据,以重建不受培养物或参考基因组可用性限制的精细输出。

尽管如此,仍有一些与样本采集和核酸处理相关的考虑因素总是特定于应用程序并影响下游步骤。宏基因组工作流程需要考虑监视目标、资源可用性、操作可行性和技术兼容性,如表2中强调的那样。以下部分概述了宏基因组工作流程的主要组成部分,并使用的案例研究来说明它们的应用。尽管样本操作和处理的一些挑战(如处理PCR抑制剂)适用于整个分子分析,但不同的宏基因组测序技术(特别是长读长测序)施加了额外的限制(DNA纯度、分子量等)

对于每个目标,讨论了宏基因组工作流程的各个阶段可能需要的潜在解决方案。 a 样品处理步骤中生物量的损失或减少可能导致用于文库制备的DNA不足,导致测序分析失败。 b 如前所述,全基因组扩增产生嵌合体。

3.1 样品采集

该步骤在宏基因组工作流程中具有大的可变性,需要考虑各种样品基质及其物理和化学特性。这些包括拭子和胶带(例如,皮肤、鼻腔和环境),过滤器,例如,用于水、污泥和半固体(如粪便、污水、土壤或沉积物和食物)和液体(如唾液)。一些样品(如污泥)可能需要大量收集以获得足够的生物量,并且相关的泄漏问题可能会对安全取样带来后勤方面的挑战。其他考虑因素包括需要防止交叉污染、需要培养储备以及是否需要在稳定培养基中进行冷链储存或运输以大限度地减少过度生长或核酸降解。

3.2 核酸提取

核酸提取方案的选择主要取决于使用苛刻的物理破坏(如珠击)有效裂解细胞的能力与通过酶混合物(me[x]taPolyzme)处理保持DNA完整性的重要性之间的权衡,me[x]taPolyzme是无色肽酶、几丁质酶、裂解酶、溶葡萄球菌素、溶菌酶和变溶菌素的混合物。由于PCR抑制剂的存在,并且需要将核酸从具有不同大小和稠度的碎片的复杂基质中分离出来,某些样本类型的处理本身就更具挑战性,例如粪便、食物和土壤样本。相应地,一些测序方案可能不那么宽容,需要合适的核酸数量和质量才能实现通量。

影响这一步骤的另一个方面是样品中微生物核酸的相对比例,这是影响分析成本、灵敏度和可行性的一个因素。微生物富集可以在核酸提取之前进行(例如,通过离心、过滤、培养富集或流式细胞术),也可以作为方案的一部分,例如,使用选择性裂解步骤来消耗真核细胞或使用靶向探针来富集和扩增微生物DNA(2)

3.3 文库制备和测序

目前的测序技术要么是提供低成本短读长的第二代测序系统(~100个碱基对,例如Illumina),要么是具有更长读长但需要权衡成本和准确性的第三代测序系统(例如Pacific Biosciences和牛津纳米孔技术)。在需要通过深度测序进行精确定量或更高灵敏度的应用中通常使用短读长测序平台,而从头组装通过包含长读长大大改善。影响监测平台选择的其他特性包括便携性、采购和维护成本以及响应时间(2)。使用拇指驱动器大小的便携式设备进行实时纳米孔测序的新进展极大地扩展了基于现场测序的监测计划的可行性。虽然文库制备工作流程在很大程度上取决于测序仪器,但li[x]nked readsHi-C技术的进步已广泛扩展了我们从宏基因组数据生成高质量基因组的能力。

3.4 生物信息学分析

宏基因组数据的分析可以在不同的分辨率下进行,从使用分类器识别和量化特定分类群到基因和通路分析,到全基因组重建、注释和系统发育分析。这是由一系列专业工具推动的,如分类分类器、读取映射器、通路重建工具和基因组组装程序。在表3中,我们重点介绍了一些更流行的管道和Web工具,它们将这些功能集成到非专业人士可以访问的用户友好工作流程中。此外,还有用于病原体检测和识别的云部署临床宏基因组计算工作流程,如SURPIIDseq

对于宏基因组监测,提高生成宏基因组组装基因组(MAGs)的能力是一个变革因素,因为它们能够实现更细粒度的传播分析和更全面的抗生素耐药性预测。其中包括改进的分箱策略,用于检索属于同一基因组的短读长contigs,以及规避更高错误率以产生更多连续组装的长读长和混合组装程序。现在可以从宏基因组数据集中重建近乎完整的基因组,但灵敏度和准确性仍有待提高,特别是在一个物种的多个相似菌株存在于一个群落中的情况下。

MAGs生成后,可以使用两种主要方法进行系统发育分析,以辅助流行病学追踪和传播分析:(1)多位点(多基因)比对和(2)全基因组比较。虽然全基因组分析原则上提供了更高的分辨率,但水平基因转移、重组事件和重复区域的较高错误率会影响结果。通常使用平均核苷酸同源性(ANI)阈值来推断传播,但这些阈值需要根据特定病原体的进化速率进行调整。AMR基因分析通常通过映射和比对到CARDARG-ANNOTMEGARes2.0等参考数据库来完成。由于这些方法可能存在假阴性、任意覆盖率和身份分界值,因此已提出深度学习方法作为替代方案。此外,通过使用Hi-C技术将移动和染色体外AMR基因与宿主联系起来,促进了对这些基因的分析。

4 案例学习

在下文中,我们将讨论揭示如何使用宏基因组监测的案例研究,包括作出的具体选择和经验教训,以及这将如何指导未来实施宏基因组监测的努力。

4.1城市环境和交通系统

随着世界日益城市化,对城市公共空间的监测(特别是公共交通系统)是绘制人类微生物暴露体的一种有效方法。宏基因组监测的首批大规模应用之一于2013-2014年在美国纽约市的地铁中进行。研究结果强调了该策略检测病原体和AMR基因的可行性和可扩展性,以及读取层级分析的潜在缺陷。在随后的工作中,国际me[x]taSUB联盟将这项研究扩展到来自58个城市的3700多个样本,构建了微生物多样性和AMR基因的全球参考图谱。由于环境拭子的生物量通常较低,因此使用标准化样本收集和包含阳性和阴性对照来大限度地减少kitome人工制品(即试剂和实验室相关污染物)。此外,利用短读长测序数据的从头组装来识别现有参考数据库中缺失的新物种和AMR基因,从而减少这种混杂因素在参考分析中的影响。

4.2 从污水中追踪AMR

在一些大规模研究中,基于污水和牲畜粪便浆液对AMR进行了宏基因组监测。在一个全球污水监测项目中,来自60个国家74个城市的未经处理的污水被冷冻并集中处理,以获得短读长宏基因组数据和组装。共鉴定出属于408个基因类别的1625个不同的AMR基因,包括blaNDMmcroptrA基因,它们是使用抗生素的AMR决定因素。研究发现,AMR总丰度因地区而异,其值与社会经济因素(如卫生条件)高度相关。因此,大规模污水监测可以提供一种方便、低成本的人群AMR监测方法。这些研究强调采样和运输物流可以得到解决,且收集和处理的进一步自动化将使这种方法对监测更具吸引力。

4.3 医疗环境

Lax等人开创了医疗环境的大规模宏基因组图谱,以确定新建医院中的微生物定植和传播模式。由于其作为高风险环境的重要性,Brooks等人将重点放在新生儿重症监护病房,使用鸟枪法宏基因组测序和MAGs来证明微生物在患者和环境之间的直接交换。此外,他们的研究表明,在为期一年的研究期间,重症监护病房环境中的一些菌株持续存在。在的研究中,我们展示了基于混合宏基因组组装的多药耐药微生物在医院环境中的持久性和广泛分布。此外,与相隔8年的患者分离株进行比较显示出高度的相似性,这突出了AMR库的持久性。该研究使用准宏基因组学(即有意修饰微生物组的宏基因组学,例如通过培养富集)来富集抗生素耐药性微生物,并从数百个样本中获得大量高质量的MAGs(>2000)。收集曲线分析表明,只需50份样本就足以在医院进行常规菌株和AMR监测。对低生物量样本分析和实时测序的进一步改进可能会使这些方法在响应时间至关重要的医疗环境中更具吸引力。还需要进行沙盒试验,以提供证据证明其快速跟踪疫情和预防感染的能力,从而为常规采用提供依据。

4.4 人畜共患病病毒库

宏基因组学方法已被用于检测和表征各种潜在宿主中的人畜共患病病原体,如节肢动物媒介、蝙蝠和野鸭。已从蜱、蚊子、蝙蝠的胃肠道排泄物和野鸭粪便中检测到已知的、新出现的和新的病毒病原体,从而突出了宏基因组监测人畜共患病病毒库的效用。相应地,全球病毒组计划的启动是一项大规模努力,旨在开发潜在人畜共患病病毒病原体的全球图谱,并提高我们发现、检测和诊断可能威胁人类健康的病毒的能力。病毒宏基因组学带来了重大的技术挑战,包括安全问题、大多数样本中的低病毒载量、RNA降解和准物种多样性。因此,通过开发新的自动化、核酸提取和生物信息学工具来解决这些问题,将是提高我们通过宏基因组学监测和了解庞大病毒圈(特别是冠状病毒、流感病毒和埃博拉病毒)的能力的关键。

综上所述,这些案例研究强调了使用宏基因组学在各个感兴趣领域进行调查的无与伦比的广度和深度。统一分析多种病原体、在单一高通量分析中整合跨领域信息以及对AMR基因进行监测的能力提供了以前不可行的分析机会。此外,在一些研究中产生的高质量宏基因组组装基因组进一步促进了全基因组研究和高分辨率系统发育,而以前只能通过较低通量的培养和分离基因组测序过程来实现。因此,人们对进行常规宏基因组监测有浓厚的兴趣,因为产生的数据可用于回答生物学研究问题。

5 宏基因组学监测的广泛应用面临的挑战

尽管在监测中实施宏基因组工作流程有着坚实的理论基础,但广泛采用该技术仍存在挑战。在本节中,我们将重点介绍其中的一些问题,并讨论将为常规应用铺平道路的正在进行的开发。

5.1 灵敏度、特异性和标准化

采用宏基因组学方法的一个重要考虑因素是检测的灵敏度、特异性和可重复性,此处讨论的宏基因组案例研究中没有详细研究这一方面。其他研究试图确定鸟枪法宏基因组分析相对于传统检测方法的灵敏度和特异性。与其他分子方法(PCR)类似,宏基因组分析的灵敏度和特异性取决于方案工作流程的优化,包括多个因素,例如不同的目标病原体和不同(有时相同)样品处理工作流程,以大限度地提高检测的灵敏度和特异性。这取决于可用的资源和样本生物量,实施起来可能可行,也可能不可行,这构成了采用的瓶颈。分子生物学技术发展的进展以及机器人技术和实验室自动化的采用(参见突破性技术部分)将极大地解决这一相关挑战并促进广泛应用。

此外,广泛的样品基质和多步骤定制实验室和分析工作流程是变异性的来源,使宏基因组分析的实施变得复杂。尽管存在这些挑战,但有研究表明,通过严格的优化、标准化和验证,可以实现实验室内的高重现性。总体而言,工作流程标准化和质量保证的努力已经取得了进展,应该通过自动化(易于使用)、降低分析成本(测序成本和多路复用)以及对生物信息学工具进行基准测试来辅助。关键的是,测序成本已经接近阈值(不到100美元),与常规监测方案的总成本(包括人工成本)相当。端到端标准化(包括生物信息学)和宏基因组工作流程的验证可能有助于更好地理解。

尽管宏基因组数据的收集和解释具有固有的复杂性,但在临床诊断中越来越多地采用鸟枪法宏基因组方法表明,这种检测可以标准化和验证。然而,由于监测计划影响公共卫生决策,宏基因组学的接受度受到灵敏度、特异性和经济可行性之外的考虑因素的影响。例如,关注的范围从微生物污染对结果的影响和相关物种生物信息学分析的保真度到检测到的病原体的生存能力和传染性以及估计所构成公共健康风险的能力。因此,除了严格的方案标准化、常见样本类型的端到端指导、纳入各种控制、质量保证和熟练样本的管道验证以及参考标准的使用外,还需要进一步研究基于宏基因组监测数据的公共卫生风险模型的开发。由于病原体监测的主要目标是提供关于潜在公共卫生威胁的早期情报,因此需要对该情报进行后续确认。此外,监测的监管影响将是复杂的,由每个管辖区根据当地可用资源、当地监测需求、流行病学和当地政策来确定。

5.2 技术障碍

一项可以降低采用宏基因组监测的障碍的进展是li[x]nked reads、合成长读长和Hi-C reads试剂盒和方案的可用性。与此同时,测序技术的快速发展,特别是在生成高精度长读长数据和超长读长数据方面,以及进行实时、现场部署的全基因组分析的能力,使宏基因组监测成为现实的选择。对于常规研究而言,价格低廉、功能强大、保质期长的测序试剂盒是正在开发的重要领域。

同时,能够对长读长数据进行敏感分类的生物信息学算法(me[x]taMaps、快速准确的宏基因组组装以及基于组合和覆盖率的组装分箱)正在使强大的宏基因组监控工作流程触手可及。需要大量的研究投资来改进宏基因组的应变分解组装。具体来说,宏基因组组装的实用性和可靠性仍然受到无法组装难以组装的基因组内容(如质粒、16S rRNA和重复