2. 新疆生产建设兵团疾病预防控制中心, 新疆 乌鲁木齐 830002
2. Center for Disease Control and Prevention, Xinjiang Production and Construction Corps, Urumqi 830002, China
结核病由结核分枝杆菌(Mycobacterium tuberculosis, MTB)引起,其致死率、致残率已超过艾滋病,高居全球第一。随着感染者中耐药比例的增加,问题将更加严峻。MTB的基因分型技术是以分子生物学为基础,利用基因序列的多样性,区分结核分枝杆菌之间的差异,把握病原的变化、疾病的传播情况,分析流行病学事件,研究结核病患者的耐药性原因,对预防、控制和治疗结核病具有重要意义[1]。
近年来,生物研究进入大数据时代,全基因组测序技术(whole genome sequencing,WGS)被引入结核病分子流行病学研究中,带来了新的机遇与挑战。WGS是以DNA为基础,以计算机技术为辅助,用于测量未知基因组序列分布的技术。现阶段的WGS包括第二代测序技术和第三代测序技术,具有高通量、准确度高和方便易行等优点,可以获得结核分枝杆菌的全基因组序列信息,不仅可以鉴定菌种,还可以分析MTB间的系统进化关系,感染源以及个体间的传播过程[2]。
1 传统MTB分型技术概述在MTB分型技术中IS6110-RFLP最早成熟[3]。IS6110是MTB DNA重复序列片段,存在于基因组中,由于不同菌株中其位置及其序列复制数是独特的,IS6110-RFLP技术即利用此点区分不同菌株的类型。间隔区寡核苷酸基因分型(spoligotyping)是PCR技术,染色体直接重复区DR (direct repeat) 存在于MTB复合群中,MTB DR序列中包含的间隔序列的位置及个数各不相同,spoligotyping可以按照识别间隔序列对菌株进行分类。可变串联重复序列技术(variable number tandem repeat, VNTR)是基于PCR的另一种技术。该方法建立在H37Rv基因组的11个串联重复区上,通过基于11个区设计引物并比较PCR产物每个区域串联重复序列的拷贝数量来区分不同的菌种。MTB的基因组中分布着许多的重复单位(Mycobacterial interspersed repetitive unit, MIRU),不同菌株的重复序列拷贝数量各异[4]。目前, 常结合VNTR与MIRU对MTB进行分型,称VNTR-MIRU法,该分型方法常用的组合位点有12、15、24位点等[5-6]。
2 全基因组测序的优势IS6110-RFLP鉴别的能力良好,是MTB基因分型的金标准[7]。但IS6110-RFLP需要大量纯化的DNA,由于MTB的生长周期长,往往需要较长的培养时间。Spoligotyping可直接应用于临床标本[8],快速、经济,但鉴别能力低于IS6110-RFLP。VNTR-MIRU法与IS6110-RFLP的检测一致性较高,达78%~85%。以上常见的MTB分型技术能够鉴别的基因组信息量常不足全基因组的1%,信息量很小,对于一些具有细微差异的菌株,常常无法分辨。具有细微差异的菌株可能属于不同株系,也可能属于同一株系,经变异而来。WGS利用DNA测序平台构建出具有细微差异的菌株基因组的完整DNA序列,发现有许多单核苷酸多态位点(single-nucleotide polymorphism, SNP)存在。目前认为,如果两个分离株之间的SNP差异数不超过5个,则菌株具有相同或相似的基因型,属于同一株系;如果SNP差异数大于12个,则菌株的基因型不相同,亲缘关系较远,属于不同株系[9-10]。
此外,为实现结核病防控,接触者追踪是十分重要的策略。既可以对密接者提供预防性治疗,也可以防止传播范围进一步扩大。然而,流行病学调查是漫长而费力的,且发现患者通过暂时或短期接触而建立的流行病学联系并不容易。而分子流行病学将分子分型结果与现有的流行病学数据相整合,在研究结核病的传播链中起着极其重要的作用。WGS能够通过SNP鉴定疾病传播方向和传播链,比传统的基因分型方法更有效地解决了大规模、纵向的结核病流行病学相关问题,更适合接触者的数据追踪及疫情的时空分布研究。
3 WGS路线及技术进展MTB全基因组测定首先要提取MTB的基因组DNA,然后按照所需长度随机切断经电泳检测合格的DNA样本。加工这些片段,包括末端修复、加测序接头、纯化等,完成基因组DNA文库的构筑。随后,检测文库的插入片段(insert size),库检合格后进行上机测序,对测定出的原始数据(raw data)中的一部分低质量数据进行过滤。对最终获得的有效数据(clean data)进行数据分析。基准株H37Rv作为标准序列,获取核心基因组SNV(single nucleotide variation),分析MTB的谱系或亚谱系,或者预测其耐药性。
全基因组第一代测序技术是Sanger法,经过三十多年,已经发展至第三代。目前全球测序市场中,第二代占有绝对优势。第二代测序的读长短,常用的测序平台有:基于焦磷酸测序原理的Roche 454平台,基于可逆链终止物和合成测序原理的Illumina平台,以及基于连接测序原理的ABI/Solid平台。与前两代测序技术比较,第三代技术的最大特征是能够实时测定单分子,是基于纳米孔单分子读取技术的方法。在第三代测序时,无需进行PCR扩增,超长读长。第三代测序技术主要是Pacific Bioscience开发的SMRT技术、Helicos开发的遗传信息分析系统(Heliscope/Helicos Genetic Analysis System),以及Oxford Nanopore Technologies纳米孔单分子测序技术[11]。虽然第三代测序无需进行PCR,但目前技术尚不成熟,且相对于第二代测序,成本较高。
4 全基因组测序的应用 4.1 WGS在疫情追踪中的应用感染MTB后的健康人,只有约5%将在两年内发病,称为近期感染(recent infection)。另外95%为潜伏感染,且无症状表现。在潜伏感染者中5%在今后几到几十年间发展成为活动性结核病的情况被称为内因复燃(reactivation)[12]。在疫情中,当地的近期感染病例数量与最近传播率呈正比。近期传播率越高,则该地区结核病传播程度越严重。全基因组测序通过菌株间SNP的差异鉴定基因型的差异,从而判断结核病发病模式是否为近期感染,为相关部门提供参考,以适时调整防控力度。由于鉴别能力高于MIRU-VNTR,MIRU-VNTR定义的簇常常被WGS进一步分割成子簇[13]。在低发病率国家瑞士最近的一项结核病传播的研究[14]中,MIRU-VNTR定义的聚类比率为17%,高于WGS定义的聚类比率8%,易导致结核病传播力度被高估。澳大利亚的一项研究使用WGS对曾经已被VNTR技术分型的菌株进行再次验证,发现近期传播率非常有限,然而当时VNTR技术定义的聚集率却超过20%[15]。WGS由于分辨率高,还能够用以识别超级传播者(super spreader,即能将自身毒株传染给其他多个人的传染性极强的个体), 识别可能的传染源以及确定传播链。在加拿大的一次结核病暴发中,按照MIRU-VNTR分析确定了1例初始病例以及1条传播链,但随后采用WGS后判定此次疫情的主要分支有两个,且存在两条不同的传播链,为采用WGS追踪结核病暴发疫情提供了范例[16]。
4.2 WGS在MTB耐药研究中的应用2015年,结核病治疗总体成功率为83%,耐多药结核病、耐利福平结核病治疗的成功率为54%,而广泛耐药结核病治疗的成功率仅为30%。耐药结核病已经成为重要的公共卫生问题[17-18]。感染者是否耐药与其自身治疗成本、治疗效果紧密相关,同时也影响着当地的发病率和死亡率等[19],研究耐药结核病的耐药机制及其流行情况十分必要。
MTB产生耐药可能是两种机制造成的:一是感染耐药MTB的原发耐药;二是获得性耐药,由治疗不足导致。WGS可将两者区分开来[20]。如上海一项全基因组测序联合VNTR分型技术研究检测结果表明,当地结核病患者耐药主要是由传播造成的原发耐药[21],结果可以为当地阻断耐药结核病的传播以及制定政策提供依据。结果也符合之前相关研究[22-26]获得的结论,即在低发病率高收入的流行地区中,大多数耐多药结核病病例是由于耐药菌株的传播,而非治疗不足。
WGS能够用于精确MTB中耐药的特定突变基因。有些已在临床分离菌株中成功验证,如利福平耐药由rpoB和rpoC基因突变导致,异烟肼耐药因katG和inhA基因突变导致等。氯法齐明和苯达喹啉的耐药已被WGS确认由药物外排泵导致[27-29],在抗结核病药物开发过程中,这仍作为耐药机制鉴定的主要策略[30]。
全基因组关联分析(GWAS)方法最初用于人类基因组数据,如今已被引入MTB等微生物领域,并证实了一些耐药相关基因[31]。Desjardins等[32]研究在来自南非和中国的498个基因组中发现,编码丙氨酸脱氢酶的ald基因突变增加了临床分离株对环丝氨酸的耐药性。环丝氨酸是治疗耐多药结核病和广泛耐药结核病的一种关键药物,具有严重的精神和中枢神经系统毒性。此外,一些已开发的数据网络工具能从WGS数据网络中推断结核病耐药性,包括CASTB、KVarQ、Mykrobe Predictor TB、PhyResSE、TBProfiler和TGS-TB。研究比较了这些工具在预测耐药性方面的灵敏度和特异度[33-35],发现其在一线药物中表现良好,在二线药物中表现不佳。
4.3 WGS在MTB微进化中的应用临床上,同一患者体内分离的MTB样本同时存在敏感和耐药菌株的情况比较复杂,尚未完全研究清楚,主要包括两种情况:一种是混合感染,也就是说宿主同时被两种菌株感染;另一种情况是MTB在被感染的宿主体内进行了微进化。MTB感染中的微进化使得传播链的推断复杂化,也为制定患者的治疗方案增加了难度。根据目前的研究,WGS区分微进化及混合感染的方式如下[36]:若两种MTB拥有的遗传背景相差明显,比例特殊,可以由差异SNP处碱基种类和比例来区分;第二,如果用现有SNP构建进化树,在不同谱系或两个不同的进化过程中发现菌株,即是混合感染;第三,由SNP差异数判别,同一患者某次化痰时培养的若干菌株或者同一个患者先后相继化痰培养菌株的SNP数差不到11个,被认为是微进化,超过475个SNP即列为混合感染。
5 小结全基因组测序起源于一项基础科研技术,现在慢慢成为现代临床微生物学实验室的一部分。WGS也存在不足之处,由于依赖MTB的培养,因此速度缓慢。具有设备昂贵、数据分析量大、技术专业方面要求标准化等特点[37]。尽管如此,与目前用于结核病诊断和流行病学监测的技术相比,WGS仍具有多项优势。随着高通量测序技术的发展,有望为结核病的公共卫生监测和防控提供更准确的依据,成为检测新标准[38-39]。
利益冲突:所有作者均声明不存在利益冲突。
[1] |
葛君, 陈赟, 傅妤倩, 等. 结核分枝杆菌基因分型与耐药性及分子流行特征探讨[J]. 中华全科医学, 2019, 17(11): 1938-1940. Ge J, Chen Y, Fu YQ, et al. Genotyping, drug resistance and molecular epidemic characteristics of Mycobacterium tuberculosis[J]. Chinese Journal of General Practice, 2019, 17(11): 1938-1940. |
[2] |
Zhou FF, Olman V, Xu Y. Barcodes for genomes and applications[J]. BMC Bioinformatics, 2008, 9: 546. DOI:10.1186/1471-2105-9-546 |
[3] |
van Embden JD, Cave MD, Crawford JT, et al. Strain identification of Mycobacterium tuberculosis by DNA fingerprinting: recommendations for a standardized methodology[J]. J Clin Microbiol, 1993, 31(2): 406-409. DOI:10.1128/jcm.31.2.406-409.1993 |
[4] |
van Deutekom H, Supply P, de Haas PEW, et al. Molecular typing of Mycobacterium tuberculosis by mycobacterial interspersed repetitive unit-variable-number tandem repeat analysis, a more accurate method for identifying epidemiological links between patients with tuberculosis[J]. J Clin Microbiol, 2005, 43(9): 4473-4479. DOI:10.1128/JCM.43.9.4473-4479.2005 |
[5] |
Supply P, Allix C, Lesjean S, et al. Proposal for standardization of optimized mycobacterial interspersed repetitive unit-va-riable-number tandem repeat typing of Mycobacterium tuberculosis[J]. J Clin Microbiol, 2006, 44(12): 4498-4510. DOI:10.1128/JCM.01392-06 |
[6] |
Hanekom M, van der Spuy GD, Gey van Pittius NC, et al. Discordance between mycobacterial interspersed repetitive-unit-variable-number tandem-repeat typing and IS6110 restriction fragment length polymorphism genotyping for analysis of Mycobacterium tuberculosis Beijing strains in a setting of high incidence of tuberculosis[J]. J Clin Microbiol, 2008, 46(10): 3338-3345. DOI:10.1128/JCM.00770-08 |
[7] |
金福姝, 薛强, 邹明强, 等. 利用插入序列IS6110建立结核分枝杆菌检测方法的研究[J]. 中国卫生检验杂志, 2014, 24(21): 3053-3055. Jin FS, Xue Q, Zou MQ, et al. Research on establishing the detection method of Mycobacterium tuberculosis by inserting sequence IS6110[J]. Chinese Journal of Health Laboratory Technology, 2014, 24(21): 3053-3055. |
[8] |
Goyal M, Saunders NA, van Embden JD, et al. Differentiation of Mycobacterium tuberculosis isolates by spoligotyping and IS6110 restriction fragment length polymorphism[J]. J Clin Microbiol, 1997, 35(3): 647-651. DOI:10.1128/jcm.35.3.647-651.1997 |
[9] |
Luo T, Yang CG, Peng Y, et al. Whole-genome sequencing to detect recent transmission of Mycobacterium tuberculosis in settings with a high burden of tuberculosis[J]. Tuberculosis (Edinb), 2014, 94(4): 434-440. DOI:10.1016/j.tube.2014.04.005 |
[10] |
Bryant JM, Schürch AC, van Deutekom H, et al. Inferring patient to patient transmission of Mycobacterium tuberculosis from whole genome sequencing data[J]. BMC Infect Dis, 2013, 13: 110. DOI:10.1186/1471-2334-13-110 |
[11] |
谈卫军. 单核细胞增生李斯特菌XYSN和NTSN全基因组测序及比较基因组学分析[D]. 扬州: 扬州大学, 2015. Tan WJ. Whole genome sequencing and comparative genomics analysis of Listeria monocytogenes XYSN and NTSN[D]. Yangzhou: Yangzhou University, 2015. |
[12] |
Colangeli R, Gupta A, Vinhas SA, et al. Mycobacterium tuberculosis progresses through two phases of latent infection in humans[J]. Nat Commun, 2020, 11(1): 4870. DOI:10.1038/s41467-020-18699-9 |
[13] |
Rodríguez NA, Lirola MM, Chaves F, et al. Differences in the robustness of clusters involving the Mycobacterium tuberculosis strains most frequently isolated from immigrant cases in Madrid[J]. Clin Microbiol Infect, 2010, 16(10): 1544-1554. DOI:10.1111/j.1469-0691.2010.03161.x |
[14] |
Stucki D, Ballif M, Egger M, et al. Standard genotyping overestimates transmission of Mycobacterium tuberculosis among immigrants in a low-incidence country[J]. J Clin Microbiol, 2016, 54(7): 1862-1870. DOI:10.1128/JCM.00126-16 |
[15] |
Gurjav U, Outhred AC, Jelfs P, et al. Whole genome sequencing demonstrates limited transmission within identified Mycobacterium tuberculosis clusters in New South Wales, Australia[J]. PLoS One, 2016, 11(10): e0163612. DOI:10.1371/journal.pone.0163612 |
[16] |
Gardy JL, Johnston JC, Ho Sui SJ, et al. Whole-genome sequencing and social-network analysis of a tuberculosis outbreak[J]. N Engl J Med, 2011, 364(8): 730-739. DOI:10.1056/NEJMoa1003176 |
[17] |
García JI, Allué-Guardia A, Tampi RP, et al. New developments and insights in the improvement of Mycobacterium tuberculosis vaccines and diagnostics within the end TB strategy[J]. Curr Epidemiol Rep, 2021, 1-13. DOI:10.1007/s40471-021-00269-2.Epubaheadofprint |
[18] |
于海娟, 赵梅, 王佳月, 等. 肺结核患者结核杆菌耐药情况及耐多药结核病的危险因素[J]. 中国感染控制杂志, 2020, 19(1): 58-62. Yu HJ, Zhao M, Wang JY, et al. Drug resistance of Mycobacterium tuberculosis and risk factors of multidrug-resistant tuberculosis in patients with pulmonary tuberculosis[J]. Chinese Journal of Infection Control, 2020, 19(1): 58-62. |
[19] |
Dheda K, Gumbo T, Maartens G, et al. The Lancet Respiratory Medicine Commission: 2019 update: epidemiology, patho-genesis, transmission, diagnosis, and management of multidrug-resistant and incurable tuberculosis[J]. Lancet Respir Med, 2019, 7(9): 820-826. DOI:10.1016/S2213-2600(19)30263-2 |
[20] |
Hatherell HA, Colijn C, Stagg HR, et al. Interpreting whole genome sequencing for investigating tuberculosis transmission: a systematic review[J]. BMC Med, 2016, 14: 21. DOI:10.1186/s12916-016-0566-x |
[21] |
Nsofor CA, Jiang Q, Wu J, et al. Transmission is a noticeable cause of resistance among treated tuberculosis patients in Shanghai, China[J]. Sci Rep, 2017, 7(1): 7691. DOI:10.1038/s41598-017-08061-3 |
[22] |
Merker M, Blin C, Mona S, et al. Evolutionary history and global spread of the Mycobacterium tuberculosis Beijing lineage[J]. Nat Genet, 2015, 47(3): 242-249. DOI:10.1038/ng.3195 |
[23] |
Casali N, Nikolayevskyy V, Balabanova Y, et al. Evolution and transmission of drug-resistant tuberculosis in a Russian population[J]. Nat Genet, 2014, 46(3): 279-286. DOI:10.1038/ng.2878 |
[24] |
Shah NS, Auld SC, Brust JC, et al. Transmission of extensively drug-resistant tuberculosis in South Africa[J]. N Engl J Med, 2017, 376(3): 243-253. DOI:10.1056/NEJMoa1604544 |
[25] |
Senghore M, Otu J, Witney A, et al. Whole-genome sequencing illuminates the evolution and spread of multidrug-resistant tuberculosis in Southwest Nigeria[J]. PLoS One, 2017, 12(9): e0184510. DOI:10.1371/journal.pone.0184510 |
[26] |
Tagliani E, Hassan MO, Waberi Y, et al. Culture and next-generation sequencing-based drug susceptibility testing unveil high levels of drug-resistant-TB in Djibouti: results from the first national survey[J]. Sci Rep, 2017, 7(1): 17672. DOI:10.1038/s41598-017-17705-3 |
[27] |
Almeida D, Ioerger T, Tyagi S, et al. Mutations in pepQ confer low-level resistance to bedaquiline and clofazimine in Mycobacterium tuberculosis[J]. Antimicrob Agents Chemother, 2016, 60(8): 4590-4599. DOI:10.1128/AAC.00753-16 |
[28] |
Hartkoorn RC, Uplekar S, Cole ST. Cross-resistance between clofazimine and bedaquiline through upregulation of MmpL5 in Mycobacterium tuberculosis[J]. Antimicrob Agents Chemo-ther, 2014, 58(5): 2979-2981. DOI:10.1128/AAC.00037-14 |
[29] |
Andries K, Villellas C, Coeck N, et al. Acquired resistance of Mycobacterium tuberculosis to bedaquiline[J]. PLoS One, 2014, 9(7). |
[30] |
Zampieri M, Szappanos B, Buchieri MV, et al. High-throughput metabolomic analysis predicts mode of action of uncharacterized antimicrobial compounds[J]. Sci Transl Med, 2018, 10(429): eaal3973. DOI:10.1126/scitranslmed.aal3973 |
[31] |
Farhat MR, Shapiro BJ, Kieser KJ, et al. Genomic analysis identifies targets of convergent positive selection in drug-resis-tant Mycobacterium tuberculosis[J]. Nat Genet, 2013, 45(10): 1183-1189. DOI:10.1038/ng.2747 |
[32] |
Desjardins CA, Cohen KA, Munsamy V, et al. Genomic and functional analyses of Mycobacterium tuberculosis strains implicate ald in D-cycloserine resistance[J]. Nat Genet, 2016, 48(5): 544-551. DOI:10.1038/ng.3548 |
[33] |
Schleusener V, Köser CU, Beckert P, et al. Mycobacterium tuberculosis resistance prediction and lineage classification from genome sequencing: comparison of automated analysis tools[J]. Sci Rep, 2017, 7: 46327. DOI:10.1038/srep46327 |
[34] |
van Beek J, Haanperä M, Smit PW, et al. Evaluation of whole genome sequencing and software tools for drug susceptibility testing of Mycobacterium tuberculosis[J]. Clin Microbiol Infect, 2019, 25(1): 82-86. DOI:10.1016/j.cmi.2018.03.041 |
[35] |
Ngo TM, Teo YY. Genomic prediction of tuberculosis drug-resistance: benchmarking existing databases and prediction algorithms[J]. BMC Bioinformatics, 2019, 20(1): 68. DOI:10.1186/s12859-019-2658-z |
[36] |
陈昕昶, 张文宏. 全基因组测序在结核病研究中的应用进展[J]. 中国防痨杂志, 2018, 40(2): 149-152. Chen XC, Zhang WH. Progress in the application of whole genome sequencing in tuberculosis research[J]. Chinese Journal of Antituberculosis, 2018, 40(2): 149-152. DOI:10.3969/j.issn.1000-6621.2018.02.007 |
[37] |
Dohál M, Porvazník I, Pršo K, et al. Whole-genome sequencing and Mycobacterium tuberculosis: challenges in sample preparation and sequencing data analysis[J]. Tuberculosis (Edinb), 2020, 123: 101946. DOI:10.1016/j.tube.2020.101946 |
[38] |
Satta G, Lipman M, Smith GP, et al. Mycobacterium tuberculosis and whole-genome sequencing: how close are we to unleashing its full potential?[J]. Clin Microbiol Infect, 2018, 24(6): 604-609. DOI:10.1016/j.cmi.2017.10.030 |
[39] |
Meehan CJ, Goig GA, Kohl TA, et al. Whole genome sequencing of Mycobacterium tuberculosis: current standards and open issues[J]. Nat Rev Microbiol, 2019, 17(9): 533-545. DOI:10.1038/s41579-019-0214-5 |