近10年来,肠道微生物基因组成为生命科学研究领域的热点。然而,目前大部分相关研究,仍使用主流二代测序技术进行肠道微生物种功能解析,宏基因组的拼接质量仍然有较大提高空间,且菌株水平的功能差异分析等领域亟待新的突破。
不久前,我国首部生物经济的五年规划《“十四五”生物经济发展规划》发布。该规划明确指出,加快发展高通量基因测序技术,推动以单分子测序为标志的新一代测序技术创新。而近期,三代测序技术已引发整个行业的关注,不少企业正积极布局,将其作为二代测序技术的有效补充,在针对二代测序范围外的复杂基因突变类型进行测序方面寻求新的解决方案。
有鉴于此,中国科学院微生物研究所王军研究员课题组和中国科学院动物研究所宋默识研究员课题组合作,利用三代纳米孔测序技术解析了肠道宏基因组,建立了三代和二代测序数据混合组装和后续分析流程。该研究提高了宏基因组组装的质量,以及对结构变异的发现能力,发现了大量包括插入突变和基因倒位在内的结构变异对于菌株水平上基因功能的影响,并对噬菌体等系统进行了深度挖掘,这些都是将三代纳米孔测序技术用于肠道微生物研究后取得的新进展。该研究论文近日发表在《自然·通讯》杂志上。
两代测序技术联手探索肠道微生物
人类的肠道是细菌、真菌等微生物的家园,这些微生物被统称为肠道微生物群。科学家们现在已经收集了人类肠道中4600多种细菌的20万个基因组和1.7亿个蛋白质序列,并建立了数据库。
尽管科学家长期致力于这一领域的研究,但肠道菌群中的一些微生物种类在很长时间内不为人所知。据估计,人体内含有的微生物数量比人体细胞还多。在人类肠道中已经发现了共计4600余种细菌。有研究表明,这其中超过70%的被检测到的细菌还未在实验室中培养,它们在人体内的活性仍然未知。
“在人的肠道中,尤其是在直肠里,有非常丰富的微生物,个体数量超过人体细胞的3—10倍。虽然这些微生物种的基因组较小,但由于种类很多,其基因多样性比人高10—100倍。”王军告诉记者,肠道微生物群落形成了一个非常复杂的肠道环境,对其进行研究有助于了解肠道的状态和功能,从而更好地了解人体和疾病,指导胃肠道疾病的诊断和治疗。
宋默识表示,肠道微生物在人类代谢食物、抵御感染和应答药物等过程中起着非常重要的作用。肠道维持着人体的代谢平衡,很多食物会在肠道内最终降解成小分子最终代谢物。如果肠道微生物生态系统失衡,将导致代谢功能失调,造成胃肠道疾病。同时,一些肠道免疫性疾病(如炎症性肠炎)也与肠道微生物生态系统的免疫调节相关。因此,肠道微生物群一直是科学家们最关注的议题之一。
但受研究方法的限制,相关研究一直进展较慢。
“以前,相关研究依靠低通量的微生物群培养手段。但随着二代测序技术的发展,能够使我们以较高通量的方法去了解肠道微生物种。近年来,三代测序技术发展迅速,又弥补了二代测序技术的一些不足,两者相结合,为探索肠道微生物种提供了较好的方法条件。”王军说。
三代测序是二代测序的有益补充
王军向记者介绍,以纳米孔测序为代表的三代测序技术飞速发展,目前英国ONT测序和美国PacBio测序两种技术路线,都能够完成较长的DNA片段测序。
三代测序技术较二代测序技术有何不同?
对此,王军表示,二代测序技术是目前的主流测序方式,已广泛应用于疾病和癌症的研究,具有高通量的特点,但不足之处在于测出来的基因片段较短,对于复杂的基因组区域以及较大的结构变异的检测有一定的局限性。而三代测序技术则能够帮助研究者针对感兴趣的基因或区域进行高深度测序研究。目前,三代测序技术已被应用于疾病或癌症领域人类基因遗传标志物、融合基因、甲基化检测等研究中,方法主要有长片段PCR扩增、CRISPR/Cas9靶向捕获和液相探针捕获三类。
在研究中,王军课题组使用了二代测序与三代测序数据组装拼接的办法。“引入三代测序能够弥补二代测序‘序列短’这一不足。三代测序读出的长序列就像一个‘骨架’,能够让研究者知道二代测序读出来的短片段之间有什么对应关系,该怎样拼接,从而提高整体基因拼接序列的质量,提高对某个生物染色体的全面认识。”王军说。
在三代测序方法出现之前,研究者利用二代测序技术拼出大大小小的不同基因片段,但常常无法知道某些片段属于哪个菌种。王军表示,虽然存在一些计算方法使研究者可以依据峰段、频率去推断基因片段之间的关系,但由于缺乏直接证据,这一研究难题仍无法得到根本解决。
“三代测序技术改变了这一情况。将三代测序技术得出的数据与二代的进行混合拼接,就能够在很复杂的环境中几乎接近拼出一个细菌的单个基因组。”王军说。
三代测序技术未来还有更大发展空间
近年来,全球实验室都开始大规模应用三代测序技术。
“每一个新测序技术刚出来的时候一般都很贵,大家都觉得是在‘烧钱’做研究。”王军向记者介绍,尽管三代测序技术为精细探索基因功能提供了新的路径,但其经济性仍不高,“三代测序技术的单位测序数据成本比二代要高很多。每次测序非常贵,一次出来的数据量约为二代的1/10,有时甚至还不到二代的3%。数据量少的特性是由三代测序技术的原理决定的。”
在充斥着电解液的容器中,放置镶嵌有纳米孔蛋白的分子膜。在相关蛋白质和酶的辅助下,DNA分子以较为稳定的速度通过纳米孔,当纳米孔内被特定的核苷酸占据时,会对孔周围的电流产生扰动。通过记录DNA分子通过纳米孔过程中产生的电流信号情况,再将这一特异性的电信号序列利用算法软件翻译为核苷酸序列,这就是三代测序技术的基本操作原理。
“目前的工艺决定了三代测序技术测出的数据量偏少。”王军说,但其与二代测序技术相结合,能为建立更高质量的基因图谱作出贡献。
下一步,三代测序技术还有哪些发展空间?
在王军看来,开发序列信息解读算法是一个发展方向。如何精确地将新一代基于纳米孔的单分子实时电信号测序技术生成的原始电信号翻译为序列信息,是科学家们关注的重点,近年来也诞生了多种用于精确翻译电信号的相关工具。
同时,三代测序技术还能在甲基化检测等特殊领域发挥重要作用。三代测序技术能够检测DNA分子自身的物理化学特性,因此生物基因组上的修饰信息也可以在电信号中得到反应。DNA分子上的甲基化修饰具有非常强的细胞特异性和细胞周期特异性,对表观遗传学研究有着重要的意义。
“三代测序技术暂时取代不了二代测序技术,但在未来,它将成为测序技术不可缺少的组成部分,在甲基化检测等独特领域实现其重要价值。”王军说。
分享让更多人看到