Literature
Home行业资讯临床快报遗传与基因组

第三代测序的希望与陷阱

来源:生物通
摘要:去年4月当美国太平洋生物科学公司PacificBiosciences(PacBio)宣布它将开始销售其商业PacBioRS系统时,该公司预计第三代测序产品的发售将“立马扩展DNA测序在诸如癌症研究、病原体检测和农业等领域的应用”。不同于市场上的第二代系统,PacBioRS系统能够实现单分子实时测序反应,在一天内生成结果。此外,跨越几千个DNA碱......

点击显示 收起

去年4月当美国太平洋生物科学公司Pacific Biosciences ( PacBio)宣布它将开始销售其商业PacBio RS系统时,该公司预计第三代测序产品的发售将“立马扩展DNA测序在诸如癌症研究、病原体检测和农业等领域的应用”。不同于市场上的第二代系统,PacBio RS系统能够实现单分子实时测序反应,在一天内生成结果。此外,跨越几千个DNA碱基的长序列读取将使从头测序成为可能,通过跨越重复区域可简化序列组装,并增进对拷贝数变异的检测。由于不需要DNA扩增,这一系统将减少基因组覆盖度中的某些人为假象(artifact)和偏差。

然而一年多过去了,现在看来研究人员对采用第三代测序技术一直保持慎重。为何?其中一个缺点就是错误率相对较高。尽管通过环形共有序列(CCS),包括多次测序较短模板,可以获得高准确度,PacBio RS仪器生成了平均不到85%核苷酸准确度的单次读取。“这些测序读取的高错误率已经被视为这一技术的主要限制,”国家生物防御分析与对策中心基因组学研究人员Adam Phillippy说。

为了解决这一问题,马里兰大学国家生物防卫分析和反制中心的Adam Phillippy及同事们开发了一种新的融合技术将第二代和第三代测序技术结合到一起生成了近乎完全准确的长读取,这一成果报道在7月1日的《自然生物技术》(Nature Biotechnology)杂志上。将这一技术应用到鹦鹉基因组,通过首先绘制短读序列,计算高度准确的融合共有序列,校正了个别的长读序列。短读和PacBio RS CCS是通过454 和Illumina测序仪生成,长单次读取是通过PacBio RS生成。“我们开发了首个能够校正和组装PacBio RS单分子序列读取的算法,并证实PacBio RS技术的高错误率可以设法得到控制,从而大大改善基因组和转录组的组装,”Phillippy说。

和平共存?

但是仍有许多的工作要做。例如,软件开发商需要更多时间来赶上新仪器。Phillippy 说:“第三代测序仪正在生成一种全新类型的测序数据。过去5年或更长时间以来算法开发几乎完全集中于高通量、高准确度的短读数据。将软件开发过程转向一个新焦点还需要相当长的时间。”Phillippy的算法是朝着这一正确方向迈出的一步,因为校正的读取可以利用现有无法处理高错误率的生物信息工具来进行分析。

该技术还需要改善其可靠性、通量及成本才能具有竞争力。Phillippy说:“从454 和 Illumina技术引入到被广泛接受,并将Sanger测序推至小角色之前,也存在相似的两至三年的滞后。”

Pacific Biosciences正处于改善仪器通量及延伸读取长度的进程中。公司产品管理总监Edwin Hauw说:“系统硬件本身并没有改变,但我们正在改善化学和软件。”目前,该系统非常适用于研究微生物基因组,但它的通量限制了对更大基因组的研究。“对于某些应用它的成本高昂,因此对人类基因组或其他大型基因组采用针对性测序是当下最佳的策略,”Hauw说。

一旦这些障碍被克服,新技术将使研究人员能够深入了解许多与拷贝数变异和其他不容易用第二代测序技术研究的大型结构变异相关的疾病,例如癌症、自闭症和染色体疾病。长单分子测序也可以揭示对于包含在基因组非编码内含子和基因内区域中的“无用DNA”的认识,这些“无用DNA”被认为起着重要的调控作用,但由于无法正确组装而没有得到广泛研究。 

但第三代测序技术不太可能很快取代之前的技术。最终,对于测序技术的选择将取决于特异的研究问题。例如种群研究需要高深度测序,人类单核苷酸多态性调查或表达研究等仍然最好用第二代技术开展研究以非常低的成本生成大量的数据。“直到第三代技术能够与这种每个碱基的成本相称,其在读长尤其重要的应用例如基因组组装或结构变异研究中将会受到限制。我期望第二代和第三代技术将可以和平共存直至产生另一个巨变,”Phillippy说。

(生物通:何嫱)

作者: 2012-8-1
医学百科App—中西医基础知识学习工具
  • 相关内容
  • 近期更新
  • 热文榜
  • 医学百科App—健康测试工具