返回首页 |
 
       科学与技术
 
 
        首页 > 硬件平台
 
硬件平台



HiSeq X Ten是Illumina于2014年推出的最新测序系统,其功能定位为工厂规模的测序系统,实现了Illumina测序仪迄今为止最高的测序通量和最低的测序成本。HiSeq X Ten系统由10台超高通量测序仪HiSeq X组成,测序读长为2×150bp,单台仪器每次运行可产出高达1.8Tb的数据,运行时间在三天以内,即每台仪器每天产出约600Gb的数据。10台仪器同时运行时,每周至少可完成320个人类基因组测序(以30×覆盖度计算),每年完成的数量可超过18000个。因此,HiSeq X Ten将使研究人员更易于开展大规模人类基因组测序,并将有利于深入挖掘与癌症及复杂疾病相关的遗传变异。


                                                                                     Table 1. HiSeq X Ten测序结果展示

一、85%以上碱基准确度达到Q30

碱基质量直接极显著影响可用数据的比例、对参考基因组的覆盖率、mapping至参考基因组的比例及变异检测的可靠性等一系列的深层质量指标。这些因素共同决定了是否能够找到致病变异。例如,根据统计Q30每下降10%,数据过滤时将有约20%的reads被滤掉,意味着75%的Q30将比85%的Q30少20%的可用数据,而致病变异很可能也同时被过滤掉了,这样将导致后续所有分析都没有意义了。所以,碱基准确度代表了测序的整体质量,并不是把错误碱基过滤掉就一样支持分析。

基于我们多年来丰富的医学国际项目经验、严格的实验流程监管严格及严格使用原厂进口测序试剂,航派的碱基准确度一直以来在全球是遥遥领先的。下表的结果显示第一条read的Q30高达91%。虽然Illumina边合成边测序时第二条read的碱基质量一般会低于第一条read,即使如此,我们得到两条reads的平均Q30也高达88.1%。

二、测序深度大于10×的参考基因组覆盖率达到98.5%

在数据均一性方面,虽然人类基因组测序的总体覆盖深度一般都在30×以上,但由于测序试剂、实验操作和GC bias等因素影响,所有待测区域的覆盖深度并不完全一致。尤其是高GC含量的区域,由于测序偏好性的存在一般覆盖深度会低于其他区域。变异检测时单条read检测出的变异信息可靠性较低,很可能有测序错误导致,因此通常选取覆盖度大于10×的reads进行变异分析。

目前已发表的基因组文章中覆盖度大于10×的reads所占比例约为85%-95%,结果表明我们通过严格的质量控制可得到很高的测序均一性,测序深度大于1×的reads占整个参考基因组的比例高达99.3%,大于10×的reads所占比例也高达98.5%。因此,即使有价值的变异信息位于高GC含量的基因组区域,测序时也能保证该区域获得较高的覆盖度,而不会在变异检测时因覆盖度较低导致这部分信息被遗漏,从而造成假阴性结果。

三、去冗余后mapping比例高达91.8%

在有效数据量方面,duplicate reads是指文库制备过程中因PCR扩增不可避免引入的完全一致的DNA片段,duplicate reads所占比例的高低主要取决于实验人员操作的熟练程度。由于这部分数据对后期的变异分析没有意义,因此会在分析前过滤去除。结果表明我们通过严格的质量控制可得到很低的duplicate reads比例,去除duplicate reads后可比对至参考基因组的reads比例仍高达91.8%。这意味着在相同原始数据量的前提下,可让研究者获得更多的可用数据量。

四、与HiSeq 2000数据具备高一致性

为了进一步验证HiSeq X Ten数据的可靠性,我们选取两个样本分别用HiSeq X Ten和HiSeq 2000测序后进行基因分型比较。其中NRD(non-reference discrepancy)代表这两种方法有差异位点的比率,该值越低表示两种方法的一致性越好。结果表明,HiSeq X Ten与HiSeq 2000进行基因分型的一致性是非常高的,这也进一步验证了HiSeq X Ten数据的高可靠性。

样本名称

Sample1

Sample2

测序平台

HiSeq 2000

HiSeq X Ten

HiSeq 2000

HiSeq X Ten

数据输出格式

fastq

bcl

fastq

bcl

比对分析软件

Isaac Genome Alignment

变异检测软件

Isaac Variant Caller

SNP数目

3,477,298

3,438,051

3,489,040

3,488,962

基因分型

overlapped SNP数目

3,306,176

3,358,359

overlapped SNP比例

95.08%

96.16%

96.25%

96.26%

异源错配

642

600

异源匹配

1,907,342

1,927,953


                                                                         Table 2. HiSeq X Ten与HiSeq 2000数据可靠性比较

 
      科技服务
医学服务
科学与技术
新闻活动
云平台
关于我们
      全基因组测序                   实验技术
      癌症基因组测序                   硬件平台
      生物信息分析                     知识中心
         
Copyright @ 2012-2015 上海派航生物科技有限公司 All Rights Reserved 沪ICP备14023300号
地址:上海市奉贤区环城西路3111弄555号1154室 电话:021-20980179
邮箱:support@ph-bio.net
在线咨询