第二孙代测序技术的核心思想是边合成边测序(Sequenci航伟么类死ng by Synthe来自sis),即通过捕捉360百科新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche/454 FLX报元境火见朝侵快般、Illumina/So缩零分若财贵还置lexa Geno到me Analyzer和Applie诉宪火封土鸡d Biosystems SOLID system。
- 中文名 第二代DNA测序技术
- 外文名 Next-generation sequencing
概述
DNA测序(DNA sequenci来自ng)作为一种重要的实验技术,在生物学研究中有着广泛的应用。早在DNA双螺旋结构(Watson and Crick,1953)被发现后不久就有人报道过DNA测序技术,但是当时的操作流程复杂,没能形成规模。360百科随后在1977年Sanger发明了具有里程碑意义的末端终止测序法,同年A.剧M.Maxam和W.Gilbe谓明临视某露引触现边台rt发明了化学降解法。Sanger法因为既简便又快速,并经过后续的不断改良,成为了迄今为止DNA测序的主流。然而随着活节川够称胶采科学的发展,传统的Sanger测序已经不能完全满足研究的需要,对模式生物进行基因组重测序以及对一些非模式生物的基因组测序,都其务影导需要费用更低、通量是害次示动雷更高、速度更快的测序技术,第二代测序技术(Next-generation sequencing)应运而生。这三个技术平台各有优点,454 FLX的测序片段比较长,高质量的读长(read)能会讨值句犯南倍达到400bp;Solexa测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据副叶应哪陈量相同的情况下,成本只有454测序的1/10;SOLID测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目出差稳主愿杆受前第二代测序技术中准确度最高的局何革受可婷聚完似。虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数根声层候铁城据分析有很重要的作用,下文将以Illumina/Solexa Genome Analyzer 测序为例,简述第二代测序技术的基本原理、操作流程等方面。
基本原理
Illumina/Solexa Genome An固宗离露它香赶协云娘alyzer测序的基本原理是边兵选合成边测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测把曾香DNA的序列信息。
操作流程
来自 1)测序文库的构建(Library Construction)
首先准备基因组(虽然360百科测序公司要求样品量要达到200ng,但是Gnome Analyzer系统所需的样品量可低至100ng,能应用在很多样品有不械报片曲限的实验中),然后井志故修将DNA随机片段化成几百碱基危雷信底我或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组绍宽审自房们联局信维受测序,则文库的构建要相对麻烦兴张兵酸买些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片定教这其联低作管重害段化并加上接头。片段的大小(I体简nsert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的insert size,以便在组装(Assembly)的时候获得更多的信息。
2积修编积刻纸历风)锚定桥接(Surface Attachment and Bridge Amplification)
Solexa测序的反应在叫做flow cell的玻璃管中进行,flow cell又被细分成8个Lane,每个Lane的内表面有无数的被固定的单链接头。上述步骤得到的位达斗曲艺滑带接头的DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用。
3)预扩增(Denaturation and Complete Amplification)
添加未标记的dNTP 和普通Taq 酶进行固相桥式PCR 扩增,单链桥型待测片段被扩增成为双衡钢征要答济和音移链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。
4)单碱基延伸测序(Single Base Extension and Sequencing)
在测序的flow cell中加入四种荧光标记的dNTP 、DNA聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。从荧光信号获取待测片段的序列信环令息的过程叫做Base Calling,Illumina公司Base Calling所用的软件是Illumina's Genome A通敌频白端额nalyzer Sequencing Control 去滑很于我通Software and Pipeline A局nalysis Software。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全艺切割。随着读长的增加,错误率也会随之上升婷云弦这列成十若黄机。
5)数据分析(Data Analyzing)
这一步严格来讲不能算作测序操作流程的一部分,但是只度才算科地胡迫致路验有通过这一步前面的工作才显得有意义。测序得到想正端的原始数据是长度只有几十个碱基的序列,要通过生物信息学工具将这些短的序列组装成长的Contigs甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。