您當前的位置:首頁 > 娛樂

我要自學生信之生信基礎:illumina測序原理

作者:由 張一柯 發表于 娛樂時間:2020-08-20

一代測序

第一代測序是由生物化學家桑格(Frederick

Sanger

)發明的,因此被稱為桑格法測序,也被稱為“雙脫氧測序”。為什麼稱為“雙脫氧測序”呢,這主要是基於它的測序原理。在DNA鏈的合成過程中加入

ddNTP

(雙脫氧核苷酸),由於ddNTP的2’和3’都不含羥基,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應,在4個DNA合成反應體系中分別加入一定比例帶有放射性同位素標記的ddNTP(分為:ddATP,ddCTP,ddGTP和ddTTP),透過凝膠電泳和放射自顯影后可以根據電泳帶的位置確定待測分子的DNA序列。

我要自學生信之生信基礎:illumina測序原理

測序過程如圖所示:玻璃毛細管中的丙烯醯胺溶液在紫外線的電離作用下發生聚合反應,變成聚丙烯醯胺凝膠,在電場條件下由於不同長度的DNA片段在聚丙烯醯胺凝膠中的遊動速度不同,而且是從負極遊向正極,因此可以分離出不同長度的DNA片段。

在毛細管正極一端用鐳射進行照射,並用分光的光學感測器把不同顏色的熒光強度記錄下來。越先到達毛細管正極的DNA片段越短,它聚合的終止位置離聚合起始位置越近,因此它的顏色就反映了離3’末端最近的鹼基的種類。然後我們就會得到峰值圖,圖的橫軸代表電泳時間,縱軸代表熒光強度,然後我們可以根據峰的顏色判斷出依次是哪種鹼基。峰越高越尖說明這個鹼基的判讀越準確。

二代測序

第二代高通量測序也稱為下一代測序技術,相比於第一代測序通量更高、速度更快、成本更低,主要有樣本製備、文庫構建、測序反應等過程。由於原理和技術的不同,二代測序有諸多的測序平臺,我們主要為大家介紹illumina 二代測序原理和過程。

我要自學生信之生信基礎:illumina測序原理

00、常用概念

首先大家請看下圖,這是一個flowcell,大家可以叫它“泳池”,測序反應就發生在它上面。同時它上面有8條lane,大家可以叫它“泳道”。

我要自學生信之生信基礎:illumina測序原理

每一條“泳道”的內表面做了專門的化學修飾,主要是兩種DNA引物,如下圖所示,(也就是圖二中的綠色和黃色這兩種)。

我要自學生信之生信基礎:illumina測序原理

這兩種DNA引物的

序列

和接下來要測序的DNA文庫的

接頭序列

是互補的。這兩種DNA引物是種植在“泳道”內表面的,大家就要問了:它是如何種植在泳道內表面的,為什麼要將它種植在內表面呢?它是透過共價鍵連線到內表面的,之所以要將它連線在內表面是因為在後面的測序過程中會有大量的液體要流過這個“泳池”,如果不將它連線在上面的話,這些液體就會將它沖走,夠直白了吧。下面正式開始介紹測序反應。

01、建庫

首先給大家說一下什麼是DNA文庫,所謂的DNA文庫就是許多兩頭接上了特定接頭的DNA片段混合物。為什麼是

特定接頭

?因為它是人為特地加上去的已知序列。和上面種植在“泳池內表面的引物序列是互補的”。

我要自學生信之生信基礎:illumina測序原理

開始建庫

1、 首先把基因組DNA用超聲波打斷;

2、 打斷之後會出現末端不平整的情況,所以我們先要將它補齊成平末端;

3、 補平之後要在3’端使用klenow酶加上一個特異性鹼基A;

4、 加上A之後就可以用連線酶加上特異性接頭;

5、 連好了接頭的DNA混合物我們就稱為DNA文庫;

6、 然後進行PCR擴增,以保證我們的DNA樣品濃度能夠達到上機的要求。

我要自學生信之生信基礎:illumina測序原理

02、橋式PCR

什麼是橋式PCR?橋式PCR是把DNA文庫種植到flowcell上去,然後進行PCR擴增的過程。因為文庫DNA片段兩頭的特異性接頭和種植在晶片上的引物是互補的,所以會產生互補雜交。

橋式PCR流程

1、 首先把文庫加入到flowcell上,等文庫和flowcell上的引物雜交完之後加入dNTP和聚合酶,就會以文庫為模板合成一條新的互補鏈。

2、 在flowcell中加入NaOH鹼溶液使DNA雙鏈解鏈,然後文庫那條鏈會被沖走,新合成的鏈由於與種植在lane內表面的引物連線,所以會被保留。

3、 在flowcell中加入中性液體中和鹼液,使環境變為中性。這時DNA鏈上的另外一端會彎曲下來與另一個引物發生互補雜交。加入聚合酶和dNTP,聚合酶沿著第二個引物,合成出一條新的鏈。

4、 再加入鹼液,使兩條鏈解開,然後再加入中和液,兩條DNA單鏈會和新的引物雜互動補,再加酶和dNTP,又從新的引物合成新的鏈。

5、 連續重複第四步,DNA鏈的數量就會以指數方式增長。

我要自學生信之生信基礎:illumina測序原理

橋式PCR完成之後,要把合成的雙鏈變成可以測序的單鏈,可以透過化學反應把一個引物上的一個特定基團切掉,然後加入鹼溶液使雙鏈解鏈,切斷了的那根DNA鏈就會被沖走,這樣就得到單鏈。再加入中性溶液,中性溶液中加入測序引物就可以開始測序了。

讀取Read1

測序時需要加入帶熒游標記的dNTP和聚合酶,在聚合酶作用下dNTP會根據鹼基互補的原則與模板鏈互補生成一條新鏈。但是,dNTP的一個特點就是它的3’末端是被一個疊氮基團堵住的,所以它一個迴圈只能延長一個鹼基。延長一個鹼基之後就用水把多餘的dNTP和聚合酶洗掉,然後進行鐳射掃描,根據發出來的顏色判斷加入的是哪種鹼基。加入的4種dNTP所標的熒光素都不一樣,根據紅黃藍綠判斷加入的是哪種鹼基,然後得出與它互補的DNA鏈上的鹼基,這就完成了一個迴圈。

一個迴圈結束之後就加入一些化學試劑把疊氮基團和標記的熒光基團切掉,使3’端的羥基暴露出來,再加入新的dNTP和聚合酶開始第二輪迴圈。不斷重複這個過程,就可以將文庫DNA片段一端的序列讀取出來,稱為“reads1”。

我要自學生信之生信基礎:illumina測序原理

讀取Index

什麼是index?因為illumina 的測序通量很大,一個樣本用不了太多的DNA。因此在文庫的接頭上做了一些標記,每一個樣本都有一個特定的接頭,每一個接頭裡面有特定的序列叫做index。

如何讀取index的序列?要讀取index的序列,先用鹼把測完“read1”序列的鏈解鏈掉,然後加入中性液,再加入“read2”的測序引物,“read2”引物的結合位點剛好在index序列的旁邊,然後開始進行第二輪測序,一般讀特異接頭的6-8個鹼基,然後就可以知道這一段DNA來自哪個樣本。

我要自學生信之生信基礎:illumina測序原理

雙端測序

雙端測序是illumina的核心技術,簡單來說就是將一條DNA鏈的一端測序得到“read1”,然後再測出互補鏈的與“read1”互補的這段的序列,得到“read2”。圖九是雙端測序概念圖。Read1的測序過程已經在文章中交代過。測“read2”需要倒鏈。倒鏈的過程是先讓測“read1”的DNA合成雙鏈,有了互補鏈之後,用化學試劑將原來的模板鏈從根部切斷。然後從互補鏈上開始進行“read2”的測序,測序原理同“read1”測序原理相同。

注:

index:

一條lane能測得的資料量在30G左右,而一個樣品的測序量一般不會這麼大,所以在建庫的時候對每一種樣品的接頭加上不同的標籤序列,這個標籤就叫做Index,有了index就可以同時在一個lane中測多種資料了,後期可以根據index將資料分開

adapter:

adapter的中文意思為介面卡或者介面,在illumina測序過程中關鍵一步是將文庫片段固定在flowcell上,然後透過橋式PCR將片段擴增,在被打斷成300~500bp的長度的片段末端被補平後adaptor將被新增到片段兩端,一方面用於將片段固定在flowcell上,同時adaptor中還包含橋式PCR所需要的引物

primer與adapter

adapter在中文是介面卡或者介面的意思,在前面的內容中已經提到將測序序列打碎成片斷後要將末端補平然後新增adapter,用於與flowcell上的oligo匹配固定併為後續橋式PCR做準備,而前面提到的Index與adapter之間的位置關係一般為adapter1-Index-fragment-adapter2,adapter2透過與oligo互補連線在flowcell上,在進行完橋式PCR之後進行測序時,新增primer,這一段primer的序列是與Index互補的而非adapter1,所以最終拿到的測序結果應該是Index+fragment+adapter2或者Index+部分fragment

標簽: 測序  DNA  引物  互補  文庫