您當前的位置:首頁 > 繪畫

組學方法與資料分析——cDNA microarray(基礎篇)

作者:由 小衝 發表于 繪畫時間:2020-03-28

有人說“21世紀是生命科學的世紀”,也有人對此說法嗤之以鼻。不可否認的是,生物學(生命科學)在過去30年間確實迎來了飛速發展。從1990年初啟動的人類基因組計劃到2003年人類基因組計劃的測序工作完成,從光遺傳技術操作神經元活動到CRISPR-Cas9技術治療多種疾病(實驗室階段),生物學發展取得了重大進步。其中,生物學結合計算機科學後,以往利用RT-PCR或者Western blotting等低通量手段檢測單個基因或蛋白表達變化的低效不足逐漸被機器輔助下的高通量方法所彌補,各種組學(基因組學、轉錄組學、蛋白質組學、代謝組學等)應運而生。隨著組學技術的普及和測試費用的減少,越來越多的實驗室開展了一項或多項組學研究,我們在中高分文章上也見到越來越多的組學資料和結果(看不懂這些資料,會感覺花花綠綠一片,不知所云,瞭解一些基本知識後再看會有新體會),如圖1所示。開玩笑的說:現在不搞點組學似乎都不好發文章?(事實上並非如此,純經典實驗方法的巧妙設計輔以充分證明,這樣的結果和資料也是可以發表CNS文章的,雖然現在比例有所下降)因此,很多小夥伴也希望能多瞭解一些組學的知識。小蟲查找了相關資料,擬於多期公眾號上展示,希望可以對大家有所幫助!如有紕漏,還請大家批評指正。

組學方法與資料分析——cDNA microarray(基礎篇)

圖1 各種組學結果

在正式介紹各種組學知識前,希望大家首先可以找準方向,明確目的。這裡的方向指的是課題設計的方向。比如腫瘤研究人員可能更關注基因組學和甲基化組學,而代謝研究人員更專注代謝組學等,選取哪一組學一定要結合自己的實驗設計。目的則是明確自己的期望。以轉錄組學RNA-seq為例,從RNA分離提取、文庫製備、加樣上機測序到獲得原始結果、資料分析和視覺化展示,每一步都不簡單,而我們也不需要全部掌握。我們首先要明白自己想要什麼,然後才能知道應該學習和掌握什麼知識。

其實對於大多數人來說,掌握各個組學的基本原理和應用,明確各自的優缺點即可

,因為大部分實驗室並沒有開展測序的裝置。如果送公司測序,我們只需要提供樣本和分組資訊,剩下的步驟公司都可以完成。即便如此,還是

希望大家也可以適當掌握一些資料分析和視覺化的操作方法

,這樣後期利用別人資料庫挖掘新資訊時也可以獨立完成。

組學,我們可以簡單地理解為“應用高通量的手段,快速檢測成千上萬個指標”。比如

轉錄組學

,就是

快速檢測轉錄本資訊

的方法,以往我們需要檢測a刺激後B基因的mRNA變化,會選擇Northern blotting或者RT-PCR,但缺點是一次只能檢測一個或者多個mRNA(實際是反轉錄後的cDNA),如果要檢測100個mRNA,工作量將非常大,更不用說幾萬個mRNA了。而轉錄組學可以輕鬆實現這點。

轉錄組學按照方法可以分為基於雜交(Hybridization)方法的微陣列技術(Microarray)和基於測序(Sequencing)方法的RNA-seq。目前市場上常用的RNA-seq多是基於二代測序技術(Next-generation sequencing, NGS)。兩者之間最大的差別在於:

microarray

是事先設計好基因模板並固定在固相裝置上,然後檢測實驗組和對照組之間基因表達差別。常用的是Affymetrix和Illumina公司的測序晶片,一次可得到3萬以上不同基因的結果。但是由於是提前設計好的模板,所以

無法檢測出新的轉錄本,且基因表達過低或過高時檢測不準

;而

RNA-seq

則是相當於讀出一個個ATGC(或者叫Reads)然後再返回匹配對應的基因(Read Alignment),因此可

以發現新的轉錄本(Transcripts or splice isoforms)甚至新的基因

轉錄組學按照轉錄產物還可分為mRNA組學,microRNA組學,lncRNA(Long noncoding RNAs)組學等等。按照實驗設計可以分為普通RNA-seq和單細胞RNA-seq等等。希望大家可以舉一反三,觸類旁通。學會一個組學,再看另一個組學就很發現非常相似。我們可以在GEO資料庫中查詢使用microarray技術的實驗設計和文章,如圖2所示。

組學方法與資料分析——cDNA microarray(基礎篇)

圖2 GEO資料庫中的microarray

Microarray主要有三種類型:點陣列(Spotted arrays)、自組裝陣列(Self-assembled arrays)和原位合成陣列(In-situ synthesized arrays),

如圖3所示。三種之間的區別不是我們要關注的重點,我們只需要瞭解microarray的原理即可。

組學方法與資料分析——cDNA microarray(基礎篇)

圖3 microarray的種類(引自DNA microarrays: Types, Applications and their future, 2013, Curr Protoc Mol Biol)

原理

簡單來講就是:

把3萬多個已知的基因模板“鋪在”固相載體上,然後將處理組(Test)和對照組(Reference)的樣本提取RNA,用不同的熒光染料標記(Test組激發後是紅光,Reference組激發後是綠光)後反轉錄為cDNA,與每一個基因模板雜交,洗脫未結合的cDNA後,在鐳射下檢測每個“spot”處的光訊號

即可知道兩組之間某基因的表達差異

。如處理組(Test)和對照組(Reference)中A基因的表達量比為1:1,紅光和綠光疊加為黃光,則該點處拍照就是黃光。如處理組(Test)和對照組(Reference)中B基因的表達量比遠大於1(如30:1),則兩光疊加後仍偏紅,該點拍照則為紅光(偏暗一點)。如圖4和5所示。

組學方法與資料分析——cDNA microarray(基礎篇)

圖4 雙樣本microarray的流程與原理(引自Expression profiling using cDNA microarrays, 1999, Nature Genetics)

組學方法與資料分析——cDNA microarray(基礎篇)

圖5 單樣本microarray原理簡化圖(引自DNA microarrays: Types, Applications and their future, 2013, Curr Protoc Mol Biol)

cDNA microarray最重要的應用就是基因表達譜分析

(Gene expression profiling),可以得到對照組和試驗組不同樣本之間的基因表達差異(如原理處展示)。其次還可以用來檢測轉錄因子結合位點,

或檢測單核苷酸多型性

(Single nucleotide polymorphism,

SNP

)。這種SNP檢測的方法常在腫瘤相關研究中應用(當然,現在更多是應用直接測序的方法來獲得)。後面有機會再單獨說這個。

整個microarray的

實驗流程

包括:

RNA提取、cDNA合成、加(熒光等)標籤、array的製備、雜交反應、機器掃描和後續的資料分析

(除了資料分析我們儘量學會外,其他內容交給公司就好了),如圖6所示。

組學方法與資料分析——cDNA microarray(基礎篇)

圖6 實驗流程圖(引自APPLICATIONS OF DNA MICROARRAYS IN BIOLOGY, 2005, Annu。 Rev。 Biochem)

關於microarray的基礎知識知道這些就足夠我們應用了,下一篇cDNA microarray(進階篇)中我們會重點講解資料的處理和視覺化展示。

標簽: 組學  轉錄  microarray  基因  測序