您當前的位置:首頁 > 體育

蛋白質組與轉錄組研究思路 | 蛋白專題

作者:由 聯川生物 發表于 體育時間:2022-01-28

一、介紹

在一個有機生物體中,基因表達的主要環節包括轉錄和蛋白質合成,mRNA是基因表達的中間體,蛋白質是基因功能的執行體。要了解具體的基因表達調控過程,需要對mRNA和蛋白進行關聯分析,透過比較蛋白質組學和轉錄組學的資料,在轉錄水平和蛋白水平上整合分析,將兩者聯絡起來。理論上講,從生長條件和狀態相同的細胞、組織或器官獲得的轉錄組與蛋白質組資料之間應該具有較高的相關性,然而大量文獻報道了轉錄組和蛋白質組的表達趨勢並不相關甚至負相關的情況。蛋白質是生物體最終的功能執行著,其含量隨著生物體的生長、環境應激反應、疾病發生髮展的過程不斷變化,因此,對蛋白質的解析意義重大。轉錄組是連線基因組和蛋白質組的中間模組,從DNA轉錄成mRNA,再翻譯成蛋白質的過程中,涉及到一整套精細的表達調控機制,如轉錄調控,轉錄後調控,翻譯調控,翻譯後調控等。研究表明轉錄組和蛋白質組的相關係數並不高,表明在這個過程中,翻譯和翻譯後調控對蛋白質的表達具有非常重要的調控作用。由於轉錄後調控以及翻譯後調控的存在,所以mRNA的表達水平並不能代表蛋白質的水平,這也是我們實驗中常常會遇到的PCR結果和WB結果不符的原因。當前的研究表明,mRNA和蛋白的相關性約在0。3-0。5之間,因此單獨只研究mRNA的表達是不充分的。而蛋白質作為細胞功能的主要執行者,它是最終參與細胞生物學過程的主要效應分子。因此,蛋白表達水平才是真實的基因表達情況的反應。

mRNA與對應蛋白表達水平相關性低的原因是當細胞適應了轉錄、轉錄後(如mRNA的剪接)、翻譯後(蛋白降解和輸出)的精細調控機制後,mRNA和蛋白質的表達丰度很可能會不一致。正如mRNA和蛋白質之間的一致性可以驗證測序資料的可信度一樣,兩者之間的差異也能暗示我們更多的生物學意義和調控機制。總結上述研究中對mRNA與其蛋白水平表達趨勢不一致的分析,其原因包括以下點 :

1。轉錄和翻譯後調節機制

基因的表達一般受到轉錄和翻譯兩個層面的調控,mRNA與其對應的蛋白質之間表達量的相關性取決於很多調控因子和代謝過程。從RNA到蛋白再到表型是一個複雜且精細的過程,在mRNA形成之後,很可能發生如轉錄後調控、表觀遺傳修飾(如DNA甲基化等)和翻譯後調控等調節活動。由於存在轉錄後,翻譯和翻譯後的調節機制,還存在降解、酸化、糖基化等導致蛋白質的異構和數量改變的過程,而這些修飾作用往往對於細胞訊號的轉導、生物的生長、發育、衰老等過程起重要調節作用,也就是說僅關注蛋白組和轉錄組的比較研究是不全面的,更值得注意的是將兩者聯絡到一起的橋樑,即轉錄後調控作用,它直接決定了mRNA和蛋白質的水平,除此以外,RNA的可變剪下、小RNA(miRNA、lncRNA 等)、轉錄因子等都有可能參與改變mRNA或蛋白的表達和功能。

2。檢測時間點不同

因為檢測的時間點不同,可能在蛋白達到峰值的時候mRNA已經降解或者在mRNA達到峰值的時候蛋白含量還在變化中,同時還存在降解、酸化、糖基化等導致蛋白質的異構和數量改變的過程。

3。測序外界噪音干擾

測序外界噪音一般由系統誤差和非目片段的測序訊號造成。信噪比,即為有效訊號/背景噪音,是測序結果中一個重要引數。高噪音影響就是低信噪比,信噪比越低結果越不可靠。因此,測序背景噪音也是造成 mRNA-蛋白相關性低的原因之一。

4。非生物學因素

兩組學之間的差異性也可能由試驗技術的侷限性、實驗系統和資料型別等非生物學因素的差異導致。此外,測序樣本的來源不同或狀態不同也會造成差異,因此需要坦然接受轉錄組與蛋白組相關性不高的事實。因此,將轉錄組資料和蛋白質組資料結合起來分析,才可能更加全面且深入地瞭解各個生物過程的分子機理。

二、蛋白質組與轉錄組聯合分析的優勢

雖然轉錄組測序和蛋白質組測序在實驗方法上差異很大,但這兩種方法的根本目的都是獲取基因的表達情況,兩者之間存在一定的共通之處。從生物學角度出發,mRNA水平可以體現基因表達的中間狀態,然而蛋白質是直接的功能執行體,因此對蛋白水平表達的檢測有著不可取代的作用。將轉錄組和蛋白質組聯合起來分析,其優點可以表示為3點:首先,兩組學的聯合分析可以獲得基因的轉錄組與蛋白組學表達水平,實現兩者的互補,對特定狀態下生物體中mRNA和蛋白質表達水平進行全方位分析。其次,將轉錄組和蛋白組聯合分析可以獲得對差異表達的深層分析,挖掘受轉錄後調控的差異基因或差異蛋白,尋找並驗證某些重要的調控通路。另外,對於那些蛋白資料庫缺乏或註釋不全的物種,透過轉錄組資料構建蛋白質搜尋庫,可大幅度提高蛋白質鑑定數。蛋白質是細胞行使功能的載體,在轉錄和蛋白水平,如果只能透過嚴格的轉錄調控去控制蛋白質的合成,細胞是不太可能選擇精細調節機制的。透過比較蛋白質組學和轉錄組學的資料將兩者聯絡起來,可以更加準確的掌握功能基因或蛋白的作用,找到基因相互作用網路,進而提供單個基因的生物學功能。蛋白質組學與轉錄組學聯合分析,就是透過對轉錄組資料和蛋白質組資料進行聯合分析,挖掘mRNA與蛋白的表達水平,充分利用轉錄組和蛋白質組研究的差異性和互補性,對基因的表達水平進行全方位的分析,以探究從基因到蛋白的全景圖,發掘常規單個組學未能發現的新結果。全面探究生物體疾病機理,生長髮育機制等。近些年,隨著基於質譜技術的蛋白組學的發展,為疾病病理機制研究和治療靶點的發現提供新的路徑,當前已經發表了大量的從蛋白組學開始的文章。鑑於轉錄組和蛋白組是關係非常緊密且處於上下游的兩個組學,所以這兩個組學的聯合研究尤其受到了研究者的青睞。我們在各類生物學研究領域裡可以搜到大量轉錄組和蛋白組聯合研究的文獻,且數量逐年增加,這也是多組學聯合研究趨勢的一種體現。

三、蛋白質組與轉錄組聯合分析的應用

案例一 :Transcriptomic and Proteomic Profiling of Human Stable and Unstable Carotid Atherosclerotic Plaques

發表期刊:Frontiers in Genetics(IF=4。6)

發表時間:2021。11

技術手段:轉錄組、蛋白質組

研究內容:

動脈硬化是一種發病率和死亡率都很高的慢性炎症性疾病。動脈硬化斑塊破裂是引起動脈硬化臨床事件的主要原因。明確穩定斑塊和不穩定動脈樣硬化斑塊之間的轉錄組學和蛋白質組學特徵對於預防臨床表現至關重要。在本研究中,透過頸動脈內膜切除術獲得了5個穩定和5個不穩定的人頸動脈樣硬化斑塊。樣品用於透過使用Illumina HiSeq測序進行全轉錄組測序 (RNA-Seq),並透過HPLC-MS/MS進行蛋白質組分析。透過分析它們的位置和序列,確定了lncRNA靶向基因和circRNA起源基因。進行GO和KEGG富集分析差異表達的RNA和蛋白質的功能。蛋白質-蛋白質相互作用(PPI)網路由線上工具STRING構建。分析轉錄組和蛋白質組的一致性,並預測lncRNA/circRNA-miRNA-mRNA相互作用。結果,鑑定出202種mRNA、488種lncRNA、91種circRNA和293種蛋白質在穩定和不穩定動脈粥樣硬化斑塊之間差異表達。488個lncRNA可能透過順式作用機制靶向381個蛋白質編碼基因。序列分析表明,91個差異表達的circRNA來自97個蛋白質編碼基因。這些差異表達的RNA和蛋白質主要在細胞對應激或刺激的反應、基因轉錄的調節、免疫反應、神經系統功能、血液學活動和內分泌系統方面富集。這些結果與資料集GSE41571中先前報告的資料一致。進一步分析發現CD5L、S100A12、CKB(lncRNA MSTRG。11455。17的靶基因)、CEMIP(lncRNA MSTRG。12845的靶基因)和SH3GLB1(hsacirc_000411的起源基因)是調節動脈樣硬化斑塊穩定性的關鍵基因。作者的研究結果提供了關於動脈樣硬化斑塊穩定性的全面轉錄組學和蛋白質組學知識。

蛋白質組與轉錄組研究思路 | 蛋白專題

蛋白質組與轉錄組研究思路 | 蛋白專題

案例二:Proteomic and transcriptomic profiling reveal different aspects of aging in the kidney

發表期刊:eLife(IF=7。08)

發表時間:2021。03

技術手段:轉錄組、蛋白質組

研究內容:

衰老的特點是所有器官的生理功能下降,發病率和死亡率上升。腎功能在衰老過程的早期受到影響,並隨著年齡的增長而逐漸下降。腎臟體積的減少和功能性濾過單元的喪失導致35歲後人類腎小球濾過率每十年下降5-10% 。在血液和尿液中測量腎臟的功能變化相對容易且無創傷。此外,腎功能顯著影響其他器官的年齡相關疾病,包括認知障礙。這些因素使腎臟成為研究器官特異性衰老的優秀模型。而以前的研究沒有將轉錄變異與蛋白質水平的變化聯絡起來,但蛋白質水平的變化可能與生理衰老更相關。為了更好地理解這些變化,研究人員測量了不同年齡的基因多樣性小鼠的mRNA和蛋白質水平。觀察到不同年齡層面小鼠的mRNA和蛋白質水平顯著變化。mRNA和蛋白的變化與免疫浸潤增加和線粒體功能下降有關。蛋白質顯示了更大程度的變化,並揭示了一系列廣泛的生物過程的變化,包括獨特的腎臟器官特定的老化。最重要的是,研究人員觀察到在mRNA沒有相應變化的情況下,蛋白質發生了功能上重要的年齡相關變化。作者的發現表明,mRNA圖譜單獨提供了腎臟中分子衰老的不完整的影象,並且檢測蛋白質的變化對於理解沒有轉錄調控的衰老過程是必要的。

蛋白質組與轉錄組研究思路 | 蛋白專題

案例三:The susceptibility ofLymantria disparlarvae toBeauveria bassiana

under Cd stress: A multi-omics study

發表期刊:Environmental Pollution(IF=8。071)

發表時間:2021。02

技術手段:轉錄組、蛋白質組

研究內容:

重金屬脅迫下昆蟲對昆蟲病原微生物的敏感性及其調控機制尚不清楚。本研究旨在研究在3。248或44。473 mg Cd/kg鎘脅迫下舞毒蛾幼蟲對球孢白僵菌(beauveria bassianavia)的敏感性,並結合轉錄組和蛋白質組分析揭示Cd對球孢白僵菌敏感性的潛在分子機制。結果表明,鎘脅迫前暴露增加了舞毒蛾幼蟲對球孢白僵菌的敏感性。Cd暴露與球孢白僵菌之間存在顯著的疊加效應對球孢白僵菌感染對幼蟲死亡率有影響。在低濃度和高濃度Cd脅迫下,分別鑑定出138個和899個差異表達基因(DEGs), 514個和840個差異表達蛋白(DEPs)。Cd在轉錄水平上誘導的免疫毒性效應呈負劑量-反應方式增加,低Cd濃度下無免疫相關DEGs產生,高Cd濃度下有大量免疫相關DEGs下調。與此相反,在低濃度或高濃度Cd處理下,Toll和Imd訊號通路在蛋白水平上可能受到抑制或刺激。在轉錄和翻譯水平上對外源生物降解相關通路的分析表明,舞毒蛾幼蟲對低水平Cd脅迫具有有效的內穩態調控機制,但在高水平Cd脅迫下,其外源生物降解能力降低。總之,這些發現表明,Cd汙染促進了基於微生物的生物防治效果,並揭示了重金屬暴露影響昆蟲對致病性疾病易感性的分子調控網路。

蛋白質組與轉錄組研究思路 | 蛋白專題

案例四:Apoptosis-inducing activity of synthetic hydrocarbon-stapled peptides in H358 cancer cells expressing KRAS G12C

發表期刊:Acta Pharmaceutica Sinica B(IF=11。413)

發表時間:2021。06

技術手段:轉錄組、蛋白質組

研究內容:

肺癌是全球癌症死亡的主要原因,對人類生命和健康構成嚴重威脅。非小細胞肺癌(NSCLC)是最常見的惡性腫瘤,佔所有肺癌亞型的80%。除了其他突變(如KRASG12V/D),這些突變也對NSCLC的發生至關重要外,KRASG12Cgene突變是NSCLC發生的重要驅動力,約佔NSCLC患者的14%。然而,目前針對krasg12c突變的治療藥物還很少。作者合成了更短、更穩定的烴類固定肽3,具有較低的KRASG12C binding親和力,並具有相同的抗腫瘤作用,基於螺旋肽模擬SAH-SOS1A。透過阻斷kras介導的RAF/MEK/ERK訊號通路,有效誘導G2/M阻滯和凋亡,抑制了kras突變肺癌細胞的生長,從基因組學和蛋白質組學角度得到了驗證。peptide3還表現出較強的抗胰蛋白酶和胰凝乳蛋白酶的能力,以及良好的血漿穩定性和人肝臟微粒體代謝穩定性。總的來說,peptide3保留了與SAH-SOS1A相當的抗腫瘤活性,並提高了穩定性和親和力,優於SAH-SOS1A。為KRASG12Cpeptide inhibitors的抗癌治療提供了一種結構最佳化的方法。

蛋白質組與轉錄組研究思路 | 蛋白專題

案例五:Integrated nuclear proteomics and transcriptomics identifies S100A4

as a therapeutic target in acute myeloid leukemia

發表期刊:Leukemia(IF=11。528)

發表時間:2019。09

技術手段:轉錄組、蛋白質組

研究內容:

蛋白質的不適當定位會干擾正常的細胞功能並推動腫瘤的發展。為了瞭解這如何導致急性髓性白血病(AML)的發展,研究者將AML母細胞的核蛋白質組和轉錄組與正常人CD34(+) 細胞進行了比較。蛋白質組分析確定了顯著影響轉錄調控的網路和過程,包括11種轉錄因子的錯誤表達,其中7種蛋白質以前與AML無關。轉錄組分析確定了40個轉錄因子的變化,但這些都不能預測蛋白質水平的變化。與正常 CD34(+) 細胞核(以前未涉及 AML)相比,AML細胞核中差異表達最高的蛋白質是 S100A4。在一個擴充套件佇列中,我們發現核 S100A4 的過度表達在 AML 中非常普遍(83%;20/24 AML患者)。在AML細胞系中敲除S100A4強烈影響它們的存活,而正常的造血幹祖細胞不受影響。這些資料是對AML中核蛋白質組的首次分析,並確定了轉錄因子表達或轉錄調控的變化,這些變化在mRNA水平上是看不到的。這些資料還表明S100A4對 AML的存活至關重要,可能是AML的治療靶點。

蛋白質組與轉錄組研究思路 | 蛋白專題

結語

轉錄組學和蛋白組學都是系統研究有機體生理狀態的常用工具。當然,沒有一種工具可以提供完全的覆蓋和絕對的精確度。研究的核心不單是找出mRNA和蛋白質之間一對一的關係,更是要透過轉錄組和蛋白組的整合分析區別出mRNA和蛋白質的一致性或不一致性。轉錄組學或蛋白組學資料通常只能體現調節系統和分解作用平衡態的淨效應,實際上兩者的不一致性只是合成與降解兩種過程交替的一種反映。mRNA和蛋白質之間的一致性一定程度上可以驗證測序資料的可信度,而兩者之間的差異往往透露出轉錄後干涉情況,暗示更多的生物學意義和調控機制。

標簽: 轉錄  蛋白質  mRNA  表達  調控