Science封面6連發:人類最完整的基因組測序完成!
如果把人類完整基因組測序比作做一篇完形填空的話,那這篇完型的後8%,科學家做了19年。如今,終於可以交上一份圓滿答卷了。
全世界科學家近40年的努力,今天終於圓滿!
Science連發6篇封面文章,宣佈人類完整基因組測序計劃正式完成。
據路透社、
Science
等報道,這項成果填補了前人幾十年努力後仍然存在的空白,為全球 79 億人中尋找有關致病突變和遺傳變異的線索提供了新的希望。
算起來,距離人類最早討論基因組測序計劃,到今天已經過去了近40年。
19年前差8%「進度條」,現在終於填上了
1984年,由美國政府資助的旨在討論日益發展的DNA重組技術的會議上,科學家們第一次討論了人類基因組測序的價值。
1990年,人類基因組計劃由美國能源部和NIH投資,預期在15年內完成。
1999年,中國科學院遺傳研究所人類基因組中心向NIH國際人類基因組計劃(HGP)遞交加入申請,承擔總測序量1%(約3000萬對鹼基)的測序任務。
2003年4月,人類基因組計劃宣佈完成。但這裡的「完成」要打個折扣,因為這個計劃無法對所有人類細胞中發現的DNA進行測序,只能對基因組的「真染色質」區域進行測序,這些區域占人類基因組的92%。
其餘的8%,稱為「異染色質」區域,由高度重複且結構緊密的 DNA 塊組成,當時的測序技術無能為力。
現在,這部分之前難以讀取的鹼基對,被一個名叫「端粒到端粒聯盟」(T2T consortium)的組織解決了。
最新一期 Science 以「填平鴻溝」(Filling the Gaps)為題報道了這一重磅訊息,並刊載了關於新的測序技術細節的六篇論文。
這個名字就很有意思,端粒是是真核生物染色體末端的DNA重複序列,正處於典型的異染色體區域,即之前的無法完成測序的部分。
「T2T聯盟」在推特上宣佈,這些部分的測序工作已經正式完成。
歐洲分子生物學實驗室副主任、原人類基因組計劃成員、生物資訊學家Ewan Birney說:「我認為我們甚至在5年前都無法想象。」
以前無法破譯的基因組序列現在已經清晰可見
,其中包括端粒和中心粒的部分,後者位於每條染色體的中間,起協調複製的作用。
此外,還有五條染色體的短臂上的基因組完成測序。這些短臂已知包含幾十個編碼核糖體主幹的基因,核糖體是細胞的「蛋白質工廠」。
全基因組測序變成「完形填空」
2001年,人類基因組的第一份草案提出開始時,甚至在首次宣佈「完成」後,基因測序技術都無法涉足DNA序列包含非常重複的鹼基段的區域。在測序結果中,這些重複序列一般被跳過留白,或者以錯誤的方式呈現。
隨著測序技術的提高和成本的下降,這些留白和錯誤的空間越來越小。2017年,科學家們釋出了一個名為GRCh38的人類基因組。由於其「留白」缺口不到1000個,在許多人看來,它成為了其他人類基因組的標杆參照。
從那時開始,科學家們開始把這個工作做成了「完形填空」。
越來越多的人加入,想把這個完形填空繼續做到底。
2019年,美國國家人類基因組研究中心的生物資訊學家Adam Phillippy報告說,已經成功地對X染色體進行了從頭到尾的測序,這也激發了其他幾十個研究人員加入這一事業。
「這項事業真的有了自己的生命,」 加州大學聖克魯茲分校的遺傳學家Karen Miga表示。在一次會議上和Adam Phillippy見面後,他們開始攜手合作。
T2T結合了多種測序技術,其中有奈米孔裝置,可以同時識別100000對鹼基;還有另一種測序裝置,結果更精確,但是同時只能識別10000對。研究人員對後一種辦法做了一些升級,進一步提高了準確性。
Waterston表示,「看看他們為了解決這些問題用了多少方法,你就知道到底有多難了。」他是華盛頓大學的一名遺傳學家,曾經一同領導過人類基因組計劃。
最終,大概兩億對鹼基排列順序正確、位置正確。其中包括超過1900組基因,大部分都是已知基因的複製。
研究人員將複製的區域和可移動的元素進行記錄——比如病毒帶來的基因材料被整合到了基因裡。
短染色體臂(short chromosome arm)蘊藏著另一個驚喜。
就像預料的一樣,這些短染色體包含很多複製,總共有400個,複製的是為RNA編碼的基因。
Miga表示,「rDNA是最後一塊多米諾骨牌。」,這部分一直以來都是最難測序的地方。
「這真的很神奇,人類的基因組竟是這麼的動態。」人類基因組計劃組織者之一George Church教授表示。
這次測的是誰的DNA?
如此完整的基因測序工作,自然離不開無私奉獻的人貢獻出自己的DNA。51歲的哈佛生物學博士Leonoid Peshkin就是這樣一個人。
此次測序基因組的Y染色體來自Peshkin,而剩下的DNA則來自所謂的葡萄糖妊娠(molar pregnancy),這是一種較為罕見的子宮生長方式。精子在進入卵細胞時如果沒有染色體,就會發生葡萄糖妊娠。
在這種情況下,受精的細胞會複製精子的23條染色體,產生兩組一模一樣的染色體, 並具備複製能力。匹茲堡大學的遺傳學家Urvashi Surti發現了這個特性可以對基因組測序工作大有幫助,因為測序儀不必解決父母染色體之間的差異。她想據此培育一個細胞系出來。
在徵得了醫療中心審查委員會的許可後,她刪掉了所有有可能會和父母有關聯的資訊。2001年,她成功了,並獲得了1981到2000年間相關研究的資料。
2019年,該研究出現了一些潛在的問題,當時美國國家人類基因組研究所(NHGRI)要求任何基因資料共享,都必須徵得捐獻者百分之百的同意。
雖然Surti和她的團隊沒有獲得相應的許可,但NHGRI最終對這項研究網開一面。他們認為,這次例外應該要開個後門,因為該研究的大部分序列都已經公開了。
然而問題還是沒有得到解決。研究中創造的基因組的主人身份究竟能不能靠資料庫確認?
NHGRI認為,就算能確認,也不能這麼做。這樣做是不道德的。男方身份也不能公開,哪怕是去找他要許可也不行。
Surti研究中的基因組只有X染色體,沒有Y染色體,最後,Peshkin的DNA被加了進去。此前,Peshkin和他的父母曾經為DNA研究捐獻過組織。
幾個月前,Peshkin給NIST打了個電話。NIST告訴他,T2T研究團隊正全面的對Peshkin的X、Y染色體測序。正是因為他的奉獻,研究人員才得以大規模的利用他的DNA。他的基因組將會是
有史以來第一個完整的人類基因組。
Peshkin表示,「我非常興奮能參與到這項前沿的科學研究中來。為科學做點微不足道的貢獻嘛,這是我該做的。」
參考資料:
https://www。
science。org/content/art
icle/most-complete-human-genome-yet-reveals-previously-indecipherable-dna
https://www。
science。org/toc/science
/376/6588
https://www。
reuters。com/lifestyle/s
cience/scientists-publish-first-complete-human-genome-2022-03-31/
——新智元