提示:閱讀本文約5分鐘!
被譽為生命科學「登月計劃」的人類基因組測序再次取得重大進展——
國際科學團隊端粒到端粒聯盟(T2T)發表了第一個完整的、無間隙的人類基因組序列,首次揭示了高度相同的節段重複基因組區域及其在人類基因組中的變異。這是對標準人類參考基因組,即2013年發布的參考基因組序列(GRCh38)的「重大升級」。當地時間31日,《科學》雜誌連發6篇論文報告這一成就。
視頻連結:https://v.qq.com/x/page/s3330vtyf1x.html
人類的細胞里,通常有23對染色體。如果仔細觀察這些染色體,會發現組蛋白和纏繞在其上的DNA。
我們的DNA由ATCG4種鹼基排列而成,生命的密碼就藏在其中。
人類的基因組包含大約30億個鹼基對,排列極其複雜,但有規律,因為人與人基因組的相似性高達99.9%。
多年來,科學家們一直想要藉助其中的規律了解人體工作的原理,特別是與疾病相關的機制。
(圖:來源自網絡)
1986年,《科學》雜誌上刊登了一篇由諾貝爾生理學或醫學獎得主Renato Dulbecco撰寫的文章。
他認為,癌症研究已經來到一個關鍵的節點:要麼零碎地挖掘一些關鍵的癌症基因,要麼測定一個特定物種完整的基因組。而想要攻克人類的癌症,測定人的基因組,了解參與關鍵的生理學和病理學過程中各個基因是必不可少的。
同年,杜爾貝科和其他科學家聯合發起了人類基因組計劃(Human Genome Project)——對人類的核基因組進行完整地測序,1990年這項計劃正式啟動,被譽為生命科學領域的「登月計劃」。又過了14年,也就是2004年,首個人類基因組測序結果發表,但基因組上仍有大約2億個鹼基未知,占全部序列的8%。這些未知序列當中包含很多高度重複的鹼基序列,受限於當時的技術難以破譯。
從那以後,科學家們陸續發布了越來越完整的人類基因組序列。到2017年,圖譜上的缺口已經不足1000個,但人類基因組依然不夠「完整」。
(圖:來源自網絡)
在如今的今天,一個由近100名研究人員組成的國際性的科學組織——端粒到端粒(T2T)聯盟,在《科學》雜誌上發表了6篇論文,表示他們測出了那些高度重複的DNA序列,並獲得了迄今為止最完整的人類基因組T2T-CHM13,其中包括30.55億個鹼基對,由22條常染色體和X染色體無縫組裝而成。此時,基因組的缺口僅剩5個,這項研究也被認為是首個完整的人類基因組測序。
為了獲得完整的基因組,團隊首先要解決測序中的一個難點:人體內的大多數細胞都包含兩個基因組——一個來自父親,一個來自母親。當研究人員將DNA片段組裝起來時,父本和母本的序列會混合在一起,無法確定某一個基因組中實際發生的變異。
因此,研究團隊使用了一個匿名的細胞系,這個細胞系來自20多年前從一位女性子宮裡切除的異常生長物。那位女性經歷了妊娠失敗——精子進入一個沒有染色體的卵細胞。如果受精卵中只有精子的遺傳物質的話,就無法長成一個胚胎,但依然可以複製,尤其是在精子攜帶X染色體的時候。
異常的受精卵有個好處,就是只包含一個基因組,23對染色體都是兩兩相同的。華盛頓大學的遺傳學家、協助領導人類基因組計劃的羅伯特·沃特斯頓(Robert Waterston)說,這對填補基因組中的缺口有很大的幫助,因為測序儀不再需要解決父母染色體不一樣的問題了。
(圖:來源自網絡)
除此之外,還有一個更重要的難點,就是高度重複的序列。在進行基因組測序時,科學家通常需要將DNA切成較短的片段再逐一測序,然後將測序結果拼湊起來。當遇到大量高度相似的序列時,研究者便難以確定它們之間的排列順序。
因此,科學家需要藉助更加先進的技術,每次測量更長的DNA序列,來減少拼湊的需求。
於是,T2T聯盟的科學家使用了多項前沿的測序技術,包括讀取10萬個鹼基的納米孔測序設備(nanopore device)和一個更加精確但每次只能讀取約1萬個鹼基的測序儀等。團隊把這些手段用在一起,幾乎消滅了所有的基因組難題,只剩下5個缺口,總共大約1000萬個未知鹼基。另外,由於那個細胞系中只有常染色體與X染色體,Y染色體的鹼基序列還需要詳細解析。
此次,研究團隊為基因組填補了大約2億個鹼基,主要位於著絲粒區域和近著絲粒染色體的短臂區域,還有許多長度超過1000個鹼基的大段重複序列。這些序列中包含1900 多個基因,大部分是已知基因的拷貝,但也包括182個新基因。
研究團隊在著絲粒上發現了一段特別的序列,它可以和一種名叫「動粒」的蛋白復合物結合,而「動粒」參與調控著染色體的移動,也參與染色體的分裂過程。一旦這個序列發生變異,就可能影響細胞內的基因表達,從而導致癌症。
(圖:來源自網絡)
科學家們十分重視基因組中的重複序列,並給它們編排了目錄。在這些序列當中,鹼基上的化學修飾可能和許多疾病有關,例如一些神經障礙和發育障礙等。並且那些疾病的出現,通常和某些重複序列的拷貝數量變化有關。
毫無疑問,這個新的人類基因參考圖譜將會對基因組分析產生重大影響。它將能更好地支持個性化醫療、人群基因組分析和基因組編輯。歐洲分子生物學實驗室的副主任、生物信息學家尤恩·伯尼(參與了人類基因組計劃,沒有參與這些研究)表示:「即使是5年前,我們也沒有想到能做到這一點,更不用說10年前了。這些研究工作極為出色。」基因編輯公司Inscripta的基因組學家迪安娜·丘奇(Deanna Church)認為,這些此前未知的DNA區域讓我們對基因組有了更多新的了解。
未完待续,请点击[下一页]继续阅读
{nextpage}雖然,這些新的研究工作使基因組測序達到了一個新的里程碑,但人類基因組測序儀器並沒有完全下班。由於使用的細胞系沒有Y染色體,T2T聯盟的科學家獲取了哈佛大學系統生物學家列昂尼德·佩什金(Leonid Peshkin)的基因組,並對他的一條Y染色體進行了測序。此前,佩什金博士的基因組已經被研究得相對充分了,只是還沒有得到完整的基因組序列。好消息是,昨日,T2T聯盟在推特上宣布他們已經確定了Y染色體上缺失序列的正確排列形式。想必離解析出完整的Y染色序列也不遠了。
除此之外,人類基因組計劃聯合負責人、貝勒醫學院遺傳學家理察·吉布斯(Richard Gibbs)說:「還有一些工作要做。」包括他在內的許多研究人員都強調,現在需要從更多樣化的人群中獲取完整的基因組序列,來尋找染色體短臂中可能存在的變異,以及其他獲取其他測序難度比較高的區域的變異,因為這些都有可能和疾病或別的性狀有關。
此外,他們還有一個新目標——從不同種族或血統的人中提取350個基因組(目前已破譯了70個基因組)。這些基因組是人類泛基因組參考聯盟(Human Pangenome Reference Consortium)的一部分,它們的測序更有挑戰性,因為每一對染色體都是兩兩不同的。最終,科學家希望給每一個基因組,都找出端粒到端粒的完整序列。
(圖:來源自網絡)
我是海羊,每天記錄和分享新加坡及世界各地有溫度、有高度、有時度的趣談,關注我,隨時了解新加坡靠譜的當地乾貨!
如果您對內容喜歡,期待您的轉發,也請您在評論區內留下留言互動!謝謝!
本文素材,觀點及部分內容來源於網絡,如果您認為侵犯您的權益請聯絡我們及時刪除和修正。