當前位置: 華文頭條 > 健康

從無數基因碎片中,尋找國人的「生命密碼」

2024-10-01健康
閱讀提要:做了40余年呼吸與危重癥醫學科醫生,今年61歲的高占成接診過上萬例患者,「我一直有一個疑問,為什麽同樣一種小分子靶向抗癌藥物,西方人服用一年甚至更久都不會出現耐藥,但對於一些中國患者來說,可能三四個月就出現耐藥」,高占成很無奈,這也讓他不斷地思考,我們和西方人是否有區別,區別在哪?2021年春天,專家團隊走進了坐落於山西省臨汾市青龍山腳下的小山村,找到了一位叫何忠(化名)的小夥子,經過研究團隊長時間調研,何忠一家世世代代沒有離開過這個村莊。這個小山村距離堯建立的古唐國遺址「堯都」的所在地很近,也是明代洪洞大遷移的發祥地。1370年至1417年,這裏曾有18次大規模人口外遷。「堯都」不僅地理位置特殊,其基因的保守性在歷史長河中也得以維持,對於追溯中國人的起源、基因變異、遺傳多樣性等具有較高的參考價值。
(人民日報健康客戶端記者 王艾冰 周學津)「問我祖先在何處,山西洪洞大槐樹。」數百年來,這首民謠在大江南北、長城內外祖輩相傳,山西省洪洞縣大槐樹,一度作為尋根祭祖文化代表,吸引著數億計移民後裔來這裏找「祖」、尋「根」。
2021年初,北京大學人民醫院呼吸與危重癥醫學科主任高占成和中國科學院北京基因組研究所(國家生物資訊中心)康禹團隊也來到這裏,走進了距離大槐樹僅30公裏的一個小山村,村莊位於青龍山腳下,2000多位村民世代生活在這裏,而他們要在這個村莊尋找中國人獨有的「生命密碼」。
歷經3年探索,2023年底【Genomics Proteomics & Bioinformatics】雜誌正式發表了關於「唐堯」基因組的論文,這是第一個「從頭到尾」來自中國人的二倍體、無間隙全基因組參考序列,為具有漢族特征的中國人提供了基因組數據。
2024年8月19日,北京大學人民醫院人類基因組研究中心正式揭牌。「未來,我們的患者就可能接受更精準的基因檢測和精準治療的靶向藥物。」高占成堅定地說道。
北京大學人民醫院呼吸與危重癥醫學科主任高占成。受訪者供圖。
萌芽:中國癌癥患者為什麽總是很快耐藥?
21世紀初,隨著「人類基因組計劃」的實施,第一個單倍體人類基因組圖譜問世,被看作是人類自我探索史上一大裏程碑1,象征著人類對自我的了解走向了全新的高度。「但此前,全球仍缺少能完整代表自身遺傳特色的參考基因組,對於中國這樣一個悠久歷史和人口龐大的國家,自身參考基因組的缺失,無疑是遺傳學研究中一個巨大的空白。」高占成告訴人民日報健康客戶端記者。
2020年,高占成的一位高中同學找到他,她患肺癌已經到了晚期,「她找到我的那一刻,我幾乎快認不出來了,整個人非常清瘦,很沒有精神。」高占成回憶,透過同學之間的介紹,這位同學找到我時已經使用了一種靶向藥,並且2個月後就出現了耐藥,我趕緊給她換了另一種靶向藥,但是3個月後也出現了耐藥。
北京大學人民醫院呼吸與危重癥醫學科主任高占成(右)在出診中,受訪者供圖。
做了40余年呼吸科醫生,今年61歲的高占成接診過上萬例患者,「我一直有一個疑問,為什麽同樣一種藥物,西方人服用一年甚至更久都不會出現耐藥,但對於一些中國患者來說,可能三四個月就出現耐藥」,高占成很無奈,這也讓他不斷地思考,我們和西方人是否有區別,區別在哪?
作為國家重大疾病應急專家組成員,高占成長期以來研究各種復雜罕見的臨床案例。透過比對不同種族人群之間同一病種的臨床表征,他發現許多症候群不論是臨床癥狀、實驗室檢查結果、肺部影像學、累及器官組織損傷的程度,還是疾病演進和治療效果等方面都存在差別。
而這些差別也許能在基因中找到答案。
據中國科學院2003年釋出的【人類基因組計劃】顯示,由美、英、日、德、法、中六國參與的國際人類基因組計劃核心內容是測定人基因組的全部DNA序列,從而獲得人類全面認識自我最重要的生物學資訊,人們將從基因組和比較生物基因組的水平,來重新探討和認識生命的前進演化、遺傳、發育、生物和環境、 腦功能等重要生物學問題,生命科學開始了以DNA序列為基礎的,以生物資訊學為導向的新紀元。中科院於1999年9月1日代表中國正式加入該計劃。
「不可否認,一個時代有一個時代的天花板。」高占成介紹,「長久以來,受制於技術和觀念的限制,全球醫學實踐大量依賴歐美科學家建立並普及的參考基因組GRCp7/38,腫瘤、遺傳病等測序診斷報告均以此序列為基準,判定是否正常或存在變異,而這一參考基因組由多個人類個體基因組序列嵌合而成,其中約70%的序列來自一個歐非裔個體。」
「這個基因組主要反映歐洲和非裔的遺傳特征,對亞洲、特別是東亞人族群的遺傳畫像描繪不足,缺失較多。」高占成表示,由於缺乏能夠準確反映中國人遺傳特性的參考基因組,臨床醫生對某些遺傳性疾病、重大疾病的辨識也可能不夠精準,進而影響治療方案的制定和執行,針對中國人的精準醫療進展也因此受到了制約。因此,在高占成看來,GRCp7/38不但不完整,而且也難以像歐美人種那樣,作為中國乃至亞裔族群的完美參考基因組。
「繪制一個代表中國人自己的高品質參考基因組圖譜,制作一把中國人的基因組標尺去精準衡量中國乃至東亞人種各個體的基因座標」,這一夢想似乎一直驅動高占成尋找一個契機。
探索:從千年堯都找到符合大部份中國人基因序列
北京大學人民醫院呼吸與危重癥醫學科主任高占成(前左一)帶領學生在進行實驗,受訪者供圖。
高占成雖是一名臨床醫生,但從1990年就開始手動給肺炎黴漿菌部份基因測序,這麽多年對基因的研究一直沒斷。「我的一位學生康禹研究員現在都在中國科學院北京基因組研究所,自中國加入‘人類基因組計劃’以來,我們就在討論,從醫學的需求出發,讓中國人有自己的參考基因組,並能服務於醫學是我最大的願望。」高占成告訴人民日報健康客戶端記者。
樣本的選擇是我們面對的第一個重要問題。我們做這件事的目的是更好地服務於現代醫學,樣本一定要代表大多數現代中國人的基因組特征。其次,首次成功構建的第一個完整單倍體人類基因組不僅源於歐洲人種,還是為單倍體22+X,缺乏Y染色體,為了更全面地反映中國人的基因,還應該構建完整的屬於中國人的單倍體參考基因組(22+XY),以及完整的源於父母的二倍體參考基因組,以了解中國人種與高加索人種之間在基因組水平上究竟有哪些不同。中國科學院北京基因所研究員康禹解釋道,另外,人類基因組應該是基於正常自然人構建的,這樣會更能反映人類基因組世界的真實狀態,會更有利於疾病診斷、探究制備靶向藥物等。
2021年春天,時任臨汾市中心醫院黨委副書記、院長郭淑明等專家走進了這個坐落於山西省臨汾市青龍山腳下的小山村,找到了一位叫何忠(化名)的小夥子,經過研究團隊長時間調研,何忠一家世世代代沒有離開過這個村莊。
這個小山村距離堯建立的古唐國遺址「堯都」的所在地很近,也是明代洪洞大遷移的發祥地。1370年至1417年,這裏曾有18次大規模人口外遷。「‘堯都’不僅地理位置特殊,其基因的保守性在歷史長河中也得以維持,對於追溯中國人的起源、基因變異、遺傳多樣性等具有較高的參考價值。」高占成說。
「何忠與他的父母一樣,是土生土長的「堯都」居民,且沒有遺傳或免疫疾病的記錄。同時,我們經過測序得到,何忠的基因展現了東亞人群的典型特征,這對於研究中國人群的基因多樣性和遺傳結構至關重要。」康禹告訴記者,何忠的樣本之所以被選中,有一個重要原因是其Y染色體分型(F2137)在中國分布廣泛,這使得他的基因組具有很高的代表性。
誕生:高品質無縫隙組裝中國人46條染色體60個億堿基,完整詮釋人類參考基因組
高占成帶領的課題組對采自何忠的血液樣本高度重視, 「因為這一血液樣本承載著太多基因人和醫學的希望,後續的核型鑒定、家系測序、組裝最佳化、效能評估、驗證比較都極為不易,但留給我們的時間並不多。」高占成告訴記者,因為國際上類似的研究也在進行,而科學領域的金牌往往只有一塊。
北京大學人民醫院呼吸與危重癥醫學科主任高占成(右)在和團隊成員做科研。受訪者供圖。
「‘唐堯’屬於二倍體染色體基因組測序,這是一項全球基因組領域中的前沿研究,可供借鑒的經驗極少。面對含有60億個堿基的人類二倍體參考基因組,我們當時的感受就像是一個人被扔進全都是拼圖碎片的卡車貨櫃裏。」康禹告訴記者,人類二倍體參考基因組中,每個染色體都有來自父母雙方的兩個拷貝,兩者之間的序列相似度極高,極易造成拼接錯誤和混淆。現有的拼接工具和策略主要針對單倍型基因組,無法有效解決二倍體基因組的拼接問題。
在多數人的眼中,高占成一直很溫和。「但那段時間,高老師經常催促我們,晚上也經常失眠,大半夜也會出去散心尋找靈感。整個拼接過程中,重點區域如著絲粒和5條近端著絲粒染色體短臂,以及Y染色體的拼接是最為困難的。」團隊成員高占成的博士生何玉坤介紹,我們開發了新的拼接策略,透過調整拼接流程順序和最佳化參數來區分父母本序列,嘗試了多種參陣列合以最佳化拼接流程,最終成功了!
2023年底,【Genomics Proteomics & Bioinformatics】雜誌正式發表「唐堯」,此外,經國際通用的評估基因組品質工具Merqury評估,「唐堯」的精準高品質水平達到了參考基因組的品質標準,成為世界第一個真實世界的高品質人類參考基因組,首次成功構建了高品質無間隙的人類二倍體染色體基因組序列。
這一成果的發表,「不僅展示了‘唐堯’基因組的高品質,也突顯了其在未來科學研究和醫學套用中的巨大潛力,這是一個‘從頭到尾’屬於中國人的高品質參考基因組,為中國精準醫療的深入研發、拓展和進步鋪平了道路。」高占成表示。
如今,北京大學人民醫院已在國內率先成立人類基因組研究中心,利用「唐堯」參考基因組基,對重癥肺炎、肺間質纖維化、肺癌等呼吸系統疾病開展基因組學研究,還與多學科多領域專家團隊廣泛合作,在不同臨床醫學領域進行深入研究和廣泛套用,運用屬於中國人自己的參考基因組序列來指引疾病的科研、診斷及治療方向,為中國疾病的臨床預防和精準醫療提供準確的個人化指導。
「唐堯」之前,我們一直用歐洲人的參考基因組來定義中國人的遺傳變異,而在高占成和多位「唐堯」基因組團隊成員看來,「唐堯」參考基因組更像一把鑰匙,一點點地開啟對中國人疾病遺傳密碼的深入探索之門,揭示不同疾病背後的基因組變化之謎。
參考資料:1、中國科學院官網,【人類基因組計劃】,2003.04.25