結構生物化學/DNA重組技術/人類基因組計劃
人類基因組計劃是一個由美國能源部和美國國立衛生研究院實施的為期 13 年的專案。對估計的 30 億個 DNA 鹼基對進行測序的任務令人生畏,完成這項任務需要國際合作,英國的 Wellcome Trust 是該專案的合作伙伴,許多其他國家,如德國、法國、中國和日本也做出了巨大貢獻。該專案的目標包括:對 30 億個人類 DNA 鹼基對進行測序,識別人類 DNA 中估計的 20,000-25,000 個基因,將所有這些資訊儲存在可訪問的資料庫中,並改進資料分析工具。
一組模式生物的 DNA 也經過了測序和研究,以提供比較資訊,以便科學家能夠了解人類基因組是如何運作的。該專案的首要原因是利用測序的基因組來了解並最終治療折磨人類的約 4000 種遺傳病,以及許多遺傳易感性起重要作用的多因素疾病。目前,人類基因組計劃的研究和開發的技術正在以下領域得到應用:分子醫學、能源/環境應用、風險評估、生物考古學、人類學、進化、人類遷徙、DNA 法醫(用於識別目的)、農業、畜牧業育種、生物加工等等領域。
人類基因組計劃 (HGP) 是一項旨在發現並建立整個人類基因組資料庫的全球合作專案。基因組是生物體(包括其基因)的全部 DNA。DNA 由四種不同鹼基腺嘌呤、鳥嘌呤、胸腺嘧啶和胞嘧啶的序列組成。瞭解這些骨架鹼基的特定序列,可以讓我們進行比較並確定某些疾病。例如,鐮狀細胞性貧血是由單個鹼基從 A 改變為 T 引起的。識別這些差異使得研究和尋求針對疾病和 DNA 疾病的醫療進展成為可能。為了進一步瞭解人類基因組序列的重要性及其意義,對非人類物種(如果蠅、小鼠和大腸桿菌)進行了研究。
建立一種方法來儲存人類基因組計劃獲得的資訊本身就是一個挑戰。人類基因組包含大約 30 億個不同的序列,僅這些序列本身就需要大約 3 吉位元組的記憶體,而這些序列的持續進步還需要額外的記憶體。生物資訊學家 Morey Parang、Richard Mural 和 Mark Adams 是設計這種儲存海量資訊方法的主要貢獻者。
HGP 的其他目標包括:識別人類 DNA 中的所有 20,000 到 25,000 個基因,改進資料分析工具,將技術轉移到私營部門,並解決 HGP 可能帶來的倫理、法律和社會 (ELSI) 問題。
這個價值 30 億美元的專案原本需要 15 年才能完成,這是一個全球合作專案,包括來自中國、日本、英國、德國和法國的科學家。奇怪的是,該專案在預計的 15 年內以 13 年的時間完成了。有些人認為,造成這種異常的原因是 Celera Genomics 僅用大約 3 億美元的私人資金進行了一個專案。由於 Celera Genomics 宣佈他們將在全球科學家合作努力的 30 億美元專案完成之前完成對人類基因組的測序。他們使用了一種略微冒險的方法,稱為“鳥槍法測序”,而不是以線性方式對基因組進行測序,他們將序列“射擊”成小的片段,並找到它們重疊的位置。兩組之間的競爭幫助推動了這個專案,因為雙方都付出了更大的努力,希望先於對方完成。因此,他們共同完成了對整個人類基因組測序的最終專案。
該專案於 1990 年啟動,於 2003 年完成。雖然該專案確定的目標已經完成,但所獲得的資訊仍在不斷地被分析和研究,以便在生命科學領域取得進展。HGP 使分子醫學、能源和環境應用、風險評估、生物考古學、人類學、進化、人類遷徙、DNA 法醫和生物加工等許多科學領域受益。雖然人類基因組現在被認為是“完整的”,但仍有很多基因組部分尚未測序。仍然存在很多空白,但當世界各地不同的研究小組對這些小片段進行測序時,這些序列會被放到世界範圍內的資料庫(如 BLAST)中。
人類基因組計劃的開發是為了開啟人類的眼睛。
例如,透過對人類基因組進行測序,科學家現在可以更詳細深入地研究遺傳疾病。人類基因組計劃幫助識別了與不同遺傳疾病相關的基因,如肌強直營養不良、脆性 X 染色體綜合徵、阿爾茨海默病、家族性乳腺癌等等。這將幫助研究人員開發出更好的方法來治療疾病的根本原因,而不僅僅是治療疾病的症狀。在傳統醫學中,它還將允許更早地識別疾病,併為個人定製治療方案。目前正在進行的研究旨在改進基因治療——在未來,科學家可能能夠修復或替換有缺陷的基因。另一個研究領域涉及個人對環境的反應差異。隨著研究人員確定哪些基因編碼對環境壓力的敏感性,如致癌物質和刺激物,他們將能夠更好地預測暴露於危險環境的個體所面臨的風險。在這一研究領域中,最重要的結果之一是加深了對低劑量輻射對癌症風險影響的理解。
該專案還有助於推動法醫學的發展;科學家現在可以建立 DNA 指紋,這些指紋來自個體之間存在差異的 DNA 區域的小片段,從而實現精確的識別技術。由於遺傳研究的直接結果,犯罪現場的體液、組織和頭髮在用途方面有了很大提高。人類基因組計劃對法醫學的重要性超出了刑事領域。“DNA 指紋”還可以用於匹配器官捐獻者,建立親屬關係,並識別可能汙染環境的微生物。
由於與基因組測序相關的普遍知識的擴充套件,微生物基因組計劃等較小的專案被開發出來,以對細菌的基因組進行測序。該專案的目標是找到利用微生物和微生物酶生產能源、減少有毒廢物和工業加工的方法。它可以用於更深入地分析即使是最微小的生命形式對生態系統的影響。此外,對某些微生物基因組進行測序使科學家能夠深入瞭解病原微生物感染人體的方式。由於人類對微生物世界的依賴,人類世界與微生物世界之間的關係也值得研究。這將有利於人類健康和環境。
人類基因組計劃還有助於人們瞭解人類在進化過程中所走的道路。它讓科學家們得以一窺歷史,因為它幫助連線了生命的三界:確定古細菌、原核生物和真核生物完全沒有種族劃分。比較基因組學透過將人類 DNA 的特定片段與其他生物體中相應的片段進行比較,幫助科學家確定這些片段編碼什麼。
至於最近的歷史,DNA 研究已應用於種族層面上,證明種族是社會而不是不同 DNA 的產物。也就是說,Y 染色體上的特定標記可用於追蹤一個男人父系血統在整個人類歷史上的遷徙。人類基因組計劃的完成也幫助了行為遺傳學領域。多年來,科學家們已經認識到,許多行為都具有生物學基礎的證據。例如,在一個物種中,某些行為會持續出現,而這些特定行為可以傳遞給後代(例如澳洲牧羊犬的放牧本能)。該理論的進一步支援包括行為的跨物種平行現象,尤其是在密切相關的物種中。雖然傳統上,行為遺傳學領域一直集中在對雙胞胎和收養者的研究上,試圖闡明自然與教養之間的辯論——也就是說,我們行為中有多少是真正編碼在我們 DNA 中的,以及有多少是由環境影響造成的。行為遺傳學因量化某些抽象概念(如智力)的難度以及任何行為都由多個基因編碼並受其他因素影響而變得複雜。此外,關於行為遺傳學研究的任何結果都可能是敏感話題,因此在得出結論之前需要更加謹慎。
最後,人類基因組計劃開發了許多基因工程技術,從而產生了轉基因植物和動物,以改善食品和能源生產。例如,培育出的作物需要更少的殺蟲劑或更少的水。人類基因組計劃還允許開發能夠分解某些型別廢物的植物。這引發了許多關於人類是否有權改變“自然”生物的爭論,以及人們對轉基因生物(尤其是那些用於人類消費的轉基因生物)的長期影響的擔憂。
94年9月: 產生了包含約 3,000 個標記的 1-cM 解析度遺傳圖譜。
94年12月: 開發了高通量寡核苷酸合成技術。
96年8月: 對詹納氏甲烷球菌基因組進行了測序;證實了地球上存在第三個主要的生命分支。
96年9月: 完成了第一個測序的基因組,即酵母基因組。
96年12月: 開發了 DNA 微陣列技術。
98年10月: 完成了一個包含約 52,000 個 STS(即序列標籤位點,一個在基因組中只出現一次的短 DNA 片段)的物理圖譜。
99年12月: 第一條人類染色體完全測序。
02年11月: 財政報告顯示,該專案在資金方面按計劃進行;該專案每年測序超過 1,400 個片段,每個完成鹼基僅需 0.09 美元,遠低於預計的每年 500 個片段,每個鹼基 0.25 美元的成本。
02年12月: 基因組規模技術:開發了用於蛋白質-蛋白質相互作用的兩雜交系統的規模化。
03年2月: 370 萬個已定位的人類 SNP(即單核苷酸多型性,當序列中的單個核苷酸發生改變時發生的 DNA 序列變異)。
03年3月: 15,000 個全長人類 cDNA(即與特定信使 RNA 互補的 DNA 分子)被測序。
03年4月: 人類序列中含有基因的部分的 99% 已完成到 99.99% 的準確度。
03年4月: 大腸桿菌、釀酒酵母、秀麗隱杆線蟲、果蠅等模式生物的完整基因組序列,以及其他模式生物(包括秀麗隱杆線蟲、擬南芥、小鼠和大鼠)的基因組草圖已經完成。
08年5月: 遺傳資訊非歧視法 (GINA) 成為法律。
人類的 DNA 序列首先被分解成更小的專案,稱為 cosmid、BAC、PAC 或 P1 克隆。這些專案可以分配給世界各地的私人實驗室。以下階段是私人或政府實驗室測序這些主要基因組的部分或片段的順序。
隨機階段 對於許多實驗室來說,這意味著使用鳥槍法測序 DNA,它利用 DNA 限制性內切酶將專案 DNA 切割成不同大小的鹼基對區域。
間隙閉合階段 連線由限制性內切酶引起的 DNA 片段是 DNA 測序過程中的瓶頸,並且透過 phredPhrap 等金標準計算機程式大大加快了速度。隨著這些程式的改進,需要更少的重疊才能找到匹配的鏈,但同時,這些鏈的重疊越多,準確性越高。
歧義解析階段 透過使用 confed 等程式,可以分析測序 DNA 的低質量區域,以查詢異常,例如缺失或汙染讀數。此步驟主要是完成或拼寫檢查功能,用於提高原始測序 DNA 的準確性。
分析階段 測序的這一部分會找到 DNA 中常見的已知模式。模式由 BLAST、XGRAIL 和 REPBASE 等程式找到。XGRAIL 尋找的共性包括外顯子、內含子、poly-a 位點、啟動子區域(TATA 盒等)和重複鹼基。REPBASE 會找到已知存在於家族和亞家族中的重複序列。BLAST 擁有一個由大量科學家組成的社群,他們輸入了來自各種物種的 DNA 序列,並允許所討論的 DNA 找到其最近的進化親屬。
有很多不同的方法可以繪製人類基因組。最常見的方法之一是使用釐摩單位。每個釐摩代表兩個基因在減數分裂過程中分離的 1% 的可能性。一個例子是與亨廷頓病一起遺傳的基因,它有 96% 的時間被遺傳。剩下的 4% 的時間它沒有與亨廷頓病一起傳播,因此它與該基因的距離為 4 釐摩。
在用於檢視 DNA 的圖譜中,有兩種型別的圖譜,遺傳連鎖圖譜和物理圖譜。遺傳連鎖圖譜參考另一個 DNA 組以及它們一起被遺傳的頻率來檢視 DNA。這些遺傳圖譜包括細胞遺傳學圖譜、限制性圖譜、cosmid 圖譜和序列圖譜。
細胞遺傳學圖譜 由 Victr McKusick 建立,它利用染色體染色來檢視組。這種方法的解析度有限,因為科學家可能正在尋找的目標基因可能位於包含 1000 萬個鹼基對的染色中。這就是為什麼這種方法對廣泛分析和將序列縮小到染色體的特定區域有用。
限制性圖譜 由雷蒙德·懷特博士建立,它利用限制性內切酶。該過程使用一個家庭或一代人的基因組,並找到這些相關人員之間緊密相連的基因的百分比。透過使用限制性內切酶,從家庭的基因組中切割出相同的特定 DNA 序列,並可以對其進行分析。這種方法的解析度比細胞遺傳學作圖高十倍,並且可以將注意力集中在一個百萬個鹼基對內的遺傳標記上。
cosmid 圖譜 來自從鳥槍法測序獲得的實際重疊的鹼基對序列。這種方法採用大約 40,000 個鹼基對長度的鹼基,並將它們重疊。這種方法的解析度非常準確,可以在 10,000-100,000 個鹼基對內找到一個基因。
序列圖譜 是所有測序的實際結果,並列出了所有 46 條染色體已知基因組的完整順序。它包含超過 30 億個鹼基對,有 20,000-25,000 個蛋白質編碼基因。
"如果科學家不扮演上帝的角色,誰會呢?" 詹姆斯·沃森,人類基因組計劃前負責人。
人類基因組計劃引發了許多倫理問題,瞭解了整個人類 DNA 序列和它們編碼的基因,人們可以改變自己的基因(有償),從而導致可能的基因歧視和其他“扮演上帝”的道德後果。雖然其意圖可能是高尚的,試圖更好地理解和幫助治療折磨人類的許多遺傳疾病和缺陷,但許多人認為基因操作/改變是一個滑坡。雖然現在大多數研究都針對識別或治療由單個基因引起的出生缺陷,例如囊性纖維化和泰-薩克斯病,以及更艱鉅的任務,如預防糖尿病、心臟病和其他重大殺手,但許多人擔心接下來會發生什麼。思想是否會被針對改進——預防酒精成癮和精神疾病,以及增強視覺敏銳度或智力,試圖改進人類設計?即使對胎兒的基因檢測也會引發有關越來越準確的基因篩查的倫理後果的問題。在消除感知缺陷的方面,應該在哪裡劃清界限?更平淡地說,人類基因組計劃的完成引發了人們對僱主和健康保險公司根據個人對現有疾病的易感性進行基因歧視的擔憂。截至 2008 年 5 月,GINA(遺傳資訊非歧視法)保護個人免受這種歧視,並禁止僱主要求進行此類測試。
美國能源部生物和環境研究辦公室生命科學部主任馬文·弗雷澤博士說,科學家需要幾十年的時間才能弄清楚如何操縱人類智力或運動能力,因為這些特徵的複雜性(它們依賴於許多基因)以及環境對這些能力的未知作用。為了實現預期目標,成本將是巨大的,不僅在財政資本方面,而且在人力資本方面,因為將涉及大量有風險的實驗。“我認為這是錯誤的,”他補充說,“但這不會阻止有些人想嘗試。關鍵問題不是人類(基因)操縱是否會發生,而是如何以及何時會發生。”
GLT:美國能源部的基因組學:透過微生物和植物基因組的 DNA 序列來探索它們的生物多樣性,以瞭解生物系統如何運作。
人類微生物組計劃:生成有關人類微生物組的資料,以研究其在人類疾病中的作用。該專案不是單獨研究單個物種,而是研究從其自然環境中收集的微生物群落。
基因地理計劃:與國家地理和 IBM 合作開展的專案,該專案的目的是在五年內分析人類遺傳根源。
2008年5月21日,喬治·W·布什總統簽署了《遺傳資訊非歧視法案》(GINA)。該法案禁止美國保險公司和僱主根據潛在客戶的基因檢測資訊進行預篩選。該法案經過幾輪爭論,最終在兩個議院獲得透過,但直到幾個月後才生效。
GINA的實施旨在防止歧視性行為,例如僱主利用未來僱員的基因資訊來決定其工作表現、遲到傾向、健康風險等。該法案還禁止要求或索取基因檢測。
由於不再擔心基因檢測會影響他們的工作或保險費率,美國人將更願意進行疾病的基因檢測。這令人鼓舞,因為它可能為新的醫療發現和治癒方法開啟大門。它還可以早期發現健康問題,從而實現具有成本效益的預防措施。
更多資訊請訪問:http://www.ornl.gov/sci/techresources/Human_Genome/publicat/GINAMay2008.pdf