跳轉到內容

分子生物學導論/DNA 生命的單位

來自華夏公益教科書,開放的書籍,開放的世界

基因由一個叫做 DNA 的長分子組成,它在世代之間被複制和遺傳。DNA 由簡單的單元組成,這些單元在該大分子中以特定的順序排列。這些單元的順序攜帶著遺傳資訊,類似於頁面上字母的順序攜帶著資訊。DNA 使用的語言稱為遺傳密碼,它允許生物體讀取基因中的資訊。該資訊是構建和執行活生物體的指令。

脫氧核糖核酸 (DNA):脫氧核糖核酸 (/diˌɒksiˌraɪbɵ.njuːˌkleɪ.ɨk ˈæsɪd/,或 DNA,是一種核酸,包含所有已知活生物體(除 RNA 病毒外)發育和功能中使用的遺傳指令。DNA 分子的主要作用是長期儲存資訊。DNA 通常被比作一組藍圖,就像食譜或程式碼一樣,因為它包含構建細胞其他成分(如蛋白質和 RNA 分子)所需的指令。攜帶這種遺傳資訊的 DNA 片段稱為基因,但其他 DNA 序列具有結構目的,或參與調節這種遺傳資訊的利用。DNA 由兩個簡單的單元組成的長聚合物組成,稱為核苷酸,其骨架由糖和磷酸基團組成,透過酯鍵連線。這兩條鏈彼此朝相反方向執行,因此是反平行的。連線到每種糖上的是一種稱為鹼基的四種類型的分子之一。正是沿著骨架的這四種鹼基的順序編碼了資訊。該資訊使用遺傳密碼被讀取,該密碼指定蛋白質中氨基酸的順序。透過將 DNA 片段複製到相關的核酸 RNA 中的過程(稱為轉錄)來讀取該程式碼。DNA 的結構首先被 **詹姆斯·D·沃森和弗朗西斯·克里克** 發現。對於所有物種來說都是一樣的,由兩條螺旋鏈組成,每條螺旋鏈圍繞同一個軸線盤旋,每條螺旋鏈的螺距為 34 埃(3.4 奈米),半徑為 10 埃(1.0 奈米)。

在細胞內,DNA 被組織成稱為染色體的長結構。在細胞分裂之前,這些染色體會複製,這一過程稱為 DNA 複製。真核生物(動物、植物、真菌和原生生物)將大部分 DNA 儲存在細胞核內,並將一些 DNA 儲存在細胞器中,例如線粒體或葉綠體。相反,原核生物(細菌和古細菌)僅在細胞質中儲存 DNA。在染色體內,組蛋白等染色質蛋白壓縮和組織 DNA。這些緊湊的結構指導 DNA 與其他蛋白質之間的相互作用,幫助控制 DNA 的哪些部分被轉錄。DNA 雙螺旋透過連線到兩條鏈上的鹼基之間的氫鍵而穩定。DNA 中發現的四種鹼基是腺嘌呤(縮寫為 A)、胞嘧啶(C)、鳥嘌呤(G)和胸腺嘧啶(T)。這四種鹼基與糖/磷酸連線形成完整的核苷酸,如腺苷一磷酸所示。[1]

DNA 複製。DNA 解開並 核苷酸 匹配以形成兩條新的鏈。

DNA 是一種遺傳物質

[編輯 | 編輯原始碼]
格里菲斯實驗發現肺炎球菌細菌中的“轉化因子”。

格里菲斯實驗由弗雷德里克·格里菲斯於 1928 年進行,是第一個表明細菌能夠透過稱為轉化的過程轉移遺傳資訊的實驗之一。

格里菲斯使用了兩種感染小鼠的肺炎鏈球菌菌株——III-S(光滑)型和 II-R(粗糙)型菌株。III-S 菌株用多糖莢膜包裹自身,使其免受宿主免疫系統的攻擊,導致宿主死亡,而 II-R 菌株沒有這種保護性莢膜,被宿主免疫系統擊敗。德國細菌學家弗雷德·諾伊費爾德發現了三種肺炎球菌型別(I 型、II 型和 III 型),並發現了奎爾隆反應,以便在體外識別它們。在格里菲斯實驗之前,細菌學家認為這些型別是固定的,從一代到一代不會改變。在這個實驗中,來自 III-S 菌株的細菌被熱殺死,它們的殘骸被新增到 II-R 菌株細菌中。雖然它們單獨都不能傷害小鼠,但它們的組合能夠殺死宿主。格里菲斯還能夠從小鼠血液中分離出活的 II-R 和活的 III-S 肺炎球菌菌株。格里菲斯得出結論,II-R 型別已被“轉化”為致命的 III-S 菌株,這是由於來自死亡的 III-S 菌株細菌的“轉化因子”所致。今天,我們知道格里菲斯觀察到的“轉化因子”是 III-S 菌株細菌的 DNA。雖然細菌已經被殺死,但 DNA 已經存活了加熱過程,並被 II-R 菌株細菌吸收。III-S 菌株 DNA 包含形成保護性多糖莢膜的基因。配備了這個基因,以前的 II-R 菌株細菌現在可以免受宿主免疫系統的攻擊,並可以殺死宿主。轉化因子的確切性質(DNA)是在艾弗裡、麥克勞德和麥卡蒂以及赫爾希和蔡斯進行的實驗中驗證的。[2]

首次確認

阿爾弗雷德·赫爾希和瑪莎·蔡斯在 1952 年進行了一系列實驗,證實了 DNA 是遺傳物質,這在 1944 年的艾弗裡-麥克勞德-麥卡蒂實驗中首次得到證明。這些實驗被稱為 **赫爾希-蔡斯實驗**。生物學家自 1869 年以來就知道 DNA 的存在,他們中的大多數人當時都認為蛋白質攜帶遺傳資訊。赫爾希和蔡斯在 T2 噬菌體上進行了他們的實驗。噬菌體由一個包含其遺傳物質的蛋白質外殼組成。噬菌體透過附著在細菌的外膜上並注入其遺傳物質來感染細菌,留下其空殼附著在細菌上。

在他們的第一組實驗中,赫爾希和蔡斯用放射性磷-32 (p32) 對噬菌體的 DNA 進行了標記(磷元素存在於 DNA 中,但不存在於作為蛋白質成分的 20 種氨基酸中的任何一種)。他們讓噬菌體感染大腸桿菌,並通過幾個巧妙的實驗能夠觀察到標記有 P32 的噬菌體 DNA 轉移到細菌的細胞質中。在他們的第二組實驗中,他們用放射性硫-35 對噬菌體進行了標記(硫存在於氨基酸半胱氨酸和蛋氨酸中,但不存在於 DNA 中)。在感染大腸桿菌後,他們使用高速攪拌器將病毒蛋白外殼從受感染的細胞中剪下下來,並使用離心機分離細胞和病毒外殼。分離後,在蛋白質外殼中觀察到放射性 S35 示蹤劑,但在受感染的細菌中沒有觀察到,這支援了感染細菌的遺傳物質是 DNA 而不是蛋白質的假設。[3][4] **赫爾希因其“關於病毒遺傳結構的發現”而獲得了 1969 年諾貝爾生理學或醫學獎。**

Oswald Avery Colin MacLeodMaclyn McCarty (with Watson and Crick)

奧斯瓦爾德·T·艾弗裡、科林·麥克勞德、麥克林·麥卡蒂以及弗朗西斯·克里克和詹姆斯·D·沃森 [5]

DNA 的結構

[編輯 | 編輯原始碼]
一個GC鹼基對,展示了三個分子間氫鍵。
一個AT鹼基對,展示了兩個分子間氫鍵。

兩條螺旋鍊形成DNA骨架。另一條雙螺旋可以透過追蹤鏈之間的空間或溝槽找到。這些空隙與鹼基對相鄰,可以提供一個結合位點。由於鏈不是完全相對的,因此溝槽的大小也不相同。一個溝槽,主溝,寬 22 Å,另一個,小溝,寬 12 Å。小溝的狹窄意味著鹼基的邊緣在主溝中更容易接近。因此,像轉錄因子這樣的蛋白質可以結合到雙鏈 DNA 中的特定序列,通常與主溝中暴露的鹼基側面接觸。這種情況在細胞內 DNA 的異常構象中有所不同,但主溝和小溝始終被命名以反映如果 DNA 扭回到普通的 B 形狀所看到的尺寸差異。

DNA的鹼基配對

[編輯 | 編輯原始碼]
DNA結構。

查伽夫法則由埃爾溫·查伽夫提出,其指出來自所有生物任何細胞的DNA應該具有嘧啶和嘌呤鹼基的1:1比例,更具體地說,鳥嘌呤的量等於胞嘧啶,腺嘌呤的量等於胸腺嘧啶。這種模式存在於DNA的兩條鏈中。它們是由奧地利化學家埃爾溫·查伽夫發現的。

在分子生物學中,透過氫鍵連線在相反互補 DNA 鏈上的兩個核苷酸稱為鹼基對(通常縮寫為bp)。在規範的沃森-克里克 DNA 鹼基配對中,腺嘌呤 (A) 與胸腺嘧啶 (T) 形成鹼基對,鳥嘌呤 (G) 與胞嘧啶 (C) 形成鹼基對。在 RNA 中,胸腺嘧啶被尿嘧啶 (U) 代替。交替氫鍵模式,如擺動鹼基對和霍格斯汀鹼基對,也存在——特別是在 RNA 中——導致複雜的和功能性的三級結構。[6]

示例

 5'CTCGTTTGCGCTCTATCG3'
 3'GAGCAAACGCGAGATAGC5'

嘌呤鹼基

[編輯 | 編輯原始碼]

德國化學家埃米爾·費舍爾在 1884 年給出了“嘌呤”(purum uricum)這個名字。他於 1899 年首次透過尿酸合成了它,尿酸是由舍勒在 1776 年從腎結石中分離出來的。除了 DNA 和 RNA 之外,嘌呤也是許多其他重要生物分子中的組成部分,如 ATP、GTP、環狀 AMP、NADH 和輔酶 A。嘌呤本身在自然界中沒有被發現,但可以透過有機合成來生產。嘌呤是一種雜環芳香族有機化合物,由一個嘧啶環與一個咪唑環融合而成。

示例

腺嘌呤

[編輯 | 編輯原始碼]

腺嘌呤是構成核酸(DNA 或 RNA)核苷酸的兩種嘌呤核鹼基之一(另一種是鳥嘌呤)。在 DNA 中,腺嘌呤透過兩個氫鍵與胸腺嘧啶結合,以幫助穩定核酸結構。腺嘌呤與核糖結合形成腺苷,一種核苷,與脫氧核糖結合形成脫氧腺苷。當三個磷酸基團新增到腺苷時,它會形成腺嘌呤三磷酸 (ATP),一種核苷酸。

鳥嘌呤

[編輯 | 編輯原始碼]

鳥嘌呤與腺嘌呤和胞嘧啶一起存在於 DNA 和 RNA 中,而胸腺嘧啶通常只在 DNA 中看到,而尿嘧啶只在 RNA 中看到。在 DNA 中,鳥嘌呤與胞嘧啶配對。以 C5H5N5O 的化學式,鳥嘌呤是嘌呤的衍生物,由一個融合的嘧啶-咪唑環系統組成,具有共軛雙鍵。

鳥嘌呤有兩種互變異構體,主要酮式和罕見的烯醇式。它透過三個氫鍵與胞嘧啶結合。在胞嘧啶中,氨基作為氫供體,C-2 羰基和 N-3 胺作為氫鍵受體。鳥嘌呤在 C-6 處有一個基團作為氫受體,而在 N-1 和 C-2 處的氨基作為氫供體。

嘧啶鹼基

[編輯 | 編輯原始碼]
胸腺嘧啶的化學結構
帶有編號組分的胞嘧啶。甲基化發生在第 5 個碳原子上。
尿嘧啶的化學結構

嘧啶是一種雜環芳香族有機化合物,類似於苯和吡啶,在六元環的 1 和 3 位包含兩個氮原子。它與二嗪的兩種其他形式互為異構體。在核酸中發現的三種核鹼基,胞嘧啶 (C)、胸腺嘧啶 (T) 和尿嘧啶 (U),是嘧啶衍生物。

嘧啶與吡啶有很多共同的性質,因為環中氮原子數量的增加使環 pi 電子變得不那麼有能量和親電子性,芳香族親電取代變得更加困難,而芳香族親核取代變得更容易。最後一種反應型別的例子是在 2-氨基嘧啶中用氯取代氨基,以及它的逆反應。嘧啶共振穩定性的降低可能會導致加成和開環反應,而不是取代反應。一種這樣的表現形式在迪莫斯重排中觀察到。與吡啶相比,N-烷基化和 N-氧化更難,嘧啶的鹼性也更弱:質子化嘧啶的 pKa 值為1.23,而吡啶的 pKa 值為5.30[7]嘧啶也存在於隕石中,但科學家仍然不知道它的起源。嘧啶在紫外線下也會光解成尿嘧啶。

胞嘧啶的化學結構

胞嘧啶

[編輯 | 編輯原始碼]

胞嘧啶可以作為 DNA 的一部分、RNA 的一部分或核苷酸的一部分找到。作為胞嘧啶三磷酸 (CTP),它可以作為酶的輔因子,並且可以轉移一個磷酸基團來將二磷酸腺苷 (ADP) 轉化為三磷酸腺苷 (ATP)。胞嘧啶的核苷是胞苷。在 DNA 和 RNA 中,胞嘧啶與鳥嘌呤配對。然而,它本質上是不穩定的,可以變成尿嘧啶(自發脫氨)。如果不對其進行修復,則會導致點突變,例如尿嘧啶糖基化酶之類的 DNA 修復酶可以修復它,尿嘧啶糖基化酶會切除 DNA 中的尿嘧啶。

胞嘧啶也可以被一種稱為 DNA 甲基轉移酶的酶甲基化為 5-甲基胞嘧啶,或者被甲基化和羥基化為 5-羥甲基胞嘧啶。胞嘧啶或 5-甲基胞嘧啶的活性酶脫氨作用(由 APOBEC 家族的胞嘧啶脫氨酶完成)可能會對各種細胞過程以及生物進化產生有益和有害的影響。另一方面,脫氨作用對 5-羥甲基胞嘧啶的影響仍然不太瞭解。[8]

胸腺嘧啶

[編輯 | 編輯原始碼]

胸腺嘧啶 (T, Thy) 是 DNA 核酸中的四種核鹼基之一,由字母 G–C–A–T 表示。其他三種是腺嘌呤、鳥嘌呤和胞嘧啶。胸腺嘧啶也被稱為 5-甲基尿嘧啶,一種嘧啶核鹼基。顧名思義,胸腺嘧啶可以透過在第 5 個碳原子上甲基化尿嘧啶來獲得。在 RNA 中,胸腺嘧啶在大多數情況下被尿嘧啶取代。在 DNA 中,胸腺嘧啶 (T) 透過兩個氫鍵與腺嘌呤 (A) 結合,從而穩定核酸結構。

尿嘧啶

[編輯 | 編輯原始碼]

尿嘧啶存在於 RNA 中,它與腺嘌呤配對,並在 DNA 轉錄過程中取代胸腺嘧啶。尿嘧啶的甲基化產生胸腺嘧啶。它轉化為胸腺嘧啶以保護 DNA 並提高 DNA 複製的效率。尿嘧啶可以與任何鹼基配對,這取決於分子在螺旋上的排列方式,但容易與腺嘌呤配對,因為甲基被排斥到固定位置。尿嘧啶透過氫鍵與腺嘌呤配對。尿嘧啶是氫鍵受體,可以形成兩個氫鍵。尿嘧啶還可以與核糖結合形成核糖核苷尿苷。當磷酸附著在尿苷上時,就會產生尿苷 5'-單磷酸。

含氮鹼基 核苷 脫氧核苷
Chemical structure of adenine
腺嘌呤
Chemical structure of adenosine
腺苷
A
Chemical structure of deoxyadenosine
脫氧腺苷
dA
Chemical structure of guanine
鳥嘌呤
Chemical structure of guanosine
鳥苷
G
Chemical structure of deoxyguanosine
脫氧鳥苷
dG
Chemical structure of thymine
胸腺嘧啶
Chemical structure of 5-methyluridine
5-甲基尿苷
m5U
Chemical structure of thymidine
胸腺嘧啶核苷
dT
Chemical structure of uracil
尿嘧啶
Chemical structure of uridine
尿苷
U
Chemical structure of deoxyuridine
脫氧尿苷
dU
Chemical structure of cytosine
胞嘧啶
Chemical structure of cytidine
胞嘧啶核苷
C
Chemical structure of deoxycytidine
脫氧胞嘧啶核苷
dC

核苷是糖基胺,由一個核鹼基(通常簡稱為鹼基)透過β-糖苷鍵連線到一個核糖或脫氧核糖糖上。核苷的例子包括胞嘧啶核苷、尿苷、腺苷、鳥苷、胸腺嘧啶核苷和肌苷。核苷可以在細胞中被特異性激酶磷酸化,在糖的伯醇基(-CH2-OH)上產生核苷酸,它是DNA和RNA的分子構建塊。

核苷可以透過從頭合成途徑產生,特別是在肝臟中,但它們主要透過飲食中核酸的攝入和消化來供應,其中核苷酸酶將核苷酸(如胸腺嘧啶核苷酸)分解為核苷(如胸腺嘧啶核苷)和磷酸鹽。

1. 腺苷是一種核苷,由一個腺嘌呤分子透過β-N9-糖苷鍵連線到一個核糖糖分子(核糖呋喃糖)上。

2. 胞嘧啶核苷是一種核苷分子,當胞嘧啶透過β-N1-糖苷鍵連線到一個核糖環(也稱為核糖呋喃糖)上時形成。胞嘧啶核苷是RNA的組成部分。

3. 鳥苷是一種嘌呤核苷,由鳥嘌呤透過β-N9-糖苷鍵連線到一個核糖(核糖呋喃糖)環上。鳥苷可以被磷酸化,形成鳥苷一磷酸 (GMP)、環鳥苷一磷酸 (cGMP)、鳥苷二磷酸 (GDP) 和鳥苷三磷酸 (GTP)。

4. 胸腺嘧啶核苷(更準確地稱為脫氧胸腺嘧啶核苷;也可以標記為脫氧核糖基胸腺嘧啶,和胸腺嘧啶脫氧核苷)是一種化學化合物,更準確地說是嘧啶脫氧核苷。脫氧胸腺嘧啶核苷是DNA核苷T,它在雙鏈DNA中與脫氧腺苷(A)配對。

如果胞嘧啶連線到一個脫氧核糖環上,它被稱為脫氧胞嘧啶核苷[9]

核苷酸

[編輯 | 編輯原始碼]

一個核苷酸由一個核鹼基(含氮鹼基)、一個五碳糖(核糖或2'-脫氧核糖)和一個到三個磷酸基團組成。核鹼基和糖一起構成一個核苷。磷酸基團與糖的2、3或5-碳形成鍵,其中5-碳位點最常見。環狀核苷酸是在磷酸基團與糖的兩個羥基結合時形成的。核糖核苷酸是糖為核糖的核苷酸,脫氧核糖核苷酸含有糖脫氧核糖。核苷酸可以包含嘌呤或嘧啶鹼基。核酸是由核苷酸單體組成的聚合大分子。在DNA中,嘌呤鹼基是腺嘌呤和鳥嘌呤,而嘧啶是胸腺嘧啶和胞嘧啶。RNA使用尿嘧啶代替胸腺嘧啶。腺嘌呤總是透過2個氫鍵與胸腺嘧啶配對,而鳥嘌呤透過3個氫鍵與胞嘧啶配對,每個配對都是由於它們獨特的結構。

脫氧核糖核苷酸是DNA或脫氧核糖核酸的單體或單個單元。每個脫氧核糖核苷酸包含三個部分:一個含氮鹼基、一個脫氧核糖糖和一個或多個磷酸基團。含氮鹼基總是與脫氧核糖的1'碳相連,脫氧核糖與核糖的區別在於2'碳上存在一個質子而不是一個-OH基團。磷酸基團與糖的5'碳相連。當脫氧核糖核苷酸聚合形成DNA時,一個核苷酸的磷酸基團將與另一個核苷酸的3'碳相連,透過脫水合成形成磷酸二酯鍵。新的核苷酸總是被新增到最後一個核苷酸的3'碳上,因此合成總是從5'到3'進行。[10]

磷酸二酯鍵

磷酸二酯鍵是透過兩個酯鍵將一個磷酸基團連線到兩個5-碳環碳水化合物(戊糖)之間的一組強共價鍵。磷酸二酯鍵對地球上的大多數生命至關重要,因為它們構成了DNA鏈的骨架。在DNA和RNA中,磷酸二酯鍵是連線一個糖分子的3'碳原子和另一個糖分子的5'碳原子的連線鍵,在DNA中為脫氧核糖,在RNA中為核糖。磷酸二酯鍵中的磷酸基團帶負電。因為磷酸基團的pKa接近0,所以在pH 7時它們帶負電。這種排斥力迫使磷酸鹽佔據DNA鏈的相反側,並被蛋白質(組蛋白)、金屬離子(如鎂)和多胺中和。為了形成磷酸二酯鍵和連線核苷酸,核苷酸構建塊的三磷酸或二磷酸形式被分解,釋放出驅動酶催化反應所需的能量。當一個單磷酸或兩個磷酸(稱為焦磷酸鹽)脫離並催化反應時,磷酸二酯鍵就形成。磷酸二酯鍵的水解可以被磷酸二酯酶的作用催化,磷酸二酯酶在修復DNA序列中起重要作用。在生物系統中,兩個核糖核苷酸之間的磷酸二酯鍵可以被鹼性水解破壞,因為存在遊離的2'羥基。[11]

核苷酸之間磷酸二酯鍵 (PO43-) 的示意圖。顯示了胸腺嘧啶 (U) 和兩個腺嘌呤 (A) 分子。

腺嘌呤一磷酸
AMP

腺嘌呤二磷酸
ADP
adenosine triphosphate
腺嘌呤三磷酸
ATP
guanosine monophosphate
鳥嘌呤一磷酸
GMP
guanosine diphosphate
鳥嘌呤二磷酸
GDP
guanosine triphosphate
鳥嘌呤三磷酸
GTP
ribothymidine monophosphate
核糖胸腺嘧啶一磷酸
rTMP
ribothymidine diphosphate
核糖胸腺嘧啶二磷酸
rTDP
ribothymidine triphosphate
核糖胸腺嘧啶三磷酸
rTTP

尿嘧啶一磷酸
UMP
diphosphate
尿嘧啶二磷酸
UDP
triphosphate
尿嘧啶三磷酸
UTP
cytidine monophosphate
胞嘧啶一磷酸
CMP
cytidine diphosphate
胞嘧啶二磷酸
CDP
cytidine triphosphate
胞嘧啶三磷酸
CTP

DNA的形式

[編輯 | 編輯原始碼]

A-DNA: A-DNA是DNA許多可能的雙螺旋結構之一。A-DNA被認為是三種生物活性雙螺旋結構之一,另外兩種是B-DNA和Z-DNA。它是一種右手雙螺旋,與更常見且更著名的B-DNA形式非常相似,但螺旋結構更短、更緊湊。它似乎只出現在脫水的DNA樣本中,如那些用於晶體學實驗的樣本,並且可能也存在於DNA-RNA雜交螺旋和雙鏈RNA區域中。[12]

B-DNA最常見的DNA形式是B DNA。DNA雙螺旋是核酸的螺旋聚合物,透過鹼基配對在一起的核苷酸連線在一起。在B-DNA中,最常見的雙螺旋結構,雙螺旋是右手螺旋,每圈大約有10-10.5個核苷酸。DNA的雙螺旋結構包含一個主溝和一個次溝,主溝比次溝更寬。鑑於主溝和次溝寬度不同,許多與DNA結合的蛋白質都是透過更寬的主溝結合的。

Z-DNA: Z-DNA是DNA許多可能的雙螺旋結構之一。它是一種左手雙螺旋結構,其中雙螺旋以之字形模式向左螺旋(而不是像更常見的B-DNA形式那樣向右螺旋)。Z-DNA被認為是三種生物活性雙螺旋結構之一,另外兩種是A-DNA和B-DNA。Z-DNA與右手形式截然不同。事實上,Z-DNA經常與B-DNA進行比較,以說明主要差異。Z-DNA螺旋是左手螺旋,其結構每2個鹼基對重複一次。與A-DNA和B-DNA不同,主溝和次溝的寬度幾乎沒有差異。這種結構的形成通常是不利的,儘管某些條件可以促進它的形成;例如交替的嘌呤-嘧啶序列(尤其是poly(dGC)2)、負DNA超螺旋或高鹽和一些陽離子(所有這些都在生理溫度37 °C和pH 7.3-7.4下)。Z-DNA可以與B-DNA形成連線(稱為“B-to-Z連線盒”),在一個涉及鹼基對擠出的結構中。Z-DNA構象很難研究,因為它不是雙螺旋的穩定特徵。相反,它是一種瞬態結構,偶爾被生物活性誘導,然後迅速消失。[13]

從左到右,A、B和Z DNA的結構
三種主要形式的DNA之間的差異
A-DNA B-DNA Z-DNA
螺旋方向 右手 右手 左手
直徑 23 Å (2.3 nm) 20 Å (2.0 nm) 18 Å (1.8 nm)
重複單元 1 bp 1 bp 2 bp
每bp旋轉 32.7° 35.9° 60°/2
每圈bp 11 10.5 12
bp相對於軸線的傾斜 +19° −1.2° −9°
沿軸線的每bp上升 2.3 Å (0.23 nm) 3.32 Å (0.332 nm) 3.8 Å (0.38 nm)
螺旋的節距 28.2 Å (2.82 nm) 33.2 Å (3.32 nm) 45.6 Å (4.56 nm)
平均螺旋扭曲 +18° +16°
糖苷鍵角 反式 反式 C: 反式,
G: 順式
糖的皺褶 C3'-內式 C2'-內式 C: C2'-內式,
G: C2'-外式

bp-鹼基對,nm-奈米

非編碼基因組DNA

[編輯 | 編輯原始碼]

在分子生物學中,非編碼 DNA 描述了生物體 DNA 序列中不編碼蛋白質序列的部分。

假基因 假基因是與已知基因相關的 DNA 序列,它們已經失去了蛋白質編碼能力,或者在細胞中不再表達。假基因產生於功能基因的逆轉座或基因組複製,併成為“基因組化石”,由於阻止基因轉錄的突變(如基因啟動子區域內的突變)或致命地改變基因翻譯的突變(如早停密碼子或移碼突變)而失去功能。由 RNA 中間體的逆轉座產生的假基因被稱為加工過的假基因;由複製基因的基因組殘留或失活基因殘留產生的假基因是非加工過的假基因。雖然 Dollo 法則表明假基因的功能喪失可能是永久性的,但沉默基因實際上可能保留數百萬年的功能,並且可以“重新啟用”為蛋白質編碼序列,並且大量假基因被積極轉錄。由於假基因被認為是在沒有進化約束的情況下進化的,因此它們可以作為各種自發性遺傳突變的型別和頻率的有效模型。[14]

DNA 的螺旋

[編輯 | 編輯原始碼]
具有低纏繞數的環狀 DNA 分子的超螺旋結構。注意,為了清晰起見,省略了 DNA 雙鏈體的螺旋性質。
具有約束末端的線性 DNA 分子的超螺旋結構。注意,為了清晰起見,省略了 DNA 雙鏈體的螺旋性質。

DNA 超螺旋對於所有細胞中的 DNA 包裝很重要。由於 DNA 的長度可以是細胞長度的數千倍,因此將這種遺傳物質包裝到細胞或細胞核(在真核生物中)是一項艱鉅的任務。DNA 的超螺旋減少了空間並允許包裝更多的 DNA。在原核生物中,由於環狀染色體和相對較少的遺傳物質,螺旋狀超螺旋占主導地位。在真核生物中,DNA 超螺旋存在於螺旋狀和螺線管狀超螺旋的多個水平上,其中螺線管狀超螺旋在壓縮 DNA 方面最為有效。螺線管狀超螺旋透過組蛋白實現,形成 10 nm 纖維。這種纖維進一步螺旋成 30 nm 纖維,然後自身再次螺旋多次。在核分裂事件(如有絲分裂或減數分裂)期間,DNA 包裝會大大增加,此時 DNA 必須被壓縮並分離到子細胞中。凝聚素和粘連素是染色體結構維持蛋白,它們有助於姐妹染色單體的凝聚和姐妹染色單體著絲粒的連線。這些 SMC 蛋白誘導正超螺旋。DNA/RNA 合成也需要超螺旋。由於 DNA 必須解旋才能進行 DNA/RNA 聚合酶作用,因此會產生超螺旋。聚合酶複合體前方的區域將被解旋;這種應力透過複合體前方的正超螺旋來補償。在複合體後方,DNA 被重新纏繞,並且會有補償性的負超螺旋。需要注意的是,拓撲異構酶(如 DNA 旋轉酶(II 型拓撲異構酶))在 DNA/RNA 合成過程中起著緩解部分應力的作用。[15]

NA 超螺旋可以透過“聯結數” Lk 的變化在數值上描述。聯結數是超螺旋 DNA 最具描述性的屬性。Lko,即鬆弛(B 型)DNA 質粒/分子的轉數,透過將分子的總鹼基對除以鬆弛 bp/轉來確定,具體取決於參考值,為 10.4-10.5。

Lk 僅僅是單鏈在平面投影中穿過另一鏈的次數。DNA 的拓撲結構由下面的等式描述,其中聯結數等效於 TW 的總和,TW 是雙螺旋的轉數或匝數,以及 Wr,即螺旋數或“纏繞數”。如果存在閉合的 DNA 分子,則 TW 和 Wr 的總和,或聯結數,不會改變。但是,TW 和 Wr 可以進行互補變化,而不會改變它們的總和。

聯結數的變化 ΔLk 是質粒/分子中的實際轉數 Lk 減去鬆弛質粒/分子 Lko 中的轉數。

如果 DNA 是負超螺旋,則 ΔLk < 0。負超螺旋意味著 DNA 被欠纏繞。

一個獨立於分子大小的標準表達是“比聯結差異”或“超螺旋密度”,用 σ 表示。σ 代表相對於鬆弛分子/質粒中的總轉數新增或移除的轉數,表明超螺旋的程度。

與螺旋相關的吉布斯自由能由下面的等式給出[16]

聯結數是一個數值不變數,描述了三維空間中兩條閉合曲線的聯結。直觀地說,聯結數表示每條曲線繞另一條曲線的次數。聯結數始終是整數,但根據兩條曲線的取向,可以是正數或負數。由於超螺旋 DNA 的聯結數 *L* 是兩條鏈相互纏繞的次數(並且兩條鏈都保持共價完整),因此 *L* 不會改變。環狀 DNA 雙鏈體的參考狀態(或引數) *L0* 是它的鬆弛狀態。在這種狀態下,它的纏繞數 *W* = 0。由於 *L = T + W*,在鬆弛狀態下 *T = L*。因此,如果我們有一個 400 bp 鬆弛的環狀 DNA 雙鏈體,則 *L ~ 40*(假設 B-DNA 每圈約 10 bp)。那麼 *T ~ 40*。

  • 正超螺旋
    T = 0,W = 0,則 L = 0
    T = +3,W = 0,則 L = +3
    T = +2,W = +1,則 L = +3
  • 負超螺旋
    T = 0,W = 0,則 L = 0
    T = -3,W = 0,則 L = -3
    T = -2,W = -1,則 L = -3

負超螺旋有利於 DNA 的區域性解旋,從而允許進行諸如轉錄DNA 複製重組 等過程。負超螺旋也被認為有利於 B-DNA 與 Z-DNA 之間的轉變,並調節參與基因調控的 DNA 結合蛋白的相互作用。[17]

組蛋白:DNA 結合蛋白

[編輯 | 編輯原始碼]

組蛋白於 1884 年由 阿爾布雷希特·科塞爾 發現。 “組蛋白”一詞源於 19 世紀末,來自德語“Histon”,其起源尚不清楚:可能是來自希臘語 histanaihistos。 直到 20 世紀 90 年代初,組蛋白被大多數人認為是真核細胞核 DNA 的惰性包裝材料,部分原因是 馬克·普塔什內 等人提出的“球棍模型”,他們認為轉錄是由蛋白質-DNA 和蛋白質-蛋白質相互作用在很大程度上裸露的 DNA 模板上啟用的,就像在細菌中一樣。 在 20 世紀 80 年代,邁克爾·格倫斯坦 [18] 的工作表明真核組蛋白抑制基因轉錄,而轉錄啟用因子的功能是克服這種抑制。 我們現在知道組蛋白在基因表達中起著正負兩方面的作用,構成了組蛋白密碼的基礎。

H5 組蛋白的發現似乎可以追溯到 20 世紀 70 年代,[19][20] 在分類中它被歸類為 核小體核心由兩個 H2A-H2B 二聚體和一個 H3-H4 四聚體組成,透過三級結構形成兩個幾乎對稱的半部分(C2 對稱性;一個大分子是另一個的映象)。H2A-H2B 二聚體和 H3-H4 四聚體也表現出假二元對稱性。 4 個“核心”組蛋白(H2A、H2B、H3 和 H4)在結構上相對相似,並且在進化過程中高度保守,所有都具有“螺旋轉螺旋轉螺旋”基序(這允許輕鬆二聚化)。 它們還共有一個特徵,即在氨基酸結構一端有長“尾”——這是翻譯後修飾的位置(見下文)。

H2A H2B H3 H4 和 DNA 組成的核小體核心顆粒的晶體結構。 檢視是從超螺旋軸頂部看。

有人提出組蛋白在進化上與擴充套件 AAA+ ATPase 結構域的螺旋部分、C 結構域以及 Clp/Hsp100 蛋白的 N 端底物識別結構域相關。 儘管它們在拓撲結構上存在差異,但這三種摺疊共享一個同源螺旋-鏈-螺旋 (HSH) 基序。

英國研究人員使用電子順磁共振自旋標記技術測量了真核細胞在其周圍纏繞 DNA 的線軸之間的距離。 他們確定間距範圍為 59 到 70 Å。 總之,組蛋白與 DNA 進行五種型別的相互作用

來自 H2B、H3 和 H4 中α-螺旋的螺旋偶極子導致淨正電荷在與 DNA 上帶負電荷的磷酸基團相互作用的點處積累

DNA 骨架與組蛋白中主鏈上的醯胺基團之間的氫鍵

組蛋白與 DNA 上的脫氧核糖糖之間的非極性相互作用

鹼性氨基酸(特別是賴氨酸和精氨酸)側鏈與 DNA 上的磷酸氧之間的鹽橋和氫鍵

H3 和 H2B N 端尾部進入 DNA 分子上兩個小溝的非特異性小溝插入

組蛋白的高度鹼性性質除了促進 DNA-組蛋白相互作用外,還有助於組蛋白的水溶性。 組蛋白主要在其 N 端尾部,但也在其球狀結構域中受到酶的翻譯後修飾。 這些修飾包括甲基化、瓜氨酸化、乙醯化、磷酸化、SUMO 化、泛素化和 ADP 核糖基化。 這會影響它們對基因調控的功能。 一般來說,活躍的基因結合的組蛋白較少,而非活躍基因在間期與組蛋白高度相關。 組蛋白的結構似乎也已在進化上得到儲存,因為任何有害的突變都會嚴重不利。

組蛋白 DNA 相互作用

[編輯 | 編輯原始碼]

核心組蛋白包含一個稱為“組蛋白摺疊”的特徵性結構基序,該基序由三個α-螺旋(α1-3)組成,它們由兩個環(L1-2)隔開。 在溶液中,組蛋白形成 H2A-H2B 異二聚體和 H3-H4 異四聚體。 組蛋白在其長的α2螺旋周圍以反平行方向二聚化,在 H3 和 H4 的情況下,兩個這樣的二聚體形成了一個由廣泛的 H3-H3’相互作用穩定的 4 螺旋束。 H2A/H2B 二聚體由於 H4 和 H2B 之間的相互作用而結合到 H3/H4 四聚體上,包括疏水簇的形成。 組蛋白八聚體由夾在兩個 H2A/H2B 二聚體之間的中心 H3/H4 四聚體形成。 由於所有四個核心組蛋白都具有高度鹼性電荷,組蛋白八聚體僅在存在 DNA 或非常高的鹽濃度的情況下穩定。

核小體構成真核染色質的基本重複單元,用於將大型真核基因組包裝到細胞核中,同時仍然確保對其的適當訪問(在哺乳動物細胞中,大約 2 米的線性 DNA 必須包裝到大約 10 微米直徑的細胞核中)。 核小體透過一系列不斷增加的高階結構摺疊,最終形成染色體; 這既壓縮了 DNA,又建立了一個額外的調控層,確保基因表達正確。 核小體被認為以核心組蛋白的共價修飾形式攜帶表觀遺傳繼承的資訊。 核小體假說由 Don 和 Ada Olins 於 1974 年提出,以及 Roger Kornberg。

核小體核心顆粒)由大約 146 bp 的 DNA 組成,圍繞組蛋白八聚體(由核心組蛋白 H2A、H2B、H3 和 H4 的 2 個複製組成)以 1.67 個左手超螺旋週數纏繞。 相鄰的核小體由一段稱為“連線 DNA”的遊離 DNA 連線(長度因物種和組織型別而異,從 10 到 80 bp 不等)。

DNA 結合域

[編輯 | 編輯原始碼]
λ噬菌體 的 λ 阻遏蛋白使用螺旋-轉角-螺旋 (左側;綠色) 結合 DNA (右側;藍色和紅色)。

一個或多個 DNA 結合域通常是包含具有不同功能的額外結構域的更大蛋白質的一部分。 額外的結構域通常調節 DNA 結合域的活性。 DNA 結合的功能要麼是結構性的,要麼涉及轉錄調控,這兩種作用有時會重疊。 具有涉及 DNA 結構功能的 DNA 結合域在 DNA 的複製、修復、儲存和修飾(例如甲基化)中具有生物學作用。 許多參與基因表達調控的蛋白質包含 DNA 結合域。 例如,透過結合 DNA 調節轉錄的蛋白質稱為轉錄因子。 大多數細胞訊號級聯的最終輸出是基因調控。 DBD 以 DNA 序列特異性或非序列特異性方式與 DNA 的核苷酸相互作用,但即使是非序列特異性識別也涉及蛋白質和 DNA 之間的某種分子互補性。 DBD 對 DNA 的識別可以發生在 DNA 的大溝或小溝,或發生在糖磷酸 DNA 骨架上(參見 DNA 的結構)。 每種特定型別的 DNA 識別都針對蛋白質的功能而定製。 例如,DNA 切割酶 DNAse I 幾乎隨機切割 DNA,因此必須以非序列特異性方式結合 DNA。 但是,即使如此,DNAse I 也識別特定 3-D DNA 結構,從而產生某種特定的 DNA 切割模式,這對於透過稱為 DNA 足跡法的技術研究 DNA 識別很有用。 許多 DNA 結合域必須識別特定的 DNA 序列,例如啟用特定基因的轉錄因子的 DBD,或在特定位點修飾 DNA 的酶的 DBD,如限制性內切酶和端粒酶。 DNA 大溝中的氫鍵模式比 DNA 小溝中的氫鍵模式退化程度更低,為序列特異性 DNA 識別提供了更具吸引力的位點。可以使用許多生化和生物物理技術來研究 DNA 結合蛋白的特異性,例如凝膠電泳、分析超速離心、量熱法、DNA 突變、蛋白質結構突變或修飾、核磁共振、X 射線晶體學、表面等離子共振、電子順磁共振、交聯和微量熱泳動 (MST)。[21]

DNA 結合域的型別

螺旋-轉角-螺旋

最初在細菌中發現,螺旋-轉角-螺旋基序通常存在於阻遏蛋白中,長度約為 20 個氨基酸。 在真核生物中,同源域包含 2 個螺旋,其中一個識別 DNA(又名識別螺旋)。 它們在調節發育過程的蛋白質中很常見(PROSITE HTH)。[22]

鋅指

與 DNA 結合的亮氨酸拉鍊 (藍色)。 代表拉鍊“齒”的亮氨酸殘基用紅色表示

糖皮質激素受體(上)的鋅指結構域(DBD)二聚體與DNA(下)結合的晶體結構(PDB 1R4O)。鋅原子用灰色球體表示,配位的半胱氨酸側鏈用棒狀表示。鋅指這個結構域通常有23到28個氨基酸長,透過與規則間隔的鋅配位殘基(組氨酸或半胱氨酸)配位鋅離子而穩定。最常見的鋅指型別(Cys2His2)配位一個鋅離子,由一個識別螺旋和一個2鏈β摺疊組成。在轉錄因子中,這些結構域通常成串排列(通常由短連線序列隔開),相鄰的指在與DNA結合時間隔3個鹼基對。

1953年克里克和沃森構建的DNA模型,在1973年從其原始部件中大部分重建,並捐贈給了倫敦的[科學博物館](/w/index.php?title=Science_Museum_(London)&action=edit&redlink=1" class="new" title="Science Museum (London) (does not exist)">。
摺疊組 代表性結構 配體放置
Cys2His2 兩個配體來自一個指節,另外兩個來自螺旋的C端。
Gag指節 兩個配體來自一個指節,另外兩個來自一個短螺旋或環。
高音譜號 兩個配體來自一個指節,另外兩個來自螺旋的N端。
鋅帶 兩個指節分別提供兩個配體。
Zn2/Cys6 兩個配體來自螺旋的N端,另外兩個來自一個環。
TAZ2結構域樣 兩個配體來自兩個螺旋的末端。


亮氨酸拉鍊

鹼性亮氨酸拉鍊(bZIP)結構域包含一個α螺旋,每7個氨基酸有一個亮氨酸。如果兩個這樣的螺旋相互靠近,亮氨酸就可以像拉鍊的齒一樣相互作用,使兩個蛋白質二聚化。在與DNA結合時,鹼性氨基酸殘基與糖磷酸骨架結合,而螺旋則位於主溝中。它調節基因表達。bZip家族的轉錄因子包含一個透過氫鍵與DNA分子主溝相互作用的鹼性區域,以及一個負責二聚化的疏水亮氨酸拉鍊區域。

翼螺旋

翼螺旋(WH)結構域包含大約110個氨基酸,具有四個螺旋和一個兩鏈β摺疊。

翼螺旋轉螺旋 翼螺旋轉螺旋結構域(wHTH)SCOP 46785 通常有85-90個氨基酸長。它由一個3螺旋束和一個4鏈β摺疊(翼)組成。

螺旋-環-螺旋

螺旋-環-螺旋結構域存在於一些轉錄因子中,其特徵是兩個由環連線的α螺旋。一個螺旋通常較小,由於環的柔性,允許透過摺疊和包裝到另一個螺旋上而二聚化。較大的螺旋通常包含DNA結合區域。

HMG盒

HMG盒結構域存在於高遷移率基團蛋白中,這些蛋白參與各種依賴DNA的過程,如複製和轉錄。該結構域由三個由環隔開的α螺旋組成。

DNA測序

[edit | edit source]

RNA測序是最早的核苷酸測序形式之一。RNA測序的主要里程碑是第一個完整基因的序列和噬菌體MS2的完整基因組的序列,由Walter Fiers及其在根特大學(比利時根特)的同事在1972年至1976年間確定並發表。在20世紀70年代初Frederick Sanger在英國劍橋大學以及Walter Gilbert和Allan Maxam在哈佛大學開發出快速DNA測序方法之前,曾使用過一些繁瑣的方法。例如,1973年,Gilbert和Maxam使用一種稱為“漫遊斑點分析”的方法報道了24個鹼基對的序列。Sanger及其同事在1975年開發的鏈終止法很快成為首選方法,因為它相對容易且可靠。[23]

Maxam和Gilbert方法

[edit | edit source]

1976-1977年,Allan Maxam和Walter Gilbert開發了一種基於DNA化學修飾和隨後在特定鹼基處裂解的DNA測序方法。雖然Maxam和Gilbert在Sanger和Coulson關於加減測序的開創性論文發表兩年後才發表了他們的化學測序方法,但Maxam-Gilbert測序很快就變得更加流行,因為可以直接使用純化的DNA,而最初的Sanger方法則要求將每個讀取的起點克隆以便產生單鏈DNA。然而,隨著鏈終止方法的改進(見下文),Maxam-Gilbert測序已經不受歡迎,因為它技術複雜,禁止其在標準分子生物學試劑盒中使用,大量使用危險化學品以及難以擴充套件。該方法需要在DNA的一個5'端進行放射性標記(通常透過使用γ-32P ATP進行激酶反應)並純化要測序的DNA片段。化學處理會在四個反應(G、A+G、C、C+T)中的一到兩個鹼基中的一小部分產生斷裂。例如,嘌呤(A+G)使用甲酸進行脫嘌呤,鳥嘌呤(以及在某種程度上腺嘌呤)使用硫酸二甲酯進行甲基化,嘧啶(C+T)使用肼進行甲基化。在肼反應中加入鹽(氯化鈉)會抑制胸腺嘧啶的甲基化,從而進行C-only反應。然後,修飾的DNA在修飾鹼基的位置用熱哌啶裂解。修飾化學品的濃度控制在平均每個DNA分子引入一個修飾。因此,會產生一系列標記片段,從放射性標記的末端到每個分子中的第一個“切割”位點。在四個反應中的片段在變性丙烯醯胺凝膠中並排進行電泳,以進行大小分離。為了視覺化片段,將凝膠暴露於X射線膠片上進行放射自顯影,產生一系列深色條帶,每個條帶對應於一個放射性標記的DNA片段,可以從中推斷出序列。該方法也稱為“化學測序”,它導致了用於繪製DNA結合蛋白的DNA結合位點的甲基化干擾分析。[24]

雙脫氧核苷酸鏈終止法

[edit | edit source]
放射性標記測序凝膠的一部分

由於鏈終止法(或以其開發者[Frederick Sanger](/w/index.php?title=Frederick_Sanger&action=edit&redlink=1" class="new" title="Frederick Sanger (does not exist)">命名的Sanger方法)比Maxam和Gilbert的方法效率更高,使用的有毒化學品更少,放射性物質也更少,因此它迅速成為首選方法。Sanger方法的關鍵原理是使用雙脫氧核苷酸三磷酸(ddNTP)作為DNA鏈終止劑。

經典的鏈終止法需要單鏈DNA模板、DNA引物、DNA聚合酶、正常的脫氧核苷酸磷酸(dNTP)以及修飾的核苷酸(雙脫氧核苷酸),這些核苷酸會終止DNA鏈的延伸。這些ddNTP也會進行放射性或熒游標記,以便在自動測序儀中檢測。DNA樣本被分成四個獨立的測序反應,每個反應包含所有四個標準脫氧核苷酸(dATP、dGTP、dCTP和dTTP)以及DNA聚合酶。在每個反應中只新增四個雙脫氧核苷酸中的一個(ddATP、ddGTP、ddCTP或ddTTP),它們是鏈終止核苷酸,缺少形成兩個核苷酸之間磷酸二酯鍵所需的3'-羥基(OH)基團,從而終止DNA鏈的延伸,併產生不同長度的DNA片段。

新合成的標記DNA片段被熱變性,並透過大小(解析度僅為一個核苷酸)在變性丙烯醯胺-尿素凝膠上進行電泳,四個反應中的每個反應都在四個獨立的泳道(泳道A、T、G、C)中進行;然後透過放射自顯影或紫外光視覺化DNA條帶,可以直接從X射線膠片或凝膠影像上讀出DNA序列。在右側的影像中,X射線膠片暴露於凝膠,深色條帶對應於不同長度的DNA片段。泳道中的深色條帶表示一個DNA片段,該片段是在摻入雙脫氧核苷酸(ddATP、ddGTP、ddCTP或ddTTP)後鏈終止的結果。然後使用四個泳道中不同條帶的相對位置(從下到上)讀出DNA序列。[25]

DNA片段用放射性或熒游標記標記在引物上(1),在用標記的dNTP的新DNA鏈上,或用標記的ddNTP標記。(點選展開)

鏈終止測序的技術變異包括使用包含放射性磷的核苷酸進行放射性標記,或使用在5'端用熒光染料標記的引物。染料引物測序便於在光學系統中讀取,從而實現更快、更經濟的分析和自動化。[Leroy Hood](/w/index.php?title=Leroy_Hood&action=edit&redlink=1" class="new" title="Leroy Hood (does not exist)">及其同事[26][27]後來開發的熒游標記的ddNTP和引物為自動化、高通量DNA測序奠定了基礎。

放射性測序的序列梯度與熒光峰比較

鏈終止法極大地簡化了DNA測序。例如,市售的基於鏈終止的試劑盒包含測序所需的試劑,預先分裝並可以使用。侷限性包括引物與DNA的非特異性結合,影響DNA序列的準確讀出,以及DNA二級結構影響序列的保真度。

染料終止測序

[編輯 | 編輯原始碼]
毛細管電泳(點選展開)

染料終止子測序利用鏈終止劑 ddNTP 的標記,使得測序可以在單一反應中完成,而不是像標記引物法那樣需要四種反應。在染料終止子測序中,四種雙脫氧核苷酸鏈終止劑中的每一種都被標記上熒光染料,每種染料都在不同的波長髮射光。

由於其更高的便利性和速度,染料終止子測序現在已成為自動化測序的主流。其侷限性包括由於染料標記的鏈終止劑摻入 DNA 片段的差異而產生的染料效應,導致電子 DNA 序列跟蹤 色譜圖 中峰高和峰形不等 毛細管電泳(見左側圖)。

這個問題已透過使用改進的 DNA 聚合酶酶系統和最大限度地減少摻入差異的染料以及消除“染料斑點”的方法得到解決。染料終止子測序方法與自動化高通量 DNA 序列分析儀一起,現在正被用於絕大多數測序專案。

DNA 測序的常見挑戰包括序列前 15-40 個鹼基的質量差以及 700-900 個鹼基後測序跟蹤質量下降。 鹼基識別 軟體通常會提供質量估計,以幫助進行質量修剪。[28][29]

在 DNA 片段在測序之前被克隆的情況下,得到的序列可能包含克隆載體的部分。相反,基於 PCR 的克隆和新興的基於焦磷酸測序的測序技術通常避免使用克隆載體。最近,已經開發出單步桑格測序(結合擴增和測序)方法,如 Ampliseq 和 SeqSharp,這些方法允許快速測序目標基因,而無需克隆或事先擴增。[30][31]

目前的方法只能直接測序相對較短的(300-1000 核苷酸 長)DNA 片段。在單一反應中測序超過此尺寸限制的 DNA 片段的主要障礙是,對於長度僅相差一個核苷酸的大 DNA 片段,分離能力不足以進行分辨。在所有情況下,使用具有遊離 5' 末端的引物都是必不可少的。

自動化和樣本製備

[編輯 | 編輯原始碼]
一個染料終止子讀取示例的開始檢視

自動化 DNA 測序儀(DNA 測序儀)可以一次批次(執行)測序多達 384 個 DNA 樣本,每天最多可執行 24 次。DNA 測序儀進行毛細管電泳以進行尺寸分離、檢測和記錄染料熒光,並將資料輸出為熒光峰跟蹤色譜圖。透過熱迴圈進行測序反應,在載入到測序儀上之前進行清理和重新懸浮在緩衝溶液中。許多商業和非商業軟體包可以自動修剪低質量 DNA 跟蹤。這些程式會對每個峰的質量進行評分,並刪除低質量的鹼基峰(通常位於序列的末端)。這種演算法的準確性低於人工操作員的視覺檢查,但足以進行大型序列資料集的自動化處理。

聚合酶鏈式反應

[編輯 | 編輯原始碼]
圖 1:PCR 迴圈的示意圖。(1) 在 94–96 °C 下變性。 (2) 在 ~65 °C 下退火 (3) 在 72 °C 下延伸。這裡顯示了四個迴圈。藍線表示 DNA 模板,引物(紅色箭頭)與之退火,並由 DNA 聚合酶(淺綠色圓圈)延伸,得到較短的 DNA 產物(綠色線),這些產物本身用作 PCR 程序中的模板。

PCR

PCR 用於擴增 DNA 鏈的特定區域(DNA 目標)。大多數 PCR 方法通常擴增高達 ~10 千鹼基對 (kb) 的 DNA 片段,儘管一些技術允許擴增高達 40 kb 的片段。基本的 PCR 設定需要幾個組分和試劑。這些組分包括

包含要擴增的 DNA 區域(目標)的 DNA 模板。

兩個引物,它們與 DNA 目標的正義鏈和反義鏈的 3'(三素)末端互補。Taq 聚合酶或其他 DNA 聚合酶,其最佳溫度在 70 °C 左右。脫氧核苷酸三磷酸 (dNTP),DNA 聚合酶合成新的 DNA 鏈的構建塊。緩衝溶液,為 DNA 聚合酶的最佳活性提供合適的化學環境。二價陽離子,鎂或錳離子;通常使用 Mg2+,但 Mn2+ 可用於 PCR 介導的 DNA 誘變,因為更高的 Mn2+ 濃度會增加 DNA 合成過程中的錯誤率。一價陽離子鉀離子。PCR 通常在熱迴圈儀中,在 10-200 μl 的反應體積內,在小反應管(0.2-0.5 ml 體積)中進行。熱迴圈儀對反應管進行加熱和冷卻,以在反應的每個步驟中實現所需的溫度(見下文)。許多現代熱迴圈儀利用珀耳帖效應,透過簡單地反轉電流來實現容納 PCR 管的模組的加熱和冷卻。薄壁反應管允許良好的熱傳導,從而實現快速熱平衡。大多數熱迴圈儀都具有加熱蓋,以防止反應管頂部的冷凝。缺乏加熱蓋的舊熱迴圈儀需要在反應混合物頂部新增一層油或在管內新增一塊蠟。[32]

程式

圖 1:PCR 迴圈示意圖。 (1) 在 94–96 °C 下變性。 (2) 在 ~65 °C 下退火 (3) 在 72 °C 下延伸。 此處顯示了四個迴圈。 藍色線表示 DNA 模板,引物(紅色箭頭)與其退火,並由 DNA 聚合酶(淺綠色圓圈)延伸,以產生較短的 DNA 產物(綠色線),這些產物本身在 PCR 過程中被用作模板。 通常,PCR 包含一系列 20-40 次重複的溫度變化,稱為迴圈,每個迴圈通常包含 2-3 個不同的溫度步驟,通常為三個。 迴圈通常以在高溫 (>90 °C) 下的單個溫度步驟(稱為保持)開始,並在最後以一個保持步驟結束,用於最終產物延伸或短暫儲存。 所使用的溫度以及它們在每個迴圈中應用的時間取決於多種引數。 這些引數包括用於 DNA 合成的酶、反應中二價離子和 dNTP 的濃度以及引物的熔解溫度 (Tm)。 初始化步驟:此步驟包括將反應加熱到 94–96 °C(或如果使用極耐熱的聚合酶則為 98 °C),並保持 1–9 分鐘。 它僅適用於需要透過熱啟動 PCR 進行熱啟用的 DNA 聚合酶。 變性步驟:此步驟是第一個常規迴圈事件,包括將反應加熱到 94–98 °C,持續 20–30 秒。 它透過破壞互補鹼基之間氫鍵引起 DNA 模板的 DNA 熔化,產生單鏈 DNA 分子。 退火步驟:反應溫度降低到 50–65 °C,持續 20–40 秒,允許引物退火到單鏈 DNA 模板。 通常,退火溫度比所用引物的 Tm 低約 3-5 攝氏度。 穩定的 DNA-DNA 氫鍵僅在引物序列與模板序列非常匹配時形成。 聚合酶結合到引物-模板雜交體並開始 DNA 合成。 延伸/延長步驟:此步驟的溫度取決於所使用的 DNA 聚合酶;Taq 聚合酶的最佳活性溫度為 75–80 °C,通常在這種酶的情況下使用 72 °C 的溫度。 在此步驟中,DNA 聚合酶透過新增與模板互補的 dNTP,以 5' 到 3' 的方向合成與 DNA 模板鏈互補的新 DNA 鏈,將 dNTP 的 5'-磷酸基團與新生(延伸)DNA 鏈末端的 3'-羥基團縮合。 延伸時間既取決於所使用的 DNA 聚合酶,也取決於要擴增的 DNA 片段的長度。 作為經驗法則,在最佳溫度下,DNA 聚合酶每分鐘會聚合一千個鹼基。 在最佳條件下,即如果沒有由於限制性底物或試劑引起的限制,在每個延伸步驟中,DNA 目標的數量都會翻倍,導致特定 DNA 片段的指數(幾何)擴增。 最終延伸:此單個步驟偶爾在最後一個 PCR 迴圈後以 70–74 °C 的溫度進行 5–15 分鐘,以確保任何剩餘的單鏈 DNA 能夠完全延伸。 最終保持:此步驟在 4–15 °C 的溫度下進行無限時間,可用於對反應進行短期儲存。

為了檢查 PCR 是否產生了預期的 DNA 片段(有時也稱為擴增子或擴增片段),採用瓊脂糖凝膠電泳來分離 PCR 產物的大小。 PCR 產物的大小透過與 DNA 梯(分子量標記)進行比較來確定,DNA 梯包含已知大小的 DNA 片段,與 PCR 產物一起在凝膠上執行。

需要記住的事實

[edit | edit source]

DNA 聚合酶是催化從核苷三磷酸合成多核苷酸鏈並製造 DNA 的酶。 1865 年,格雷戈爾·孟德爾的論文《植物雜交實驗》

1869 年,瑞士醫生弗里德里希·米歇爾首次分離出 DNA,他在廢棄的繃帶的膿液中發現了一種顯微鏡下可見的物質。

從 1880 年到 1890 年,沃爾特·弗萊明、愛德華·施特拉斯伯格和埃德華·範·貝內登闡明瞭細胞分裂過程中染色體的分佈。

1889 年,休戈·德·弗里斯假設“生物體中特定性狀的遺傳是以顆粒的形式存在的”,並稱這些顆粒為“(泛)基因”。

1903 年,沃爾特·薩頓假設以孟德爾方式分離的染色體是遺傳單位。

1905 年,威廉·貝特森在一封給亞當·塞奇威克的信中和 1906 年的一次會議上創造了“遺傳學”一詞。

1908 年,推匯出哈代-溫伯格定律。

1910 年,托馬斯·亨特·摩根證明基因位於染色體上。

1913 年,阿爾弗雷德·斯特蒂文特製作了第一張染色體遺傳圖。

1913 年,基因圖譜顯示染色體包含線性排列的基因。

1918 年,羅納德·費舍爾發表了《關於孟德爾遺傳假設下的親屬之間的相關性》一書,現代遺傳學與進化生物學合成開始。 請參見群體遺傳學。

1928 年,弗雷德里克·格里菲斯發現,來自死亡細菌的遺傳物質可以整合到活細菌中(請參見格里菲斯實驗)。

1931 年,交叉被確定為重組的原因。

1933 年,讓·布拉謝特能夠證明 DNA 存在於染色體中,而 RNA 存在於所有細胞的細胞質中。

1937 年,威廉·阿斯特伯裡產生了第一個 X 射線衍射圖譜,顯示 DNA 具有規則的結構。

1928 年,弗雷德里克·格里菲斯發現,肺炎鏈球菌的“光滑”形式的性狀可以透過將殺死的“光滑”細菌與活的“粗糙”形式混合來轉移到相同細菌的“粗糙”形式。

1952 年,阿爾弗雷德·赫希瑪莎·蔡斯在赫希-蔡斯實驗中表明,DNA 是 T2 噬菌體的遺傳物質。

1953 年,詹姆斯·D·沃森弗朗西斯·克里克提出了 DNA 結構的雙螺旋模型。

嘌呤在肉類和肉製品中含量很高,尤其是在肝臟和腎臟等內臟中。

高嘌呤來源的示例包括:胸腺、鳳尾魚、沙丁魚、肝臟、牛肉腎臟、腦、肉汁(例如 Oxo、Bovril)、鯡魚、鯖魚、扇貝、野味、啤酒(來自酵母)和肉汁。

bp = 鹼基對。 一個 bp 對應於沿鏈約 3.4 Å 的長度。

kb (= kbp) = 千鹼基對 = 1,000 bp

Mb = 兆鹼基對 = 1,000,000 bp

DNA 拓撲結構分析使用三個值

L = 連線數 - 一條 DNA 鏈繞另一條 DNA 鏈纏繞的次數。 對於閉合環,它是整數,對於閉合拓撲域,它是常數。

T = 扭曲 - 雙鏈 DNA 螺旋中總的轉數。 通常,這將趨向於接近在溶液中自由形成的拓撲開放雙鏈 DNA 螺旋的轉數:鹼基數/10.5,假設沒有嵌入劑(例如,氯喹)或其他改變 DNA 剛度的元素。

W = 纏繞 - 雙鏈 DNA 螺旋繞超螺旋軸纏繞的次數

L = T + W 且 ΔL = ΔT + ΔW

在閉合拓撲域中,T 的任何變化都必須由 W 的變化來平衡,反之亦然。 這導致 DNA 的更高階結構。 具有 0 纏繞的環狀 DNA 分子將是圓形的。 如果該分子的扭曲隨後透過超螺旋而增加或減少,則纏繞將相應地改變,使分子經歷曲折或環狀超螺旋纏繞。 當一段雙鏈螺旋 DNA 的末端連線在一起形成一個圓時,鏈條在拓撲上是打結的。 這意味著單鏈無法透過任何不涉及斷裂鏈條(例如加熱)的過程來分離。 解開拓撲連線的 DNA 鏈的任務落到了稱為拓撲異構酶的酶上。 這些酶專門透過切割一條或兩條鏈來解開環狀 DNA,以便另一段雙鏈或單鏈可以透過。 這種解開對於環狀 DNA 的複製以及具有類似拓撲約束的線性 DNA 中的各種型別的重組是必需的。

Gb = 吉鹼基對 = 1,000,000,000 bp。

1972年,重組DNA技術的開發允許分離出明確的DNA片段;在此之前,唯一可用於測序的樣本來自噬菌體或病毒DNA。 1977年,第一個完整測序的DNA基因組是噬菌體φX174。 1977年,Allan Maxam和Walter Gilbert發表了“化學降解法測序DNA”。 同時,Frederick Sanger獨立發表了“利用鏈終止抑制劑測序DNA”。 1984年,英國醫學研究委員會的科學家破譯了170kb的EB病毒的完整DNA序列。 1986年,加州理工學院Leroy E. Hood實驗室和Smith宣佈了第一個半自動化的DNA測序儀。 1987年,應用生物系統公司推出了第一臺自動測序儀,型號為ABI 370。 1990年,美國國立衛生研究院(NIH)開始對支原體(Mycoplasma capricolum)、大腸桿菌(Escherichia coli)、秀麗隱杆線蟲(Caenorhabditis elegans)和釀酒酵母(Saccharomyces cerevisiae)進行大規模測序試驗(每鹼基0.75美元)。 1991年,Craig Venter實驗室開始對人類表達序列標籤進行測序,試圖捕捉人類基因組的編碼部分。 1995年,Craig Venter、Hamilton Smith和基因組研究所(TIGR)的同事發表了第一個自由生活生物體的完整基因組,即嗜血桿菌(Haemophilus influenzae)。 環狀染色體包含1,830,137個鹼基,其發表在《科學》雜誌上標誌著首次使用全基因組鳥槍法測序,消除了對初始作圖工作的需求。 1996年,瑞典皇家理工學院的Pål Nyrén和他的學生Mostafa Ronaghi發表了他們的焦磷酸測序方法。 1998年,華盛頓大學的Phil Green和Brent Ewing釋出了用於測序資料分析的“phred”軟體。 2001年,人類基因組的草圖序列發表。 2004年,454 Life Sciences公司推出了焦磷酸測序的並行版本。 他們機器的第一版與自動化的Sanger測序相比,測序成本降低了6倍,是繼MPSS之後,新一代測序技術的第二種。

DNA和RNA中發現的鹼基列表

名稱 3D結構 縮寫 結構式 分類 發現於
胞嘧啶
C
嘧啶 DNA,RNA
胸腺嘧啶
T
嘧啶 DNA
尿嘧啶
U
嘧啶 RNA
腺嘌呤
A
嘌呤 DNA,RNA
鳥嘌呤
C
嘌呤 DNA,RNA

參考文獻

[編輯 | 編輯原始碼]
  1. DNA
  2. 格里菲斯實驗
  3. 赫希-蔡斯實驗
  4. Hershey, A.D. and Chase, M. (1952) 噬菌體生長中病毒蛋白和核酸的獨立功能。J Gen Physiol. 36:39–56.
  5. 艾弗裡-麥克萊德-麥卡錫實驗
  6. 鹼基對
  7. 嘧啶
  8. 胞嘧啶
  9. 核苷
  10. 核苷酸
  11. 磷酸二酯鍵
  12. A-DNA
  13. Z-DNA
  14. 非編碼DNA
  15. DNA超螺旋
  16. Vologodskii AV,Lukashin AV,Anshelevich VV 等。 (1979). “超螺旋DNA的波動”。核酸研究. 6: 967–682. doi:10.1093/nar/6.3.967. {{引用期刊}}: 在“|作者=”中顯式使用“等”。 (幫助)CS1維護:作者列表中的多個名稱 (連結)
  17. H. S. Chawla (2002). 植物生物技術導論. 科學出版社. ISBN 1578082285.
  18. Kayne PS, Kim UJ, Han M, Mullen JR, Yoshizaki F, Grunstein M. 酵母中高度保守的組蛋白H4 N端對於生長是可有可無的,但對於抑制沉默的交配位點是必不可少的。細胞. 1988年10月7日;55(1):27-39. PMID 3048701
  19. Crane-Robinson C,Dancy SE,Bradbury EM,Garel A,Kovacs AM,Champagne M,Daune M (1976). “雞紅細胞組蛋白H5的結構研究”。歐洲生物化學雜誌. 67 (2): 379–88. doi:10.1111/j.1432-1033.1976.tb10702.x. PMID 964248. {{引用期刊}}: 未知引數“|月=”被忽略 (幫助)CS1維護:作者列表中的多個名稱 (連結)
  20. Aviles FJ,Chapman GE,Kneale GG,Crane-Robinson C,Bradbury EM (1978). “組蛋白H5的構象。球狀片段的隔離和表徵”。歐洲生物化學雜誌. 88 (2): 363–71. doi:10.1111/j.1432-1033.1978.tb12457.x. PMID 689022. {{引用期刊}}: 未知引數“|月=”被忽略 (幫助)CS1維護:作者列表中的多個名稱 (連結)
  21. DNA結合域
  22. DNA結合域
  23. DNA測序
  24. DNA測序
  25. DNA測序
  26. Smith LM, Sanders JZ, Kaiser RJ 等人。 (1986). “自動化 DNA 測序分析中的熒光檢測”。自然. 321 (6071): 674–9. doi:10.1038/321674a0. PMID 3713851. 我們開發了一種用於 DNA 測序分析部分自動化的方法。 DNA 片段的熒光檢測是透過將熒光團共價連線到用於酶促 DNA 測序分析的寡核苷酸引物來實現的。 每個特定於鹼基 A、C、G 和 T 的反應使用不同的彩色熒光團。 反應混合物被組合並共同電泳透過單個聚丙烯醯胺凝膠管,分離的 DNA 熒光帶在管底部附近被檢測到,並且序列資訊直接由計算機獲取。 {{cite journal}}: |author= 中明確使用 et al. (help)CS1 維護:作者列表的多個名稱 (link)
  27. Smith LM, Fung S, Hunkapiller MW, Hunkapiller TJ, Hood LE (1985). "合成在 5' 末端含有脂肪族氨基的寡核苷酸:合成用於 DNA 測序分析的熒光 DNA 引物". 核酸研究. 13 (7): 2399–412. doi:10.1093/nar/13.7.2399. PMC 341163. PMID 4000959. {{cite journal}}: 未知引數 |month= 被忽略 (help)CS1 維護:作者列表的多個名稱 (link)
  28. "Phred - 質量鹼基呼叫". 檢索於 2011-02-24.
  29. "下一代測序平臺的鹼基呼叫 - 簡短生物資訊學". 檢索於 2011-02-24.
  30. Murphy, K.;Berg, K.;Eshleman, J. (2005). “透過組合擴增和迴圈測序反應對基因組 DNA 進行測序”。臨床化學 51 (1): 35–39。
  31. Sengupta, D.;Cookson, B. (2010). “SeqSharp:一種用於改進迴圈測序的通用方法,它促進穩健的一步組合擴增和測序方法”。分子診斷雜誌:JMD 12 (3): 272–277。
  32. 聚合酶鏈式反應
華夏公益教科書