分子生物學/遺傳密碼簡介

在詹姆斯·沃森和弗朗西斯·克里克發現DNA結構之後，他們利用了莫里斯·威爾金斯和羅莎琳德·富蘭克林（以及其他）的實驗證據，人們開始認真地努力去理解蛋白質編碼的性質。1954年，喬治·伽莫夫^[1]推測必須使用一個三字母密碼來編碼活細胞用來編碼蛋白質的20種標準氨基酸。3是最小的整數n，使得4ⁿ至少為20。

密碼子由三個DNA鹼基組成這一事實最早是在克里克、布倫納等人的實驗中得到證實。 ^[2] 第一個密碼子的闡明是由馬歇爾·尼倫伯格和海因裡希·J·馬特海在1961年美國國立衛生研究院完成的。^[3]他們使用無細胞系統翻譯多尿嘧啶RNA序列（即UUUU...），發現他們合成的多肽僅由苯丙氨酸組成。由此他們推斷密碼子UUU指定了氨基酸苯丙氨酸。隨後，塞韋羅·奧喬阿實驗室的實驗表明，多腺嘌呤RNA序列（AAAAA...）編碼多肽，多賴氨酸，而多胞嘧啶RNA序列（CCCCC...）編碼多肽，多脯氨酸。因此，密碼子AAA指定了氨基酸賴氨酸，而密碼子CCC指定了氨基酸脯氨酸。使用不同的共聚物，隨後確定了大多數剩餘的密碼子。擴充套件這項工作，尼倫伯格和菲利普·萊德揭示了遺傳密碼的三聯體性質，並允許對標準遺傳密碼的密碼子進行破譯。在這些實驗中，各種mRNA組合透過包含核糖體的過濾器，核糖體是細胞中將RNA翻譯成蛋白質的成分。獨特的三個鹼基促進了特定tRNA與核糖體的結合。萊德和尼倫伯格能夠在他們的實驗中確定54個密碼子中的64個密碼子的序列。

哈爾·戈賓德·科拉納的後續工作確定了剩餘的遺傳密碼。不久之後，羅伯特·W·霍利確定了轉運RNA（tRNA）的結構，轉運RNA是促進將RNA翻譯成蛋白質過程的介面卡分子。這項工作基於塞韋羅·奧喬阿早期的研究，奧喬阿因其在RNA合成酶學方面的研究獲得了1959年的諾貝爾獎。1968年，科拉納、霍利和尼倫伯格因他們的工作獲得了諾貝爾生理學或醫學獎。^[4]

遺傳密碼的起源

關於遺傳密碼起源有很多理論。所有已知生命形式使用的遺傳密碼幾乎是通用的。然而，可能的遺傳密碼數量巨大。如果氨基酸與三聯體密碼子隨機關聯，則將有1.5 x 10⁸⁴個可能的遺傳密碼。轉運RNA的系統發育分析表明，轉運RNA分子是在現有的氨醯-tRNA合成酶出現之前進化出來的。

理論上，遺傳密碼可能是完全隨機的（“凍結的意外”）、完全非隨機的（最優的）或隨機和非隨機的組合。有足夠的資料來反駁第一個可能性。首先，簡單地看一下遺傳密碼錶已經顯示出氨基酸分配的聚類。此外，在相同生物合成途徑中共享相同氨基酸的傾向於在其密碼子中具有相同的第一個鹼基，而具有相似物理特性的氨基酸往往具有相似的密碼子。

在試圖解釋遺傳密碼的進化（因此解釋這些模式的起源）的許多理論中，有四個主題貫穿其中

1. 化學原理決定了特定的RNA與氨基酸的相互作用。適體實驗表明，一些氨基酸對其編碼的鹼基三聯體具有選擇性的化學親和力。最近的實驗表明，在測試的8種氨基酸中，有6種顯示出一些RNA三聯體-氨基酸關聯。這被稱為立體化學密碼。立體化學密碼可能創造了一個古代的核心分配。當前複雜的翻譯機制，包括tRNA和相關的酶，可能是後來的發展，最初，蛋白質序列直接在鹼基序列上模板化。

2. 生物合成擴充套件。現代標準遺傳密碼是從一個更簡單的早期密碼透過“生物合成擴充套件”過程發展而來的。這裡的意思是，原始生命“發現”了新的氨基酸（例如，作為代謝的副產物），後來將其中一些氨基酸重新整合到遺傳編碼機制中。雖然已經找到了許多間接證據表明過去使用的不同氨基酸比今天少，但關於哪些氨基酸以何種順序進入密碼的具體和詳細假設，已被證明具有更大的爭議性。

3. 自然選擇導致了遺傳密碼的密碼子分配，從而最大程度地減少了突變的影響。最近的一個假設表明，三聯體密碼是從使用比三聯體密碼子更長的密碼子演變而來的。比三聯體解碼具有更高的密碼子冗餘度，並且比三聯體解碼更具抗錯性。此功能允許在沒有高度複雜的翻譯機制（如核糖體）的情況下進行準確解碼。

4. 資訊通道：資訊理論方法將遺傳密碼視為一個容易出錯的資訊通道。通道固有的噪聲（即錯誤）給生物體帶來了一個基本問題：如何構建一個能夠承受噪聲影響並準確有效地翻譯資訊的遺傳密碼？這些“速率-失真”模型表明，遺傳密碼的起源是三種相互衝突的進化力量相互作用的結果：對不同氨基酸的需求、對容錯性的需求以及對資源最小成本的需求。當密碼子到氨基酸的對映變得非隨機時，程式碼就會出現在編碼轉變處。程式碼的出現受可能錯誤定義的拓撲結構控制，並且與地圖著色問題有關。

科拉納研究概述

具有兩個重複單元的核糖核酸（RNA）（UCUCUCU → UCU CUC UCU）產生了兩種交替的氨基酸。這與尼倫伯格和萊德的實驗相結合，表明UCU編碼絲氨酸，而CUC編碼亮氨酸。具有三個重複單元的RNA（UACUACUA → UAC UAC UAC，或 ACU ACU ACU，或 CUA CUA CUA）產生了三種不同的氨基酸串。具有四個重複單元（包括UAG、UAA或UGA）的RNA僅產生了二肽和三肽，因此揭示了UAG、UAA和UGA是終止密碼子。透過此，科拉納及其團隊已經確定了所有生物通用的所有程式碼之母，生物學語言是用三個字母的單詞拼寫的：每組三個核苷酸編碼一個特定的氨基酸。他們的諾貝爾演講於1968年12月12日發表。為此，科拉納也是第一個合成寡核苷酸的人，即核苷酸串。

遺傳密碼錶


		第二鹼基
		T		C		A		G
第一鹼基	T	TTT	(Phe/F) 苯丙氨酸	TCT	(Ser/S) 絲氨酸	TAT	(Tyr/Y) 酪氨酸	TGT	(Cys/C) 半胱氨酸
		TTC	(Phe/F) 苯丙氨酸	TCC	(Ser/S) 絲氨酸	TAC	(Tyr/Y) 酪氨酸	TGC	(Cys/C) 半胱氨酸
		TTA	(Leu/L) 亮氨酸	TCA	(Ser/S) 絲氨酸	TAA	赭石 (停止)	TGA	蛋白石 (停止)
		TTG	(Leu/L) 亮氨酸	TCG	(Ser/S) 絲氨酸	TAG	琥珀 (停止)	TGG	(Trp/W) 色氨酸
	C	CTT	(Leu/L) 亮氨酸	CCT	(Pro/P) 脯氨酸	CAT	(His/H) 組氨酸	CGT	(Arg/R) 精氨酸
		CTC	(Leu/L) 亮氨酸	CCC	(Pro/P) 脯氨酸	CAC	(His/H) 組氨酸	CGC	(Arg/R) 精氨酸
		CTA	(Leu/L) 亮氨酸	CCA	(Pro/P) 脯氨酸	CAA	(Gln/Q) 谷氨醯胺	CGA	(Arg/R) 精氨酸
		CTG	(Leu/L) 亮氨酸	CCG	(Pro/P) 脯氨酸	CAG	(Gln/Q) 谷氨醯胺	CGG	(Arg/R) 精氨酸
	A	ATT	(Ile/I) 異亮氨酸	ACT	(Thr/T) 蘇氨酸	AAT	(Asn/N) 天冬醯胺	AGT	(Ser/S) 絲氨酸
		ATC	(Ile/I) 異亮氨酸	ACC	(Thr/T) 蘇氨酸	AAC	(Asn/N) 天冬醯胺	AGC	(Ser/S) 絲氨酸
		ATA	(Ile/I) 異亮氨酸	ACA	(Thr/T) 蘇氨酸	AAA	(Lys/K) 賴氨酸	AGA	(Arg/R) 精氨酸
		ATG	(Met/M) 甲硫氨酸	ACG	(Thr/T) 蘇氨酸	AAG	(Lys/K) 賴氨酸	AGG	(Arg/R) 精氨酸
	G	GTT	(Val/V) 纈氨酸	GCT	(Ala/A) 丙氨酸	GAT	(Asp/D) 天冬氨酸	GGT	(Gly/G) 甘氨酸
		GTC	(Val/V) 纈氨酸	GCC	(Ala/A) 丙氨酸	GAC	(Asp/D) 天冬氨酸	GGC	(Gly/G) 甘氨酸
		GTA	(Val/V) 纈氨酸	GCA	(Ala/A) 丙氨酸	GAA	(Glu/E) 穀氨酸	GGA	(Gly/G) 甘氨酸
		GTG	(Val/V) 纈氨酸	GCG	(Ala/A) 丙氨酸	GAG	(Glu/E) 穀氨酸	GGG	(Gly/G) 甘氨酸

非極性	極性	鹼性	酸性	(終止密碼子)

遺傳密碼的簡併性

簡併性是指遺傳密碼的冗餘性。遺傳密碼具有冗餘性，但不具有歧義性（以上是完整相關性）。例如，雖然密碼子GAA和GAG都指定穀氨酸（冗餘性），但它們都不指定任何其他氨基酸（無歧義性）。編碼一個氨基酸的密碼子可能在其三個位置中的任何一個都不同。例如，氨基酸穀氨酸由密碼子GAA和GAG指定（第三位不同），氨基酸亮氨酸由密碼子UUA、UUG、CUU、CUC、CUA、CUG指定（第一位或第三位不同），而氨基酸絲氨酸由密碼子UCA、UCG、UCC、UCU、AGU、AGC指定（第一位、第二位或第三位不同）。

如果密碼子中的一個位置上的任何核苷酸都指定相同的氨基酸，則稱該位置為四重簡併位點。例如，甘氨酸密碼子（GGA、GGG、GGC、GGU）的第三位是一個四重簡併位點，因為該位點的所有核苷酸替換都是同義的；也就是說，它們不會改變氨基酸。只有某些密碼子的第三位可能是四重簡併的。如果密碼子中的一個位置上只有四個可能的核苷酸中的兩個指定相同的氨基酸，則稱該位置為二重簡併位點。例如，穀氨酸密碼子（GAA、GAG）的第三位是一個二重簡併位點。在二重簡併位點，等效核苷酸總是兩個嘌呤（A/G）或兩個嘧啶（C/U），因此只有二重簡併位點的顛換替換（嘌呤到嘧啶或嘧啶到嘌呤）是非同義的。

如果密碼子中的一個位置上的任何突變都會導致氨基酸替換，則稱該位置為非簡併位點。只有一個三重簡併位點，改變為四個核苷酸中的三個可能對氨基酸沒有影響（取決於改變成什麼），而改變為第四個可能的核苷酸總是會導致氨基酸替換。這是異亮氨酸密碼子的第三位：AUU、AUC或AUA都編碼異亮氨酸，但AUG編碼蛋氨酸。在計算中，該位置通常被視為二重簡併位點。

有三個氨基酸由六個不同的密碼子編碼：絲氨酸、亮氨酸和精氨酸。只有一個氨基酸由單個密碼子指定。其中一個是氨基酸蛋氨酸，由密碼子AUG指定，該密碼子也指定翻譯的開始；另一個是色氨酸，由密碼子UGG指定。遺傳密碼的簡併性解釋了同義突變的存在。

簡併性是由於密碼子數量多於可編碼的氨基酸數量。例如，如果每個密碼子有兩個鹼基，那麼只能編碼16個氨基酸 **(4²=16)**。因為至少需要21個密碼子（20個氨基酸加上終止密碼子），而下一個最大的鹼基數是三個，那麼 **4³得到64** 個可能的密碼子，這意味著必須存在一些簡併性。

遺傳密碼的這些特性使其對點突變具有更強的容錯性。例如，理論上，四重簡併密碼子可以容忍第三位上的任何點突變，儘管在實踐中，密碼子使用偏好限制了這一點，尤其是在許多生物體中；二重簡併密碼子可以容忍第三位上的三種可能的點突變中的一種。由於轉換突變（嘌呤到嘌呤或嘧啶到嘧啶突變）比顛換突變（嘌呤到嘧啶或反之）更可能發生，因此二重簡併位點上嘌呤或嘧啶的等效性進一步增強了容錯性。

儘管遺傳密碼具有冗餘性，但單個點突變仍然會導致蛋白質功能障礙。例如，突變的珠蛋白基因會導致鐮狀細胞病。在突變的珠蛋白中，親水性穀氨酸（Glu）被疏水性纈氨酸（Val）取代，即GAA或GAG變為GUA或GUG。穀氨酸被纈氨酸取代降低了 β-珠蛋白的溶解度，導致珠蛋白形成由纈氨酸基團之間的疏水相互作用連線的線性聚合物，從而導致紅細胞的鐮狀變形。鐮狀細胞病通常不是由從頭突變引起的。相反，它在瘧疾流行的地理區域被選擇出來（與地中海貧血相似），因為雜合子對瘧疾的寄生蟲 *瘧原蟲* 有一定的抵抗力（雜合子優勢）。^[5]

這些氨基酸的可變密碼是允許的，因為 tRNA 反密碼子的第一個鹼基中存在修飾鹼基，形成的鹼基對稱為擺動鹼基對。修飾的鹼基包括肌苷和非沃森-克里克 U-G 鹼基對。^[6]

起始密碼子和終止密碼子

起始密碼子

起始密碼子通常被定義為核糖體開始將 RNA 序列翻譯成氨基酸的點，即序列。當核糖體從 mRNA 的 5' 端碳到 3' 端碳“讀取”時，起始密碼子是 tRNA 結合蛋氨酸、甲硫氨酸和核糖體亞基附著到的第一個密碼子。**ATG 和 AUG 分別表示 DNA 和 RNA 序列，它們是編碼真核生物中甲硫氨酸 (Met) 和原核生物中修飾的 Met (fMet) 的起始密碼子或起始密碼子。**中心法則描述了基因到蛋白質的翻譯過程。特定的 DNA 序列充當模板在細胞核中合成 mRNA，這個過程稱為“轉錄”。這種 mRNA 從細胞核輸出到細胞的細胞質中，並充當模板在細胞質中合成蛋白質，這個過程稱為“翻譯”。三個核苷酸鹼基指定遺傳密碼中的一個氨基酸，這種對映編碼在生物體的 tRNA 中。mRNA 編碼序列 (CDS) 中要翻譯成蛋白質的前三個鹼基稱為起始密碼子或起始密碼子。起始密碼子幾乎總是位於一個未翻譯區 5' UTR 之前。起始密碼子通常是 AUG（或 DNA 中的 ATG；這也編碼甲硫氨酸）。在高等生物（真核生物）中，很少使用非 AUG 起始密碼子。除了 AUG 之外，原核生物中還使用備用起始密碼子，主要是 **GUG** 和 **UUG**。例如，大腸桿菌使用 83% ATG (AUG)、14% GTG (GUG)、3% TTG (UUG) 和一兩個其他密碼子（例如，ATT 和 CTG）。

終止密碼子

在遺傳密碼中，終止密碼子（也稱為終止密碼子）是信使 RNA 中的核苷酸三聯體，它指示翻譯終止。蛋白質基於多肽，多肽是氨基酸的獨特序列；大多數信使 RNA 中的密碼子對應於向生長的多肽鏈新增一個氨基酸，該多肽鏈最終可能成為蛋白質——終止密碼子指示此過程終止，釋放氨基酸鏈。

終止密碼子在歷史上被賦予了許多不同的名稱，因為它們各自對應於一類不同的突變體，這些突變體的行為方式都相似。**這些突變體最初是在噬菌體中分離出來的**（T4 和 λ），噬菌體是感染大腸桿菌的病毒。病毒基因中的突變削弱了它們的感染能力，有時會產生只能感染和生長在某些大腸桿菌品種中的病毒。

1. **琥珀突變**是發現的第一組無義突變。它們是由理查德·埃普斯坦和查爾斯·斯坦伯格分離出來的，但以他們朋友哈里斯·伯恩斯坦的名字命名（見埃德加第 580-581 頁^[7]）關於這個事件背後的故事）。

帶有琥珀突變的病毒的特點是它們只能感染某些菌株的細菌，這些細菌被稱為琥珀抑制子。這些細菌攜帶著自身的突變，使突變病毒恢復功能。例如，識別琥珀終止密碼子的 tRNA 中的突變允許翻譯“通讀”該密碼子併產生全長蛋白質，從而恢復蛋白質的正常形式並“抑制”琥珀突變。因此，琥珀突變體是可以在含有琥珀抑制子突變的細菌中生長的整個病毒突變體類別。

2.赭石赭石突變是發現的第二個終止密碼子突變。為了與琥珀突變體的名稱相匹配，赭石突變體病毒具有類似的特性，即它們在某些抑制子菌株的細菌中恢復了感染能力。赭石抑制子組與琥珀抑制子組不同，因此推斷赭石突變體對應於不同的核苷酸三聯體。透過一系列比較這些突變體彼此之間以及其他已知氨基酸密碼子的突變實驗，悉尼·布倫納得出結論，琥珀和赭石突變體分別對應於核苷酸三聯體“UAG”和“UAA”。^[8]

3. 碧玉突變或褐色突變標準遺傳密碼中的第三個也是最後一個終止密碼子不久後被發現，對應於核苷酸三聯體“UGA”。產生這種過早終止密碼子的無義突變後來被稱為碧玉突變或褐色突變。

在 RNA 中：UAG (“琥珀”) UAA (“赭石”) UGA (“碧玉”)

在 DNA 中：TAG (“琥珀”) TAA (“赭石”) TGA (“碧玉”或“褐色”)。

線粒體中通用遺傳密碼 (UGC) 的例外情況
生物體	密碼子	標準	新穎
哺乳動物	AGA, AGG	精氨酸	終止密碼子
	AUA	異亮氨酸	甲硫氨酸
	UGA	終止密碼子	色氨酸
無脊椎動物	AGA, AGG	精氨酸	絲氨酸
	AUA	異亮氨酸	甲硫氨酸
	UGA	終止密碼子	色氨酸
酵母	AUA	異亮氨酸	甲硫氨酸
	UGA	終止密碼子	色氨酸
	CUA	亮氨酸	蘇氨酸

需要記住的事實

遺傳密碼的例外情況：儘管今天絕大多數生物體使用標準遺傳密碼，但遺傳學家已經發現了一些關於該密碼的變異。此外，這些變異存在於不同的進化譜系中，並且包括對少數密碼子的不同翻譯。

CUG 密碼子通常翻譯為亮氨酸，在許多真菌物種中對應於絲氨酸 2 ，如 Candida 3。

許多綠藻屬 Acetabularia 的物種使用終止密碼子 UAG 和 UAA 來編碼甘氨酸。

許多纖毛蟲，如 Paramecium tetraurelia 、 Tetrahymena thermophila 或 Stylonychia 4 lemnae，使用密碼子 UAG 和 UAA 來編碼谷氨醯胺而不是終止。UGA 是這些細胞使用的唯一終止密碼子。

纖毛蟲 Euplotes octocarinatus 使用密碼子 UGA 來編碼半胱氨酸，使 UAG 和 UAA 成為終止訊號。

在生命的三界中，我們有時會發現一種第二十一氨基酸，硒代半胱氨酸，由 UGA 密碼子 (通常為終止密碼子) 編碼。

在古細菌和真細菌中，有時會發現一種第二十二氨基酸，吡咯賴氨酸，由 UAG (通常為終止密碼子) 編碼。

第一個摻入的氨基酸（由起始密碼子 AUG 決定）在大多數真核生物中是甲硫氨酸，更少見的是纈氨酸（在一些真核生物中），以及大多數原核生物中的甲醯甲硫氨酸。此外，在一些原核生物中，該密碼子有時是 GUG 或 GUU。

因此，我們認為今天的生命最初具有較少的氨基酸數量。這些氨基酸已被修飾，並且它們的數量已經增加（透過類似於硒代半胱氨酸和吡咯賴氨酸形成的現象，分別源自絲氨酸和賴氨酸，在核糖體上對其轉移 RNA 進行修飾）。這些新的氨基酸隨後被用於一小部分轉移 RNA 及其相關編碼。也許我們注意到這種現象的跡象，即谷氨醯胺，在某些細菌中，仍然附著在它的 tRNA 上的穀氨酸衍生而來。

另一個例外：程式碼有時是不明確的。例如，密碼子 UGA 在同一個生物體中（例如大腸桿菌）有時編碼上面提到的第 21 個氨基酸（硒代半胱氨酸）或“終止”。

參考文獻

↑ Gamow, G. 1954. 脫氧核糖核酸與蛋白質結構之間的可能關係。自然 173: 318。
↑ CRICK FH, BARNETT L, BRENNER S, WATTS-TOBIN RJ (1961)。“蛋白質遺傳密碼的一般性質”。自然。192: 1227–32。PMID 13882203。
↑ NIRENBERG MW, MATTHAEI JH (1961)。“大腸桿菌無細胞蛋白質合成的依賴性，依賴於天然存在或合成的多核苷酸”。美國國家科學院院刊。47: 1588–602。PMC 223178。PMID 14479932。
↑ 遺傳密碼
↑ Hebbel RP (2003)。“鐮狀血紅蛋白不穩定性：瘧疾保護的機制”。氧化還原報告。8 (5): 238–40。doi:10.1179/135100003225002826。PMID 14962356。
↑ Varani G, McClain WH (2000)。“G x U 擺動鹼基對。RNA 結構的基本組成部分，對各種生物系統中 RNA 功能至關重要”。EMBO 報告。1 (1): 18–23。doi:10.1093/embo-reports/kvd001。PMC 1083677。PMID 11256617。 {{cite journal}}: Unknown parameter |month= ignored (help)
↑ Edgar B (2004). "T4噬菌體的基因組：一項考古學發掘". 遺傳學. 168 (2): 575–82. PMC 1448817. PMID 15514035.
↑ Brenner S. 科學生活 2001 年（參見第 101-104 頁） BioMed Central Limited 出版 ISBN 0954027809 ISBN 978-0954027803

[1] Gamow, G. 1954. 脫氧核糖核酸與蛋白質結構之間的可能關係。自然 173: 318。

[pmid13882203-2] CRICK FH, BARNETT L, BRENNER S, WATTS-TOBIN RJ (1961)。“蛋白質遺傳密碼的一般性質”。自然。192: 1227–32。PMID 13882203。

[pmid14479932-3] NIRENBERG MW, MATTHAEI JH (1961)。“大腸桿菌無細胞蛋白質合成的依賴性，依賴於天然存在或合成的多核苷酸”。美國國家科學院院刊。47: 1588–602。PMC 223178。PMID 14479932。

[4] 遺傳密碼

[pmid14962356-5] Hebbel RP (2003)。“鐮狀血紅蛋白不穩定性：瘧疾保護的機制”。氧化還原報告。8 (5): 238–40。doi:10.1179/135100003225002826。PMID 14962356。

[pmid11256617-6] Varani G, McClain WH (2000)。“G x U 擺動鹼基對。RNA 結構的基本組成部分，對各種生物系統中 RNA 功能至關重要”。EMBO 報告。1 (1): 18–23。doi:10.1093/embo-reports/kvd001。PMC 1083677。PMID 11256617。 {{cite journal}}: Unknown parameter |month= ignored (help)

[pmid15514035-7] Edgar B (2004). "T4噬菌體的基因組：一項考古學發掘". 遺傳學. 168 (2): 575–82. PMC 1448817. PMID 15514035.

[8] Brenner S. 科學生活 2001 年（參見第 101-104 頁） BioMed Central Limited 出版 ISBN 0954027809 ISBN 978-0954027803

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]