跳轉到內容

生物化學/生物資訊學

來自華夏公益教科書,開放的書籍,開放的世界

同源性

[編輯 | 編輯原始碼]

當科學家研究不同物種之間蛋白質的關係時,他們必須確定這些蛋白質是否彼此同源。同源蛋白是具有共同祖先的蛋白質。同源物有兩類:直系同源物和旁系同源物。直系同源物是在不同物種中發現的具有相似功能的同源蛋白。直系同源物是由於物種形成而產生的。旁系同源物是在同一物種中發現的同源蛋白。它們具有非常相似的結構,但在生物體中起著不同的作用。旁系同源物是由於物種內部的基因複製而產生的。科學家透過研究DNA序列、氨基酸序列、蛋白質的三級結構來確定蛋白質是否同源。換句話說,他們研究蛋白質的序列比對和結構比對。

序列比對

[編輯 | 編輯原始碼]

在分析DNA序列或氨基酸序列的相似性和差異時,科學家研究DNA序列的比對或蛋白質的氨基酸序列的比對。DNA序列比對對氨基酸序列比對的敏感度較低。DNA序列只包含4個鹼基。這意味著兩個殘基相同的機率是4分之1。對於氨基酸序列,兩個殘基相同的機率是21分之1。每個比對的相似程度評分由矩陣決定。有各種方法來確定核苷酸序列的最佳比對。一種著名的方法是由Needleman Wunsch演算法確定的。

矩陣是一種用於確定序列(DNA或氨基酸)之間相似程度的方法。矩陣考慮了兩個因素:保守性和頻率。

保守性透過比較殘基的物理性質(如疏水性、電荷和大小)來確定某個殘基是否可以替換另一個殘基。例如,如果兩個殘基都是疏水的,它們可能可以相互替換。如果兩個殘基的電荷不同,它們可以相互替換的機率非常小。

頻率表示殘基出現的頻率。例如,如果序列A的殘基A佔20%,殘基B佔30%,而序列B的殘基A佔21%,殘基B佔35%,那麼這些殘基A和B的流行度可能表明這些序列彼此相關。

矩陣使用的技術是序列之間的滑動、序列中引入的間隙以及序列中某些殘基的刪除。該方法用於提高比對的相似性。在滑動中,一個序列相對於另一個序列滑動。例如,在將序列滑動一個殘基後,序列之間的相似性可能會增加,因為更多殘基是相同的或彼此相似的。在序列中引入間隙以提高殘基相似性。例如,如果序列A具有此特定範圍的殘基,這些殘基對它的功能或結構並不重要或至關重要,但它在非重要殘基範圍之後具有重要的殘基範圍,而另一個序列B則缺乏非重要殘基範圍,但確實具有與序列A相同的重要的殘基範圍。然後在序列B中引入一個間隙以彌補非重要殘基範圍。對於刪除,序列中的某些殘基被省略。通常刪除不重要的殘基以提高序列之間的相似性。

矩陣有兩種型別:恆等矩陣和替換矩陣。恆等矩陣只為相同的殘基分配分數,而替換矩陣可能為不同的但從保守的角度來看相似的殘基分配分數。替換矩陣比恆等矩陣更準確,因為在考慮保守替換時,替換矩陣對發生頻繁替換的序列給出較高的正分數,對發生罕見替換的序列給出較高的負分數。因此,替換矩陣比恆等矩陣更敏感。

結構比對

[編輯 | 編輯原始碼]

結構比對是對一級、二級和三級結構相似程度的分析。在蛋白質中,三級結構比一級結構更保守,因為三級結構與蛋白質的功能更密切相關。結構比對的目的是透過建立序列模板來改進序列比對(之前討論過的方法)。由於某些區域比其他區域更保守,因此序列模板是映射出對特定蛋白質家族成員在結構上和功能上重要的保守氨基酸殘基的模板。因此,序列模板有助於找到屬於某個家族成員的蛋白質。

SIRCh 生物資訊學連結(精選網際網路資源)

華夏公益教科書