結構生物化學/生物資訊學/蛋白質摺疊識別
外觀
生物資訊學中最大的問題之一是氨基酸序列、結構和蛋白質功能之間的關係。蛋白質的三維結構有助於藥物的開發、酶的工程化和蛋白質功能的分析。
結構空間及其與蛋白質同源性之間的關係存在著爭議。然而,三級結構的預測依賴於主觀片段的重複使用,而無需同源序列(目標序列和片段來源之間)。
GenTHREADER是生物學家和研究人員用來預測蛋白質三級結構的眾多方法之一。這種方法有助於檢測蛋白質模板和序列-結構比對的準確性。大多數用於摺疊預測的方法使用已知的蛋白質結構作為計算蛋白質序列譜之間比對評分的基礎。GenTHREADER 的兩個版本是 pGenTHREADER 和 pDomTHREADER 方法,它們用於識別和比對蛋白質序列,以分析它們與蛋白質結構和功能的關係。這兩個版本都具有類似的蛋白質序列譜和結構資訊的輸入;它們使用一個核心比對演算法。
pGenTHREADER 使用從序列、捲曲螺旋區域和過濾的跨膜片段構建的矩陣進行譜-譜比較。最後一步包括兩個序列-譜和譜-序列分數,這使得譜-譜匹配的分數高於其他匹配。此外,添加了一個疏水埋藏項,其作用是偏置比對在目標序列中的位置。
在確定結果時,使用模板-目標對的最佳結果來計算等效殘基數,而不是使用該方法的結果;這將比對準確性與模板選擇區分開來。選擇最佳結果顯著提高了小於 200 個氨基酸的鏈的效能,但在更長的鏈中幾乎沒有改進。當摺疊識別關係更遠時,pGenTHREADER 的效果明顯優於其他方法;當距離更近時,其他方法往往顯示出更大的改進。這些其他方法使用了摺疊識別、側鏈最佳化和模型質量評估的混合方法。