蛋白質組學/蛋白質 - 蛋白質相互作用/預測
頁面由:Dan Surdyk 編輯和更新
電子郵件:dfs6389@rit.edu
本節
蒙特卡羅方法用於蛋白質/蛋白質相互作用,它模仿了計算機科學中著名的隨機抽樣演算法。該理論總結如下:給定足夠多的初始配置,其中一個配置將成為最佳配置,或者最終導致最佳配置。該過程從一個蛋白質與另一個蛋白質的對接開始。然後根據能量、暴露疏水錶面的量、相互作用氨基酸的數量等引數計算得分。對相互作用進行隨機改變(在整個蛋白質、側鏈甚至單個原子級別!),然後根據得分是否提高來接受或拒絕該步驟。 [2]
蛋白質中的每個原子都有範德華半徑,用於建立蛋白質的範德華表面。ASA 描述了溶劑可能與該表面接觸的所有地方。它透過在範德華表面上計算“滾動”一個球體來計算,並計算它與表面接觸的部分。該表面被納入許多對接和表面斑塊程式中。 [3]
CAPRI 挑戰是歐洲生物資訊學研究所 (EBI) 評估蛋白質對接程式的一種創造性方式。研究小組從 EBI 接收蛋白質資料,並嘗試對接蛋白質。然後測試和比較他們的結果,不僅表彰應得的研究人員,而且還為科學家提供每個程式或協議優勢的比較。 [4]
幾何雜湊是一種分子建模技術,它將目標分子與感興趣的蛋白質匹配。
- TESS
TESS 是一種演算法,它使用 X 射線和 NMR 資料從 PDB 中儲存的結構中確定蛋白質的 3D 模板。可以掃描新結構以匹配這些 3D 結構,以識別功能位點。因此,TESS 用於識別新蛋白質結構的功能,並透過開發 3D 模板資料庫來設計具有特定功能的蛋白質。 [5]

德勞內三角剖分是將蛋白質表面轉化為三角形的一種方法。該方法包括在三維空間中取一組點,並形成三角形,以便如果繪製一個包含所有三個點的圓(外接圓),則該集合中的其他點不會落在該圓內。對於蛋白質表面,這些點將是原子位置。這會建立一個表面,沒有佔用更多時間和記憶體的“薄片”三角形,而這些三角形對於計算而言並沒有真正意義。 [6]
快速原子密度評估器 (FADE) 和成對原子密度逆向工程 (PADRE) 程式用於確定蛋白質的分子模型。FADE 和 PADRE 透過闡明感興趣的特徵(如縫隙、凹槽和突起)來識別蛋白質中最突出的特徵,例如與其他分子相互作用的區域。FADE 具有評估對接的蛋白質-蛋白質複合物的形狀互補性的特殊功能。 [7] FADE 和 PADRE 可從 http://www.mitchell-lab.org/mitchell-lab/FADE.php 下載。
表面形貌計算圖譜使用加權德勞內三角剖分來測量蛋白質口袋的形狀。蛋白質和某些氨基酸具有稱為腔體的特定結構,這些結構產生了蛋白質功能所需的理化性質。CASTp 是一種線上工具,它透過定位和測量 3D 蛋白質結構上的口袋和空洞來估計蛋白質的功能。CASTp 的新版本包含來自 PDB、Swiss-prot 和 SNP 的註釋版本。來自這些來源的註釋殘基被對映到 PDB 結構的表面口袋、內部空洞或其他區域。CASTp 用於研究蛋白質的表面特徵、功能區域和關鍵殘基的特定作用。 [8] [9] CASTp 可從 http://cast.engr.uic.edu 下載。
基因鄰近方法的假設是,具有相似功能的基因被轉錄在一起,作為一個稱為操縱子的單一單元。如果編碼兩種蛋白質的基因在多個基因組的染色體上是相鄰的,那麼這些蛋白質將具有相似的功能。這些儘管在它們之間存在遺傳距離但仍一起轉錄的基因被稱為共調控基因。即使在遠緣生物體中,共調控基因的保守性也是觀察到的。操縱子揭示了組成基因之間的功能聯絡。與其他基因組推斷方法相比,基因鄰近方法是最廣泛使用的方法。該方法用於檢測以前未知的相互作用。基因鄰近預測的例子包括透過與真核生物基因組進行比較來預測古細菌外泌體。 [10] [11]
系統發育譜描述了蛋白質在基因組已被測序的特定生物體中存在或不存在的情況。系統發育譜包含 n 個條目,其中 n 表示已測序的基因組數量。在第 n 個基因組中存在與給定蛋白質的同源物用 1 表示,蛋白質不存在用 0 表示。然後根據其系統發育譜的相似性對蛋白質進行聚類。功能相關的蛋白質存在於同一個簇中。使用這種方法可以檢測蛋白質和蛋白質結構域。這種方法的主要缺點是成本高、依賴於高資訊譜以及錯誤檢測遠緣生物體之間的同源性。錯誤相關性的最顯著例子是檢測所有基因組中存在的普遍非連線蛋白質之間的相關性。 [12] [13] [14]
羅塞塔石碑方法也稱為基因融合方法。一些相互作用的蛋白質對在其他生物體中具有同源物,這些同源物被融合成一條單一的蛋白質鏈。這種融合蛋白被稱為羅塞塔石碑蛋白。該方法檢測不同基因組中的蛋白質相互作用。例如,大腸桿菌中的 Gyr A 和 Gyr B 是獨立的蛋白質亞基,而這些蛋白質在釀酒酵母中發現的同源物是單一的蛋白質拓撲異構酶-2。羅塞塔石碑方法用於預測大約 6.4% 的所有實驗相互作用。在大腸桿菌中,該方法發現了大約 6,809 對相互作用的非同源蛋白質。 [15] [16] [17]

該方法基於測量兩種不同生物體之間的進化距離。共同進化是非同源蛋白質在系統發育樹中的相似性。透過計算兩個不同蛋白質家族的距離矩陣之間的相關係數來量化相似程度,以指示它們的共同進化。為了計算相關係數,需要兩個元素之間的對應關係,但這並不總是可用的。因此,開發了幾種演算法來識別特定的相互作用模式。在共同進化中,一種蛋白質的變化導致其功能喪失,而另一種基因的相關變化則彌補了這種喪失。由於物種形成過程,任何蛋白質的樹之間總是存在一些相似性。這被稱為“背景相似性”。它由 16S rRNA 序列構建,最終的距離矩陣透過從原始系統發育樹獲得的進化距離中減去基於 rRNA 的距離來計算。共同進化研究的廣泛研究示例是預測 DNA 細菌素及其免疫蛋白的相互作用伴侶。共同進化方法也用於預測結構域相互作用。 [18]
分類方法用於預測蛋白質和結構域的相互作用。這些方法透過使用各種資料來源訓練分類器來區分真正的相互作用蛋白質對和錯誤的非相互作用蛋白質對。在分類方法中使用了許多分類器,最流行的分類器是隨機森林決策,其次是支援向量機。最常用的分類方法是核方法,它在特徵空間中用一組成對比較來提供資料的向量表示。特徵向量代表了蛋白質的特定資訊,例如蛋白質相互作用、特定蛋白質的結構域組成。 [19]
關聯方法通常用於預測結構域相互作用。關聯方法用於區分相互作用蛋白質和非相互作用蛋白質。使用不同的分類器(如相關的序列特徵)來區分這一點。相關的序列特徵分別考慮每對相互作用的結構域,而忽略蛋白質中存在的其他結構域。這些方法透過計算對數機率得分來區分相互作用蛋白質和非相互作用蛋白質。對數機率得分 (log2(Pij/PiPj)) 是透過取一個蛋白質對中觀察到的結構域頻率與資料中背景頻率的比率來計算的。結構域相互作用是根據正的對數機率得分預測的。根據蛋白質相互作用對中結構域的出現情況,也可以進行蛋白質預測。 [20]
該方法用於預測域的相互作用。與關聯方法相比,這是一種優勢,因為貝葉斯網路模型考慮了缺失和錯誤的互動資料。貝葉斯引數是使用最大似然估計方法估計的。最大似然估計方法透過最大化推定域對相互作用的機率來計算評分方案中的實驗誤差。似然函式(θ)是許多引數的函式,例如λij(域i和j相互作用的機率)、fp(假陽性率)、fn(假陰性率),因此直接最大化似然函式非常困難。因此,使用期望最大化演算法透過計算兩個迭代集中的完整資料來找到未知引數的最大似然估計:1)觀察資料:包括蛋白質-蛋白質相互作用;2)未觀察資料:包括非蛋白質-蛋白質相互作用。 [21]
域對排除分析
[edit | edit source]該方法是對最大似然估計方法的改進,它預測非特異性相互作用。域對排除分析檢測蛋白質之間特定且罕見的相互作用,這些相互作用具有較低的θ值。這些相互作用是透過計算Eij得分來估計的,Eij得分是給定域i和j相互作用時兩個蛋白質相互作用的機率與給定i和j不相互作用時兩個蛋白質相互作用的機率的對數比率。分子中的機率是使用期望最大化過程計算的,分母中的機率是透過重複該過程計算的,其中域對相互作用的機率為零。較高的E得分表示域相互作用的可能性較高,而較低的值表示競爭域負責相互作用。因此,域對排除分析檢測具有低θ和高Eij值的相互作用。儘管它不能檢測假陽性和假陰性,但它在很大程度上檢測到了真陽性。 [22]
p值方法
[edit | edit source]該方法的零假設檢驗了蛋白質對中域的存在是否影響蛋白質的相互作用。p值方法中的統計量是透過考慮兩個因素來計算的。它們是稱為實驗誤差的假陽性比例和稱為資料集不完整性的假陰性比例。該方法的理想參考分佈是透過隨機排列蛋白質中的域獲得的,以使蛋白質相互作用保持穩定。然後,考慮到參考分佈獲得的p統計量表明,給定兩個蛋白質相互作用,域相互作用的可靠性。p統計量的值與蛋白質相互作用之間存在反比關係。給定兩個蛋白質相互作用,具有最低p值的域對最有可能相互作用。如果給定蛋白質對中有九個或更多個域,則p值方法效果很好。 [23]
確定蛋白質-蛋白質相互作用的可用軟體程式
[edit | edit source]蛋白質相互作用計算器
[edit | edit source]蛋白質相互作用計算器 (PMID:17584791) 是一個伺服器,它識別各種型別的相互作用;例如,蛋白質內部或複合物中蛋白質之間的二硫鍵、疏水相互作用、離子相互作用、氫鍵、芳香族-芳香族相互作用、芳香族-硫相互作用和陽離子-π相互作用。它還確定可及表面積以及殘基到蛋白質表面的距離。輸入應為蛋白質資料庫 (pdb) 格式。相互作用是根據經驗或半經驗規則集來計算的。所有相互作用和鍵可以在一個站點中看到,並且還可以使用 RasMol 和 Jmol 介面視覺化識別出的殘基之間的相互作用/鍵。 [24] URL: http://crick.mbu.iisc.ernet.in/~PIC/
DOCK
[edit | edit source]DOCK 軟體與基於 UNIX 的平臺相容。DOCK 在使用者選擇的受體結構區域中生成推定配體的許多可能方向。這些方向使用幾種評分方案進行評分,這些評分方案旨在測量受體-配體複合物的空間和化學互補性。DOCK 有許多應用,例如檢測蛋白質-蛋白質複合物的結合方向、蛋白質-DNA 複合物、評估單個配體的可能方向、對資料庫中的分子進行排名。它還在不同的資料庫中搜索充當酶抑制劑、DNA 結合化合物、與受體結合的化合物等,DOCK 使用幾何匹配演算法透過將配體的負像疊加到結合口袋來評估剛性受體對接。 [25][26] DOCK 的官方網站是 http://dock.compbio.ucsf.edu/
autoDOCK
[edit | edit source]AUTODOCK 由許多自動對接工具組成。它預測底物和候選藥物如何與已知 3D 結構的受體或蛋白質結合。它有兩個主要程式。第一個程式將配體對接到描述目標蛋白質的一組網格上。第二個程式是 AutoGrid,它預先計算這些網格。AUTODOCK 也與基於 UNIX 的平臺相容。AUTODOCK 在許多領域都有應用,例如 X 射線晶體學、基於結構的藥物設計、蛋白質-蛋白質對接、先導最佳化、組合文庫設計等。 [27] [28] [29]
ICM(內部座標機制)
[edit | edit source]ICM 使用鍵長、扭轉角、鍵角來確定結構預測。它執行快速而準確的對接模擬。它具有一套獨特的工具,用於準確的配體-蛋白質對接、肽-蛋白質對接和蛋白質-蛋白質對接,包括互動式圖形工具。 [30] 訪問 Abagyan 實驗室:http://abagyan.scripps.edu/lab/web/man/frames.htm 或 www.molsoft.com 瞭解更多資訊。
FleXX
[edit | edit source]FleXX 是一款高速計算機程式,用於確定結合模式。如果蛋白質的三維結構已知,它可以在幾秒鐘內檢測到蛋白質-配體複合物。FLEXX 透過從已知的蛋白質 3D 結構預測蛋白質-配體複合物的幾何形狀來估計蛋白質-配體複合物的結合親和力。FLEXX 在蛋白質預測中主要有兩個應用:1)複合物預測:當存在蛋白質和小分子,但不知道蛋白質配體複合物的結構時,使用此方法。它建立並對一系列可能的蛋白質-配體複合物進行排序。2)虛擬篩選:它用於從化合物集和給定蛋白質中對用於實驗測試的化合物進行優先排序。FLEXX 中的放置演算法基於兩個分子之間的相互作用,並應用 Boehm 函式進行評分。FLEXX 中廣泛使用兩個資料庫來預測蛋白質-配體相互作用。它們是 1)MIMUMBA 扭轉角資料庫:用於建立構象異構體。2)相互作用幾何資料庫:用於精確描述分子間相互作用模式。該軟體的優勢在於它是在結構基礎的藥物設計中最好的富集工具,透過使用高速對接在蛋白質結合位點生成先導結構的姿勢並對接巨大的庫。 [31][32] 從以下地址下載程式:http://www.biosolveit.de/download/
GRAMM(全域性範圍分子匹配)
[edit | edit source]GRAMM 是一種經驗方法,透過改變原子-原子勢的範圍來平滑分子間能量函式。它是一個用於蛋白質對接的免費程式,用於高解析度和不精確的研究。它根據兩個分子的原子座標,透過對分子進行相對平移和旋轉進行詳盡的 6D 搜尋,來預測複合物的結構。複合物可以由兩個蛋白質、蛋白質和小分子、兩個跨膜螺旋等組成,GRAMM 在 SGI 系列、SUN SPARC、IBM RS6000、DEC Alpha 和 PC 上編譯。 [33][34] 要檢視 GRAMM 網站:http://reco3.musc.edu/gramm/
GRAMM X
[edit | edit source]GRAMMX 是 GRAMM 的擴充套件版本。它是透過更新平滑勢、細化階段和基於知識的評分完成的。對接問題由一個 320 處理器 Linux 叢集處理。GRAMMX 可以用 Python 和 C++ 實現。在以下地址執行 GRAMMX 模擬:http://vakser.bioinformatics.ku.edu/resources/gramm/grammx/
FTDOCK
[edit | edit source]FTDock 是一款免費程式,它對兩個生物分子執行剛性體對接,以預測它們的正確結合幾何形狀。FTDock 輸出多個預測,可以使用生化資訊對這些預測進行篩選。該軟體在 RedHat Linux 和奔騰平臺上執行。FTDock 使用傅立葉變換來確定對接。 [35] 從以下地址下載程式:http://www.bmm.icnet.uk/docking/download.html
ZDOCK
[edit | edit source]它是一種計算技術,其中根據兩個蛋白質的獨立結晶結構來預測兩個蛋白質之間複合物的結構。ZDOCK 使用傅立葉變換來搜尋蛋白質的所有可能的結合模式,並根據形狀互補性、去溶劑化能和靜電統計資料進行評估。 [36] 訪問波士頓大學網站:http://zdock.bu.edu/software.php
更多資訊
[edit | edit source]- 蒙特卡羅方法:http://www.desy.de/~heramc/mclist.html
- 可及表面積
- CAPRI 主頁:http://capri.ebi.ac.uk/
- TESS 位於:http://www.biochem.ucl.ac.uk/bsm/PROCAT/manual/man1.html
- FADE 和 PADRE:聖地亞哥超級計算機中心 http://www.sdsc.edu/CCMS/FP/
- CAST:http://sts.bioengr.uic.edu/castp/
參考資料(開放訪問)
[edit | edit source]- ^ 維基百科關於蛋白質-蛋白質對接(蒙特卡羅部分)的頁面:http://en.wikipedia.org/wiki/Protein-protein_docking#Monte_Carlo_methods
- ^ NACCESS S.Hubbard 和 J.Thornton。1992 年。 http://wolf.bms.umist.ac.uk/naccess/naccess.html
- ^ CAPRI 關於蛋白質-蛋白質對接結構預測比較評估的社群範圍實驗 http://capri.ebi.ac.uk/
- ^ Wallace AC、Borkakoti N、Thornton JM。1997 年。TESS:一種幾何雜湊演算法,用於推匯出用於搜尋結構資料庫的 3D 座標模板。
- ^ 維基百科關於德勞內三角剖分的頁面:http://en.wikipedia.org/wiki/Delaunay_triangulation
- ^ Mitchell, JC、Kerr, R 和 Ten Eyck, LF。2001 年。用於分子形狀表徵的快速原子密度測量。J.Mol. Graph. Model. 19(3): 324-329,2001 年。
- ^ Joe Dundas、Zheng Ouyang、Jeffrey Tseng、Andrew Binkowski、Yaron Turpaz 和 Jie Liang。2006 年。CASTp:計算出的蛋白質表面地形圖,具有功能註釋殘基的結構和地形對映。Nucl. Acids Res., 34:W116-W118。
- ^ Dundas J、Ouyang Z、Tseng J、Binkowski A、Turpaz Y 和 Liang J。2006 年。CASTp:計算出的蛋白質表面地形圖,具有功能註釋殘基的結構和地形對映。
- ^ Marcotte, EM、Pellegrini, M、Ho-Leung, N、Rice, DW、Yeates, TO、Eisenberg, D。1999 年。從基因組序列中檢測蛋白質功能和蛋白質-蛋白質相互作用。Science 285:751–753.
- ^ Shoemaker, BA、Panchenko, AR。2007 年計算方法來預測蛋白質和結構域相互作用夥伴。PLoS Comput Biol 3(4): e43。
- ^ Timothy Palzkill,蛋白質組學,Kluwer Academic Publishers。 http://books.google.com/books?id=JoEgI1a3yrAC&pg=PA78&lpg=PA78&dq=Gene+neighbor+method+in+proteomics&source=bl&ots=k7ByV84JZf&sig=wSdaO0l91A9BX-cFt9xwjQil3o4&hl=en&ei=034BSvLoBomeM4PclOcH&sa=X&oi=book_result&ct=result&resnum=1#PPA76,M1
- ^ K. G. Tina、R. Bhadra 和 N. Srinivasan。2007 年。PIC:蛋白質相互作用計算器,核酸研究,第 35 卷,網路伺服器問題 W473–W476。
- ^ BioSolveIT http://www.biosolveit.de/FlexX/
- ^ 基於結構的藥物設計和分子建模。 http://www.imb-jena.de/~rake/Bioinformatics_WEB/dd_tools.html
- ^ 波士頓大學生物資訊學。 http://zlab.bu.edu/zdock/