蛋白質組學/蛋白質組學與藥物發現/對接與評分
章節編輯和更新:Vishal Thovarai & Kevin Smith
電子郵件: pac8612@rit.edu
本節
在進行蛋白質研究以及建立虛擬庫或決定使用特定現有庫之後,此類藥物發現的下一步是對接和評分。在對接過程中,各種演算法將虛擬庫中的化合物與特定蛋白質上的指定靶點或靶點進行匹配。此階段中使用的演算法通常使用蒙特卡羅方法、遺傳演算法或增量構建,這些將在本節後面詳細介紹。
對接化合物後,將對其進行評分。評分考慮了配體與靶點之間的化學相互作用,以確定複合物的能量狀態並對所評分化合物的功效進行排名。
然後,在進行實際實驗室實驗以驗證和確定藥物先導的功效和毒性之前,將對得分最高的化合物在預測的對接方向上進行視覺檢查,以驗證計算出的穩定性。
分子對接的目的是確定兩種分子物種之間的結合相互作用,在本例中,可以是蛋白質與蛋白質之間的相互作用,也可以是蛋白質與配體之間的相互作用。當然,為了能夠模擬分子的行為,必須已經知道表示該分子及其相應特性的資料。因此,這種型別的行為推斷被稱為回顧性虛擬篩選 (Paetz)。從計算的角度來看,這在現代是透過模擬分子建模軟體或演算法來實現的。然後,模型分析大量可能出現的構象,以評估那些在能量上似乎更有利的構象。為此使用的主要演算法使用蒙特卡羅方法、遺傳演算法或增量構建。
蒙特卡羅方法演算法可用於幫助預測物理系統的行為。使用偽隨機數生成來為計算提供支援,從而產生許多配體在結合位點上的隨機構象和構型,試圖“隨機”地找到最佳匹配。鑑於可能的相互作用的複雜性和數量巨大,這種型別的演算法非常適合用於模擬分子相互作用的應用。
遺傳演算法將配體不同的狀態視為種群中的成員。這些成員會交配和突變,每一代的最佳匹配成員會被帶到下一代。在尋求最佳匹配的過程中,模擬進化以在每一代產生越來越好的匹配。突變和有害事件用於避免區域性最大值,這會讓人誤以為正在朝著一個“區域性”最佳匹配的方向努力,儘管它可能不是絕對最佳匹配。
增量構建將配體視為片段,這些片段可以是剛性的,也可以是柔性的,具體取決於已知的立體化學原理。剛性部分首先放置在目標位點的理想位置,然後放置柔性部分。最後新增柔性部分的目的是能夠完全且適當地連線所有剛性片段。增量構建的版本類似於團搜尋。在這種方法中,根據特定特徵(例如形成氫鍵的能力或官能團和側鏈之間的靜電相互作用)選擇和定位剛性片段(Krovat)。
需要決定的一項主要因素是配體、蛋白質或兩者是否將被視為剛性或柔性。當配體被視為柔性而蛋白質被視為剛性時,計算時間已經很長。這種在初始篩選中經常出現的場景的原因是:a) 由於化合物尺寸較小,配體的柔性更容易模擬;b) 配體的柔性會導致更廣泛的化合物適合特定構象,因此,在合成或獲取成本低廉且易於合成的化學物質方面,有一組備選方案可供選擇。虛擬庫中的許多化學物質實際上並不存在,或者很難獲得,因此,在多個良好匹配中進行選擇這一要素對於使 VLS 成為傳統實驗室篩選的更廉價替代方案至關重要。
將蛋白質視為柔性會大大增加對接的計算時間,因為需要考慮大量構象變化,但是,當蛋白質在體內是柔性時,這可以使對接更加準確,尤其是在以誘導契合蛋白質為目標時。某些當蛋白質被認為是剛性時,不一定是最佳匹配的配體,當允許蛋白質是柔性時,其排名可能會高得多。對於蛋白質柔性,有一些替代方案可以降低計算時間。一種方法是在對接過程中使用與已知配體結合的蛋白質的X 射線晶體學或NMR結構。這允許將虛擬庫對接到處於配體結合構象的蛋白質中。另一種方法是使用多個具有略微不同構象的蛋白質結構,這通常是在 NMR 結構測定過程中實現的。這組結構,即系綜,用於對接以找到在多個構象模型中適當地對接的化學匹配;目標是找到一種在蛋白質從未結合構象到蛋白質-配體構象的轉變過程中,可以保持對接的先導。
兩種常用的方法是表面互補性和基於模擬的方法。表面互補性方法使用傅立葉變換或快速傅立葉變換等技術將受體和配體的結構資訊轉換為數學網格,然後檢查結構之間的互補性。模擬退火和禁忌搜尋等模擬演算法通常使用能量計算來執行模擬,如後面所述。
模擬退火是一種機率型元演算法,它有許多應用,其中之一是分子對接。該演算法在最佳化函式時會建立一個良好的近似值。它透過獲取函式 E(s) 中的點s 並最小化能量來實現這一點,在分子對接中,這將導致蛋白質相互作用的最佳化。它透過執行一系列計算來實現,從s 的原始狀態移動到s’ 狀態,s’ 是一個任意數字。這被稱為轉換。轉換透過接受機率函式 n P(e,e',T) 來顯示,該函式取決於兩種狀態的能量和溫度。在函式 P 中,e 是能量,e’ 是演算法要移動到的能量狀態,T 是溫度。接受機率函式是有益的,因為當溫度值非常小時,計算將移動到更低能量級的值。機率函式的要求是,每次移動都必須是非零的。1 模擬退火的另一個方面是退火計劃。在此階段,隨著模擬的進行,溫度會緩慢降低。模擬退火中使用的引數是狀態空間、能量函式、候選生成過程鄰域、接受機率函式以及退火計劃。1
模擬退火過程流程圖
禁忌搜尋是另一種型別的演算法。這裡不同的是,它具有一個記憶體結構,並且不會嘗試計算一個可能性超過兩次。它可用於組合最佳化問題,其中目標是找到可能的最佳解決方案。它使用區域性搜尋過程從一個解決方案移動到下一個解決方案。禁忌搜尋演算法中的 N*(x) 函式被設定為記憶它已經嘗試過的最後幾個可能性 (n),因此不會重複計算。2 這使得它比其他演算法更高效 (Hou)。
由於對接和評分演算法的巨大計算需求,許多此類應用程式都是使用並行程式設計正規化開發的,因此它們可以在多個 CPU 的叢集上執行,並大大加快速度。 網格計算,一個快速發展的平行計算領域,目前正在作為專用 計算叢集 的替代方案進行研究。網格計算模擬了電力公用事業網格,將允許製藥公司所有閒置的計算機用於分散式計算網格。特別是在晚上,數百甚至數千臺閒置的工作站可以與專用叢集相媲美,而且成本只是其一小部分。然而,權衡取捨是網格計算缺乏按需保證可用性。
評分在虛擬藥物發現中緊隨對接,評估配體-蛋白質複合物的結合強度和能量狀態。評分可以使用不同程度的嚴格性。最基本的評分函式考慮 氫鍵形成、範德華相互作用和其他靜電作用力。更高階的評分函式除了考慮上述力之外,還考慮溶液的 介電常數,以及各種化學能模型(Anderson)。更基本的評分通常在初始篩選過程中完成,隨著評分複雜性的提高,迭代地使用以縮小高評分藥物先導的範圍。
另一種旨在對非金屬蛋白與配體相互作用進行“評分”的方法基於對相關分子(s)的特定原子特徵的全面分析。在考慮上述一些更基本標準(如範德華力和靜電相互作用)的同時,還根據疏水性以及結合狀態下的自由能變化(Jain)指定了經驗得分。到目前為止,該協議在快速計算和準確性方面已顯示出很大的希望,並且可以在網際網路上以蛋白質-配體結合親和力預測伺服器(BAPPL)的名義獲得 [1]。
評分的第二階段涉及視覺評估得分最高的匹配,以驗證預測的結合潛力。在最終審查步驟中,會考慮構象、鍵的排列以及相互作用表面的形狀。此外,先導物的尺寸和可用性/可生產性也包括在評估步驟中。一種易於合成但效果略差的化合物,可能比一種得分更高的配體更便宜、更值得進一步研究,而這種配體在虛擬庫之外並不存在。
在對接中需要注意的首要問題之一是蛋白質結構的解析度,以及組成蛋白質的原子的溫度。溫度是指結構測定階段由於共振和振動導致原子三維座標的不確定程度。這種振動存在於所有原子中;然而,振動越大,溫度越高,因此原子的確定座標變得越不可靠和不準確(Krovat)。
對接中的另一個問題是蛋白質的生理 pH 與蛋白質結晶時的 pH 值。這是確定潛在氫鍵位點的主要因素。許多氨基酸側鏈的質子化和去質子化隨著 pH 值的變化可能意味著緊密結合的配體和根本不結合的配體之間的區別,即使前者可能是假陽性,而後者則是假陰性。還必須考慮氫鍵的上下文,因為它們可以佔據一系列結合強度。此因素也會影響評分。
其他問題包括在寬而淺的位點結合,因為由於缺乏可能相互作用的特定形狀,表面幾何形狀的作用較小。此外,在體外可能存在的非典型結合模式可能在計算機模擬對接過程中無法檢測到(Krovat)。
由於難以解析膜結合蛋白,因此在這些情況下對接中使用 同源建模,或者從一級序列推斷的分子結構的闡明;這除了用於確定膜蛋白結構的同源建模之外。
BAPPL 連結:[2]
Bleicher,H. Konrad 等人。命中和先導物生成:超越高通量篩選。自然評論,藥物發現。2003 年 5 月:(2),369-378。
Hou,T.,Wang,J.,XU,X.,“三種用於分子對接的啟發式演算法的比較”。中國化學快報 10 (1999): 615-618
Jain,Tarum,Jayaram,B. 一種基於全原子能量的計算協議,用於預測蛋白質-配體複合物的結合親和力。FEBS Letters。2005:(579),6659-6666。
Kapetanovic,M. I. 計算機輔助藥物發現與開發 (CADDD):計算機模擬-化學-生物學方法。化學生物學國際。2007 年。
Lengauer,Thomas 等人。新技術虛擬篩選。藥物發現今日。2004 年 1 月:(9)1,27-34。
Meek,J. Peter 等人。形狀特徵;加速計算機輔助藥物發現。藥物發現今日。2006 年 10 月:(11)19-20,895-904。
Paetz,Jurgen,Schneider,Gisbert。一種用於分子生物資訊學中的虛擬篩選的神經模糊方法。模糊集和系統。2005:(152),67-82。
Krovat,m. Eva,Langer,Thierry。評分函式對基於對接的虛擬篩選中富集的影響:對腎素抑制劑的應用研究。J. 化學。資訊。計算。科學。2004 年 4 月:(3)44,1123-1129。
下一步:軟體工具