蛋白質組學/蛋白質組學與藥物發現/軟體工具
本節
這些工具和資料庫是公開資源的示例,可供藥物發現團隊使用。私有資料庫通常也包含公開資源的內容。
資料庫
應用程式
- ExPASy 蛋白質組學伺服器 [3] 它包含許多用於蛋白質序列和結構分析的有用工具。
印刷/網路資源
- Landes Bioscience 的藥物設計 [4] NCBI 上的一本免費書籍,其中包含關於藥物發現的良好資訊。
- 藥物發現新聞 [5] 包含許多關於藥物發現的最新新聞和趨勢的免費文章。
- 生物技術資訊目錄 [6] 這是一個基因組學、蛋白質組學和藥物發現的連結列表。
免費庫
- 人類代謝組資料庫[7] HMD 是一個免費的資料庫,其中包含略低於 2500 種代謝物,這些代謝物與超過 5500 種對應於它們的蛋白質和 DNA 序列相關聯。
- 美國國立癌症研究所 (NCI) 資料庫 [搜尋增強型 NCI 資料庫瀏覽器] 這個公開資料庫包含超過 250,000 種化合物,以及詳細的搜尋功能。
- ZINC[8] ZINC 是加州大學舊金山分校的一個免費庫,包含驚人的 460 萬種可搜尋化合物,這些化合物以多種格式提供,並提供供應商連結以供訂購。
付費庫
- 可用化學品目錄 (ACD) [9] ACD 是 Elsevier MDL 推出的專有化學資料庫。它包含超過 480,000 種獨特的化學化合物;多個學術機構可以訂閱使用該資料庫。
- Quantum Lead 虛擬篩選服務 [10] 這個付費庫包含 50,000 種化合物。該公司還提供其他化合物分析軟體。
- 治療靶點資料庫 (TTD) [11] TTD 包含有關已知治療性蛋白質和核酸靶點的資訊。此外,它描述了靶向疾病狀態並提供通路資訊。目前,TTD 包含 1535 個藥物靶點和 2107 個藥物/配體 (Chen)。
對接問題中的搜尋空間由所有可能的構象(分子 3D 結構中原子相對位置,與座標系無關)和構型/取向(分子原子在經歷座標系中的旋轉和平移後所處的位置,與配體配對的蛋白質)組成。在現有的計算資源下,不可能詳盡地探索所有可能姿勢的搜尋空間(姿勢是分子在座標系中構象構型的名稱)。不用說,每個對接模擬都是準確性和速度之間的權衡,一個好的對接工具預計在這兩者之間保持合理的平衡。對接程式的成功可以說取決於兩個因素:評分函式和搜尋演算法。
- 評分函式將正確(實驗驗證)的對接姿勢與不正確的姿勢區分開來。它估計配體與受體之間的結合親和力。
- 搜尋演算法根據評分函式找到最佳的對接姿勢。
有許多競爭性的對接工具可供使用,來源廣泛,從昂貴的、功能豐富的企業套件到由學術/研究機構開發的簡單但功能強大的應用程式。
DOCK 是由 Irwin Kuntz 領導的團隊在加州大學舊金山分校開發的 (http://dock.compbio.ucsf.edu/)。最新版本 DOCK 6; 用 C++ 編寫,並在功能上分為獨立的元件,從而賦予程式靈活性。Kuntz 實驗室為所有程式提供原始碼,這些程式碼可供學術機構免費使用,但工業組織需要支付許可費。以下是作者為 DOCK 引用的部分應用程式:
- 預測小分子-蛋白質複合物的結合模式
- 搜尋配體資料庫,尋找抑制酶活性的化合物
- 搜尋配體資料庫,尋找與特定蛋白質結合的化合物
DOCK 的主要可執行檔案是從標準 unix shell 中的命令列執行的,Windows 使用者需要使用類似 Linux 的環境(如 Cygwin)來執行它。DOCK 使用“增量構建”對接演算法,這實際上意味著配體最初被“片段化”。
- 選擇一個基礎的“錨點”。
- 將錨點片段放置/錨定到活性位點。
- 然後逐步新增其他片段。
蛋白質的活性位點由程式 sphgen 識別,該程式還生成填充位點的球體中心。得分網格由程式 grid 生成。程式 DOCK 然後將球體與配體原子匹配,並使用得分網格來評估配體取向,最後根據能量得分進行最小化。DOCK 6 和對接過程的一般綜合教程可在此處找到:http://www2.umdnj.edu/~kholodvl/tut/DOCK60_intro_linux.pdf
Glide 是 Schrödinger (http://www.schrodinger.com/) 推出的商業產品,被宣傳為“配體-受體對接的完整解決方案”。該工具的一些亮點包括:
- 一系列速度與準確性的選擇,從用於數百萬種化合物的 HTVS(高通量虛擬篩選)模式,到 SP(標準精度)模式,到具有高階評分的 XP(額外精度)模式。
- 使用者友好介面:Glide 自動執行大型化合物庫的計算,並以摘要和詳細報告兩種形式組織對接結果。“Maestro”使用者介面提供高階視覺化和分析工具來檢查配體-受體相互作用。
- 跨平臺(Linux、SGI 和 IBM/AIX)和並行處理支援。
Glide 使用“隨機搜尋”對接演算法。該演算法近似於對受體位點中配體位置、取向和構象進行完整的系統搜尋。能量最小化階段利用蒙特卡羅模擬演算法。
然而,Glide 的增強功能和易於使用的介面是有代價的,既有經濟上的,也有計算上的。
Yucca 是一種專為小分子對接而設計的全新演算法,由弗吉尼亞理工大學計算機科學系的 Vicky Choi 開發。該演算法 (仍在積極開發中) 基於高效的區域性搜尋啟發式演算法,並與構象生成器 OMEGA (Optimized Molecular Ensemble Generation Application) 結合使用,生成了一組低能量構象。Yucca 利用“多構象”演算法。從 OMEGA 獲得的構象隨後被剛性對接,並對構型進行粗略取樣。然後對每個構型進行區域性最佳化,以達到區域性最小值。
與其他現有演算法相比,Yucca 的評估結果表明它是一種具有競爭力的工具,但它仍在不斷開發和改進,以新增和改進功能。正在進行的改進包括:該工具自己的構象生成器、更好的評分函式、靈活受體對接和虛擬篩選。
其他可用的軟體工具包括
- BAPPL [12]
蛋白質-配體結合親和力預測伺服器是一個工具,可用於計算非金屬蛋白質-配體複合物的結合能。
- AutoDOCK [13]
AutoDOCK 與 DOCK 一樣,試圖確定化合物在藥物靶標中的方向。AutoDOCK 作為一個對接和評分包,也包含評分函式。AutoDOCK 也已應用於蛋白質-蛋白質對接問題。
- 使用 HyperChem 進行對接研究 [14]
一個聲稱使用新型對接演算法的新系統。
- FleXX[15]
FleXX 是另一個廣泛使用的對接程式,以其速度著稱,相比之下,許多其他應用程式的執行速度都比較慢。
- 分子對接伺服器 [16]
分子對接伺服器是一個網際網路服務,可以計算小分子與蛋白質相互作用的位點、幾何形狀和能量。
- ZLAB[17]
ZLAB 在學術界是免費的,但商業上需要透過 Accelrys 購買付費許可證。它是一個兩階段的對接系統,ZLAB 執行初始 FT 計算,而 RLAB 最佳化最高得分的結果。
有關其他軟體的連結,請參閱 維基百科分子對接 [18] 站點。
雖然目前有很多應用程式可以模擬分子間相互作用,但仍有很大的改進空間。新的應用程式和演算法正在不斷開發,在準確性和速度之間取得完美平衡的鬥爭仍然是關鍵因素之一。例如,Glide 儘管在準確性和易用性方面都是最佳表現者之一,但在計算時間方面卻損失慘重。DOCK 和 AutoDock 等機構設計的軟體包也有其優勢,因為它們一直在不斷改進和更新。但是,大多數此類學術軟體都是基於命令列的,對於大多數使用者來說學習曲線非常陡峭。靈活受體對接 (目前計算量非常大) 等其他各種問題仍然是活躍的研究領域。
參考文獻
[edit | edit source]Choi, Vicky. “Yucca: An Efficient Algorithm for Small-Molecule Docking."[19] 化學與生物多樣性 2 (2005): 1517-1524。
Flower, Darren. "分子資訊學:銳化藥物設計的尖端"[20]。無出版商:英國皇家化學會,2002 年。
Kellenberger, E 等。“對八種對接工具進行對接和虛擬篩選準確性的比較評估。”蛋白質 57.2 (2004): 225-242。
Kuntz, Irwin 等。“DOCK 6.0 使用者手冊。”加州大學舊金山分校 DOCK 官方網站。2006 年 7 月。2006 年 11 月 12 日 http://dock.compbio.ucsf.edu/DOCK_6/dock6_manual.htm>。
Perun, Thomas J 和 C L Propst。 “計算機輔助藥物設計”。無出版商:Marcel Dekker, Inc,1989 年。
Schrödinger。“Glide 4.0 使用者手冊。”Biowulf。2006 年 4 月。Schrödinger。2006 年 11 月 12 日。
下一章: 貢獻者