蛋白質組學/蛋白質組學導論/生物資訊學

與生物學的其他子集一樣,高通量方法的使用使得能夠生成大量的生物資料,這使得人們越來越依賴計算機來進行資料採集、儲存和分析。網際網路還使協作和資料共享成為可能,這些資料以前是不可能獲得的,從而導致了大型公共資料庫的開發,這些資料庫由世界各地的貢獻者共同維護。許多資料庫都包含與蛋白質相關的各種資訊,例如蛋白質資料庫(PDB),該資料庫處理具有確定晶體結構的蛋白質的結構和序列資訊。ExPASy 是一個流行的且經過良好管理的蛋白質組學資料庫和工具資源,包括 Prosite 蛋白質特徵和結構域資料庫、蛋白質 BLAST(基本區域性比對搜尋工具,用於相似性搜尋)和結構預測等資源。NCBI 還為多種型別的資料提供許多資源,包括蛋白質,所有這些資料都可搜尋且良好整合。
與其他生物資訊學資源一樣,“in-silico” 發現並非旨在替代實驗室技術,而是作為補充溼實驗室工作的工具。例如,如果一種被認為是跨膜蛋白的蛋白質被用基於序列的定位工具分析,並且分析結果與假設一致,那麼在得出結論之前,可能仍然值得進行實驗驗證。然而,生物資訊學工具可以節省大量時間,並且可以提供一個可能的起點進行實驗,縮小問題領域,或提供潛在的解決方案來解決難以或不可能透過實驗確定的問題,例如蛋白質摺疊問題。蛋白質摺疊已經成為許多超級計算機和分散式計算系統(例如 IBM 的 BlueGene [1] 和斯坦福大學的 Folding@Home 專案)的基準應用程式。分散式計算利用許多獨立的客戶端節點連線到一個主伺服器來獲取要處理的資料併發送回結果,使其非常適合在區域網和網際網路上使用。Grid.org 和 Folding@Home 等專案可以由任何人在自己的計算機上執行,目前擁有數千名參與者。雖然目前摺疊不能替代晶體學結構測定,但它可以提供一個合理的結構估計,可以在闡明實際結構之前對其進行研究。