跳轉到內容

蛋白質組學/蛋白質鑑定 - 質譜/資料庫

來自華夏公益教科書
Previous page
質譜應用
蛋白質鑑定 - 質譜 Next page
下一章 - 蛋白質一級結構
資料庫


本節


質譜資料庫在維護大量 MS 實驗資料方面面臨著獨特的挑戰,因為資料量大且複雜。雖然產生的實際資料(主要是本章前面討論的峰資料)相對線性,但產生光譜的各種技術差異導致了試圖將質譜實驗必須呈現的格式標準化的重大複雜性。儘管在標準化這些資料型別方面取得了重大進展,但從一個光譜資料庫到另一個光譜資料庫之間仍然存在著很大的不一致。這部分是由於技術的多種變化以及應用依賴性的變化程度,以目的驅動的質譜在很大程度上決定了實驗設計(包括裝置、協議和材料),以及預期結果的格式。 [1] 因此,儘管存在一些標準資料格式(以前討論過的基於 XML 的資料型別)以及大量成熟的資料庫,但在有效、以目的為導向的光譜資料探勘方面仍然存在著重大挑戰。


資料庫示例

[編輯 | 編輯原始碼]

也許第一個將光譜資料組織成一個經過整理的來源的嘗試是美國國家標準與技術研究院 [2] 與美國環境保護署 (EPA) 和美國國立衛生研究院 (NIH) 共同做出的。該標準參考資料庫始於 1970 年,是一個詳細的光譜資料集合,採用通用資料型別,需要最少的資料量來描述實驗,以及用於呈現來自各種 MS 應用的光譜資料的一種標準格式。然而,更專注的儲存庫更為常見,這些儲存庫用於儲存和整理特定型別的光譜。這種型別的資料庫的一個例子是質譜資料庫委員會的綜合藥物庫 [3],其中包含有關藥物物質、代謝物和中間體化合物的光譜資料。其他包含蛋白質組學資料的資料庫包括


其他資源

[編輯 | 編輯原始碼]

常見碎片表:http://ull.chemistry.uakron.edu/gcms/

資料庫彙編:http://www.infochembio.ethz.ch/Links/en/spectrosc_mass.html

光譜資料庫:http://www.chemlin.de/chemistry/spectral_database.htm

光譜資料表:http://www.lohninger.com/spectroscopy/dball.html

質譜資訊和分析:http://www.dkfz.de/spec/glycosciences.de/sweetdb/start.php?action=form_profiling_search

計算機光譜資料庫:http://www.hellers.com/steve/resume/p125.html

公司資料庫:http://www.medibix.com/CompanySearch.jsp?cs_choice=c&clt_choice=t&treepath=15442&stype=i

新的摘要文章

[編輯 | 編輯原始碼]

Vizcaíno JA,Côté R,Reisinger F,Barsnes H,Foster JM,Rameseder J,Hermjakob H,Martens L。蛋白質組學鑑定資料庫:2010 年更新。核酸研究。2010 年 1 月;38(資料庫問題):D736-42。Epub 2009 年 11 月 11 日。

審稿人:Ben H。

主要關注點

[編輯 | 編輯原始碼]

本文旨在強調蛋白質組學鑑定資料庫的最新進展和修改,並指出其在收集和儲存質譜 (MS) 資料方面的至關重要作用。資料庫中的資料來自各種實驗,並以一種允許以通用格式進行簡單和複雜查詢的格式儲存。資料庫一直在不斷增長,在 2008 年到 2010 年的兩年中,該資料庫已擴充套件到包含超過 250 萬個蛋白質 ID 和 1150 萬個肽。它還包含超過 5000 萬個光譜。所有這些資料來自大約 60 種不同的生物體。其中包含的資料主要是蛋白質和肽 ID、MS 質譜以及任何相關的元資料。

新術語

[編輯 | 編輯原始碼]
蛋白質組學鑑定資料庫 (PRIDE)
一個集中、公開且符合標準的資料庫,其中包含各種蛋白質組學資料。(http://www.ebi.ac.uk/pride/
本體查詢服務 (OLS)
用於控制詞彙和本體查詢的查詢介面。(http://www.ebi.ac.uk/ontology-lookup/
蛋白質識別符號交叉引用系統 (PICR)
一個旨在將蛋白質序列與蛋白質 ID 進行匹配的系統。(http://www.ebi.ac.uk/Tools/picr/implementation.do
按需資料庫 (DoD)
用於生成 FASTA 序列自定義資料庫的工具。(來源:http://)
PRIDE 光譜檢視器
用於檢視蛋白質組學鑑定資料庫中光譜的工具。(http://www.ebi.ac.uk/pride/viewSpectrumHelp.do
PRIDE 轉換器
用於將各種蛋白質組學資料轉換為 PRIDE XML 格式,以便提交到 PRIDE 並符合提交標準的工具。(http://code.google.com/p/pride-converter/#What_is_PRIDE_Converter?)
蛋白質組學交換
一個旨在為各種蛋白質組學儲存庫提供共同提交點的聯盟。它還致力於鼓勵儲存庫之間共享資訊。(http://www.proteomexchange.org/

蛋白質組學鑑定資料庫 (PRIDE) 於 2005 年建立,以應對大量蛋白質組學資料。它並不是唯一一個作為蛋白質組學資料儲存庫的資料庫。其他資料庫包括 GPMDB、蛋白質百科、肽譜圖和 NCBI 的肽組。提交到 PRIDE 資料庫的資料可以透過登入帳戶與審稿人和編輯匿名共享。此功能使 PRIDE 資料庫成為各種期刊(包括《自然生物技術》、《蛋白質組學》和《自然方法》)的首選資料提交平臺。有兩個工具對 PRIDE 資料庫的增長產生了非常積極的影響。它們是本體查詢服務 (OLS) 和蛋白質識別符號交叉引用系統 (PICR)。按需資料庫 (DoD) 是第三個新增到資料庫以提高其實用性的工具。

PRIDE 中包含的資料非常多樣化,而且隨著時間的推移,資料的多樣性還在不斷增加。截至 2010 年,人類在資料庫中的代表性最多,佔所有蛋白質資料的 38% 和所有肽資料的 36%。細菌是生物體中最具多樣性的群體,資料庫中代表了 20 個不同的物種。提交到 PRIDE 的最大實驗約為 85GB,與秀麗隱杆線蟲基因組有關。目前 PRIDE 中最大的實驗集是關於大鼠分泌途徑的實驗集。令人驚訝的是,該資料庫還包含來自各種滅絕動物的資料,最引人注目的是霸王龍。

PRIDE 網頁介面中的主要改進是能夠提交片段離子註釋。然後,這些資料可以使用線上“PRIDE 光譜檢視器”進行視覺化。另一個開發的功能是將 PICR 對映整合到各種工具中。這些工具包括維恩圖工具、查詢和 BioMart 介面。“鑑定詳細資訊檢視”也進行了修改,以考慮 PICR 對映。

PRIDE 轉換器的加入極大地簡化了提交流程,導致資料提交量激增。該工具提供了一個簡單的嚮導,可將各種蛋白質組學資料格式轉換為 PRIDE XML 格式以供提交。除了轉換資料之外,現在還可以透過 FTP 伺服器提交非常大的資料集。這實際上消除了資料提交的所有大小限制。

PRIDE BioMart 介面用於將 PRIDE 中的資訊與其他資源整合。這些資源的數量在不斷增長。能夠將這些資源連結在一起,以便更清楚地瞭解生物學整體,這對我們理解生物學至關重要。未來的目標包括實施一項技術,允許使用 PRIDE 和 NCBI 作為主要提交點,在社群所有成員之間共享蛋白質組學資料。所有資料將共享並公開提供,以確保在科學界充分公開。

與傳統蛋白質組學課程的相關性

[編輯 | 編輯原始碼]

在過去十年中,蛋白質組學領域取得了爆炸式增長,資訊量也大幅增加。質譜法只是眾多技術中的一種,它產生了大量資料,現在儲存在 PRIDE 中。在任何蛋白質組學課程中,瞭解能夠儲存和共享資料以及從資料中獲得的資訊的重要性都非常重要。擁有一個用於共同訪問共享資料的單一位置,對於任何學習蛋白質組學的人來說都具有巨大的優勢。

華夏公益教科書