蛋白質組學/蛋白質組學與藥物發現/蛋白質聚集
章節作者:Ashlee Benjamin 和 Rhea Sanchez
聯絡 amb4541@rit.edu 或 ris6859@rit.edu 以獲取貢獻
本節
蛋白質聚集近年來已成為一個越來越受關注的話題,尤其是在製藥研究中。蛋白質聚集通常在生物製藥研究的後期階段或生產中遇到。聚集體的存在通常會導致免疫反應,從而拒絕該產品,有時還會干擾身體的正常功能。聚集會導致幾種嚴重的疾病,如阿爾茨海默病和II 型糖尿病 [1]。為研究而開發的抗體或其他小分子有時會在過表達時發生聚集,給公司造成時間和金錢上的損失。許多公司正在利用生物資訊學技術來預測聚集。這些方法只是預測,但對於研究和開發過程中的分析仍然非常有用。
蛋白質聚集可以描述為纖維化或從完全或部分展開的肽 [2]形成不溶性結構。一個肽可以以非自然的方式與自身或細胞中的其他蛋白質結合。這通常發生在蛋白質過表達時。蛋白質聚集不止一種型別;然而,研究得最透徹的型別是澱粉樣蛋白纖維化。澱粉樣蛋白纖維主要由β 片層構成,主鏈主導蛋白質的結構。這些纖維是高度有序的結構,由氫鍵 [3]穩定。澱粉樣蛋白纖維的直徑通常為 10 奈米,由大約 2-6 個“原纖維”相互纏繞而成。原纖維是澱粉樣蛋白纖維的前體,對細胞有最大的毒性。原纖維由交叉 β 結構構成。在交叉 β 結構中,β 片層由垂直於纖維的 β 鏈組成。圖 1 顯示了澱粉樣蛋白纖維的影像 [4]。
圖 1:小型澱粉樣蛋白纖維
蛋白質的天然狀態通常是該蛋白質在環境條件下能量最有利的形式,這種狀態可以產生適當的功能。當蛋白質發生鏈間接觸,與該蛋白質的其他部分或其他蛋白質接觸時,就會發生蛋白質聚集。因此,人們認為這些聚集體在能量上與天然狀態一樣有利,或者比天然狀態更具能量優勢。有幾種疾病與蛋白質聚集有關。本討論將考察阿爾茨海默病和轉甲狀腺素蛋白相關疾病 [4]。
可能發生許多不同型別的聚集。它們根據相互作用型別和溶解度進行分類。可溶性聚集體是不可見的顆粒,無法透過過濾器去除。不溶性聚集體可以透過過濾去除,通常是人眼可見的。這兩種型別的聚集體都會在生物製藥開發中造成問題。共價聚集體是由給定肽的多個單體的共價鍵形成造成的。遊離硫醇的二硫鍵形成是共價聚集的常見機制。酪氨酸殘基的氧化會導致雙酪氨酸的形成,這通常會導致聚集。可逆蛋白質聚集通常是由於蛋白質之間較弱的相互作用造成的。當環境因素如蛋白質濃度、鹽濃度或 pH 值發生變化時,這種聚集的可逆性可能會改變 [5]。
為了理解蛋白質聚集,我們需要更多地瞭解蛋白質摺疊本身。在開發預測工具時,瞭解和解釋所有與聚集相關的因素是不可行的。然而,對這些因素瞭解得越多,預測模型就可能越好。在理解蛋白質摺疊過程方面取得了進展。這些進展可以幫助我們瞭解該過程是如何“出錯”的,並導致聚集。圖 2 顯示了一個展開的肽鏈及其相應的天然摺疊狀態肽的影像。
圖 2:蛋白質摺疊

蛋白質的一般摺疊過程可以描述為對天然狀態 [3][7]的“隨機搜尋”。天然狀態通常是穩定、低能量的構象。更具體地說,較小的蛋白質透過成核-凝聚機制摺疊,而較大的蛋白質則以模組或較小的部分摺疊 [7]。成核-凝聚是摺疊核的形成,其餘的結構圍繞它凝聚或坍塌。隨著對摺疊過程的更多瞭解,對像這樣的預測模型的需求將減少。然而,在此期間,可以建立這樣的模型來加深對聚集甚至蛋白質摺疊本身的理解。
有人認為,一些普遍的原則或蛋白質特徵可能決定聚集和纖維化 [7][2]。儘管已經證明在合適的外部條件下,任何普通蛋白質都有能力形成類似澱粉樣蛋白纖維的聚集體,但聚集也取決於序列的特徵。除了溫度等外部條件以及序列本身的特徵外,肽單體的特徵可能無法提供其聚合物版本的聚集傾向的見解,因為肽間鏈相互作用會導致構象變化 [2]。無論涉及哪些因素,人們已經對可以用來預測聚集的因素有了很多瞭解。已知的內在屬性可能影響聚集,包括電荷、疏水性、疏水/親水模式以及二級結構傾向。
疏水性 表面在變性後暴露出來,極易受到雜亂無章的相互作用的影響,導致蛋白質聚集。這些表面充當“粘性”點,試圖與它們能接觸到的任何東西相互作用。高螺旋二級結構傾向性顯著降低聚集的可能性,而高β-摺疊傾向性顯著增加聚集。帶電荷殘基已被證明也能減少聚集。外在因素如離子強度、溫度、pH 值、蛋白質濃度、伴侶蛋白、質量控制和壓力已被證明對聚集有影響[1]。一些配體和離子的存在會增加聚集。施加到蛋白質上的應力會導致變性,從而導致隨後的聚集。這些應力包括冷凍、暴露在空氣中或與金屬表面相互作用——其中許多都參與生物製藥的開發。由於這些應力在藥物開發中的參與,我們對聚集的瞭解越多,在藥物開發中就越能更好地控制。極性或非極性可及表面積、偶極矩和芳香族殘基等物理化學性質也很重要[8][9]。研究表明,朝向內側的帶電荷殘基和較少的懸掛氫鍵將減少蛋白質聚集的量[2]。利用所有這些知識,我們可以確定給定蛋白質聚集的可能性。這些因素可以,並且已經被用來預測蛋白質聚集。
當蛋白質被表達時,蛋白質濃度的急劇增加會導致細胞內聚集。這是由於未摺疊的蛋白質分子之間的相互作用或分子伴侶蛋白對新生肽鏈的識別不良。
當然,仍然存在生物體透過自然途徑阻止聚集的問題。 伴侶蛋白在蛋白質摺疊中起輔助作用。守門人殘基也有助於防止聚集[1][3][7][2]。這些外在因素在建立預測模型時幾乎不可能利用。
聚集相關的疾病
[edit | edit source]阿爾茨海默病
[edit | edit source]阿爾茨海默病 是一種神經退行性疾病,由β-澱粉樣蛋白肽的聚集引起。β-澱粉樣蛋白肽在人體以及實驗條件下都容易發生聚集。該肽的天然狀態相對不穩定,導致聚集。該肽在大腦中的聚集導致聚集斑塊的形成。圖 3 顯示了阿爾茨海默病患者大腦皮層的這些斑塊。
圖 3:β-澱粉樣蛋白斑塊

β-澱粉樣蛋白單體被認為會形成六邊形排列,然後繼續形成澱粉樣原纖維。中間步驟的確切結構尚未確定[4]。
TTR 相關疾病
[edit | edit source]甲狀腺素運載蛋白或 TTR 是一種蛋白質,當它聚集時會導致老年性系統澱粉樣變性、家族性澱粉樣變性神經病變以及其他一些罕見神經退行性疾病。 甲狀腺素運載蛋白存在於中樞神經系統中。 TTR 是腦脊液中的血清蛋白,並攜帶甲狀腺激素甲狀腺素。在血液中,白蛋白通常執行此功能,但腦脊液中不存在白蛋白。許多TTR 疾病已被證明是由肽序列中的點突變引起的。這些突變改變了序列的內在特性,增加了聚集的傾向。 TTR 是一種四聚體,聚集在四聚體解離時開始。分離後,肽鏈形成有利於纖維化的能量有利接觸。從這一點開始,TTR 單體的聚集迅速進行。中間結構尚未透過TTR 聚集確定[4]。
建立的預測模型
[edit | edit source]為了更好地理解和預測蛋白質聚集,幾個研究小組一直在開發基於不同原理的預測模型。
Tartaglia 等人建立的預測方法基於物理化學性質。該方法是一種從頭預測方法,基於極性和非極性可及表面積、偶極矩、電荷、芳香族殘基和β-摺疊傾向性。預測結果給出了聚集速率和“澱粉樣蛋白譜”。該方法使用確定的視窗大小掃描每個序列,一次移動一個氨基酸。使用聚集傾向性對每個片段進行排名。儲存三個最高排名片段的位置。該方法與實驗聚集速率的關聯度高達 95%[8]。
AGGRESCAN 方法基於實驗得出的單個氨基酸的聚集傾向性。使用滑動視窗來計算視窗的平均聚集傾向性,並將該值分配給中心氨基酸。這給出了聚集“熱點”的分佈。該方法提供了聚集分佈的圖形表示,包括熱點、峰值區域和聚集值[11]。
TANGO 方法是一種統計機制演算法,用於識別序列中容易發生聚集的區域。該方法考慮了多肽序列的幾種不同型別的內在結構傾向性,並確定了不同長度的滑動視窗最可能的構象。該方法在一般聚集預測方面的準確率在 87% 到 92% 之間,但與大多數聚集預測工具一樣,它無法區分澱粉樣蛋白形成和無定形聚集。 [12]。
Pawar 等人建立的方法使用序列的內在特性來尋找易聚集和易受聚集的區域。該方法利用α-螺旋傾向性、β-摺疊傾向性、電荷、疏水性和疏水/親水模式來預測序列的易聚集和易受聚集區域。使用此方法可以計算出總的聚集傾向性、傾向性的 z 分數、聚集速率以及速率或傾向性分佈。在計算分佈時,將每個氨基酸突變為所有其他可能性,並計算速率或傾向性。儲存最大值、最小值和野生型值,並在 7 個氨基酸的滑動視窗上對這些分佈進行平滑處理[13]。
肽的序列特徵能否提供對蘊含澱粉樣蛋白傾向性位點的見解?已知的與聚集相關的疾病為我們提供了研究基礎,使我們能夠開始模式搜尋。到目前為止,從生物資訊學方法在這個領域所看到的情況來看,序列特徵確實告訴了我們很多關於蛋白質聚集的資訊。但是,還沒有建立完美的模型,因此很明顯我們還沒有理解蛋白質聚集的各個方面。我們希望能夠理解蛋白質聚集,並學習如何防止它。
參考文獻
[edit | edit source]- ↑ a b c "澱粉樣蛋白生成多肽鏈絕對聚集速率的預測。"Dubay, K. F., Pawar, A. P., Chiti, F., Zurdo, J., Dobson, C. M., & Vendruscolo, M. (2004). J. Mol. Biol. 341, 1317-1326. 摘要
- ↑ a b c d e "蛋白質和肽聚集的分子基礎的新興觀點。"Thirumalai, D., Klimov, D. K., & Dima, R. I. (2003). Current Opinion in Structural Biology. 13, 146-159. 摘要
- ↑ a b c “蛋白質摺疊和錯誤摺疊的實驗研究。” Dobson, C. M. (2004)。方法。34, 4-14。摘要
- ↑ a b c d thglab.lbl.gov 訪問日期:2008 年 3 月 27 日。
- ↑ 蛋白質聚集和生物加工 訪問日期:2008 年 3 月 21 日。
- ↑ “蛋白質摺疊。” http://en.wikipedia.org/wiki/Image:Protein_folding.png 訪問日期:2008 年 4 月 2 日。
- ↑ a b c d “蛋白質摺疊、錯誤摺疊和聚集的原理。” Dobson, C. M. (2004)。細胞與發育生物學研討會。15, 3-16。摘要
- ↑ a b “芳香性、暴露表面和偶極矩在決定蛋白質聚集速率中的作用” Tartaglia, G. G., Cavalli, A., Pellarin, R., & Caflisch, A. (2004)。蛋白質科學。13, 1939-1941。全文
- ↑ Tartaglia, G. G., Cavalli, A., Pellarin, R., & Caflisch, A. (2004)。蛋白質科學。14, 2723-2734。
- ↑ “阿爾茨海默病。” http://en.wikipedia.org/wiki/Alzheimer%27s_disease 訪問日期:2008 年 4 月 2 日。
- ↑ AGGRESCAN:用於預測和評估多肽中聚集“熱點”的伺服器” Conchillo-Sole, O., de Groot, N. S., Aviles, F. X., Vendrell, J., Daura, X., & Ventura, S. (2007)。BMC 生物資訊學。8, 65-81。全文
- ↑ “Fernandez-Escamilla, A. M., Rousseau, F., Schymkowitz, J. & Serrano, L. (2004)。預測肽和蛋白質聚集的序列依賴性和突變效應。Nat Biotechnol 22, 1302-6。[1]
- ↑ “預測與神經退行性疾病相關的蛋白質中‘易於聚集’和‘易受聚集影響’的區域。” Pawar, A. P., Dubay, K. F., Zurdo, J., Chiti, F., Vendruscolo, M., & Dobson, C. M. (2005)。J. Mol. Biol. 350, 379-392。全文