結構生物化學/分子建模/分子動力學

經典分子動力學 (MD) 是計算化學的一個分支,它專注於根據牛頓運動定律模擬粒子的運動。[1] 原子被近似為“彈簧上的球”,這使得可以應用以下定律
其中 是位置, 是速度, 是加速度,以及 是時間。
經典 MD 近似將鍵和角勢視為諧波,並將二面角視為週期性的。這使得可以用類似於 AMBER 分子動力學程式使用的以下方程來表達系統的能量:[2]
模擬在一系列“時間步長”中進行。在每一步中,根據能量方程的導數計算每個原子的作用力。原子會移動一定的距離,這個距離與作用力的方向和大小以及時間步長的大小成正比。這個過程會重複很多時間步長,迭代地計算作用力和求解運動方程(基於作用力產生的加速度),並生成模擬複雜行為的結果,從藥物化合物的對接到簡單蛋白質的摺疊。
限制
[edit | edit source]量子效應
[edit | edit source]儘管已知原子是根據薛定諤方程而不是牛頓定律來運作的,但經典方法仍能用較高的精度進行模擬。可以透過檢查參與粒子的德布羅意波長來了解這一點[3]
其中 是原子質量, 是溫度。當 粒子之間的平均最近鄰間距時,經典近似是合理的。因此,對於較重的系統,如有機分子,經典近似是合理的,但對於輕型系統,如 H2、He 或 Ne,該方法的精度會大大降低。
由於原子被近似為離散粒子,因此無法用經典 MD 正確模擬較小粒子的相互作用。[4] 化學鍵的形成和斷裂、非共價反應中間體以及質子或電子隧穿都無法用這種方法模擬。在非常低的溫度下進行的模擬也存在問題,因為在接近絕對零度時,經典力學越來越不受青睞,而量子解釋則越來越受青睞。量子分子動力學方法可以用於模擬,這些模擬可以更電子地逼真,但計算成本要高得多。
系統大小和時間尺度
[edit | edit source]可以模擬的原子數量和時間量與可用的計算能力直接相關。雖然之前已經模擬過一個小型病毒的全部結構[5],但大多數精細的、全原子模擬都是針對蛋白質的規模,而不是細胞器或複雜的組裝體。這是因為觀察結果所需的模擬時間與系統大小直接相關。
表格 - 分子過程的時間尺度
[edit | edit source]| 秒 | 名稱 | 過程 |
|---|---|---|
| 10−1 | 表面重組 | |
| 10−3 | 毫秒 | 蛋白質摺疊 |
| 10−8 | 10 納秒 | 核磁共振 |
| 10−9 | 至 10+3 | 布朗動力學 |
| 10−9 | 至 100 | 格點蒙特卡羅 |
| 10−12 | 皮秒 | 快速振動 |
| 10−15 | 飛秒 | 電子激發 |
因此,系統越大,模擬執行的時間就需要越長才能觀察到相關的行為。如今,專門為分子動力學模擬設計的計算機硬體[6] 可以用一天的時間模擬大約 17 微秒的 23,000 原子系統,時間步長為 0.5 飛秒。在同一系統上,通用並行超級計算機可以獲得大約幾百納秒的模擬時間。
恆溫器
[edit | edit source]使用基於牛頓運動方程的方法,在“微正則系綜”中獲得了模擬,這是一個恆定能量系統 (nVE)。然而,這並不現實,為了與實驗結果進行準確比較,模擬最常在正則系綜中進行,該系綜具有恆定溫度 (nVT)。[7]這個溫度必須用演算法來維持,這種演算法被稱為恆溫器。常用的恆溫器有很多,它們在可靠性、精度和計算成本方面各有優劣。
典型的模擬包括一個 MD 平衡階段,在這個階段,結構在 0K 恆定溫度下模擬一定時間,一個加熱階段,在這個階段,系統逐漸加熱到所需的溫度(通常為 300K),以及一個在該恆定溫度下的最終生產模擬。最初的平衡不是為了使結構達到化學平衡,而是為了達到能量最小值(通常接近化學平衡狀態)。如果省略平衡階段,而在高能量區域執行模擬,模擬將繼續對高能量相空間進行取樣,從而產生與實驗資料不一致的結果。[8]
這個恆溫器遵循朗之萬運動方程而不是牛頓運動方程,其中一個與速度成正比的摩擦力被新增到保守力中,它會調整粒子的動能,從而使溫度正確。[9]
然後系統由以下方程描述:
其中 、 和 分別是粒子的質量、速度和加速度。 是摩擦常數,而 是一個隨機力,它會向粒子新增動能。它是從高斯分佈中取樣的,其中方差是設定溫度和時間步長的函式。這平衡了摩擦力,以使溫度保持在設定值。
這個恆溫器將系統耦合到一個設定為所需溫度的熱浴。熱浴由隨機選擇的系統粒子上的隨機粒子碰撞來表示。
據已證實[10],將隨機碰撞新增到牛頓 MD 系統會使模擬成為一個不可約且非週期的馬爾可夫鏈。這意味著使用安德森演算法生成的分佈不是正則分佈。
這個恆溫器會隨機影響粒子的速度,這會導致模擬系統中出現非物理動力學。
這個恆溫器將系統與設定為所需溫度的熱浴緊密耦合。這裡,每個粒子的動量變化表示為:[11]
這種重新縮放會很快破壞動態相關性,因此不會保持正則系綜。
這個恆溫器首先於 1984 年提出[12],它涉及以控制溫度的方式重新縮放每個粒子的速度。
與高斯恆溫器類似,系統與一個設定為所需溫度的熱浴耦合,儘管這種演算法使用的是弱耦合而不是強耦合,其中系統溫度的校正使得溫度偏差以某個時間常數 指數衰減,該時間常數與時間步長成正比。
該熱浴在牛頓運動方程中添加了一個額外的項,,產生了以下二階微分
其中 是質量, 是目標溫度, 是玻爾茲曼常數。熱浴被賦予了一定的質量,,對於 Nose 建議的 值,產生了上述每個粒子的動量變化方程。
使用該熱浴,模擬系統的能量會發生波動,但系統和熱浴的總能量是守恆的。如果系統是遍歷的(所有可訪問的微觀狀態的可能性相等),那麼該系統將給出正則系綜。[13]
分子動力學模擬需要一個“力場”,它列出了能量方程中每種相互作用型別涉及的引數。例如,AMBER 力場需要每個可能的兩種原子型別的組合的鍵平衡長度、鍵力常數,每個可能的三個原子型別的組合的角度平衡值和角度力,每個可能的四種原子型別的組合的二面角平衡相位、二面角力常數和二面角週期性。額外的引數還描述了每個原子的非鍵合(靜電)力。
這些引數的開發和分析,統稱為力場,是分子動力學研究的重點。
經典分子動力學的引數理想情況下會導致行為與原子水平上實際分子的行為非常接近,而實際分子在現實中受量子現象控制。經典引數的開發使得這種情況成為可能——一旦能量和力方程(例如 AMBER 方程)被用來建立系統的正規化,引數就會被推匯出來,使得使用它們計算的值與使用量子力學方法或實驗計算的值相匹配。由於缺乏用於開發力場所需的各種分子和分子構象的實驗資料,因此使用量子計算得出的資料來代替。
力場是為特定型別的分子開發的。例如,AMBER 為蛋白質提供了 Amber ff99SB 力場[14],為碳水化合物提供了 Glycam 力場[15],以及新開發的脂質力場 GAFFLipid[16]。此外,還開發了“通用 AMBER 力場”或 GAFF,用於對不適合廣泛力場類別的小配體和其他分子進行引數化。
力場的準確性對於模擬的準確性至關重要。諸如二面角力常數之類的簡單項,可以對整體模擬產生極大的影響。事實上,蛋白質主鏈 和 角的不準確二面角引數會導致模擬過度傾向於α螺旋形成,這一事實影響了許多結果。[17][18][19]
從歷史上看,力場開發一直受到缺乏可用於擬合的能量和力資料的困擾。力場引數是透過擬合引數來生成的,使得使用這些引數預測的結構的能量或每個原子的力與從頭算量子計算生成的能量或力匹配。這些計算非常昂貴,因此通常從一組引數推斷到一個通用引數,以避免重複進行計算。例如,使用為四丙氨酸蛋白質主鏈生成的引數來描述任何蛋白質的主鏈。
計算能力的不斷提高、更有效的演算法以及對過去方法的瞭解為未來的引數開發帶來了希望。例如,可以分別計算各種氨基酸的側鏈引數,然後將它們新增到一個通用引數集中,以便分別描述每個氨基酸。[20]
經典力場是透過擬合經典引數而開發的,這些引數使其產生的結果與實驗和量子資料一致。它們按生物分子型別進行分類——蛋白質、碳水化合物和脂類力場已針對所有主要的 MD 程式單獨開發。然而,這種分類仍然相當廣泛,並且可能忽略系統特定的相互作用。

- ↑ Meller,Jarosaw。“分子動力學”生命科學百科全書,2001
- ↑ R. Salomon-Ferrer、D.A. Case、R.C.Walker。Amber 生物分子模擬軟體包概述。WIREs Comput. Mol. Sci.(2012)
- ↑ J. P. Hansen 和 I. R. McDonald,簡單液體理論,第 2 版,學術出版社,1986。
- ↑ Ercolessi,Furio。“分子動力學入門”烏迪內大學計算物理春季學院,1997
- ↑ Peter L. Freddolino、Anton S. Arkhipov、Steven B. Larson、Alexander McPherson 和 Klaus Schulten。完整衛星菸草花葉病毒的分子動力學模擬。結構,14:437-449,2006。
- ↑ David E. Shaw、Martin M. Deneroff、Ron O. Dror、Jeffrey S. Kuskin、Richard H. Larson、John K. Salmon、Cliff Young、Brannon Batson、Kevin J. Bowers、Jack C. Chao、Michael P. Eastwood、Joseph Gagliardo、J.P. Grossman、C. Richard Ho、Douglas J. Ierardi、István Kolossváry、John L. Klepeis、Timothy Layman、Christine McLeavey、Mark A. Moraes、Rolf Mueller、Edward C. Priest、Yibing Shan、Jochen Spengler、Michael Theobald、Brian Towles 和 Stanley C. Wang(2008 年 7 月)。“Anton,用於分子動力學模擬的專用機器”。ACM 通訊 (ACM) 51 (7): 91–97。
- ↑ Hunenberger,Phillipe。分子動力學模擬的恆溫器演算法 DOI:10.1007/b99427
- ↑ Finnerty,J。“分子動力學與物理世界的交匯:恆溫器和恆壓器”
- ↑ Adelman,S.A. 和 J.D. Doll,原子-固體-表面散射的廣義朗之萬方程方法 - 經典散射非諧固體的通用公式。化學物理雜誌,1976。
- ↑ E,W. 和 Li,D.(2008),分子動力學中的 Andersen 恆溫器。純應用數學通訊,61:96–136。doi:10.1002/cpa.20198
- ↑ J. Clarke D. Brown。分子物理學,51:1243,1983。
- ↑ Berendsen,H.J.C. 等人,耦合到外部浴的分子動力學。化學物理雜誌,1984。81(8):p. 3684-3690。
- ↑ Palmer,R. G.(1982)。高階物理學 31:669
- ↑ Lindorff‐Larsen,Kresten 等人。“改進 Amber ff99SB 蛋白質力場的側鏈扭轉勢。”蛋白質:結構、功能和生物資訊學 78.8 (2010):1950-1958。
- ↑ Kirschner,Karl N. 等人。“GLYCAM06:一種通用的生物分子力場。碳水化合物。”計算化學雜誌 29.4 (2007):622-655。
- ↑ Dickson,C. J.、Rosso,L.、Betz,R. M.、Walker,R. C. 和 Gould,I. R.(2012)。GAFFlipid:一種用於準確模擬磷脂的分子動力學的通用 Amber 力場。軟物質。
- ↑ Best,Robert B.、Nicolae-Viorel Buchete 和 Gerhard Hummer。“當前的分子動力學力場是否過螺旋?”。生物物理學雜誌 95.1 (2008):L07-L09。
- ↑ Freddolino,Peter L. 等人。“蛋白質摺疊模擬中的力場偏差。”。生物物理學雜誌 96.9 (2009):3772。
- ↑ Lindorff‐Larsen,Kresten 等人。“改進 Amber ff99SB 蛋白質力場的側鏈扭轉勢。”蛋白質:結構、功能和生物資訊學 78.8 (2010):1950-1958。
- ↑ Lindorff‐Larsen,Kresten 等人。“改進 Amber ff99SB 蛋白質力場的側鏈扭轉勢。”蛋白質:結構、功能和生物資訊學 78.8 (2010):1950-1958。