向上
本節包含拉格朗日形式主義的幾個理論發展,這些發展對於解決問題並不直接必要。但是,這些考慮有助於更深入地理解理論並回答一些重要問題。
在力學的拉格朗日表述中,軌跡
由作用泛函
應該有一個極值來決定。(並非總是這樣,軌跡是最小作用;在某些情況下,它可能只是一個極值,即泛函導數
為零。) 這個條件被稱為作用原理。到目前為止,您應該熟悉從作用原理推匯出運動方程的數學過程。
因此,在這一點上,您應該習慣於每個機械系統的正確運動方程確實遵循作用原理,如果拉格朗日函式被適當地選擇。然而,您可能仍然感到困惑,牛頓定律等價於某個泛函的極值條件。您可能會問自己:為什麼這可能?
這裡有一個解釋可能會有所幫助。讓我們考慮一個簡單的機械系統:一個質量為
的質點,在一個維度上運動,座標為
,在一個勢能為
的力場中。(同樣的考慮很容易推廣到多個維度和多個座標的情況。)假設
是根據牛頓定律正確的軌跡,

我們如何使用泛函
來表達軌跡
是正確的那個?一種方法是要求
與
的偏差處處為零。這可以用泛函表示為
![{\displaystyle S_{1}[x]=\int _{t_{1}}^{t_{2}}[x(t)-x_{0}(t)]^{2}dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8f9fa3be3689e4ea2aff93274e23c41d374b07d8)
很明顯,泛函
僅當
對所有
成立時,才取到最小值(顯然最小值為 0)。這展示瞭如何使用泛函來表達函式的一些條件:泛函
衡量了
與
在整個過程中的偏差。最小的偏差是完全沒有偏差;因此,泛函
的最小值出現在軌跡
上,該軌跡與
完全沒有偏差。
另一種類似的方法是使用泛函來指定軌跡
![{\displaystyle S_{2}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}(t)-{\dot {x}}_{0}(t)]^{2}dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7ff7308858a2c765e9e9da8d416facf9010af49a)
該泛函與邊界條件
聯立,僅當
對所有
成立時,才取到最小值。
不可否認,泛函
無法幫助我們表述力學的規律,因為它們已經顯式地包含了正確的軌跡
。現在,我們將從
開始構建另一個泛函,
,試圖消除對
的顯式依賴。
讓我們重寫
為
![{\displaystyle S_{2}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}^{2}-2{\dot {x}}{\dot {x}}_{0}+{\dot {x}}_{0}^{2}]dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f6c3004af7d90fd67f4865cf6653b42fd94ab917)
第三項,
,是一個固定函式,當我們改變
時不會改變。因此,我們可以從
中省略該項。此外,我們希望得到
而不是
,因為這樣我們就可以使用牛頓定律來求出正確的軌跡。所以讓我們用分部積分法積分第二項

邊界項
不會隨著
而改變,因為
的邊界值是固定的。因此,我們可以省略該項。最後,我們使用牛頓定律來用
替換 

現在我們*假設*軌跡
與正確軌跡
的偏差非常小,那麼我們可以近似地寫成
![{\displaystyle xU'(x_{0})=(x-x_{0})U'(x_{0})+x_{0}U'(x_{0})=U(x)-U(x_{0})+O[(x-x_{0})^{2}]+x_{0}U'(x_{0}).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e8d00e4cff7c8fde7565a93489e3eb6f69ca388f)
在上述假設下,可以忽略
的二次項。項
和
可以省略,因為它們與
無關。因此我們發現泛函
等價於以下泛函,直到與
無關的非本質項
![{\displaystyle S_{3}[x]=\int _{t_{1}}^{t_{2}}[{\dot {x}}^{2}-2m^{-1}U(x)]dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/245b1936487259dc101381b170356d3981d41d76)
很明顯,
等價於通常的拉格朗日量,直到係數
。
透過這種方式,我們得到了一個函式
,當
非常接近於
時,該函式具有最小值;也就是說,它是一個區域性最小值。這個新函式不顯式地依賴於
,正如我們所期望的。需要付出的代價是,這個函式只對微小的偏離正確軌跡的情況有效。事實上,函式
可能還有其他最小值或最大值,而原始函式
沒有。對
正確性的唯一真正理由是運動方程與牛頓定律一致。
在簡單的情況下,拉格朗日量等於動能和勢能項的差。然而,需要選擇一些座標來描述這些項。然後,選擇哪些變數作為座標就完全無關緊要了;這些變數可以是長度、角度,或者長度和角度的任何函式(但不能是速度!)。換句話說,只要座標能夠充分描述每個質量點的可能位置,並且滿足適當的約束條件,就可以使用任何座標系,甚至只是某個座標系的部分。因此,進入拉格朗日量的座標被稱為廣義座標。通常,為了方便起見,人們會選擇廣義座標,以減少所需的計算量,或減少必要的約束條件的數量。
但是,你可能在問自己:為什麼在拉格朗日形式主義中允許使用任意座標呢?當然,我們知道,牛頓定律在不同的座標系中是不一樣的:例如,質量乘以加速度等於力,只有當加速度計算為
時才成立,其中
是笛卡爾座標
的向量。如果向量
由,比如說,半徑
、方位角
在
平面內,以及座標
組成的話,這個公式就會不正確。但是,如果我們用變數
來表示動能和勢能,拉格朗日形式主義將能夠很好地工作。運動方程將由尤拉-拉格朗日方程給出,

如前所述,人們說拉格朗日形式在座標變換方面是協變的。
這種現象的原因可以用兩種方式解釋:更正式地,透過證明尤拉-拉格朗日方程在任意座標變化下保持不變;或者更直觀地,從幾何角度來解決問題。
為簡單起見,我們只考慮拉格朗日量為
的一維問題,其中
是一個廣義座標。同樣的考慮很容易推廣到多個座標的情況。
假設選擇新的座標
來代替
。新的座標可以是舊座標的函式。讓我們考慮更一般的情況,即座標的變化取決於時間(即,我們可以在不同的時間選擇略微不同的座標)。那麼,新的座標與舊座標之間的關係可以用以下公式表示:

其中
是一個已知函式。
現在我們需要透過新的變數
及其導數
來表達舊的拉格朗日量
。我們有

其中,我們用帶逗號的下標表示偏導數,例如
。這是物理學中常用的簡化記法。
因此,用新變數
表示的拉格朗日量為

新的變數
是一個很好的變數,如果它是舊變數的非平凡函式,即如果
。 那麼新的拉格朗日函式將是一個非平凡函式,它依賴於
以及
。 因此,我們假設
至少在
的某個區間內。
現在讓我們比較一下在舊座標系和新座標系中推匯出的運動方程(EOM)。
舊的 EOM 可以寫成

新的 EOM 是

讓我們用
代替
來表達這個方程

因此,新的 EOM 是

簡化這個表示式,我們發現

我們發現新的運動方程在假設
的情況下,確實等價於舊的運動方程。
上面給出的計算直觀明確,但可能會讓你想知道它為什麼有效。下面是一個更直觀的解釋。
尤拉-拉格朗日方程表達了泛函
在軌跡
處取得極值。想象一個包含所有軌跡的空間,即一個巨大的空間,其中每個“點”代表一條完整的軌跡
。泛函
在某個“點”
處取得極值,該“點”對應於機械系統的實際軌跡。當我們改變座標
時,我們只是改變了對該軌跡空間的描述方式。但我們無法改變泛函
在某個“點”
處取得極值的事實。我們只能改變對該“點”的描述方式。因此,在變數變換後,新的泛函
仍然會在某個“點”
處取得極值,而這個“點”
必須對應於變數變換後的“點”
。極值的存在是泛函
形狀的幾何特徵,因此它與我們選擇用座標描述它的方式無關。
讓我們考慮一個簡單的例子,在這個例子中我們使用函式而不是泛函。函式
在
處取得最小值。我們可以改變座標系,使用
來代替
,例如
。這是一個在區間
上定義良好的變數變換,其中
。在新座標系中,函式
看起來像
。這個函式在
處取得最小值,其中
。但是,從幾何學的角度來看,這與之前的函式完全相同,只是在不同的座標系下觀察。因此,最小值
是在座標系變換後舊的最小值
。
這種等價性可以透過更正式的方式觀察到。函式
取得最小值的條件是

此條件等效於函式
的最小值的條件,即
,只要
。這就是為什麼舊座標中最小值的位置,
,與新座標中最小值的位置,
,完全一致。
類似地,當我們考慮泛函時,我們可以將
在新座標中的最小值的條件寫成

很明顯,只要新變數定義良好,即
,最小值的條件在變數變化下保持不變。
另一個重要的問題是,對於給定的系統,是否只有一個拉格朗日量可以得到正確的運動方程。答案是,對於任何給定的系統,可以採用無限多個不同的拉格朗日量。
首先,始終可以將拉格朗日量乘以一個常數
,還可以向拉格朗日量中新增一個任意的固定時間函式,
。修改後的拉格朗日量則為
。項
是“固定”的,因為它不依賴於
。然後我們可以顯式地對該項進行積分,並將修改後的作用量表示為
![{\displaystyle {\tilde {S}}[q]=\alpha S[q]+\int _{t_{1}}^{t_{2}}F(t)dt.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/476bcbe0761e1e038b6b6ada0d58190872d1f8b1)
上面的最後一項只是一個數字。顯然,這種對作用量的修改是無關緊要的:如果
是
的極值,那麼它也是
的極值。在函式中新增一個常數不會改變極值的位置。
更一般地說,我們可以將一個任意的 *時間全導數* 加到拉格朗日量中

作用量由此得到的修改是
![{\displaystyle {\tilde {S}}[q]=S[q]+\int _{t_{1}}^{t_{2}}{\frac {d}{dt}}F(q,t)dt=S[q]+F(q_{2},t_{2})-F(q_{1},t_{1}),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec2e0729e243e2c7dea63789ac6c502ca86c5895)
其中
是
的邊界值。由於這些值是固定的,在我們改變
時不會改變,作用量中的額外項再次是一個常數。因此,這種對作用量的修改不會改變運動方程。人們說,兩個拉格朗日量如果相差一個時間全導數,那麼它們是等效的。
我們甚至可以允許函式
也依賴於
的導數,以及
本身。然而,在這種情況下,還需要固定
在邊界點
處對應導數的值。
因此,正如我們所見,給定物理系統的拉格朗日量並不唯一。“動能減去勢能”這個公式只是一個簡單的規則,可以得到一個好的拉格朗日量。
等效拉格朗日量的多樣性並不侷限於那些相差一個時間全導數或一個常係數的拉格朗日量。例如,拉格朗日量

會導致相同的運動方程,
![{\displaystyle [{\dot {q}}^{2}+2q{\ddot {q}}]q{\dot {q}}^{2}=0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db30c94e74f72be699a01dd1e1a7e857c55208f2)
儘管明顯找不到一個函式
和一個常數
使得
。(這樣的函式最多會在拉格朗日量中產生一個額外的
項,但不會產生對導數非線性的項。)