GLSL 程式設計/頂點變換

頂點著色器和之後在 OpenGL (ES) 2.0 管道中的階段中最重要的一項任務是，將圖元（例如三角形）的頂點從原始座標（例如在 3D 建模工具中指定的座標）變換到螢幕座標。雖然可程式設計的頂點著色器允許以多種方式變換頂點，但一些變換是在頂點著色器後的固定功能階段執行的。因此，在程式設計頂點著色器時，瞭解哪些變換必須在頂點著色器中執行尤為重要。這些變換通常以統一變數的形式指定，並透過矩陣-向量乘法應用於傳入的頂點位置和法向量。雖然對於點和方向來說這是直觀的，但對於法向量來說就不那麼直觀了，如 “應用矩陣變換”部分中所述。

這裡，我們將首先概述座標系以及它們之間的變換，然後討論各個變換。

概述：相機類比

將變換頂點的整個過程想象成一個相機類比，如右圖所示，步驟和相應的頂點變換是

定位模型 - 模型變換
定位相機 - 觀察變換
調整縮放 - 投影變換
裁剪影像 - 視口變換

前三個變換在頂點著色器中應用。然後，透視除法（可能被認為是投影變換的一部分）在頂點著色器後的固定功能階段自動應用。視口變換也在這個固定功能階段自動應用。雖然固定功能階段中的變換不可修改，但其他變換可以被替換為這裡描述的其他型別的變換。然而，瞭解傳統的變換很有用，因為它們可以充分利用裁剪和對變化變數的透視正確插值。

以下概述顯示了不同座標系之間的頂點變換序列，幷包括表示變換的矩陣

物件/模型座標			頂點著色器的輸入，即屬性中的位置
	↓	模型變換：模型矩陣 $\mathrm {M} _{{\text{object}}\to {\text{world}}}$
世界座標
	↓	觀察變換：觀察矩陣 $\mathrm {M} _{{\text{world}}\to {\text{view}}}$
觀察/眼睛座標
	↓	投影變換：投影矩陣 $\mathrm {M} _{\text{projection}}$
裁剪座標			頂點著色器的輸出，即 `gl_Position`
	↓	透視除法（除以 `gl_Position.w`）
歸一化裝置座標
	↓	視口變換
螢幕/視窗座標			片段著色器中的 `gl_FragCoord`

請注意，模型、觀察和投影變換在頂點著色器中應用。透視除法和視口變換在頂點著色器後的固定功能階段應用。接下來的部分將詳細討論所有這些變換。

模型變換

模型變換指定從物件座標（也稱為模型座標或區域性座標）到公共世界座標系的變換。物件座標通常特定於每個物件或模型，並且通常在 3D 建模工具中指定。另一方面，世界座標是場景中所有物件的公共座標系，包括光源、3D 音訊源等。由於不同的物件具有不同的物件座標系，因此模型變換也不同；即，必須對每個物件應用不同的模型變換。

實際上，它會將物件從原點“推開”，並可以選擇對其應用旋轉。

模型矩陣的結構

模型變換可以用一個 4×4 矩陣表示，我們將其表示為模型矩陣 $\mathrm {M} _{{\text{object}}\to {\text{world}}}$ . 它的結構是

$\mathrm {M} _{{\text{object}}\to {\text{world}}}=\left[{\begin{matrix}a_{1,1}&a_{1,2}&a_{1,3}&t_{1}\\a_{2,1}&a_{2,2}&a_{2,3}&t_{2}\\a_{3,1}&a_{3,2}&a_{3,3}&t_{3}\\0&0&0&1\end{matrix}}\right]$ ${\text{ with }}\mathrm {A} =\left[{\begin{matrix}a_{1,1}&a_{1,2}&a_{1,3}\\a_{2,1}&a_{2,2}&a_{2,3}\\a_{3,1}&a_{3,2}&a_{3,3}\end{matrix}}\right]$ ${\text{ and }}\mathbf {t} =\left[{\begin{matrix}t_{1}\\t_{2}\\t_{3}\end{matrix}}\right]$

$\mathrm {A}$ 是一個 3×3 矩陣，它表示 3D 空間中的線性變換。這包括旋轉、縮放和其他不太常見的線性變換的任何組合。t 是一個 3D 向量，表示 3D 空間中的平移（即位移）。 $\mathrm {M} _{{\text{object}}\to {\text{world}}}$ 將 $\mathrm {A}$ 和 t 組合在一個方便的 4×4 矩陣中。從數學角度來說，模型矩陣代表仿射變換：線性變換加上平移。為了使這能夠工作，所有三維點都用四維向量表示，第四個座標等於 1。

$P=\left[{\begin{matrix}p_{1}\\p_{2}\\p_{3}\\1\end{matrix}}\right]$

當我們將矩陣乘以這樣的點 $P$ 時，三維線性變換和平移的組合會體現在結果中。

$\mathrm {M} _{{\text{object}}\to {\text{world}}}\;P=\left[{\begin{matrix}a_{1,1}&a_{1,2}&a_{1,3}&t_{1}\\a_{2,1}&a_{2,2}&a_{2,3}&t_{2}\\a_{3,1}&a_{3,2}&a_{3,3}&t_{3}\\0&0&0&1\end{matrix}}\right]\left[{\begin{matrix}p_{1}\\p_{2}\\p_{3}\\1\end{matrix}}\right]$ $=\left[{\begin{matrix}a_{1,1}p_{1}+a_{1,2}p_{2}+a_{1,3}p_{3}+t_{1}\\a_{2,1}p_{1}+a_{2,2}p_{2}+a_{2,3}p_{3}+t_{2}\\a_{3,1}p_{1}+a_{3,2}p_{2}+a_{3,3}p_{3}+t_{3}\\1\end{matrix}}\right]$

除了第四個座標（應該是 1，因為它是點），結果等於

$\mathrm {A} \left[{\begin{matrix}p_{1}\\p_{2}\\p_{3}\end{matrix}}\right]+\left[{\begin{matrix}t_{1}\\t_{2}\\t_{3}\end{matrix}}\right]$

在頂點著色器中訪問模型矩陣

模型矩陣 $\mathrm {M} _{{\text{object}}\to {\text{world}}}$ 可以定義為一個統一變數，以便在頂點著色器中使用。然而，它通常與檢視變換矩陣結合起來形成模型檢視矩陣，然後將其設定為統一變數。在一些版本的 OpenGL（ES）中，在頂點著色器中可以使用內建的統一變數 gl_ModelViewMatrix。（另見 “應用矩陣變換”部分。）

計算模型矩陣

嚴格來說，GLSL 程式設計師不必擔心模型矩陣的計算，因為它以統一變數的形式提供給頂點著色器。事實上，渲染引擎、場景圖和遊戲引擎通常會提供模型矩陣；因此，頂點著色器的程式設計師不必擔心計算模型矩陣。然而，在現代版本的 OpenGL 和 OpenGL ES 或 WebGL 中開發應用程式時，必須計算模型矩陣。（OpenGL 3.2 之前的版本、新版本 OpenGL 的相容性配置檔案以及 OpenGL ES 1.x 提供了計算模型矩陣的函式。）

模型矩陣通常透過組合物件的基本變換的 4×4 矩陣來計算，特別是平移、旋轉和縮放。具體來說，在層次場景圖的情況下，物件的父組的所有變換（父、祖父母等）被組合起來形成模型矩陣。讓我們來看看最重要的基本變換及其矩陣。

表示由向量 t $=(t_{1},t_{2},t_{3})$ 執行的平移的 4×4 矩陣是

$\mathrm {M} _{\text{translation}}=\left[{\begin{matrix}1&0&0&t_{1}\\0&1&0&t_{2}\\0&0&1&t_{3}\\0&0&0&1\end{matrix}}\right]$

表示按因子 $s_{x}$ 沿 $x$ 軸縮放、按因子 $s_{y}$ 沿 $y$ 軸縮放，以及按因子 $s_{z}$ 沿 $z$ 軸縮放的 4×4 矩陣是

$\mathrm {M} _{\text{scaling}}=\left[{\begin{matrix}s_{x}&0&0&0\\0&s_{y}&0&0\\0&0&s_{z}&0\\0&0&0&1\end{matrix}}\right]$

表示繞歸一化軸 $(x,y,z)$ 旋轉角度 $\alpha$ 的 4×4 矩陣是

$\mathrm {M} _{\text{rotation}}=\left[{\begin{matrix}(1-\cos \alpha )x\,x+\cos \alpha &(1-\cos \alpha )x\,y-z\sin \alpha &(1-\cos \alpha )z\,x+y\sin \alpha &0\\(1-\cos \alpha )x\,y+z\sin \alpha &(1-\cos \alpha )y\,y+\cos \alpha &(1-\cos \alpha )y\,z-x\sin \alpha &0\\(1-\cos \alpha )z\,x-y\sin \alpha &(1-\cos \alpha )y\,z+x\sin \alpha &(1-\cos \alpha )z\,z+\cos \alpha &0\\0&0&0&1\end{matrix}}\right]$

繞特定軸的旋轉的特殊情況可以很容易地推匯出。例如，這些對於實現尤拉角旋轉是必要的。但是，尤拉角有多種約定，這裡不再討論。

歸一化四元數 $(w_{q},x_{q},y_{q},z_{q})$ 對應於繞角度 $2\arccos(w_{q})$ 的旋轉。旋轉軸的方向可以透過對 3D 向量 $(x_{q},y_{q},z_{q})$ 進行歸一化來確定。

還存在其他基本變換，但對於模型矩陣的計算而言，它們並不那麼重要。這些變換或其他變換的 4×4 矩陣可以透過矩陣乘法來組合。假設矩陣 $\mathrm {M} _{1}$ 、 $\mathrm {M} _{2}$ 和 $\mathrm {M} _{3}$ 按此特定順序應用於一個物體。（ $\mathrm {M} _{1}$ 可能代表從物體座標到父組座標系的變換； $\mathrm {M} _{2}$ 代表從父組到祖父母組的變換； $\mathrm {M} _{3}$ 代表從祖父母組到世界座標的變換。）那麼組合的矩陣乘積為

$\mathrm {M} _{\text{combined}}=\mathrm {M} _{3}\mathrm {M} _{2}\mathrm {M} _{1}\,\!$

請注意，矩陣因子的順序很重要。還要注意，此矩陣乘積應從右（向量相乘的地方）到左閱讀，即 $\mathrm {M} _{1}$ 首先應用，而 $\mathrm {M} _{3}$ 最後應用。

檢視變換

視點變換對應於放置和定向相機（或觀察者的眼睛）。然而，思考視點變換的最佳方式是它將世界座標轉換為相機的檢視座標系（也稱為眼睛座標系），該相機放置在座標系的原點，指向 **負** $z$ 軸，並放置在 $xz$ 平面上，即向上方向由正 $y$ 軸給出。

此步驟將整個世界旋轉朝向相機，相機始終從原點看向一個固定位置。

在頂點著色器中訪問檢視矩陣

與模型變換類似，視點變換由一個 4×4 矩陣表示，稱為檢視矩陣 $\mathrm {M} _{{\text{world}}\to {\text{view}}}$ 。它可以定義為頂點著色器的統一變數；但是，它通常與模型矩陣 $\mathrm {M} _{{\text{object}}\to {\text{world}}}$ 結合形成模型檢視矩陣 $\mathrm {M} _{{\text{object}}\to {\text{view}}}$ 。（在某些版本的 OpenGL (ES) 中，頂點著色器中提供了一個內建的統一變數 gl_ModelViewMatrix。）由於模型矩陣首先應用，所以正確的組合是

$\mathrm {M} _{{\text{object}}\to {\text{view}}}=\mathrm {M} _{{\text{world}}\to {\text{view}}}\mathrm {M} _{{\text{object}}\to {\text{world}}}\,\!$

（另請參閱 “應用矩陣變換”部分。）

計算檢視矩陣

與模型矩陣類似，GLSL 程式設計師不必擔心檢視矩陣的計算，因為它以統一變數的形式提供給頂點著色器。但是，在開發現代版本的 OpenGL 和 OpenGL ES 或 WebGL 中的應用程式時，有必要計算檢視矩陣。（在舊版本的 OpenGL 中，這通常透過一個名為 gluLookAt 的實用程式函式來實現。）

在這裡，我們簡要總結了如何從相機的方位 t、觀察方向 d 和世界向上向量 k（都在世界座標中）計算檢視矩陣 $\mathrm {M} _{{\text{world}}\to {\text{view}}}$ 。步驟很簡單

1. 計算（在世界座標中）檢視座標系的 $z$ 軸的方向 z，作為負的標準化 d 向量

$\mathbf {z} =-{\frac {\mathbf {d} }{|\mathbf {d} |}}$

2. 計算（再次在世界座標中）檢視座標系的 $x$ 軸的方向 x，方法是

$\mathbf {x} ={\frac {\mathbf {d} \times \mathbf {k} }{|\mathbf {d} \times \mathbf {k} |}}$

3. 在世界座標系中計算檢視座標系 $y$ 軸的方向 y

$\mathbf {y} =\mathbf {z} \times \mathbf {x}$

使用 x、y、z 和 t，可以輕鬆確定逆檢視矩陣 $\mathrm {M} _{{\text{view}}\to {\text{world}}}$ ，因為該矩陣將原點 (0,0,0) 對映到 t，並將單位向量 (1,0,0)、(0,1,0) 和 (0,0,1) 對映到 x、y,、z。因此，後一個向量必須位於矩陣 $\mathrm {M} _{{\text{view}}\to {\text{world}}}$ 的列中。

$\mathrm {M} _{{\text{view}}\to {\text{world}}}=\left[{\begin{matrix}x_{1}&y_{1}&z_{1}&t_{1}\\x_{2}&y_{2}&z_{2}&t_{2}\\x_{3}&y_{3}&z_{3}&t_{3}\\0&0&0&1\end{matrix}}\right]$

但是，我們需要矩陣 $\mathrm {M} _{{\text{world}}\to {\text{view}}}$ ；因此，我們必須計算矩陣 $\mathrm {M} _{{\text{view}}\to {\text{world}}}$ 的逆矩陣。請注意，矩陣 $\mathrm {M} _{\text{view→world}}$ 的形式為

$\mathrm {M} _{{\text{view}}\to {\text{world}}}=\left[{\begin{matrix}\mathrm {R} &\mathbf {t} \\\mathbf {0} ^{T}&1\end{matrix}}\right]$

其中， $\mathrm {R}$ 是一個 3×3 矩陣，t 是一個 3D 向量。此類矩陣的逆矩陣為

$\mathrm {M} _{{\text{view}}\to {\text{world}}}^{-1}=\mathrm {M} _{{\text{world}}\to {\text{view}}}=\left[{\begin{matrix}\mathrm {R} ^{-1}&-\mathrm {R} ^{-1}\mathbf {t} \\\mathbf {0} ^{T}&1\end{matrix}}\right]$

由於在此特定情況下矩陣 $\mathrm {R}$ 是正交的（因為它的列向量是歸一化的並且彼此正交）， $\mathrm {R}$ 的逆矩陣只是它的轉置，即第四步是計算

$\mathrm {M} _{{\text{world}}\to {\text{view}}}=\left[{\begin{matrix}\mathrm {R} ^{T}&-\mathrm {R} ^{T}\mathbf {t} \\\mathbf {0} ^{T}&1\end{matrix}}\right]$ ${\text{with }}\mathrm {R} =\left[{\begin{matrix}x_{1}&y_{1}&z_{1}\\x_{2}&y_{2}&z_{2}\\x_{3}&y_{3}&z_{3}\end{matrix}}\right]$

雖然推導這個結果需要一些線性代數的知識，但最終的計算只需要基本的向量和矩陣運算，並且可以很容易地在任何常見的程式語言中實現。

投影變換和透視除法

首先，投影變換決定投影的型別，例如透視投影或正交投影。透視投影對應於具有縮短的線性透視，而正交投影是沒有縮短的正交投影。縮短實際上是透過透視除法完成的；但是，所有控制透視投影的引數都設定在投影變換中。

從技術上講，投影變換將檢視座標轉換為裁剪座標。（場景中可見部分外部的所有圖元部分都在裁剪座標中被裁剪掉。）它應該是頂點著色器中應用於頂點的最後一個變換，在頂點以 gl_Position 返回之前。然後，這些裁剪座標透過**透視除法**轉換為歸一化裝置座標，該除法只是將所有座標除以第四個座標。（歸一化裝置座標之所以如此命名，是因為它們的取值範圍在場景中可見部分的所有點的 -1 到 +1 之間。）

此步驟將物體頂點的 3D 位置轉換為螢幕上的 2D 位置。

在頂點著色器中訪問投影矩陣

與模型變換和檢視變換類似，投影變換由一個 4×4 矩陣表示，稱為投影矩陣 $\mathrm {M} _{\text{projection}}$ 。它通常被定義為頂點著色器的uniform變數。（在某些版本的 OpenGL（ES）中，頂點著色器中可以使用內建 uniform 變數 gl_Projection；另請參見“應用矩陣變換”部分。）

計算投影矩陣

與模型檢視矩陣類似，GLSL 程式設計師不必擔心投影矩陣的計算。但是，在現代版本的 OpenGL 和 OpenGL ES 或 WebGL 中開發應用程式時，需要計算投影矩陣。在舊版本的 OpenGL 中，這通常使用函式 gluPerspective、glFrustum 或 glOrtho 來完成。

在這裡，我們針對三種情況展示投影矩陣

標準透視投影（對應於 gluPerspective）
傾斜透視投影（對應於 glFrustum）
正交投影（對應於 glOrtho）

標準透視投影 的特徵在於

一個角度 $\theta _{\text{fovy}}$ ，它指定了 $y$ 方向上的視野，如圖所示，
到近裁剪平面的距離 $n$ 和到遠裁剪平面的距離 $f$ ，如圖所示，
近裁剪平面上以中心為原點的矩形的寬高比 $a$ 。

連同視點和裁剪平面，這個以中心為原點的矩形定義了視錐體，即對於特定的投影變換可見的 3D 空間區域。所有原語和所有位於視錐體外部的原語部分都會被裁剪掉。近裁剪平面和遠裁剪平面是必需的，因為深度值以有限精度儲存；因此，不可能覆蓋無限大的視錐體。

使用引數 $\theta _{\text{fovy}}$ 、 $a$ 、 $n$ 和 $f$ ，透視投影的投影矩陣 $\mathrm {M} _{\text{projection}}$ 為

$\mathrm {M} _{\text{projection}}=\left[{\begin{matrix}{\frac {d}{a}}&0&0&0\\0&d&0&0\\0&0&{\frac {n+f}{n-f}}&{\frac {2nf}{n-f}}\\0&0&-1&0\end{matrix}}\right]$ ${\text{ with }}d={\frac {1}{\tan(\theta _{\text{fovy}}/2)}}$

斜透視投影 的特徵在於

與標準透視投影情況相同，到裁剪平面的距離為 $n$ 和 $f$ 。
座標 $r$ （右）、 $l$ （左）、 $t$ （上）和 $b$ （下），如圖所示。這些座標決定了視錐體的正面矩形的位置；因此，可以指定比使用縱橫比 $a$ 和視野角度 $\theta _{\text{fovy}}$ 更多的視錐體（例如，偏心）。

給定引數 $n$ 、 $f$ 、 $r$ 、 $l$ 、 $t$ 和 $b$ ，斜透視投影的投影矩陣 $\mathrm {M} _{\text{projection}}$ 為

$\mathrm {M} _{\text{projection}}=\left[{\begin{matrix}{\frac {2n}{r-l}}&0&{\frac {r+l}{r-l}}&0\\0&{\frac {2n}{t-b}}&{\frac {t+b}{t-b}}&0\\0&0&{\frac {n+f}{n-f}}&{\frac {2nf}{n-f}}\\0&0&-1&0\end{matrix}}\right]$

正交投影（沒有透視縮短）如圖右側所示。引數與斜透視投影的情況相同；但是，視錐體（更準確地說，視體積）現在是一個長方體，而不是一個截斷的稜錐。

在引數 $n$ , $f$ , $r$ , $l$ , $t$ , 以及 $b$ ，正投影的投影矩陣 $\mathrm {M} _{\text{projection}}$ 為

$\mathrm {M} _{\text{projection}}=\left[{\begin{matrix}{\frac {2}{r-l}}&0&0&-{\frac {r+l}{r-l}}\\0&{\frac {2}{t-b}}&0&-{\frac {t+b}{t-b}}\\0&0&{\frac {-2}{f-n}}&-{\frac {f+n}{f-n}}\\0&0&0&1\end{matrix}}\right]$

視口變換

投影變換將視座標對映到裁剪座標，然後透過裁剪座標的第四個分量進行透視除法，對映到歸一化的裝置座標。在歸一化的裝置座標 (ndc) 中，視體積始終是一個以原點為中心的立方體，其中立方體內的座標介於 -1 和 +1 之間。然後，該立方體透過視口變換對映到螢幕座標（也稱為視窗座標），如對應圖所示。此對映的引數是視口（螢幕上呈現的矩形）左下角的座標 $s_{x}$ 和 $s_{y}$ ，以及它的寬度 $w_{s}$ 和高度 $h_{s}$ ，以及近裁剪平面和遠裁剪平面的深度 $n_{s}$ 和 $f_{s}$ 。（這些深度介於 0 和 1 之間）。在 OpenGL 和 OpenGL ES 中，這些引數透過兩個函式設定

glViewport(GLint $s_{x}$ , GLint $s_{y}$ , GLsizei $w_{s}$ , GLsizei $h_{s}$ );

glDepthRangef(GLclampf $n_{s}$ , GLclampf $f_{s}$ );

視口變換矩陣並不重要，因為它在固定功能階段自動應用。然而，為了完整起見，這裡提供它。

$\mathrm {M} _{\text{viewport}}=\left[{\begin{matrix}{\frac {w_{s}}{2}}&0&0&s_{x}+{\frac {w_{s}}{2}}\\0&{\frac {h_{s}}{2}}&0&s_{y}+{\frac {h_{s}}{2}}\\0&0&{\frac {f_{s}-n_{s}}{2}}&{\frac {n_{s}+f_{s}}{2}}\\0&0&0&1\end{matrix}}\right]$

進一步閱讀

此處描述的傳統頂點變換在“OpenGL 4.1 Compatibility Profile Specification”的第 2.12 節中進行了詳細定義，該規範可在 Khronos OpenGL 網站上獲得。

Dave Shreiner 編寫的“OpenGL Programming Guide”一書的第 3 章（關於檢視）中給出了對頂點變換更易於理解的描述，該書由 Addison-Wesley 出版。（較舊的版本可在網上獲得）。

< GLSL 程式設計

除非另有說明，否則本頁上的所有示例原始碼均授予公共領域。