古吉拉特語/如何在建立古吉拉特語文字時使用 Unicode

How-tos bookshelf | 如何在建立古吉拉特語文字時使用 Unicode

介紹

本頁包含婆羅米系文字。如果您沒有足夠的文字支援，您可能會看到不規則的母音位置和沒有連字。更多...

古吉拉特語文字用於書寫古吉拉特語。這個主題最初是一篇簡短的文章，後來成為了古吉拉特語文字的子頁面，最後被標記為華夏公益教科書的候選人。在這裡，我們將嘗試處理古吉拉特語文字的略微複雜的排版，以供非母語使用者，以及它在 Unicode 中的實現方式。由於標準化的優勢，Unicode 已經嘗試使用類似的規則來實現 12 種南亞文字。這意味著，一旦您瞭解了如何在建立古吉拉特語文字時使用 Unicode，您就可以將類似的方法應用於其他印度文字，例如天城文、孟加拉文、古穆奇文等；前提是您具有基本知識和相應書寫系統的流利度。

基礎知識

古吉拉特語字母主要包括 34 個子音（裝飾音），2 個被視為子音的複合字元（雖然在詞彙上不是），以及 14 個母音（純粹音）。總體而言，這個書寫系統包含 94 個合法且公認的獨立符號或形狀。然而，在目前的 Unicode 4.1 實現中，只有其中一些符號被納入字形或形狀。其餘形狀是透過連字建立的。

您可以從以下資源獲取有關古吉拉特語和文字的入門知識

古吉拉特語符號的框架

給定一個構造好的古吉拉特語音節，它可以根據所涉及的形狀的位置，邏輯地劃分為以下幾個部分。

1. 基線區域 - 這是子音和獨立母音的佔位符
2. 基線下方和上方的區域 - 分別用於放置下基（基線下方）和上基（基線上方）的從屬母音
3. 基線之前和之後的區域 - 分別用於書寫左基（前基）和右基（後基）的從屬母音

範例（從左上角順時針方向）：1. 後基（右）2. 下基（下）3. 前基（左）4. 上基（上）。我們將在進一步的討論中使用這些約定。

什麼是替換？

這裡所指的替換，是指用一個字元或形狀來替換一組或多個字元或形狀。在實務上，這轉換為 - 1) 多個鍵擊將生成一個形狀；以及 2) 生成的形狀將根據使用者的鍵擊或輸入，根據某些規則不斷轉換自身。

當您在基線區域以外的任何位置新增一個或多個形狀時，可能會發生替換（請參閱上圖）。

Unicode 編碼集

古吉拉特語文字的 Unicode 範圍是從 U+0A80 到 U+0AFF。古吉拉特語文字的 ISCII 編碼頁識別符是 57010。

下表顯示了 Unicode 標準 4.0.0 中實現的字形。灰色框表示保留/未使用的程式碼點。

x=

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

U+0A8x

ઁ

ં

ઃ

અ

આ

ઇ

ઈ

ઉ

ઊ

ઋ

ઌ

ઍ

એ

U+0A9x

ઐ

ઑ

ઓ

ઔ

ક

ખ

ગ

ઘ

ઙ

ચ

છ

જ

ઝ

ઞ

ટ

U+0AAx

ઠ

ડ

ઢ

ણ

ત

થ

દ

ધ

ન

પ

ફ

બ

ભ

મ

ય

U+0ABx

ર

લ

ળ

વ

શ

ષ

સ

હ

઼

ઽ

ા

િ

U+0ACx

ી

ુ

ૂ

ૃ

ૄ

ૅ

ે

ૈ

ૉ

ો

ૌ

્

U+0ADx

ૐ

U+0AEx

ૠ

ૡ

ૢ

ૣ

૦

૧

૨

૩

૪

૫

૬

૭

૮

૯

U+0AFx

૱

有關 Unicode 程式碼點和標準的更多詳細資訊，您可以參閱 Unicode 編碼表 - 標準 4.1。

範例

注意：在下述各節中所示的範例中，“+”符號表示鍵擊或使用者輸入的組合。

子音的半形

子音的半形用於前基位置。對於沒有半形字形的子音，可以使用Halant（્）來建立半形，如下所示

મ +્ + ય = મ્ય

— 如 રમ્ય（令人愉快的）

（注意這裡使用的 મ 的半形，它與 ય 連用）注意：即使音節以Halant 結尾，基字形也不會建立半形。

Ra 的上基形式的應用 - (Reph)

將帶有Halant 的Ra（如上所示的Ra 的半形）應用於前子音的完整形式子音會產生該子音的Reph。這會影響Ra 與該子音連用時的發音。Reph 可以透過以下方式建立

ર +્	= Ra + Halant
ર +્ + થ = ર્થ	— 如 અર્થ (意思)

(Ra + Halant + થ = Reph 對 થ 的影響)

Ra 的下置形式的應用 – (Vattu)

將子音的 Halant（子音的半形）應用於 Ra 的全形會產生該子音的 Vattu。這會影響 Ra 與該子音結合時的發音。Vattu 可以按如下方式建立

પ +્ + ર = પ્ર

— 如 પ્રજા (人民)

(પ + Halant + Ra = Vattu 對 પ 的影響)

Vattu 變體

Vattu 變體（半形和全形）是在帶 vattu 標記的子音組合時形成的。通常在某些情況下，當各種子音組合時，需要一個特殊的字形來表示 vattu。

ડ +્ + ર = ડ્ર

— 如 ડ્રમ (鼓)

(特殊字形 ડ્ર。注意有兩個下置標記，而前面的例子只有一個。)

特殊標記、字元和 Nukta

上置標記

所有上置標記和後置 matra 如下建立

ક +ં = કં

— 如 કંપન (振動)

下置標記

下置標記和後置 matra 如下建立

ક +ુ = કુ	— 如 કુતરો (狗)
ભ +ૂ = ભૂ	— 如 ભૂકંપ (地震)

字元 શ્ર、ક્ષ 和 જ્ઞ

以下字元是古吉拉特語字母表的一部分，但在 Unicode 字元集中沒有明確地作為字形建立，可以按如下所示生成

શ +્ + ર = શ્ર

ક +્ + ષ = ક્ષ

જ +્ + ઞ = જ્ઞ

Nukta 的應用

Nukta 會影響它所應用到的（前面的）子音的發音。子音的 Nukta 形可以在 Unicode 中按如下方式建立

ય +઼ = ય઼

用於指令碼特定排版的替換

以下是解決語言複雜性和生成指令碼各種字元形式所需的字元替換

前置替換

半形連字元是指令碼中最常見的現象之一，它們是透過前置替換建立的。

ન +્ + ન = ન્ન

— 如 પ્રસન્ન (快樂)

此外，這種替換的特殊用法是建立 I-Matra（及其適當對齊的形狀），如下所示

ત +િ = તિ

— 如 તિર (箭)

後置替換

古吉拉特語指令碼的子音沒有後置形式。主要是，後置替換用於從母音建立 visarga，也應用於“I-Matra”替換，如下所示（如果也應用，則將在任何上置替換之前）

જ +ી = જી

— 如 જીવન (生命)

(將特殊的形狀 જી（後置替換的結果）與使用像 લ 這樣的字元的類似組合的另一個結果進行比較，它將生成：લ +ી = લી)

上置替換

上置替換主要應用於 Matra、Reph、母音修改以及重音和音調標記。請考慮以下示例

વ +ૈ = વૈ	— 如 વૈભવ (浮誇)
ર +્ + ગ +ે = ર્ગે	— 如 સ્વર્ગે (在天堂)
મ +ે +ં = મેં	— 如 મેંઢક (青蛙)

下置替換

主要用於下置 matra，下置替換可能會產生連字元，或改變字形的整體形狀。這種替換也用於產生特殊的音調效果，例如 anudatta。

關於古吉拉特語 Unicode 的更多資訊

有關古吉拉特語 Unicode 的更多資訊，您可以參考 Unicode Std 4.0.0 - 第 9 章
TDIL：印度通訊和資訊科技部
如果您在作業系統語言不是古吉拉特語的情況下建立網頁，請將檔案另存為 UTF-8 Unicode HTML。否則，程式碼點可能會丟失。