古吉拉特語/如何在建立古吉拉特語指令碼中使用 Unicode

介紹

此頁面包含婆羅米系文字。如果您沒有足夠的文字支援，您可能會看到不規則的母音放置和沒有連字。更多...

古吉拉特語指令碼用於書寫古吉拉特語。該主題最初是一個存根，然後成為古吉拉特語指令碼下的一個子頁面，最後被標記為華夏公益教科書的候選者。在這裡，我們將嘗試處理古吉拉特語指令碼的略微複雜的排版，針對指令碼的非母語使用者，以及它在 Unicode 中的實現方式，這稍微有些複雜。透過標準化的優點，Unicode 試圖以類似的規則集來實現十二種南亞文字。這意味著，一旦您知道如何在建立古吉拉特語指令碼中使用 Unicode，您就可以將類似的方法應用於其他印度文字，例如天城體、孟加拉語、古木吉語等；前提是您具備基本知識並能熟練使用相應的書寫系統。

基礎知識

古吉拉特語字母表主要包括 34 個子音（裝飾音），2 個被視為子音的複合字符（但詞典上不是），以及 14 個母音（純音）。總的來說，書寫系統包含 94 個合法且公認的獨特符號或形狀。然而，在當前的 Unicode 4.1 實現中，只有其中一些符號被納入字形或形狀。剩餘的形狀是透過連字建立的。

您可以從以下資源獲取關於古吉拉特語語言和指令碼的入門知識

古吉拉特語符號的框架

給定一個構造的古吉拉特語音節，它可以根據所涉及形狀的位置邏輯地劃分為以下部分。

1. 基線區域 - 這是子音和獨立母音的佔位符
2. 基線下方的區域 - 用於放置下部（基線下部）和上部（基線上部）的從屬母音
3. 基線之前和之後的區域 - 用於書寫左部（前基）和右部（後基）的從屬母音

示例（從左上角順時針）：1. 後基（右）2. 下基（下）3. 前基（左）4. 上基（上）。我們將在進一步的討論中使用這些約定。

什麼是替換？

替換，在此適用的意義上，意味著用單個字元或形狀替換一組或一組字元或形狀。在實際應用中，這轉化為 - 1) 多個按鍵操作會生成一個形狀；以及 2) 生成的形狀會根據使用者的按鍵操作或輸入，根據某些規則進行自我轉換。

當您在除基線區域之外的任何位置新增一個或多個形狀時，可能會發生替換（請參閱上面的插圖）。

Unicode 程式碼集

古吉拉特語指令碼的 Unicode 範圍從 U+0A80 到 U+0AFF。古吉拉特語指令碼的 ISCII 內碼表識別符號是 57010。

下表顯示了在 Unicode 標準 4.0.0 中實現的字形。灰色框表示保留/未使用的程式碼點。

x=

0

1

2

3

4

5

6

7

8

9

A

B

C

D

E

F

U+0A8x

ઁ

ં

ઃ

અ

આ

ઇ

ઈ

ઉ

ઊ

ઋ

ઌ

ઍ

એ

U+0A9x

ઐ

ઑ

ઓ

ઔ

ક

ખ

ગ

ઘ

ઙ

ચ

છ

જ

ઝ

ઞ

ટ

U+0AAx

ઠ

ડ

ઢ

ણ

ત

થ

દ

ધ

ન

પ

ફ

બ

ભ

મ

ય

U+0ABx

ર

લ

ળ

વ

શ

ષ

સ

હ

઼

ઽ

ા

િ

U+0ACx

ી

ુ

ૂ

ૃ

ૄ

ૅ

ે

ૈ

ૉ

ો

ૌ

્

U+0ADx

ૐ

U+0AEx

ૠ

ૡ

ૢ

ૣ

૦

૧

૨

૩

૪

૫

૬

૭

૮

૯

U+0AFx

૱

有關 Unicode 程式碼點和標準的更多詳細資訊，您可以參考 Unicode 程式碼表 - 標準 4.1。

示例

注意：在下文中顯示的示例中，“+”符號表示按鍵操作或使用者輸入的組合。

子音的半形

子音半形用於前置位置。對於沒有獨立半形字形的子音，可以使用Halant（્）來建立半形，如下所示

મ +્ + ય = મ્ય

— 如 રમ્ય（令人愉悅）

（注意這裡使用的 મ 的半形，它與 ય 結合使用）注意：即使音節以Halant結尾，也不會為基字形建立半形。

Ra的上置形式的應用 – （Reph）

在子音之前將帶有Halant（如上所示的Ra 的半形）的Ra 應用於全形子音會產生該子音的Reph。這會影響Ra 與該子音結合時的發音。Reph 可以如下建立

ર +્	= Ra + Halant
ર +્ + થ = ર્થ	— 如 અર્થ（意義）

（Ra + Halant + થ = Reph 對 થ 的影響）

Ra 的下置形式的應用 – （Vattu）

將子音的Halant（子音的半形）應用於Ra 的全形會產生該子音的Vattu。這會影響Ra 與該子音結合時的發音。Vattu 可以如下建立

પ +્ + ર = પ્ર

— 如 પ્રજા（人民）

（પ + Halant + Ra = Vattu 對 પ 的影響）

Vattu 變體

Vattu 變體（半形和全形）是在帶有vattu 標記的子音組合時形成的。在某些情況下，當各種子音組合時，需要特殊的字形來表示vattu。

ડ +્ + ર = ડ્ર

— 如 ડ્રમ（鼓）

（特殊字形 ડ્ર。注意有兩個下置標記，而之前的例子只有一個。）

特殊標記、字元和Nukta

上置標記

所有上置標記和後置matra 如下建立

ક +ં = કં

— 如 કંપન（振動）

下置標記

下置標記和後置matra 如下建立

ક +ુ = કુ	— 如 કુતરો（狗）
ભ +ૂ = ભૂ	— 如 ભૂકંપ（地震）

字元 શ્ર、ક્ષ 和 જ્ઞ

以下字元是古吉拉特語字母表的一部分，但 Unicode 字元集中沒有明確建立為字形，可以如下生成

શ +્ + ર = શ્ર

ક +્ + ષ = ક્ષ

જ +્ + ઞ = જ્ઞ

Nukta 的應用

Nukta 影響它所應用的（前面的）子音的發音。子音的Nukta 形式可以在 Unicode 中如下建立

ય +઼ = ય઼

用於指令碼特定排版的替代

以下是解決語言複雜性和生成指令碼各種字元形式所需的字元主要替代

前置替代

半形連詞是指令碼中最常見的用法之一，它們透過前置替代來建立。

ન +્ + ન = ન્ન

— 如 પ્રસન્ન（高興）

此外，這種替代的特殊用法是在建立I-Matra（及其適當對齊的形狀）時，如下所示

ત +િ = તિ

— 如 તિર（箭頭）

後置替代

古吉拉特語指令碼的子音沒有後置形式。主要使用後置替代來從母音建立visarga，也用於“I-Matra”替代，如下所示（如果也應用，它將在任何上置替代之前）

જ +ી = જી

— 如 જીવન（生活）

（將特殊形狀 જી - 後置替代的結果 - 與使用像 લ 這樣的字元產生的類似組合的另一個結果進行比較，它將生成：લ +ી = લી）

上置替代

上置替代主要用於Matra、Reph、母音修改以及重音和音調標記。請考慮以下示例

વ +ૈ = વૈ	— 如 વૈભવ（浮誇）
ર +્ + ગ +ે = ર્ગે	— 如 સ્વર્ગે（在天堂）
મ +ે +ં = મેં	— 如 મેંઢક（青蛙）

下置替代

主要用於下置matra，下置替代可以產生連詞，或改變字形的整體形狀。這種替代也用於產生特殊的音調效果，如anudatta。

有關古吉拉特語 Unicode 的更多詳細資訊

有關古吉拉特語 Unicode 的更多詳細資訊，您可以參考 Unicode Std 4.0.0 - 第 9 章
TDIL：印度通訊與資訊科技部
如果您在作業系統語言不是古吉拉特語的情況下建立網頁，請將檔案儲存為 UTF-8 Unicode HTML。否則程式碼點可能會丟失。