跳轉到內容

古吉拉特語/如何在建立古吉拉特語文字時使用 Unicode

來自華夏公益教科書,為開放世界提供開放書籍

How-tos bookshelf | 如何在建立古吉拉特語文字時使用 Unicode

本頁包含 婆羅米系文字。如果您沒有足夠的文字支援,您可能會看到不規則的母音位置和沒有連字。 更多...

古吉拉特語文字用於書寫 古吉拉特語。這個主題最初是一篇簡短的文章,後來成為了 古吉拉特語文字 的子頁面,最後被標記為 華夏公益教科書 的候選人。在這裡,我們將嘗試處理古吉拉特語文字的略微複雜的 排版,以供非母語使用者,以及它在 Unicode 中的實現方式。由於標準化的優勢,Unicode 已經嘗試使用類似的規則來實現 12 種 南亞文字。這意味著,一旦您瞭解了如何在建立古吉拉特語文字時使用 Unicode,您就可以將類似的方法應用於其他 印度文字,例如 天城文孟加拉文古穆奇文 等;前提是您具有基本知識和相應 書寫系統 的流利度。

基礎知識

[編輯 | 編輯來源]

古吉拉特語字母主要包括 34 個子音(裝飾音),2 個被視為子音的複合字元(雖然在詞彙上不是),以及 14 個母音(純粹音)。總體而言,這個書寫系統包含 94 個合法且公認的獨立符號或形狀。然而,在目前的 Unicode 4.1 實現中,只有其中一些符號被納入字形或形狀。其餘形狀是透過 連字 建立的。

您可以從以下資源獲取有關古吉拉特語和文字的入門知識

古吉拉特語符號的框架

[編輯 | 編輯來源]

給定一個構造好的古吉拉特語音節,它可以根據所涉及的形狀的位置,邏輯地劃分為以下幾個部分。

  • 1. 基線區域 - 這是子音和獨立母音的佔位符
  • 2. 基線下方和上方的區域 - 分別用於放置下基(基線下方)和上基(基線上方)的從屬母音
  • 3. 基線之前和之後的區域 - 分別用於書寫左基(前基)和右基(後基)的從屬母音

範例(從左上角順時針方向):1. 後基(右)2. 下基(下)3. 前基(左)4. 上基(上)。我們將在進一步的討論中使用這些約定。

什麼是替換

[編輯 | 編輯來源]

這裡所指的替換,是指用一個字元或形狀來替換一組或多個字元或形狀。在實務上,這轉換為 - 1) 多個鍵擊將生成一個形狀;以及 2) 生成的形狀將根據使用者的鍵擊或輸入,根據某些規則不斷轉換自身。

當您在基線區域以外的任何位置新增一個或多個形狀時,可能會發生替換(請參閱上圖)。

Unicode 編碼集

[編輯 | 編輯來源]

古吉拉特語文字的 Unicode 範圍是從 U+0A80 到 U+0AFF。古吉拉特語文字的 ISCII 編碼頁識別符是 57010。


下表顯示了 Unicode 標準 4.0.0 中實現的字形。灰色框表示保留/未使用的程式碼點。


x= 0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0A8x      
U+0A9x  
U+0AAx  
U+0ABx         િ
U+0ACx        
U+0ADx                              
U+0AEx    
U+0AFx                              

注意:在下述各節中所示的範例中,“+”符號表示鍵擊或使用者輸入的組合。

子音的半形

[編輯 | 編輯來源]

子音的半形用於前基位置。對於沒有半形字形的子音,可以使用Halant(્)來建立半形,如下所示

મ +્ + ય = મ્ય — 如 રમ્ય(令人愉快的)

(注意這裡使用的 મ 的半形,它與 ય 連用)注意:即使音節以Halant 結尾,基字形也不會建立半形。


Ra 的上基形式的應用 - (Reph)

[編輯 | 編輯來源]

將帶有HalantRa(如上所示的Ra 的半形)應用於子音的完整形式子音會產生該子音的Reph。這會影響Ra 與該子音連用時的發音。Reph 可以透過以下方式建立

ર +્ = Ra + Halant
ર +્ + થ = ર્થ — 如 અર્થ (意思)

(Ra + Halant + થ = Reph 對 થ 的影響)


Ra 的下置形式的應用 – (Vattu)

[編輯 | 編輯原始碼]

將子音的 Halant(子音的半形)應用於 Ra 的全形會產生該子音的 Vattu。這會影響 Ra 與該子音結合時的發音。Vattu 可以按如下方式建立

પ +્ + ર = પ્ર — 如 પ્રજા (人民)

(પ + Halant + Ra = Vattu 對 પ 的影響)

Vattu 變體

[編輯 | 編輯原始碼]

Vattu 變體(半形和全形)是在帶 vattu 標記的子音組合時形成的。通常在某些情況下,當各種子音組合時,需要一個特殊的字形來表示 vattu

ડ +્ + ર = ડ્ર — 如 ડ્રમ (鼓)

(特殊字形 ડ્ર。注意有兩個下置標記,而前面的例子只有一個。)

特殊標記、字元和 Nukta

[編輯 | 編輯原始碼]

上置標記

[編輯 | 編輯原始碼]

所有上置標記和後置 matra 如下建立

ક +ં = કં — 如 કંપન (振動)

下置標記

[編輯 | 編輯原始碼]

下置標記和後置 matra 如下建立

ક +ુ = કુ — 如 કુતરો (狗)
ભ +ૂ = ભૂ — 如 ભૂકંપ (地震)

字元 શ્ર、ક્ષ 和 જ્ઞ

[編輯 | 編輯原始碼]

以下字元是古吉拉特語字母表的一部分,但在 Unicode 字元集中沒有明確地作為字形建立,可以按如下所示生成

શ +્ + ર = શ્ર
ક +્ + ષ = ક્ષ
જ +્ + ઞ = જ્ઞ

Nukta 的應用

[編輯 | 編輯原始碼]

Nukta 會影響它所應用到的(前面的)子音的發音。子音的 Nukta 形可以在 Unicode 中按如下方式建立

ય +઼ = ય઼

用於指令碼特定排版的替換

[編輯 | 編輯原始碼]

以下是解決語言複雜性和生成指令碼各種字元形式所需的字元替換

前置替換

[編輯 | 編輯原始碼]

半形連字元是指令碼中最常見的現象之一,它們是透過前置替換建立的。

ન +્ + ન = ન્ન — 如 પ્રસન્ન (快樂)

此外,這種替換的特殊用法是建立 I-Matra(及其適當對齊的形狀),如下所示

ત +િ = તિ — 如 તિર (箭)

後置替換

[編輯 | 編輯原始碼]

古吉拉特語指令碼的子音沒有後置形式。主要是,後置替換用於從母音建立 visarga,也應用於“I-Matra”替換,如下所示(如果也應用,則將在任何上置替換之前)

જ +ી = જી — 如 જીવન (生命)

(將特殊的形狀 જી(後置替換的結果)與使用像 લ 這樣的字元的類似組合的另一個結果進行比較,它將生成:લ +ી = લી)

上置替換

[編輯 | 編輯原始碼]

上置替換主要應用於 MatraReph、母音修改以及重音和音調標記。請考慮以下示例

વ +ૈ = વૈ — 如 વૈભવ (浮誇)
ર +્ + ગ +ે = ર્ગે — 如 સ્વર્ગે (在天堂)
મ +ે +ં = મેં — 如 મેંઢક (青蛙)

下置替換

[編輯 | 編輯原始碼]

主要用於下置 matra,下置替換可能會產生連字元,或改變字形的整體形狀。這種替換也用於產生特殊的音調效果,例如 anudatta

關於古吉拉特語 Unicode 的更多資訊

[編輯 | 編輯原始碼]
  • 有關古吉拉特語 Unicode 的更多資訊,您可以參考 Unicode Std 4.0.0 - 第 9 章
  • TDIL:印度通訊和資訊科技部
  • 如果您在作業系統語言不是古吉拉特語的情況下建立網頁,請將檔案另存為 UTF-8 Unicode HTML。否則,程式碼點可能會丟失。


華夏公益教科書