人工語言/中級/書寫
此模組的文字目前不完整。 |
(這裡提到的所有音素和語音轉錄都是用 X-SAMPA)
文字,或書寫系統,是許多人在接觸另一種語言時首先注意到的東西之一。許多人在人生的某個階段,都嘗試過創造某種“程式碼”,用他們自己的符號與母語的字母建立一對一的對應關係。繼續閱讀,瞭解如何為一種語言建立現實的文字。
主要有五種文字型別。本頁按從最進化到最不進化的順序排列。所有這些系統都有不同的優點和缺點,例如,表意文字系統在語言有很多方言的情況下很有用,但如果想提高人工語言的使用者識字率,字母表會很有用。
- 字母表是你可能比較熟悉的一種型別。它由一系列符號組成,通常在 10 到 45 個之間,每個符號代表語言中的一個子音或母音。有些可能有一些重複的字母(例如,英語 C、K 和 Q),但這些通常具有某些歷史意義,將在後面討論。其他字母表將包含用於子音連綴的符號,例如希臘語“Ξ”/ks/,西裡爾字母“Ц”/ts/,甚至英語“X”/ks, gz/。
- 子音字母,也稱為子音字母表,標記子音,但不標記母音。阿拉伯語和希伯來語就是例子。雖然這些語言確實有顯示母音的方法,透過變音符號,但通常不顯示,除非是兒童讀物、外國人讀物或宗教文字。有些子音字母,比如腓尼基語,根本沒有標記母音的系統!它們通常包含 15 到 35 個符號。
- 音節文字包含與母音配對的子音,可以用變音符號進行更改。印地語和其他許多南亞語言就是例子。每個符號都有一個“固有母音”,通常是/a/,所以你每個單獨的符號都代表/pa/、/ba/、/ta/、/da/等。母音可以用變音符號進行更改或靜音。它們通常包含 30 到 60 個符號,不包括變音符號。
- 音節文字包含語言中每個音節的不同符號,例如阿姆哈拉語、彝語或切羅基語。換句話說,每個母音和子音都有一個單獨的音節,比如/ka/、/ke/、/ki/、/ko/等。代表相同子音的符號可能相關(比如在 Ojibwe 語中,符號是旋轉的),或者可能與其他符號沒有相似之處,比如在彝語或切羅基語中。音節文字的大小通常在 40 個符號到 400 個符號之間,彝語是最大的標準化音節文字,超過 800 個符號。
- 表意文字系統包含代表單個語素的符號,或者語言中最小的有意義單位。(例如,英語中的“手”、“-er”、“un-”)。許多語言包含一些表意文字符號,例如“1”、“@”和“&”,但有一些語言,例如漢語、日語、古埃及語和瑪雅語,使用表意文字來代表他們整個語言的很大一部分或全部。
表意系統使用一個符號來代表一個思想或概念。由於語言不是直接由思想和概念構成的,書寫系統代表的是語言,因此真正的表意系統並不存在。它們將在“外星”語言中進行討論,儘管如此。漢語經常被描述為“表意”——這要麼是將“表意”一詞寬泛地用於指代“表意文字”,要麼就是誤解——漢字不是直接代表概念。日語漢字更接近於“表意”的理想,一個符號代表一個上下文中幾個同義詞中的任何一個。
字母表是歐洲以及歐洲曾經殖民地區的地區使用的主要書寫系統。基本上,它們代表每個聲音一個符號,包括母音。
然而,字母表,尤其是拉丁字母表,往往更加複雜。每個符號通常代表不止一個聲音,有時在語言中有所區分,有時沒有。例如,英語<c>代表/k/和/s/,<x> /ks/和/gz/(如 exist),或者<a> /a/、/A/、/{/、/O/或/@/。造成這種情況的主要原因是拉丁字母是為拉丁語而創造的,只是為了後來的語言而被調整。英語本身最初使用的是盧恩文字,北歐語言也是如此。用拉丁字母書寫的拉丁語完全是語音的。
許多字母表還包含代表完全不同聲音的字母組合。這些被稱為二合字母。在英語中,主要的子音二合字母是<sh> /S/,<ch> /tS/,<ng> /N/,以及許多其他二合字母。雙母音,或母音組合,也經常出現。英語<i>代表/aj/以及/i/或/I/。一些語言使用二合字母表示雙母音,比如<ei>代表/ej/。
請注意,上述情況經常發生。隨著語言的改變,它們的正字法(書寫系統)可能隨之改變,但並不總是發展到與之相匹配的地步。幾乎沒有一種語言的字母只代表一個聲音,而不是其他聲音。一個現實的人工文字不應該與英語之間有直接的對應關係。
變音符號是字母表可能使用的另一種方法。創造新的符號可能很困難,也很難記憶,因此許多語言創造了“變音符號”,即在字母上新增的小筆畫,用於標記新的聲音。拉丁字母語言中使用的主要變音符號有銳音:'(á,é,等等,通常用於標記重音),重音(à,è,等等),尖音符(â,ê),分音符(ä,ë),波浪號(ã,ñ,通常在母音上標記鼻音化),小尾巴(ç),以及許多其他變音符號。“連字”,或者字母組合,也可能被引入,例如“æ”。符號“&”實際上是<E>和<T>的嚴重修改後的連字,構成“et”,拉丁語中的“and”。
然而,有些語言確實創造了新的字母,這些字母通常基於以前的系統。例如“þ”(thorn,/T/),它源自盧恩文字(ᚦ)和“ð”(eth,/D/),是在中世紀發展起來的,這些字母在冰島語、古英語和幾種相關語言中使用。
有些字母本身不發音,但會影響其他字母。例如,西裡爾字母<Ь>(軟符號)將它之前的子音顎化。有些字母可以同時執行一個功能和一個聲音,例如俄語<Я>(“ya”),它既顎化了前面的子音,又發音為/a/。
有一些文字被稱為特徵文字,它們類似於字母表,但顯示的是音素特徵,而不是音素本身。最好的例子無疑是韓語諺文,儘管特徵文字元素也出現在其他一些文字中,例如日語平假名和片假名,它們主要為音節文字,但會使用變音符號來表示有聲。
- 拉丁字母(包括英語、德語、法語、西班牙語、羅馬尼亞語、波蘭語、捷克語、斯瓦希里語、芬蘭語、越南語、納瓦特爾語等等)
- 西裡爾字母(包括俄語、烏克蘭語、保加利亞語、馬其頓語、哈薩克語等等)
- 希臘語
- 喬治亞語
- 亞美尼亞語
- 蒙古語
子音字母是中東地區的主要書寫系統。基本上,它們以字母的方式標記子音,但母音通常不標記。
阿拉伯語和希伯來語子音字母完全由子音組成。母音可以標記,但通常不標記。阿拉伯語有六個母音標記。其中三個是“短母音”,只用變音符號標記。另外三個是“長母音”,它們與一些子音共享符號。/a/ 與'alif /? /共享,/i/ 與yaa /j/ 共享,/u/ 與waaw /w/ 共享。當它們被視為子音或母音時,可以更清楚地看到母音的顯示方式。
阿拉伯語還有一個變音符號叫做“sukuun”,意思是它所在的字母上面沒有母音。如果 sukuun 在'alif、yaa 或 waaw 上面,它們就起子音的作用。如果沒有 sukuun,而是母音標記,它們就變成了長母音。如果 sukuun 在上面,但前面的子音有母音,它們也可以成為雙母音。因此,以下形式發音為 /kaj/。
Ø a
Y K
(其中 Ø 是 sukuun,請記住阿拉伯語是從右到左閱讀)。
由於母音通常不標記,因此發音必須透過語境推斷。序列“KY”(使用英語順序)可以發音為
/ kaja kajI kajV kIja kIjI kIjV kVja kVjI kVjV kaj /
- 阿拉伯語(包括阿拉伯語、伊朗語和普什圖語)
- 烏爾都語
- 希伯來語(包括希伯來語和意第緒語)
- 敘利亞語(現代敘利亞語/亞拉姆語使用)
- 腓尼基語和草書,均已滅絕。
子音字母表是印度、其他南亞國家和東南亞的主要書寫系統。它們基本上是一組具有共同固有母音的音節,必須用變音符號改變。
所有音節都以一個固有母音開始,通常是 /a/,以及一個不同的子音:ka、ca、ta、ta、pa 等。這些都有它們自己的符號。例如,你想寫音節 <ki>。然後,將 <i> 變音符號新增到 <ka> 符號上,並否定 /a/。請注意,在印度和東南亞語言中,變音符號可以出現在字母的前後,而不僅僅是上面或下面。
印地語對所有母音和雙母音都有變音符號——a、e、i、o、u、r、ai 和 au。但如果一個詞或音節以母音開頭呢?可能有兩種方法可以處理這種情況。在大多數亞洲子音字母表中,有一組“獨立母音”,它們是完整的字母,就像其他任何子音一樣,它們的作用只是用於音節開頭的母音。
另一種方法在任何南亞子音字母表中都沒有使用,但仍然可行。只需建立一個“母音載體”,一個不發音的字母,但可以承載母音變音符號,就像希伯來語的 aleph 一樣。
許多這些子音字母表還包含“連音子音”,你不需要做太多。這些基本上是連字,兩個字母的形式組合成一個“空間”,它們可以一起帶母音。例如,當“ta”和“ka”組合在一起時,它們就變成了“tka”,可以像其他任何子音一樣帶變音符號。
- 天城體,用於印地語、馬拉地語、尼泊爾語和其他許多語言
- 馬拉雅拉姆語,用於馬拉雅拉姆語、孔卡尼語,有時也用於科達古語。
- 孟加拉語,用於孟加拉語和阿薩姆語。
- 古木基文,用於旁遮普語。
- 古吉拉特語,用於古吉拉特語和卡奇語。
- 奧裡雅語,用於奧裡雅語和其他幾種語言。
- 泰米爾語,用於泰米爾語,有時也用於禮儀梵語。
- 僧伽羅語,用於僧伽羅語。
- 卡納達語,用於卡納達語和圖盧語。
- 泰盧固語,用於泰盧固語。
- 藏語,用於藏語和宗喀語
- 泰語,用於泰語、南泰語和其他幾種語言。
- 高棉語,用於高棉語,有時也用於巴利語。
- 寮國語,用於寮國語和寮國的其他一些語言。
- 緬甸語,用於緬甸語、孟語和克倫語。
音節文字在世界各地廣泛使用。它們包含語言中每個 CV(子音 + 母音)組合的單獨符號,儘管最後的子音有許多表達方式。
以下是一個典型音節文字的例子,使用羅馬字母拼寫。這是克里語系統
ê pê tê kê cê mê nê sê šê yê wê rê lê i pi ti ki ci mi ni si ši yi wi ri li î pî tî kî cî mî nî sî šî yî wî rî lî o po to ko co mo no so šo yo wo ro lo ô pô tô kô cô mô nô sô šô yô wô rô lô a pa ta ka ca ma na sa ša ya wa ra la â pâ tâ kâ câ mâ nâ sâ šâ yâ wâ râ lâ -h -p -t -k -c -m -n -s -š -y -w -r -l
請注意,還有單獨的母音符號。為了寫最後的子音(CVC 形式),新增最後一行符號,稱為“尾音”。所以,“tak”將用兩個符號來寫:<ta> 和 <-k>。許多音節文字使用這種方法,它基本上侷限於只有少量合法尾音的語言。
瑪雅音節文字系統使用的另一種尾音系統是“音調和諧原則”。它指出,最後的母音是用重複前一個母音來標記的。例如,一個像“kalo”這樣的詞,通常用兩個符號來寫:ka-lo。但是,如果你想寫“kal”這個音節,就需要重複前一個母音:ka-la。由於母音被重複,因此在第二個音節中被忽略。這適用於任何母音。但是,如果你想寫“kala”這個音節呢?這需要三個音節,再加上一個簡單的母音:ka-la-a。第二個“a”被否定,但由下一個音節返回。
第三種系統,由赫梯語使用,包含兩組音節,一組為 CV 形式,另一組為 VC 形式。這樣,當需要 C1VC2 形式的音節時,就可以寫 C1V-VC2,例如,<ka><al> 表示“kal”。此外,當需要將母音變長時,例如“kāl”,模式就變成了 C1V-V-VC2:<ka><a><al>。對於“kala”,只需寫 <ka><la>,因為 /l/ 將移到下一個音節。
有時,但並非總是如此,具有相關性的音節,例如具有相同子音的音節,看起來很相似。例如,音節“ka”、“ke”、“ki”等可能看起來很相似。在像奧吉布韋語這樣的系統中,母音符號透過簡單地將符號旋轉來改變。
- 克里語(旋轉),用於奧吉布韋語、克里語、因紐特語和許多其他北美土著語言;統稱為“土著音節文字”。
- 切羅基語
- 衣索比亞語,用於阿姆哈拉語、吉茲語、提格雷語和其他幾種語言
- 片假名和平假名,用於日語
- 彝語
- 塞普勒斯語、線性 B 和凱爾特伊比利亞語,均已滅絕
還有許多其他系統。
有一組來自羅馬化西班牙之前的文字,處於真正的字母表和音節文字之間的中間類別。在這些文字中,爆破音與後面的母音結合成一個音節符號——例如,有一個 PA 的符號,另一個是 PI 的符號,另一個是 PE 的符號,等等——但所有其他子音和母音也有單獨的符號。在這種系統中,例如,短語“barenarkenti”將用九個符號 <ba> <r> <e> <n> <a> <r> <ke> <n> <ti> 來拼寫。事實上,這些系統很可能演變自所謂的冗餘字母表,其中爆破音根據後面的母音而有不同的符號,就像古代伊特魯里亞字母表一樣,其中 /k/ 音在 <A> 前寫為 <K>,在 <E> 或 <I> 前寫為 <C>,在 <U> 前寫為 <Q>(伊特魯里亞語沒有 /o/ 音)。
表意文字系統被用於書寫漢語、日語、古埃及語、瑪雅語、蘇美爾語和許多其他語言。古代文明首先創造了表意文字,然後將其發展成其他系統。
在純粹的表意文字系統(如果自然界中存在這樣的系統的話)中,每個符號代表一個語素,即語言中最小的有意義的部分。例如,“手”、“紅”、“地方”、“-er”、“-ist”、“un-”和“anti-”都是語素。在表意文字系統中,這些都將有自己的符號。正如你可能想象的那樣,大多數語言中都有數千個語素,因此任何表意文字系統中都存在數千個符號。
這些符號並不都是隨機的。一般來說,代表可見的想法或事物的詞的符號通常是小圖畫。(請記住,書寫一直在發展,因此幾千年後,不會留下太多的相似之處!)例如,“太陽”、“月亮”、“人”、“孩子”、“水”、“火”、“左”、“右”、“狗”、“馬”、“樹”、“花”等詞可能被畫成圖片。
並非所有詞都可以這樣畫。你怎麼畫“愛”或“-er”或“anti-”呢?不同的語言有不同的方法。在某些情況下,用發音相似的詞來代替,例如,用“ant”來表示“anti-”。如果你經常這樣做,你就在走向音節文字、子音字母表或字母表。然而,在某些情況下,會畫另一張圖片來“解釋”新詞:例如,你可能會在“ant”旁邊畫一把長矛來表示“anti-”——長矛意味著你反對,對吧?在古埃及語中,長矛會被作為一個單獨的符號放在一邊,而在漢語中,長矛會被融入到“ant”符號中,形成一個表示“anti-”的新符號。(這就是為什麼埃及語這樣的文字有時被稱為音義文字,這也是用於混合使用表意文字和其他系統的語言的名稱。)這完全取決於你。
事實上,據估計,90% 以上的漢字都是用上述方法形成的:取一個發音相似的現有符號,並融入另一個符號來解釋其含義。然而,隨著時間的推移,這些字的形狀已經固定下來,而且聲音和意義發生了很多變化,因此一些字由實際上不再很好地代表其意義或聲音的符號組成。
如此龐大的系統註定不會是純粹的;它的一部分或整個部分可能正在向其他型別的系統轉變,而它的不同部分可能正在向不同的方向轉變。會有語素由多個沒有獨立含義的符號來表示,還會有符號代表多個詞。
- 漢語
- 日語漢字、韓語漢字和越南 chữ Nôm,所有都是漢字表意文字的借用
- 契丹語,古代東北亞的一種已滅絕的阿爾泰語系語言
- 女真語,滿語的前身
- 西夏語,中國西北部的一種古代語言
- 納西語,雲南省的一種緬甸- लो लो語
- 日語
- 朝鮮語(混合使用諺文和漢字的形式)
- 古埃及語
- 盧維語(在古代小亞細亞)
- 蘇美爾語
- 阿卡德語
- 瑪雅語
- 薩波特克語
- 米斯特克語
- 阿茲特克語
現在,如果你已經決定了想要哪種書寫系統,還需要完成三個步驟:書寫方向、文字歷史和書寫媒介。然後,你就可以開始真正的文字創作了。
所有文字都有特定的書寫方向。拉丁語從左到右書寫。希伯來語和阿拉伯語從右到左書寫。蒙古語從上到下書寫。這些是地球上真實文字中主要的方向型別。
- 從左到右:英語、西裡爾字母、希臘語和許多其他系統。
- 從右到左:希伯來語、阿拉伯語、烏爾都語、亞述語和其他幾個系統。
- 從上到下:蒙古語,有時也用於漢語
- 牛耕式:古希臘語
“牛耕式書寫”(Boustrophedon)指的是一種書寫方式,其中一行文字從左到右閱讀,下一行從右到左閱讀,再下一行又從左到右閱讀,以此類推。
THIS IS AN EXAMPLE ИI HƧI˩GИƎ FO BOUSTROPHEDON .Ǝ˩YTƧ
需要注意的是,在古希臘語中,一種牛耕式語言,有時字母在反方向閱讀時會實際翻轉過來。例如,希臘字母
如果你想堅持使用上述方法之一,可以繼續。大多數文字都使用它們。下面描述了幾個更復雜的系統。
一些文字可以向多個方向書寫,即從左到右、從右到左和從上到下都是可以接受的。漢語和古埃及語就是這樣的。在古埃及語中,所有帶有面部特徵的象形文字都朝向開始閱讀的方向。所以,如果你從右到左閱讀,所有帶有面部特徵(或可辨認的正面)的象形文字都會“面向”右側。在漢語中,必須透過上下文來確定方向。
另一個系統是“旋轉式”系統,這是一個非常罕見的系統。據我們所知,只有這一個文字系統使用過它,rongorongo(復活節島文字)。它類似於牛耕式書寫,但字母在每行之後還會旋轉 180 度!如果你在每行之後將閱讀板旋轉一下,它們看起來就會正常。以下是用英文字母的示例:
一些其他的想法,據我們所知,還沒有被使用。
- 螺旋式,向內或向外。
- 以順時針或逆時針方向寫圓圈,在寫每個字時旋轉它;本質上是從左到右或從右到左,但每一句話都在最後一個環的外面。
- 頂點式;句子的每個部分都在它自己的行上,指向一個所有句子都匯聚的頂點。
文字史
[edit | edit source]文字不是一成不變的。它們不斷變化,就像語言一樣。比較一下古埃及象形文字和現代拉丁文字。信不信由你,現代拉丁文字最終源於 *原西奈文字*,這是一組小型的埃及象形文字。這些象形文字後來被腓尼基人採用,並被大大簡化,每個象形文字都分配了一個單一的音節。由於與腓尼基人有著密切的接觸,希臘人很快也採用了他們的字母,但改變了他們的一些子音字母,將代表希臘語中不存在的音節的子音字母變成了希臘語的母音符號。在某個時間,儘管我們不完全清楚原因,希臘語開始使用牛耕式書寫而不是從右到左書寫,最終堅持使用從左到右書寫。當這種轉變發生時,所有字母都水平翻轉過來,形成了現在的希臘字母。然後,伊特魯里亞人和義大利半島上的拉丁人採用了希臘字母,並進行了微小的修改,拉丁字母最終成為現在歐洲大部分地區使用的文字。斯拉夫字母也源於希臘字母,這是因為俄國人皈依了東正教,在經過大約 1000 年的變革後,現代斯拉夫字母出現了。
| 字母“A”的簡史 | |||||
|---|---|---|---|---|---|
| 埃及象形文字牛頭 | 原閃族文字牛頭 | 腓尼基語 *aleph* | 希臘語 Alpha | 伊特魯里亞語 A | 羅馬語 A |
|
|
| |||
在原西奈文字和腓尼基語中,這個字母代表喉塞音 /?/, 但希臘語中沒有這個音節,所以它變成了 /a/。
“A”最初是 “aleph”,即牛。後來身體消失了,只剩下頭部。然後頭部被簡化為一條簡單的線,保留了最具識別度的部分(角)。最終,角穿透了這條線,字母在腓尼基語中翻轉到了側面。在希臘語中,它再次翻轉,在幾條線被修剪後,它變成了現代拉丁語/希臘語/斯拉夫語的“A”。
注意複雜性的變化。早期的文字幾乎可以肯定是一種象形文字,每個符號代表的正是它看起來的樣子。但是,隨著時間的推移,文字傳播開來,對許多人來說,這僅僅成了毫無意義的複雜性。符號開始簡化,有時變成了字母。當一個識字的人開始與一個不識字的人進行貿易時,他們的書寫系統就有一個很好的機會傳播開來。有時,一種文字會勝過另一種文字。例如,在古代印度,主要使用兩種文字:婆羅米文和佉盧文,但佉盧文已經不再使用,現在印度和東南亞部分地區的主要文字都是婆羅米文的演變而來。
有時,早期的象形文字系統並沒有簡化多少。在古代漢語文字中,漢字發生了變化,但許多漢字並沒有像原西奈文字那樣顯著地簡化。現代漢語的表意文字系統仍然非常複雜。1949 年的主要改革是由中國政府推行的。
需要注意的是,歐洲的文字種類繁多,而東南亞的文字種類卻相對較少。幾乎整個歐洲都使用拉丁字母或斯拉夫字母,但在東南亞,每個國家都至少有一種自己的文字。這可能是因為羅馬帝國的存在。羅馬人統一了大部分歐洲,並在他們衰落之前建立了自己的文字系統,他們的文字一直保留下來。東南亞不存在這樣的帝國,因此出現了種類繁多的文字。
所以,基本上,當古代象形文字系統不再只是供祭司使用時,它們就會簡化,因此可以簡寫。對於普通人來說,仔細地細化每個符號只是一項浪費時間的事情。這在今天仍然適用,只是程度較輕,但這正是草書的來源。甚至古埃及象形文字也有高度簡化的形式,被稱為“草書”,這種文字被普通人使用。你可以在羅塞塔石碑(右圖)的中間部分看到草書(圖片在右側)。
這是一個連結,指向一個好的圖表(在維基媒體之外),展示了一個單一符號在東南亞語言中的演變過程:[1]
書寫媒介
[edit | edit source]書寫文字的表面實際上對文字的影響很大。當刻在石頭上時,比如在富薩克文字或其他符文文字中,字母往往非常稜角分明,由直線組成。在石頭上刻曲線比在紙上更難。另外,儘管羅塞塔石碑是刻在石頭上的,但埃及草書比象形文字要“流暢”得多,而且通常是用紙莎草紙寫成的。
古代蘇美爾人用泥土寫字,用蘆葦筆在泥土上刻下符號。這使它具有非常獨特的風格。這種型別的書寫被稱為“楔形文字”。
一些現代語言,如緬甸語,保留了他們過去獨特的文字。緬甸語的圓形外形源於它最初是用棕櫚葉寫成的,如果直線過多,棕櫚葉就會撕裂。
在拉丁語、希臘語和斯拉夫語的混合大小寫系統(即既有“大寫”(大寫字母)又有“小寫”(小寫字母))中,小寫字母來自大寫字母的草書形式。
現在,如果你已經考慮過你的文字,並選擇了一種文字型別、書寫方向和書寫媒介,那麼你現在就可以建立你自己的文字了。


