跳轉至內容

維基百科是如何運作的/第15章

來自華夏公益教科書

到目前為止,我們主要關注的是英語版本的維基百科,但維基百科已經建立了超過280種語言版本,每個版本都代表著其獨特的社群和內容集合。一個普遍的假設是其他語言的維基百科文章基本上是從英語翻譯而來,但這完全是誤導:這些網站都建立了自己的內容,翻譯只扮演著次要的角色。總的來說,維基媒體專案是當今網際網路上最全面的多語言和全球化專案之一。[32]

英語維基百科是規模最大的網站,但其他語言的維基百科也相當龐大:七個其他語言版本的維基百科擁有超過百萬篇文章。這些非常活躍的網站通常具有較高的增長速度並在技術上具有創新性。如果您訪問http://wikipedia.org/(圖15.1,“Wikipedia.org門戶頁面,顯示所有語言”),您會發現它充當了通往其他語言版本維基百科的入口。

在本章中,我們將探討維基百科的全球化意義,它現在是一個真正國際化且互聯的專案。其他語言的維基百科是什麼樣的,以及如何參與其中?我們還將討論與英語維基百科相關的語言問題,包括顯示外語字元、從全球視角撰寫主題以及新增指向維基百科其他語言版本的連結。

[32] Byte Level Research每年釋出一份全球化報告卡,該報告卡經常將維基百科評為全球第二大“公司如何成功地為國際市場開發網站”的平臺,僅次於谷歌。請參閱http://bytelevel.com/news/reportcard2008.html

語言和文字

[編輯 | 編輯原始碼]

專案的早期目標之一就是使維基百科成為多語言的;吉米·威爾士在2001年初首次提出建立德語版本的維基百科。到2001年5月,也就是英語維基百科成立幾個月後,加泰羅尼亞語、中文、德語、法語、希伯來語、義大利語、西班牙語、日語、俄語、葡萄牙語和世界語版本的維基百科相繼啟動。

正如下面“語言的長尾”中所述,新的語言版本仍在不斷增加。截至2013年中期,最大的維基百科是英語版(420萬篇文章)、荷蘭語版和德語版(各160萬篇文章)、法語版(140萬篇文章)、瑞典語版(120萬篇文章)以及義大利語版、西班牙語版和俄語版(各100萬篇文章)。然而,規模本身不應成為衡量重要性的唯一標準。例如,中文維基百科經常引起媒體關注,部分原因是中國政府繼續部分限制中國境內訪問該網站(作為所謂的“中國防火牆”的一部分)。儘管如此,中文維基百科仍擁有超過71萬篇文章,這些文章很大一部分是由臺灣、香港和東亞以外地區的眾多中文編輯撰寫的。

維基百科至少有46個語言版本擁有超過10萬篇文章,119個語言版本擁有超過1萬篇文章。當一個維基百科達到1萬篇文章時,它通常會形成一致的方法、自我更新的社群以及基本政策結構。其餘的網站才剛剛起步,只有少量文章和活躍的貢獻者,正如下一節所解釋的那樣。

語言的長尾

[編輯 | 編輯原始碼]

維基百科以其樂觀的態度,啟動了許多語言版本的維基百科,但目前這些版本只有幾百篇文章。這些網站發揮什麼作用?沒有人能稱它們為全面的百科全書資源。事實是,它們只是剛剛起步的維基——就像2001年或2002年的英語維基百科一樣。如果您確實精通其中一種語言,能夠做出貢獻,那麼參與一個較小的維基百科會非常有趣。您會發現一個小網站的使用者文化與擁有眾多習俗、規則和(顯然)更多已編寫文章的龐大英語維基百科截然不同。即使在小型維基百科上,文章在很大程度上也不是翻譯而來,而是用特定語言新撰寫的。

圖15.1. Wikipedia.org門戶頁面,顯示所有語言

有時,其他語言的維基百科規模較小,是因為它們非常新,或者是因為說這種語言的人不多,因此潛在的貢獻者群體很小。或者,維基百科可能存在於使用廣泛但網際網路普及率不高的語言中,例如泰盧固語,它是印度次大陸上第三大使用語言,也是全球前十五大使用語言之一(圖15.2,“2008年4月泰盧固語版維基百科首頁”顯示了泰盧固語版維基百科的首頁)。這些語言可能沒有強大的書面傳統,或者在大多數母語使用者居住的地區,網際網路接入可能有限。其中一些維基百科很可能構成了其語言最大的線上語料庫;無論如何,它們都代表了線上語言,其他人可以輕鬆地找到它。

圖15.2. 2008年4月泰盧固語版維基百科首頁http://te.wikipedia.org

維基百科所涵蓋的語言範圍非常廣。維基百科存在於人工語言(具有國際主義目標的世界語[eo]和沃拉普克語[vo])以及重要的已死語言(拉丁語[la]和古教會斯拉夫語[cu])中,這些語言沒有母語使用者。[33](這兩個字母的程式碼是語言識別符號程式碼,在第2節“語言之間的連結”中的“語言之間的連結”中進行了說明)。當少數母語使用者存活時,語言儲存問題並不是維基媒體基金會的明確目標。但另一方面,為世界上所有的人提供免費資訊,無論其語言如何,絕對是基金會的目標,許多較小的維基百科代表了該語言唯一的線上參考作品。在某些情況下,維基百科可能是特定語言中唯一的百科全書!儘管存在這種多樣性,但維基媒體已經支援的250多種語言遠遠不能代表世界上所有活躍的語言。SIL是《民族語》(一種語言標準參考書)的建立者,也是語言識別ISO標準的維護者之一,它認為世界語言總數接近5000種。

因此,新的語言版本仍在不斷被提出和啟動。這是如何運作的?關鍵要求是您可以提供潛在活躍使用者群的證據。新的維基百科將需要活躍的志願者來提供內容並監視維基以防止垃圾郵件和破壞。維基百科有一個啟動新語言專案的程式,所有新的請求都必須由網站開發人員批准,他們可以建立該專案。第17章“基金會和專案協調”中討論的維基媒體維基Meta有一個專門的頁面用於提出這些請求。請求提交後,新語言版本委員會或langcom將審查該請求。精通該語言的人員必須承諾為新專案翻譯Mediawiki介面(包括選項卡、按鈕和關鍵頁面的文字)。您可以在http://incubator.wikimedia.org/上檢視(並參與)翻譯過程中的某些新專案。

克林貢語戰爭

克林貢語維基百科(使用科幻作品《星際迷航》中克林貢種族使用的語言)存在於2004年至2005年。經過一番爭論,吉米·威爾士決定關閉該網站,並在2005年維基迷大會上當場實施了該決定。正如Meta上的克林貢語維基百科歷史頁面所述,“克林貢語專案的存續存在爭議,並引發了關於公平性和與其他語言,特別是與其他人工語言的同等地位的長期辯論……克林貢語詞彙封閉且不完整,這限制了工作。”內容最終被轉移到Wikia於2006年12月在klingon.wikia.com上託管的新網站,截至2008年7月,該網站有161篇文章。/>。

參與其他語言的維基

[編輯 | 編輯原始碼]

即使您對所討論的語言只有最基本的瞭解,在其他語言的維基百科上進行編輯也可能很有趣且有價值。所有維基百科都使用相同的MediaWiki引擎,因此按鈕、導航連結和圖示的功能都相同,無論其標籤是什麼。

一種幫助的方式是在小型維基上觀看內容。只需記得定期檢視慢速增長的維基上的近期更改,你就可以幫助將垃圾郵件和質量差的貢獻降到最低。要採用一個維基,你只需要對維基百科的標準足夠熟悉,以便識別出肯定無用的更改。檢視新的編輯將幫助你指導新的編輯到多語言元頁面,並識別出優秀的新的編輯。wikipedia-L 郵件列表用於討論任何語言中的一般維基百科相關問題。

目前,你必須為每個你想要參與的新語言專案建立一個賬戶。隨著 2008 年年中引入單使用者登入(有時稱為統一登入)這一情況正在發生變化,使用者可以使用它在所有維基媒體專案之間關聯其現有賬戶(更多資訊請參見第 1 節“維基共享資源”中的“專案賬戶和單使用者登入”)。但是,所有維基百科都應該允許匿名編輯,如果你只想進行一些更改,這可能會更容易。如果你在未登入的情況下進行編輯,請注意當你嘗試儲存時出現的強制預覽:點選你認為必須是“顯示預覽”按鈕的按鈕。

在其他語言中新增編輯摘要怎麼樣?專案對此可能會有所不同。例如,波蘭語維基百科強制要求編輯摘要;否則,除非你登入,否則你將無法儲存。在葡萄牙語維基百科上,如果你未登入,則必須在儲存編輯之前填寫一個驗證碼框。如果你準備好了這些偶爾的額外手續,那麼用其他語言編輯維基百科實際上非常容易。

請記住,不同語言社群的政策、指南和社群實踐可能存在很大差異。儘管一些基本原則(例如中立的觀點、禮貌和 GFDL 許可證)是所有維基媒體專案的基礎,但程式的執行方式由專案社群決定。你經常會發現,較小的專案規則和指南較少,並且討論往往比那些受到更多外部關注的較大專案更具思考性。

指令碼支援

[編輯 | 編輯原始碼]

隨著各種語言的出現,也出現了各種書寫系統:希臘語、西裡爾字母、阿拉伯語、希伯來語、表意文字和其他不太熟悉的文字。即使使用基本羅馬字母的語言也可能使用重音符號和其他變音符號。例如,各種型別的文字也被用於並整合到維基百科的英語版本中,以提供專有名詞的原始形式。圖 15.3,“英語版維基百科關於聖雄甘地的文章的第一段,其中使用了三種不同文字的語言(英語、梵語和古吉拉特語),以及 IPA 符號”展示了文章w:莫罕達斯·卡拉姆昌德·甘地中的一個例子,該文章在導言部分使用了古吉拉特語和梵語文字以及 IPA 發音符號。

大使館
你可以在維基百科:本地大使館找到一個會說各種語言並參與英語維基百科,並且願意幫助解答其他語言問題的使用者列表。此頁面是大使館系統的一部分,每個維基百科上都有一個專門的地方供說其他語言的訪問者使用。描述了特定語言的維基百科,訪問者可以提出問題或請求幫助。你可以在http://meta.wikimedia.org/wiki/Wikimedia_Embassy找到所有大使館的列表。此列表包含指向每個大使館的連結,以及該維基百科上會說其他語言並願意提供幫助的貢獻者的姓名。

如果你沒有安裝必要的字型,這些文字中的任何一個都可能無法在你的網頁瀏覽器中正確顯示。如果你正在檢視你沒有字型支援的文字,你可能會看到小方塊或問號而不是正確的字元。如果是這種情況,你需要下載並安裝正確的字型。w:幫助:多語言支援收集了有關字型支援的資訊和一些建議。此頁面有一個圖表,你可以在其中比較一些常見的有問題的字型(例如東亞字元集)的影像和你電腦上看到的影像。Firefox 網頁瀏覽器提供了相對較好的多語言支援,大多數較新的作業系統(包括 Windows Vista)也是如此。

圖 15.3。英語版維基百科關於聖雄甘地的文章的第一段,其中使用了三種不同文字的語言(英語、梵語和古吉拉特語),以及 IPA 符號

作業系統的語言支援當然仍然受到發達國家需求的驅動,這意味著許多不太常用的文字,例如一些印度語的文字,通常不會被你的瀏覽器或作業系統原生支援。通常需要下載的字元集包括母語的字元集。要查詢這些字型,該語言的維基百科版本可能是一個很好的資源;使用非拉丁文字的維基百科通常有一個幫助頁面,關於從其主頁連結到獲取檢視它們所需字型的地址。例如,要在切羅基語文章中看到切羅基語母語文字的正確渲染,你必須下載一個特殊的字型;切羅基語維基百科上的幫助頁面http://chr.wikipedia.org/詳細介紹瞭如何查詢合適的字型。

在撰寫文章時,如果你沒有帶有你需要字元的鍵盤,你會發現許多型別的文字,例如西裡爾字母和漢字,可以從其他文件中成功複製並儲存到維基百科頁面上。(這是因為使用了 Unicode 字元編碼或w:UTF-8。)大多數作業系統,包括 Windows、Mac OS X 和許多 Linux 發行版,也允許你虛擬地更改鍵盤佈局,以便你可以直接用另一種語言打字。例如,在 Windows XP 中,你可以透過“控制面板”下的“區域和語言選項”來執行此操作。w:幫助:多語言支援(印度語)頁面提供了在多個作業系統上輸入印度語字元的完整說明;這些說明也適用於其他字元集。

顯示象形文字
如果需要,你可以在維基百科文章中顯示埃及象形文字!請參閱幫助:WikiHiero 語法以瞭解這種基於影像的特殊字型;要使用它,只需將要顯示的字元的程式碼括在<hiero>和</hiero>標籤之間即可。

最後,主編輯視窗下方的編輯框(在第 1.1 節“理解編輯視窗”的“理解編輯視窗”中進行了描述)可以輕鬆訪問許多帶重音符號和變音符號的字元,以及希臘字母、西裡爾字母和 IPA 字母表。只需點選其中一個字元即可將其插入文章中。

進一步閱讀

[33] “Veni, Vidi, Wiki: 拉丁語在‘Vicipaedia’上並沒有消亡”(華爾街日報,2007 年 9 月 29 日);請參閱http://online.wsj.com/public/article/SB119103413731143589.html

[編輯 | 編輯原始碼]

維基間連結或語言間連結是指到維基百科另一個語言版本中關於同一主題的文章的連結。這些特殊連結顯示在左側邊欄的“語言”下,如第 3 章“查詢維基百科的內容”(第 2.2 節“無所不在的側邊欄”中的“無所不在的側邊欄”)中首次提到。這些指向其他語言維基百科的連結顯示在語言的本機拼寫下(例如 Français),並按該語言的二字母或三字母程式碼排序(例如 fr 或 ja)。點選連結將帶你到其他語言維基百科中的相應文章。

任何頁面,不僅僅是文章,都可以進行維基間連結。例如,如果你在俄語和英語中都有一個使用者頁面,你可以在你的英語使用者頁面上新增一個指向你的俄語頁面的維基間連結,反之亦然。許多幫助和社群頁面存在於多種語言中,並以這種方式相互連結。如果你想在另一種語言中找到等效的專案或策略,這些連結非常有用;例如,如果你想找到德語口語文章,只需轉到英語口語維基百科專案,該專案有一個指向德語維基百科頁面的維基間連結,WikiProjekt Gesprochene Wikipedia。

編輯們必須逐篇文章新增其他語言的連結,才能顯示這些連結。連結是使用特殊的語言程式碼建立的。這些程式碼大多是兩個字母(少數是三個字母),並且基於國際標準ISO 639,該標準對語言進行了編目。如果不存在 ISO 程式碼,則會開發和使用一個特殊的程式碼;例如,簡易英語維基百科(用更簡單的英語編寫的維基百科)使用字首 simple(根據w:Wikipedia:Multilingual coordination)。這些字首也出現在每個版本的維基百科 URL 中:因此http://en.wikipedia.org/ 是英語維基百科。可以在元維基站點上的meta:List of Wikipedias找到所有現有維基百科語言及其對應程式碼的表格。這些程式碼在專案中也非正式地用於指代各種語言的維基百科;您可能會看到 en:WP 或 enWP 用於表示英語維基百科,de:WP 用於表示德語維基百科,ru:WP 用於表示俄語維基百科,等等。

找到您希望連結的兩篇文章並瞭解其各自的標題和語言程式碼後,建立連結就非常簡單了。編輯其中一篇文章,然後滾動到文字末尾。語言間連結放置在文章的最底部,位於所有文章文字之下。

連結採用以下形式:[[語言程式碼:母語文章名稱]]。例如,如果您正在處理英語文章Cat,並且想要連結到法語文章Chat,您將在英語文章末尾新增連結 [[fr:chat]]。儲存頁面後,左側邊欄中會顯示一個帶有文字 Français 的連結;如果單擊它,您將被帶到http://fr.wikipedia.org/wiki/Chat的法語文章。同樣,要連結到德語文章,您將輸入 [[de:Hauskatze]],這將在邊欄的 Deutsch 下為您提供到http://de.wikipedia.org/wiki/Hauskatze的連結。

按照慣例,語言間連結放置在頁面上的類別標籤下方,每個連結獨佔一行。頁面上排序語言間連結最常用的方法是按程式碼字母順序排序。

損壞的語言間連結

連結時請確保您選擇了正確的文章。特別是對於具有多種含義的概念,找到完全等價的詞有時很困難——注意不要連結到錯誤的概念。還要注意不要連結到消歧義頁面,這些頁面可能存在於一個維基百科中,而不存在於另一個維基百科中。顯然,並非所有文章都存在於所有語言中;由於英語維基百科是最大的,它通常包含其他語言沒有的文章,但您可能會對較小維基百科的覆蓋範圍感到驚訝。如果您建立了一個似乎無處可達的語言間連結,請檢查您是否輸入了錯誤的標題。

為了完整起見,您還應該轉到其他語言中的文章,以新增一個返回第一篇文章的語言間連結(例如,頁面Hauskatze也應該連結到英語Cat)。建立語言間連結時,在編輯摘要中新增一個簡單的 +en: 或 interwiki。您可能還會發現更多要新增到您正在處理的原始文章中的該文章的語言間連結。如今,機器人自動執行了大部分此類缺少的語言間連結。

要連結到另一個語言頁面而不將其顯示為語言間連結,請使用相同的語法,但在語言字首前面放置一個冒號,就像您連結到類別名稱一樣。在英語維基百科頁面上鍵入fr:chat 將顯示為一個與您鍵入的相同的淺藍色連結,該連結指向http://fr.wikipedia.org/wiki/Chat,但該連結不會出現在左側邊欄中。一些重要的通用原則仍然適用:優先使用內部連結意味著不要使用指向另一種語言維基百科的連結來替換指向英語文章的紅色連結,尋求外部參考意味著您不應該依賴另一個維基百科來作為文章中重要事實的來源。翻譯本身不足以驗證,並且其他維基百科頁面——無論使用何種語言——都不能作為來源。

進一步閱讀

英語在全球視野中的地位

[編輯 | 編輯原始碼]

英語維基百科擁有一個全球性的編輯社群,作為一名編輯,您將定期與來自許多時區的人員合作。英語維基百科的典型貢獻者很可能是在英語國家(美國、加拿大、英國、澳大利亞等)的母語人士,但許多編輯既不是母語人士,也不在這些地方。瞭解來自世界各地的人是參與維基百科的好處之一。由於編輯相對匿名,您通常不知道您的維基朋友來自哪裡,甚至不知道他們的國籍。為了克服文化差異,請記住關於在網上與他人禮貌互動的指南,不要過分依賴區域俚語或網路術語,因為並非每個人都能理解。

貢獻者的多樣性也反映在維基百科主題的全球廣度上。顯著性不具有文化或語言特異性;地理特徵、重要人物和其他值得注意的區域主題應該明確地包含在維基百科中,無論它們位於世界何處或與世界何處相關。

簡易英語維基百科
簡易英語維基百科是一個獨立於英語維基百科的專案。該維基百科旨在提供用簡化英語編寫的文章,專為學習英語的人和兒童設計。整個介面都已重寫為使用更簡單的語言,例如,隨機頁面連結是顯示任意頁面連結。大多數文章都從英語維基百科版本“翻譯”成更短、更簡單的文章。反過來,這些文章可以成為其他語言工作者的一種資源。簡易英語是那些有興趣教授或學習英語作為第二語言的人的理想專案。簡易英語位於http://simple.wikipedia.org/,截至 2008 年年中,大約有 33,000 篇文章。

一些維基專案也側重於世界特定地區。例如,維基專案印度專注於撰寫有關印度的文章、審查有關印度的現有文章以及支援一個面向對印度相關主題感興趣的編輯的社群門戶。可以在Wikipedia:WikiProject Council/Directory/Geographical找到處理地理主題的維基專案的列表。

其他維基專案專注於將其他維基百科中有用或有趣的文章翻譯成英語(其他語言的維基百科有類似的專案,專注於將文章翻譯成他們的本地語言)。協調英語翻譯的地方是w:Wikipedia:Translation。翻譯帶來了雙重挑戰:編寫既是優秀的英語又是優秀的維基百科內容的文章。

非英語母語人士用英語撰寫文章時,通常會出現風格問題。對這些文章進行清理工作有助於使有價值的材料可用。當根據第 4 章“理解和評估文章”中提出的標準或在刪除討論中評估文章時,請考慮到文章可能是由一位在該主題方面有專業知識的非母語人士撰寫的。

在用英語撰寫有關非英語國家/地區主題的文章時,來源可能存在問題。例如,查詢英語來源材料可能要困難得多。檢查語言間連結以查詢其他語言維基百科上的相關文章,這對於查詢來源和更多資訊很有幫助。

儘管引用非英語來源並非理想之選,但您可以這樣做。您可以使用特殊的模板來識別其他語言的來源;例如,在指向義大利語網站的連結之前放置可選模板Template:It icon 會提醒讀者該來源是義大利語的(語言程式碼與前面提到的相同標準 ISO 程式碼相同)。引用非維基百科母語的來源總比不引用來源好。也請嘗試查詢英語來源,以便讀者可以更輕鬆地核實您的事實。(如果不同語言的來源存在分歧,這可能是值得注意和包含的有用資訊。)

進一步閱讀
華夏公益教科書