CAT 工具/DéjàVu X/從 Microsoft Word 匯入
4. 從 Microsoft Word 匯入
新增: --Loek van Kooten 15:54, 2007 年 2 月 6 日 (UTC)
版本 7.0.284
系統: Windows XP SP2
描述: 從匯入日語 Word 文件後,DVX 中的文字充斥著亂碼。日語通常包含漢字 (kanji) 和羅馬字母/阿拉伯數字。由於日語字型中的標準羅馬字母/阿拉伯數字非常難看,大多數日語文字在 Word 中使用兩種不同的字型(一種用於漢字,另一種用於羅馬字母/阿拉伯數字),它們不斷交替使用。每次交替都會導致亂碼。
問題是,如果目標文字是西語,這些亂碼毫無意義,因為目標文字不會包含漢字,因此使用一種字型(用於羅馬字母/阿拉伯數字的字型)。也就是說,這些亂碼在目標文字中是完全多餘的,會減慢翻譯過程並汙染您的資料庫。
因此,從日語翻譯到西語時,DVX 應該忽略所有字型更改,而是選擇標準字型(例如 Arial,或者甚至使用者定義的字型)。自動識別日語源文字中使用的字型似乎非常複雜,因為“字型集”(由日語和羅馬字型組成)可能被使用,並且“配對”不一致。
似乎許多亂碼實際上並非由字型交替引起,而是由程式碼集交替引起,因為即使是強制使用一種字型的 Word 文件,在 DVX 中也會出現不一致的亂碼。
{\loch\af25\hich\af25\dbch\af25 \loch\af25\hich\af25\dbch\f25 平成}{\loch\af25\hich\af25\dbch\af25 \hich\af25\dbch\af25\loch\f25 18年12月19日}
而不是僅僅 平成18年12月19日
亂碼不一致:如果一個程式碼出現在 平成 (日語從漢字轉換為阿拉伯數字)後面,您會期望在 年、月 或 日 後面出現類似的程式碼,但事實並非如此。重現:
解決方法
狀態
Atril 尚未閱讀。
其他使用者的評論