CAT 工具/DéjàVu X/日語
錯誤 (特定語言:日語作為源語言)
1. 掃描功能 (Ctrl+S)
新增: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)
版本 7.0.284
系統: Windows XP SP2
描述: 掃描功能(在其他 CAT 工具中也稱為一致性)無法可靠地工作。日語源文字中的詞語並不總是能找到。尚未建立任何模式。
複製
解決方法
狀態
Atril 尚未閱讀。
其他使用者的評論
2. 找到的部分視窗
新增: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)<
版本 7.0.284
系統: Windows XP SP2
描述: 如果日語源詞語前面或後面有標點符號 (、。),則它們不會出現在“找到的部分”視窗中。
複製
解決方法
狀態
Atril 尚未閱讀。
其他使用者的評論
3. 自動傳播
新增: --Loek van Kooten 2007 年 2 月 5 日 18:19 (UTC)<
版本 7.0.284
系統: Windows XP SP2
描述: DVX 會因日語翻譯中的數字轉換問題而感到困惑,因此會直接複製自動傳播字串的數字,而不會實際檢查自動傳播的“副本”中的數字是否等於自動傳播的“原始”中的數字。
示例
平成 19 年 2 月 2 日 (平成 19 年 2 月 2 日) 翻譯為 2007 年 2 月 2 日
平成 19 年 1 月 1 日 (平成 19 年 1 月 1 日) 自動傳播為 2007 年 2 月 2 日(應該是 2007 年 1 月 1 日)
雖然 DVX 無法為自動傳播的副本生成正確的翻譯是可以理解的,但危險在於 DVX 將副本標記為自動傳播,而實際上源文字是不同的。關閉自動傳播是另一個極端,因為它也會取消對原本會正確傳播的字串的自動傳播。
解決方案:如果 a) 源文字為日語,並且 b) 自動傳播的副本中的數字不等於自動傳播的原始文字中的數字,則 DVX 不應自動傳播字串。複製:
解決方法
狀態
Atril 尚未閱讀。
其他使用者的評論
4. 從 Microsoft Word 匯入
新增: --Loek van Kooten 2007 年 2 月 6 日 15:54 (UTC)
版本 7.0.284
系統: Windows XP SP2
描述: 從日語 Word 文件匯入後,DVX 中的文字充斥著惡意程式碼。日語通常包含漢字 (kanji) 和羅馬字母/阿拉伯數字。由於日語字型中標準的羅馬字母/阿拉伯數字非常難看,大多數日語 Word 文字使用兩種不同的字型(一種用於漢字,另一種用於羅馬字母/阿拉伯數字),並且不斷交替使用。每次交替都會產生一個惡意程式碼。
問題在於,如果目標文字是西方語言,那麼這些惡意程式碼毫無意義,因為目標文字不會包含漢字,因此用一種字型書寫(用於羅馬字母/阿拉伯數字的字型)。也就是說,這些惡意程式碼在目標文字中是完全多餘的,會減慢翻譯過程並汙染資料庫。
因此,從日語翻譯到西方語言時,DVX 應該忽略所有字型更改,而選擇標準字型(如 Arial,甚至可能是使用者定義的字型)。自動識別日語源文字中使用的字型似乎非常複雜,因為“字型集”(包含日語和羅馬字型)可能被使用並且“配對”不一致。
似乎許多惡意程式碼實際上不是由交替字型引起的,而是由交替程式碼集引起的,因為即使是強制使用一種字型的 Word 文件也會在 DVX 中產生不一致的惡意程式碼
{\loch\af25\hich\af25\dbch\af25 \loch\af25\hich\af25\dbch\f25 平成}{\loch\af25\hich\af25\dbch\af25 \hich\af25\dbch\af25\loch\f25 18 年 12 月 19 日}
而不是僅僅 平成 18 年 12 月 19 日
惡意程式碼是不一致的:如果程式碼出現在 平成 (日語從漢字變為阿拉伯數字) 後面,你會期望在 年、月 或 日 後面出現類似的程式碼,但事實並非如此。複製:
解決方法
狀態
Atril 尚未閱讀。
其他使用者的評論