CAT 工具/MemoQ/技巧和竅門
您可能希望定期備份您的資源(專案、翻譯記憶庫、術語庫、設定等),以進行災難恢復。由於 MemoQ 將資源儲存為檔案,因此只需複製資料夾或檔案即可輕鬆建立備份。以下說明可幫助您建立備份,以便在資源損壞時可以快速恢復。但是,此方法建立的備份並非用於“長期”使用:嘗試恢復在舊版本中建立的備份可能會導致問題。
備份或還原任何檔案之前,請確保 MemoQ 未執行。MemoQ 可能會將某些檔案保持開啟狀態,甚至可能正在寫入其中一個檔案,這可能會阻止成功備份或還原。
您需要備份以下資料夾
- C:\Documents and Settings\All users\Application Data\MemoQ
(在 Windows Vista 中:C:\ProgramData\MemoQ)
- C:\Documents and Settings\(您的使用者名稱)\Application Data\MemoQ
(在 Windows Vista 中:C:\Users\(您的使用者名稱)\AppData\Roaming\MemoQ)
- 我的文件\我的 MemoQ 專案
(以上假設 C:\ 為系統驅動器。)對於專案、翻譯記憶庫、術語庫和過濾器配置,預設儲存路徑可以在 MemoQ 中的“工具”>“選項”>“外觀”>“位置”中更改。如果您已更改了上述任何預設路徑,請備份您的新路徑。
如果您使用的是伺服器解決方案,建議您定期備份包含有關使用者、組、許可權和專案的資訊的 SQL 資料庫。預設情況下,它位於以下資料夾中,該資料夾還包含專案資料夾和一些您可能也想備份的配置檔案
- C:\Documents and Settings\All Users\Application Data\MemoQ Server
(在 Windows Vista 中:C:\ProgramData\MemoQ Server)
SQL 資料庫檔案和事務日誌分別儲存在 MemoQServer.mdf 和 MemoQServer_log.ldf 中。兩者都需要成功備份和還原。在伺服器安裝過程中,您可能已更改了伺服器資料庫儲存的路徑。如果您更改了路徑,請確保也備份新路徑。伺服器專案文件儲存的資料夾也可以從伺服器管理員中更改,因此,如果您未使用預設資料夾,請也備份實際的專案資料夾。
在備份或還原操作之前,您需要停止 MemoQ Server 服務和與 MemoQ Server 相關的 SQL Server 例項的服務(按此順序)。未能執行此操作可能會阻止您成功完成操作,甚至可能使伺服器處於不可用狀態。在備份或還原操作後,再次啟動 SQL 例項服務和 MemoQ Server 服務(按此順序)。
如果自備份建立以來您已將伺服器升級到更新版本,切勿嘗試還原資料庫備份。資料庫模式通常會在版本之間進行修改,由舊版本建立的資料庫可能無法與當前版本的伺服器一起使用。如果您需要還原在舊版本的 MemoQ Server 中建立的資料庫,則首先需要解除安裝您當前版本的 MemoQ Server,然後安裝建立資料庫的版本。之後,您可以還原資料庫備份,然後安裝當前版本。安裝程式將把已還原的資料庫升級到當前版本。
透過遵循以上說明,您的備份可能包含 MemoQ 和/或 MemoQ Server 的許可證檔案。但是,如果存在頻繁的許可證相關更改(例如,您使用的是移動許可證或最近獲得了新的許可證),則在還原備份時還原舊版本的許可證檔案可能不是一個好主意。在這種情況下,請不要在備份包中包含許可證檔案。(或者,如果它們已經備份,請不要還原它們。)許可證檔案命名為 LicenseNN.dat(其中 N 是數字,例如 License11.dat、License02.dat 等)。它們可以在以下資料夾中找到
MemoQ
- C:\Documents and Settings\All users\Application Data\MemoQ
(在 Windows Vista 中:C:\ProgramData\MemoQ)
和/或
- C:\Documents and Settings\(您的使用者名稱)\Application Data\MemoQ
(在 Windows Vista 中:C:\Users\(您的使用者名稱)\AppData\Roaming\MemoQ)
MemoQ 伺服器
- C:\Documents and Settings\All Users\Application Data\MemoQ Server
(在 Windows Vista 中:C:\ProgramData\MemoQ Server)
如果在還原備份後遇到許可證問題,請先線上更新您的許可證。為此,請單擊“幫助”選單中的“啟用”(或“伺服器啟用”用於伺服器),然後單擊“線上更新許可證”。如果這不能解決問題,請聯絡 Kilgray 支援。
任務:如何清除較舊的翻譯,在某些情況下,某個段落有多個翻譯。
解決方案:這實際上在 MemoQ 中是可能的,使用或不使用一些技巧,具體取決於 TM 的設定。
- 預設情況下,TM 僅允許一個相同源段落的條目;這是您在建立 TM 時可以指定的設定。您還可以配置要保留哪些條目:同樣,預設情況下,您提交的最後一個翻譯將覆蓋之前的翻譯。在這種情況下,多個翻譯問題從一開始就不存在。
- 如果您的 TM 允許多個翻譯並且您想要清除它,也有一個方法。當您開啟 TM 進行編輯時,您可以指定篩選/排序條件。如果您按條目日期和時間排序,然後匯出到 TMX,則條目將按時間順序排列。匯入回僅允許一個翻譯的 TM 將具有以下效果:僅保留最新的翻譯。
這可能不是一個非常簡單的方法;但同樣,也許如果一個人選擇允許多個翻譯,這也不是您想定期做的事情。
MemoQ 的最新版本(2.1 及更高版本)完全支援 TTX 檔案,但對於舊版本,仍然有解決方法可以處理 TTX 檔案。以下是操作步驟。
首先,您需要下載一個名為 PlusToyz 的 doc 檔案,其中包含 Word 宏,可在 Wordfast Yahoo 群組(檔案部分,位於 http://tech.groups.yahoo.com/group/wordfast/files)免費獲取。您需要加入該群組才能下載該檔案。
使用任何 Web 搜尋引擎,您可能會找到幾個指向直接下載的連結,但其中 99% 都是該檔案的舊版本,因此無法保證結果。
因此,以下是操作步驟:
- 使用 Word 開啟 PlusToyz.doc 檔案。
- 使用底部宏(TTX 檔案轉換為 Trados 風格的段落文字)將您的 TTX 檔案轉換為帶 Trados 標記的雙語 Word 文件。
- 使用 MemoQ 匯入生成的標記 Word 檔案,確保將 tw4winMark 新增為排除的樣式(確保也選中了 外部 框)。
- 翻譯 每個第二個段落,將所有“源”(第一個)段落留空。
- 翻譯完成後,並確保所有應有的段落已正確確認,請從 翻譯 選單中選擇 將源複製到目標為空處。
- 現在所有段落都已填充,按 CTRL+SHIFT+A 選擇所有段落,然後從 翻譯 選單中選擇 確認但不更新。
- 現在您有一個完全可匯出 doc 檔案(以及正確的 TM,沒有無用的源=源內容)!
- 匯出文件。
- 再次開啟 PlusToyz.doc Word 檔案。
- 選擇 段落文字轉換為 TTX 宏,將您的翻譯檔案轉換回 TTX。
- 使用 TagEditor 開啟生成的 TTX 檔案,您可以看到一個經過正確翻譯的檔案!
請注意,儘管翻譯過程中的拆分/合併操作不應也不一定會改變最終結果,但最好不要過多地使用它,直到我們獲得大量可靠的報告證明它不會影響最終的 TTX。
您可以在 MemoQ 的當前版本中直接匯入 DOCX 檔案。
您可以在 MemoQ 的當前版本中直接匯入 .docx 檔案。
- 重新命名您的 .docx 檔案並新增 .zip 字尾。
- 開啟新的“zip”檔案,您會看到幾個資料夾。瀏覽到 Word 資料夾,只提取 document.xml 檔案,其中包含您需要翻譯的文件文字。
- 啟動 MemoQ 並建立一個新專案。
- 選擇 新增文件為,並瀏覽到 document.xml 檔案。
- 在 文件匯入設定 對話方塊中,您將看到已選中的 XML 過濾器。
- 我們現在將為 DOCX 文件建立一個 XML 過濾器。稍後,您只需雙擊它即可選擇它。
- 點選 管理 XML 格式 以顯示 XML 格式管理員 對話方塊。
- 現在選擇 建立新格式 選項。
- 為這個全新的自定義 XML 過濾器命名。我們將其命名為 DOCX(Word2007)。
- 確保 從頭開始建立 已選中,然後點選確定。
- 在 XML 格式設定 對話方塊中,點選 新增檔案,並瀏覽到 document.xml 檔案。
- 現在選擇 標籤和屬性 選項卡,然後點選 填充。MemoQ 將分析檔案並自動建立正確的標記設定。
- 點選 確定。您現在擁有一個正確的 DOCX xml 過濾器。點選 關閉 關閉此視窗。
- 現在您擁有了一個合適的 xml 過濾器,雙擊自定義 DOCX(Word2007) 過濾器。
- 檔案已匯入。您現在可以使用 MemoQ 安全地翻譯它。
- 翻譯完成後,只需匯出 document.xml 檔案。
- 將 .zip 存檔中的舊 document.xml 檔案替換為翻譯後的檔案。
- 重新命名檔案以刪除 .zip 字尾,並恢復以前的 .docx 副檔名。
您現在擁有一個翻譯後的 DOCX 檔案!
有時,當您的客戶使用特定源語言(例如 EN-CA)向您傳送 TM 時,您可能會將您的 TTX 檔案匯入到使用其他區域語言(例如 EN-GB)的專案中,但之後您可能會發現,當您匯出生成的 TTX 時,源語言發生了變化!這可能會導致問題,因為 TagEditor 拒絕使用與當前關聯的 TM 不同的語言設定來編輯 TTX。
事實上,MemoQ 會將 TTX 檔案的源語言和目標語言設定為當前專案中選擇的語言。有時您可能想利用這一點,並故意選擇您認為合適的源語言和目標語言。
要做到這一點,請執行以下操作:
- 從當前專案中以 MBD(MemoQ 雙語文件)格式匯出翻譯後的 TTX 檔案。
- 建立一個使用任何需要的源語言或目標語言的新專案。
這裡特別要注意:如果您只選擇了“英語”而沒有指定區域設定,MemoQ 會預設設定為 EN-US。 - 將您的 MBD 檔案匯入到這個新專案中。
- 選擇所有段落並將源文字複製到目標文字。
- 使用“匯出選中內容”或“匯出全部”匯出這些 TTX 檔案。
現在您擁有完全可用的雙語 TTX 檔案,您可以使用 TagEditor 開啟這些檔案,並使用您選擇的源/目標語言!
MemoQ 沒有內建的開關來顯示或隱藏空格和其他不可列印字元。您可以透過使用經過特別調整的字型來顯示它們。該字型名為 Veronika,由 Endre Both 開發,經作者許可,該字型也可以從 Kilgray 網站上的以下連結獲取:
http://kilgray.com/memoq/VeronikaSans.ttf
http://kilgray.com/memoq/VeronikaSerif.ttf
注意:Veronika 字型使用矩形代替擴充套件的 CEE(中歐和東歐)字元。
Denis Hay 基於 Calibri 建立了類似的字型;這些字型也可以從 Kilgray 網站上獲得,經作者許可:
http://kilgray.com/memoq/CALIBRI_MQ.ttf http://kilgray.com/memoq/CALIBRI_MQ2.ttf http://kilgray.com/memoq/CALIBRI_MQ3.ttf
Denis 對這些字型的描述:
Calibri MQ 只添加了一個小三角形字形來顯示不間斷空格。
Calibri MQ2 還在此基礎上添加了一個非常小的點來顯示普通空格。與常用的修改字型不同,這個點不會妨礙閱讀,但它允許在仔細觀察時輕鬆發現雙空格。這是我比較喜歡的字型。
Calibri MQ3 與 MQ2 非常相似,但普通空格的點字形更大,適合那些可能更喜歡這種字形的使用者。
要在 MemoQ 中翻譯時顯示空格,請執行以下步驟:
- 從上面的連結下載字型。
- 轉到 控制面板 / 字型,然後從 檔案 選單中選擇 安裝新字型...。
- 瀏覽到儲存字型的資料夾,從頂部的列表中選擇它們,然後點選確定。
- 在 MemoQ 中,開啟 工具 / 選項,然後轉到 外觀、位置 類別。在 字體系列 下拉列表中,選擇任何新安裝的字型。
MemoQ 現在將在翻譯網格中顯示每個空格字元的小圓點。
雖然這不是一個記錄的功能,但 MemoQ 可以輸入不間斷空格,例如在法語引號中很有用。要輸入不間斷空格,請按 ctrl+shift+空格,而不是空格。
對於某些 Word 文件,MemoQ 將顯示多餘的標籤,這些標籤顯然沒有用處。匯入文件後,無法刪除這些標籤;您能做的最好的就是按 F8 插入它們,或者透過按 Alt+F8 將它們放在目標段落的末尾。
有幾種可能的方法可以在匯入之前減少這些標籤:
- 選擇整個文件並設定正確的語言。
- 接受所有更改。
- 關閉修訂。
- 關閉智慧標籤。
- 選擇整個文件並設定字元間距 - 比例 100%;間距:正常;位置:正常。
- 另存為 Open Office,然後儲存回 Word(這可能會導致某些格式丟失)。
- 將 doc 另存為 Word 6.0/95(這可能會導致某些格式丟失)。
- 使用 TRADOS 進行段落分割並清理。
這些方法和其他方法在此處討論:http://www.necco.ca/dv/word.htm#Rogue_codes
我已將這些匯入前提示和其他一些提示自動化到一個帶有自定義工具欄的 Word 模板中(CodeZapper_2.3)。此模板還包含一些其他匯入前和匯入後處理宏,這些宏可能會有用。它主要是為了與 Deja Vu 一起使用而設計的,但 MemoQ 使用者在某些情況下也可能會發現它有用。您可以在檔案部分找到它 (http://tech.groups.yahoo.com/group/MemoQ/files/)。Dave Turner
Jim Wardell 關於消除惡意程式碼的更多想法::
如果 Word 檔案在 MemoQ 中導致惡意程式碼,請在匯入之前預先編輯它們,尋找 Dave 提到的問題。此外:
確保整個 Word 檔案中已停用自動連字。
使用查詢和替換功能刪除所有可選連字元。
確保 Word 設定“對大寫字母進行連字”已關閉。
有時,當源 PDF 文字中的字號在兩個整數字號之間徘徊時,就會出現錯誤程式碼。OCR 輸出(甚至允許半點字號)然後可能包含嵌入的字號更改(例如 11 pt. --> 11.5 pt. --> 11 pt --> 10.5 pt.)。如果您遇到很多這種情況,並且 Word 檔案本身包含多個您希望保留的字號,您可能需要逐一選擇連續的字號段落,並應用您希望使用的字號(例如,在上述情況下,可能是 Arial 11 pt.)。一種更簡潔、更專業的做法是將樣式定義應用於此類段落。您的樣式定義還應包括“不自動換行”和“正常字元間距”。
如果您的源文件不包含粗體或斜體,請選擇整個檔案並將所有內容更改為粗體+斜體。然後再次選擇整個檔案,並刪除粗體和斜體。
如果您使用 OCR 軟體掃描 PDF 檔案(因此是您最初建立錯誤程式碼的人!),請仔細檢視從 OCR 匯出到 Word 時生效的詳細設定選項。只使用您需要的設定,其他設定可能會生成錯誤程式碼。
Arial Unicode 字型由 OmniPage 安裝。OmniPage 在 Word 檔案中插入了圍繞變音符號的標記。我透過從系統中刪除 Arial Unicode 字型解決了這個問題。使用 OCR 軟體時,最好使用字型匹配來限制 OCR 輸出中允許的字型,例如,限制為 Times New Roman 和 Arial。
如果您的客戶主動為您轉換 PDF 檔案為 Word,請考慮他/她可能正在使用廉價的 PDF 轉換器程式來執行此操作,並且可能對自己的操作一無所知。在這種情況下,您最好自己獲取 PDF 檔案,並使用高質量的 OCR 軟體自行進行轉換。請注意,即使是最好的 PDF 轉換器也比專業品質的 OCR 軟體更容易導致錯誤程式碼和格式問題。一分錢一分貨。在減少錯誤程式碼和生成 TM 友好格式方面,兩款領先的專業級 OCR 程式之間也存在重大差異。仔細測試兩者,看看哪一個在您的情況下提供更 TM 友好的結果。
Dave 和我提供的建議應該可以幫助您消除幾乎所有錯誤程式碼,但是如果您仍然遇到太多錯誤程式碼,請開啟 MQ 並注意給定錯誤程式碼發生的位置,然後在 Word 中同時開啟有問題的檔案。嘗試選擇有問題的周圍字元,並檢查任何設定更改。如果您學到了一些有用的東西,請註冊為 Wikibooks 作者並將其新增到此頁面。
對我們(一家遊戲公司)有效的一個建議是,透過簡單地使用正則表示式 </?rpr[^>]*> 刪除特定型別的這些標記,在查詢和替換中啟用正則表示式,啟用源替換,以及在複選框中啟用標籤內的查詢和替換。在 99% 的 docx 文件中,這些文件充滿了過多的標記,這解決了問題,而不會對格式或質量造成任何明顯的影響。這也適用於具有類似問題的 Excel 檔案。最好在之後進行測試匯出,以檢視是否破壞了任何內容,但通常情況下,這毫無問題地奏效。因此,是的,您確實可以在匯入後使用一些查詢和替換來刪除它們!
在“翻譯結果”中停用大小寫轉換
[edit | edit source]對於某些語言,您可能希望在“翻譯結果”窗格中停用大小寫轉換。
- "工具" > "選項" > "TM 預設值,使用者資訊"
- 停用“切換所有替換”
過濾掉不需要的語言
[edit | edit source]在專案配置期間滾動瀏覽語言列表很繁瑣。在未來的版本中,Kilgray 可能會讓 MemoQ 記住最近使用的語言列表,並在列表頂部顯示這些語言。
同時,使用者可以使用以下簡單步驟(基於 Gregory 在 <http://tech.groups.yahoo.com/group/MemoQ2/message/291> 中的建議)消除不需要的語言。
如果您沒有 XML 編輯器,可以從這裡下載免費的 XML Marker 軟體:<http://symbolclick.com/>
開啟 XML Marker 並開啟 LangInfo.xml 檔案。該檔案很可能位於“C:\Documents and Settings\All Users\Application Data\MemoQ”中,或者可能在其他位置,具體取決於您的安裝選項。
注意:在 Windows 7 中,該檔案可能位於“C:\ProgramData\MemoQ”中。這一點很重要,因為 Windows 搜尋通常 (?) 不會在此特殊隱藏的系統資料夾中查詢檔案。--Drawdenrubdarb (discuss • contribs) 08:14, 15 May 2012 (UTC)
在 XML Marker 中,突出顯示您不需要的語言程式碼,右鍵單擊並選擇“註釋掉選擇”。一旦所有不需要的語言都被註釋掉,儲存該檔案,然後幸福地生活在一起 :-)
--HerbEppel 15:49, 17 November 2007 (UTC)
減少從包含影像的 DOC 格式轉換的 RTF 檔案的大小
[edit | edit source]MemoQ 不支援 DOC 檔案,而是在匯入過程中,它使用您的 Microsoft® Office™ Word 應用程式將您的檔案從 DOC 格式轉換為富文字格式 (RTF)。當 DOC 檔案包含影像時,這些影像將被轉換為無用但巨大的 Windows 元檔案。這確保了與 ANCIENT 文字編輯器的相容性,但對您毫無用處。實際上,一個簡單的公司徽標可以將一封簡短的信件的大小從 20 KB 擴充套件到 1,200 KB(或 1.2 MB)。而且這是在您開始新增文字之前。解決方案是對每臺機器上的 WORD 登錄檔進行簡單的更改。要防止 Word 在您的 RTF 檔案中儲存影像的兩個副本,請執行以下操作
- 關閉 Word(如果它正在執行)。
- 單擊“開始”>“執行”。將出現“執行”對話方塊。
- 在“開啟”框中,鍵入 regedit 並單擊“確定”。將開啟登錄檔編輯器。
- 導航到 HKEY_CURRENT_USER > Software > Microsoft > Office > Version > Word > Options。(將 Version 替換為您使用的 Word 版本。)
- 在視窗的右側窗格中,右鍵單擊並選擇“新建”>“字串值”。將建立一個名為“新建值 #1”的新字串。
- 將該值重新命名為 ExportPictureWithMetafile。(要執行此操作,您可以從快捷選單中選擇“重新命名”。)
- 更改名稱後,右鍵單擊該字串並選擇“修改”。將出現“編輯字串”對話方塊。
- 在“數值資料”框中,輸入 0。
- 單擊“確定”。
此方法在以下位置進行了討論:<http://hotdocstips.bashasys.info/index.php/hotdocs/automation/correcting_bloated_images_in_rtf_templates/>
在同一臺計算機上使用 MemoQ 明信片軟體和 MemoQ Translator Pro(完整版)
[edit | edit source]如果您想使用 MemoQ 2.0,但同時在同一臺計算機上安裝 MemoQ 的完整版或試用版,請執行以下操作
- 安裝 MemoQ 2.0。
- 將 C:\Program Files\Kilgray\MemoQ 下的所有內容複製到另一個資料夾中,並建立一個指向 MemoQ.exe 的快捷方式。
- 安裝 MemoQ Translator Pro。
現在您可以同時使用這兩個程式 - 但請確保使用不同的資源。
避免在將大塊文字從源複製到目標時出現卡頓
[edit | edit source]如果您想在翻譯過程中將大塊文字從源複製到目標,MemoQ 目前可能會卡住或崩潰,如果質量保證模組在後臺執行。
轉到主設定區域中的“專案 QA 設定”,並確保標籤上方的所有複選框都沒有被選中。等到您真正到了真正想要開始進行質量保證檢查的時候,再真正開始執行 QA 功能。
使用自動可翻譯項進行數字格式轉換
[edit | edit source]除了其他功能外,MemoQ 中的自動翻譯功能可以用來將數字從一種語言格式轉換為另一種。例如,英語使用逗號作為千位分隔符,使用句號作為小數分隔符。義大利語則相反。設定好正確的自動翻譯規則後,MemoQ 會在源段落中提供數字的“本地化”版本。這些本地化的數字會顯示在翻譯結果列表中。這些自動翻譯的匹配項可以像翻譯記憶庫或術語庫中的匹配項一樣快速插入到翻譯中。自動翻譯功能也用於片段組裝功能。
自動翻譯規則可以在專案級別(在專案的設定頁面)或全域性級別設定,適用於具有相同源語言和目標語言的所有專案(在工具選單 > 選項 > 自動翻譯中)。
以下是將英語翻譯成上述語言(以及其他可能語言)的專案所需的規則。該規則將本地化包含小數分隔符或千位分隔符(而不是兩者都包含)的數字。規則需要按以下順序輸入,以確保其正常工作。有關輸入自動翻譯規則的資訊,請參閱 MemoQ 幫助主題中的“語言特定設定 > 自動翻譯”。
規則 1(將 1.234 更改為 1,234)
自動翻譯規則
(\d+)\.(\d+)
替換順序規則
$1,$2
說明:如果數字序列後面跟著一個句號和另一個數字序列,則此規則會將句號替換為逗號。
規則 2(將 12,345,678 更改為 12.345.678)
自動翻譯規則
([\d]{1,3}),?(\d\d\d),?(\d\d\d)
替換順序規則
$1.$2.$3
說明:如果由 1 到 3 位數字組成的序列後面跟著一個逗號,然後是三位數字,另一個逗號,再是三位數字,則該規則會將逗號替換為句號。
規則 3(將 12,345 更改為 12.345)
自動翻譯規則
([\d]{2,3}),?(\d\d\d)
替換順序規則
$1.$2
說明:如果由 2 到 3 位數字組成的序列後面跟著一個逗號,然後是三位數字,則該規則會將逗號替換為句號。