ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ИЛИ ПРОБНЫЙ ПЕРЕВОД.

Yes, I want my consultation

Простой способ перевода файлов TTX в OmegaT

Сейчас последняя версия OmegaT поддерживает файлы SDL Trados TTX благодаря расширению Okapi. Хотя это отличный способ работать с файлами TTX в замечательной программе для перевода, он сопряжен с парой проблем. Одним из возможных решений является использование Okapi Rainbow для создания проекта перевода для OmegaT и последующее обратное преобразование по завершении перевода. Если такой способ вам не подходит и переводить файлы TTX приходится в OmegaT напрямую, то существует другое простое решение, чтобы обойти текущие ограничения. Какое? Ответ в этой записи. Однако прежде всего предлагаю рассмотреть сами проблемы.

Сегментированный файл TTX

При открытии сегментированного файла TTX в OmegaT все повторяющие сегменты (>внутренние совпадения) помечаются как альтернативные переводы, т. е. идентичные сегменты, переведенные по-разному. Это можно легко проверить, посмотрев на вкладку Multiple Translations, в которой для подобных сегментов будет отображаться по несколько переводов. В этой ситуации автоподстановка переводов в идентичные сегменты невозможна. В случае редактирования такого внутреннего совпадения изменению подвергнется только этот конкретный сегмент, в то время как остальные идентичные сегменты останутся прежними. Таким образом, каждый идентичный сегмент придется редактировать вручную. Функция Multiple Translations появилась только в OmegaT 2.5, поэтому подобного неудобства можно избежать, воспользовавшись более старой версией 2.3. Однако мне это не подходит, поскольку в последних версиях программы появилось очень много полезных функций.

Несегментированный файл TTX

Проблема, описанная выше, не распространяется на несегментированные файлы TTX. Однако в настоящее время OmegaT создает в окончательных файлах TTX сегментацию по абзацам, а не по предложениям, что обычно неудобно. К примеру, клиент может требовать сегментацию TTX на основе его собственных правил сегментации для SDL Trados. Если же сегментация по абзацам устраивает вас и вашего клиента, то можно просто переводить несегментированный файл TTX в последней версии OmegaT. Если же нет, то единственный выход — работа с сегментированным TTX.

Возможное решение

Теперь перейдем к самому способу. Это решение придумал мой коллега Владимир, и пока оно нас не подводило. Мы заметили, что если в сегментированном файле TTX заменить часть перевода одним пробелом, OmegaT воспринимает такой сегмент как непереведенный — проблема ненужных альтернативных переводов решена. В то же время OmegaT сохраняет сегментацию (поскольку файл сегментирован), а это значит, что разбивать его программа будет согласно сегментации исходного файла, а не по абзацам. Применяя этот способ, можно переводить сегментированные файлы TTX в последней версии OmegaT напрямую.

    1. Для начала необходим полностью сегментированный файл TTX. Его можно попросить у клиента. Также можно сегментировать файл TTX самостоятельно в пробной версии Wordfast Pro или в SDL Trados. Если в файле присутствуют 100%-ные совпадения, то перевод в них можно оставить или заменить на оригинал. Мы их оставляем, если клиент не требует их проверять. В этом случае они помечаются как альтернативные переводы в OmegaT, однако в этом нет ничего страшного, поскольку их менять не требуется. Если же они требуют проверки, мы заменяем в них перевод на оригинал.
    2. Откройте файл TTX в любом текстовом редакторе, который поддерживает регулярные выражения, например в Notepad++.
    3. Откройте окно поиска и замены, включите использование регулярных выражений и произведите следующие замены:

=> ‰

Чтобы ввести «‰», наберите Alt+0137. На самом деле можно использовать любой редкий символ по своему усмотрению. Просто убедитесь, что он не встречается в файле TTX изначально.

[^‰rn]* =>

Обратите внимание на пробел между тегами в строке замены. В качестве примера я привожу теги в файле для перевода с английского на русский, для других комбинаций необходимо подставлять соответствующие языковые коды.

‰ =>

Эта замена является обратной для замены, выполненной на первом этапе.

  1. Сохраните файл TTX и откройте его в TagEditor или Wordfast Pro. Просмотрите файл, чтобы проверить, все ли части перевода были правильно заменены на пробелы. Если вы не заменяли существующие переводы (100%-ные совпадения) на оригиналы при сегментировании, то эти подставленные переводы останутся в файле.
  2. Теперь можно переводить файл TTX в OmegaT.

Заключение

Этот простой способ позволит вам работать с сегментированными файлами TTX в последней версии OmegaT напрямую. Прежде чем его пробовать, учтите: мы опробовали его на ограниченном числе файлов TTX. Шансы того, что у вас возникнут проблемы, чрезвычайно высоки. Перед тем как приступать непосредственно к переводу, всегда проверяйте файл TTX после осуществления замены, а также проверяйте, правильно ли OmegaT сохраняет готовый файл TTX. Кроме того, я не слишком подкован в области регулярных выражений, поэтому вам, возможно, удастся улучшить правила замены.

Если вы решите пользоваться этим способом, пока текущие ограничения по работе с файлами TTX в OmegaT 2.5 не будут разрешены, нам бы хотелось увидеть ваши комментарии.

Оставить комментарий


About the Author

Roman Mironov
Roman Mironov
CEO & Founder

As the founder of Velior, Roman has had the privilege of being able to turn his passion for languages into a business. He has over 15 years of experience in the translation industry. Roman has helped dozens of clients increase sales by making their products appealing for speakers of other languages.