ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ИЛИ ПРОБНЫЙ ПЕРЕВОД.

Yes, I want my consultation

Снова о переводе файлов SDLXLIFF в OmegaT

Преобразование SDLXLIFF в TTX и обратное преобразование для перевода в OmegaT
Не успел я написать про трудности перевода файлов SDLXLIFF в OmegaT из-за различий между тегами, как на ум пришло одно возможное временное решение. Проблема заключается в том, что в связи с текущими ограничениями OmegaT готова работать с файлами SDLXLIFF, только если в часть перевода скопирован оригинал (т. е. они предварительно сегментированы). Из-за этого в файле невозможно сохранить 100-процентные совпадения, что является обязательным условием для автоматического преобразования тегов Trados в теги OmegaT.

Суть решения

В последнем бюллетене Йост Цетше (Jost Zetzsche) упомянул про крайне полезную программу SDLXLIFF to Legacy Converter, которая среди прочего умеет преобразовывать SDLXLIFF в ТТХ и обратно. Вы подумали о том же, что и я? Ура, мы получаем возможность преобразовать файл SDLXLIFF в ТТХ, перевести TTX в OmegaT и преобразовать обратно в SDLXLIFF! Дело в том, что OmegaT лучше работает с TTX, чем с SDLXLIFF, в том числе поддерживает наличие в файле части или всего перевода, так что такое преобразование позволяет обойти ограничения, с которых я начал эту запись.

Когда применять

На ум пока приходят три варианта использования:

  1. Предварительно переведенный файл SDLXLIFF с некоторым количеством 100-процентных совпадений. Чтобы работать с ним в OmegaT напрямую, придется заменить все 100-процентные совпадения, а также непереведенные сегменты на оригинал. В итоге все 100-процентные совпадения, содержащие теги, потребуется подставлять из памяти, всякий раз вручную меняя теги. Вместо этого теперь можно преобразовать его в TTX, и после загрузки TTX в OmegaT все 100-процентные совпадения с тегами подставятся автоматически!
  2. Редактирование полностью переведенного файла SDLXLIFF. Касается ситуаций, когда бюро переводов присылает уже переведенный файл на редактирование другому переводчику. В настоящее время работать с таким файлом в OmegaT можно только следующим способом: создать на его базе память TMX, заменить все 100-процентные совпадения на оригинал, загрузить сам файл и память TMX в OmegaT и вручную подставлять все сегменты, содержащие теги. Очевидно, это слишком трудоемко и неэффективно. Вряд ли кому захочется возиться с этим, когда можно просто отредактировать файл SDLXLIFF напрямую в Studio. SDLXLIFF to Legacy Converter же существенно упрощает этот процесс: нужно лишь преобразовать файл SDLXLIFF в TTX и обратно.
  3. Файлы SDLXLIFF большого размера. Большие файлы SDLXLIFF загружаются в OmegaT невыносимо долго. Теперь таких «монстров» можно преобразовывать в формат ТТХ, у которого такой проблемы нет.

Потенциальные проблемы

OmegaT в целом следует существующей в файле TTX сегментации (равно как и в SDLXLIFF), в частности не объединяет сегменты. Но вот разбить может запросто. Например, два предложения, которые Trados были объединены в один сегмент, OmegaT часто бьет на два. В результате перевод из ТТХ или памяти автоматически в такие сегменты не подставляется. Поэтому приходится либо подстраивать правила сегментации под каждый конкретный случай, чтобы подогнать ее под сегментацию ТТХ, либо подставлять переводы вручную.

Любое промежуточное преобразование сопряжено с ошибками и потерей времени. Конвертация из SDLXLIFF в ТТХ и обратно не исключение. Тут нужно каждый раз сравнивать ожидаемые выгоды и необходимое для всех преобразований время с тем временем, которое может уйти на работу без каких-либо преобразований: подстановку 100-процентных совпадений вручную или перевод файла напрямую в Studio.

OmegaT может не загрузить преобразованный файл TTX, выдав в логе такую ошибку: «26473: Warning: Attribute Lang is missing in Tuv (after text unit ‘0’)». В этом случае необходимо либо просто пересохранить этот файл в TagEditor, либо, открыв его в текстовом редакторе, заменить все случаи «Tuv lang» на «Tuv Lang».

И напоследок

Не забывайте, что файлы SDLXLIFF до преобразования нужно сегментировать. В противном случае у OmegaT могут возникнуть проблемы с сегментацией файлов TTX. Ну и наиболее пытливые читатели могут с помощью регулярных выражений обхитрить OmegaT, так чтобы в окне нечетких совпадений не мешались переводы из TTX.

Узнать больше об OmegaT можно в других наших статьях о многочисленных функциях этой замечательной переводческой программы.

Оставить комментарий


About the Author

Roman Mironov
Roman Mironov
CEO & Founder

As the founder of Velior, Roman has had the privilege of being able to turn his passion for languages into a business. He has over 15 years of experience in the translation industry. Roman has helped dozens of clients increase sales by making their products appealing for speakers of other languages.