О принципах сегментации текста в OmegaT

Как добиться правильной сегментации в программе перевода OmegaTВ OmegaT, в отличие от других программ памяти перевода, нет понятия «рабочий двуязычный файл» и, как следствие, нет функций «Разделить сегмент» и «Объединить сегменты», которые бы позволяли разделять и соединять сегменты вручную. В OmegaT это делается с помощью автоматических правил сегментации. Откровенно говоря, разобраться в этом вопросе может быть непросто. Нам самим сегментация давалась нелегко, когда мы только начинали пользоваться OmegaT. Помню, как в одном срочном проекте, разделенном между несколькими переводчиками, один из участников по ошибке добавил правило сегментации, которое автоматически объединяло все сегменты, заканчивающиеся на «s», со следующим сегментом. Из-за спешки мы тогда так и не смогли понять, в чем причина! Но со временем дело пошло на лад. Бьюсь об заклад, что, освоив эти правила, вы будете получать удовольствие от работы с ними. Надеюсь, что эта статья поможет вам сделать первый шаг.

Основные моменты

По умолчанию сегментация происходит на уровне предложений. Предложения можно заменить на абзацы в диалоговом окне Properties. Сегментация на уровне абзацев может быть полезна в нестандартных текстах, требующих творческого подхода, где может потребоваться менять местами предложения внутри абзаца.

Правила сегментации основаны на регулярных выражениях. С другой стороны, ничто не мешает вводить текст в правила напрямую; нужно только не забывать следить за тем, чтобы содержимое этого текста не совпадало с регулярными выражениями. Например, нельзя ввести точку напрямую, потому что это регулярное выражение, соответствующее одному любому знаку. Чтобы OmegaT не воспринимала ее как регулярное выражение, нужно поставить перед ней обратную косую черту: .

Приоритет правил

Правила применяются в следующем порядке:

  1. Правила на уровне диалекта языка (например, EN-GB)
  2. Правила на уровне отдельного языка (например, EN)
  3. Правила по умолчанию

Правила по умолчанию имеют самый низкий приоритет и применяются только после всех других правил. Новые правила обычно добавляют либо в правила по умолчанию, либо в правила для отдельного языка в зависимости от того, будет ли новое правило полезно также для других языков. Соответственно, обычно имеет смысл добавлять общие вещи в правила по умолчанию, а специфические правила — уже в группу правил для отдельного языка. Отдельные правила в группе применяются сверху вниз.

Общие правила и правила для конкретного проекта

Правила сегментации могут быть общими или созданными для отдельного проекта, «проектными». Общие правила хранятся в файле segmentation.conf в папке пользовательских настроек. В Windows 7 и 8 она по умолчанию находится по адресу c:UsersusernameAppDataRoamingOmegaT.

Эти настройки можно открыть, выбрав пункты меню Options => Segmentation, даже когда проект в программе не открыт.

Эти общие правила применяются по умолчанию, если только их не сделают «проектными». Для этого выбирают Ctrl+E => Segmentation => Make the segmentation rules project-specific. После этого все изменения, внесенные в правила сегментации, пока этот проект открыт, будут сохраняться в файл segmentation.conf, созданный в подпапке omegat этого проекта. При открытии другого проекта к нему уже будут применены общие правила, если только для него тоже не были созданы «проектные» правила.

Процесс управления различными правилами сегментации

Приведу пример того, как мы работаем с правилами:

  1. Руководитель проектов открывает проект во время первоначальной подготовки и просматривает его на предмет некорректной сегментации.
  2. Если он решает поправить правила, то первым делом делает их «проектными». Это гарантирует, что каждый, кто будет открывать проект после него, получит точно такую же сегментацию.
  3. Если эти правила могут быть полезными для будущих проектов, он сохраняет их отдельно, чтобы потом добавить в общий файл segmentation.conf, который мы используем на всех компьютерах в целях унификации сегментации.
  4. Если переводчик решает добавить в правила еще что-нибудь по ходу перевода, он поступает аналогичным образом: добавляет «проектное» правило (все правила уже «проектные», поскольку их сделал таковыми раньше руководитель проектов) и при необходимости тоже сохраняет его впрок.

Примечание. В совместных проектах перевода оптимально сразу делать правила сегментации «проектными», чтобы файл segmentation.conf был включен в проект, выгруженный на SVN-/GIT-сервер. Таким образом, все участники проекта изначально будут работать с одними и теми же правилами сегментации.

Благодарим за интерес к этой статье. Продолжайте следить за нашими публикациями: в следующей статье я приведу несколько примеров того, как объединять и разбивать сегменты в OmegaT с помощью пользовательских правил. Пока же предлагаю еще почитать запись про оптимальный способ освоения OmegaT.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *