ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ИЛИ ПРОБНЫЙ ПЕРЕВОД.

Yes, I want my consultaion

Видео: основные параметры сегментации в OmegaT

Судя по отзывам читателей, сегментация текста в программе OmegaT вызывает трудности у многих, поэтому я решил записать короткий ролик про ее основы. Предлагаю его вашему вниманию ниже (а также сценарий):

Сценарий

Здравствуйте, меня зовут Роман Миронов. Сегодня я познакомлю вас с некоторыми из основ сегментации в программе перевода OmegaT.

  1. Начнем с разбора разницы между сегментацией по абзацам и предложениям. Сегментация по предложениям в подавляющем большинстве случаев более удобна, поскольку целый абзац в одном сегменте — это слишком много. Одно предложение обычно оптимально. В этом примере три предложения в исходном файле принадлежат к одному абзацу. Но в OmegaT они представлены в виде трех отдельных сегментов. Это настройка по умолчанию.
  2. Переключимся на сегментацию на уровне абзацев и посмотрим, что произойдет. Теперь эти три предложения появляются в одном сегменте. Переводить их в таком виде — крайне неудачное решение.
  3. Вернемся к настройкам по умолчанию. Вот так гораздо лучше.
  4. Но постойте. Нельзя не упомянуть про случаи, когда сегментация по абзацам может прийтись весьма кстати. Например, в этом исходном немецком файле весь текст разбит на строки, и каждая отдельная строка являет собой, таким образом, абзац, равный предложению. При этом в тексте много сокращенных слов, которые вызывают неправильную сегментацию: разбитый на две части сегмент. Вместо того чтобы вручную править каждый случай с помощью отдельного правила сегментации, я могу просто переключиться на сегментацию по абзацам. В результате получаем правильную сегментацию.
  5. Идем дальше. Теперь посмотрим, как работает главное правило по умолчанию. Оно выглядит следующим образом. Как и многие другие правила в OmegaT, оно основано на регулярных выражениях. Правило разбивает текст после любой точки, вопросительного знака или восклицательного знака, при условии что за ними следует пробел. Флажок означает, что текст в данном месте разбивается.
  6. Вернемся в панель редактора. В данном случае правило разбило текст по точке, что нам и нужно. Но в следующем случае оно дает сбой, не разделяя текст после вопросительного знака, потому что за ним следует не пробел. За ним следует неразрывный пробел. Поэтому мне нужно вернуться к правилу и доработать его так, чтобы в него входил не только обычный пробел, но и неразрывный.
  7. Вернемся к правилу. Это регулярное выражение означает обычный пробел. Я заменю его другим, которое уже означает любой пробел, включая неразрывный.В результате получаем правильную сегментацию.

На этом на сегодня все. Спасибо за внимание. Если у вас есть вопросы, прошу писать в комментариях.

Оставить комментарий


About the Author

Roman Mironov
Roman Mironov
CEO & Founder

As the founder of Velior, Roman has had the privilege of being able to turn his passion for languages into a business. He has over 15 years of experience in the translation industry. Roman has helped dozens of clients increase sales by making their products appealing for speakers of other languages.