Корпоративный блог «Велиора» о бюро переводов и переводческой отрасли
Архив рубрики «Технологии перевода»
18.05.2012, Roman Mironov

Как и в случае со всеми последними крупными обновлениями, OmegaT 2.5.4, выпущенная на прошлой неделе, содержит ряд очень серьезных улучшений. Рассмотрим некоторые из них, чтобы оценить, насколько полезны они будут в повседневной деятельности профессионального переводчика.
Автоматическая замена цифр
Пожалуй, главным улучшением стала возможность автоматически подставлять цифры при вставке частичного совпадения, в котором цифры отличаются от тех, что в текущем оригинале. Эта функция существует и в других программах памяти переводов, так что ее ждали давно. Очень приятно, что она наконец-то реализована! Отвечающий за нее параметр находится здесь: «Параметры» > «Параметры редактирования» > Attempt to convert numbers when inserting a fuzzy match.
В прошлом году мы работали над одним переводом с немецкого на русский, где как раз из-за отсутствия возможности подставлять отличающиеся цифры было потеряно много времени. Сейчас я решил вернуться к нему, чтобы проверить, как поведет себя долгожданная функция. Сначала посмотрим, как она справляется с отдельно стоящими цифрами:
1 Niederdrucküberwachung 4 Kreis 1
2 Niederdrucküberwachung 5 Kreis 2
3 Niederdrucküberwachung 6 Kreis 3
После перевода первой фразы я вставил частичное совпадение из памяти в две другие. OmegaT правильно заменила цифры в третьем сегменте, но во втором перепутала порядок. На основании этого теста и других переводов, в которых удалось проверить эту функцию, можно сделать вывод, что она работает в целом неплохо, но может и не срабатывать. Видимо, слово «Attempt» в названии содержится не зря. Поэтому полностью полагаться на нее не следует. Продолжайте проверять переводы на предмет ошибки с помощью любимого средства контроля качества, например CheckMate.
Более сложна ситуация, когда цифры «приклеены» к словам. Например, раньше в популярной программе SDL Trados такие цифры не заменялись (как сейчас — не знаю):
Strom L1
Strom L2
Strom L3
Оказалось, что OmegaT такой тип цифр пока не заменяет.
В целом предполагаю, что с введением этой функции мы могли бы сэкономить по крайней мере 20 % времени в том немецком проекте перевода — отличный результат для одного улучшения! Интересно было также проверить, распространяется ли эта функция на цифры в тегах. К сожалению, пока нет. Вот пример:
Select <t0/>Yes<t1/> to restart the system.
Select <t2/>Yes<t3/> to restart the system.
В этом случае при подстановке частичного совпадения во второй сегмент OmegaT не заменяет цифры в тегах. Так что ждем улучшения этого момента в будущих версиях, а также возможности заменять теги целиком, например <x0> и <x1> на <t3> и <t4>.
Я также надеялся, что новая функция распространяется и на статистику (анализ) проекта, но увы. Функция «Статистика» определяет схожие сегменты, различающиеся лишь цифрами, как новые слова. А функция «Статистика по совпадениям» по-прежнему видит в них частичные совпадения, а не 100-процентные, как хотелось бы.
Автоматическое обновление совпадений в файлах TTX
Другая долгожданная функция, реализованная в OmegaT 2.5.4, — это возможность автоматического обновления совпадений при работе с двуязычными файлами, такими как ТТХ или TXML. Без нее было настолько неудобно, что мы даже предложили временный способ обойти эту проблему, специальным образом подготавливая файлы TTX. Раньше, когда в OmegaT загружали сегментированный файл, все сегменты распознавались как уникальные (альтернативные), что не давало пользоваться автоматической подстановкой повторов. Каждое внутреннее совпадение приходилось менять вручную. Теперь это в прошлом. При загрузке переведенного или сегментированного файла TTX можно спокойно менять любой повтор — все остальные его вхождения автоматически обновляются.
Однако нужно отметить, что некоторые ограничения в плане файлов TTX все же сохранились. Весь сегментированный текст в файлах ТТХ, включая тот, где оригинал просто равен переводу, отображается как переведенный в панели редактора, что для профессиональных пользователей OmegaT может быть непривычно и неудобно. Более того, если удалить любой из этих переводов, то после перезагрузки он снова появляется. Эти переводы также отображаются в панели «Нечеткие совпадения», занимая ценное место. Было бы здорово видеть улучшения в этом плане в будущих версиях.
Автоматическая подстановка повторов в файлах TXML при использовании фильтра Okapi
Интересно было также проверить эту новую функцию на файлах TXML. Они также загружаются в OmegaT сегментированными, и фильтр Wordfast Pro TXML, входящий в состав плагина Okapi, тоже имел вышеуказанную проблему. Однако в OmegaT есть и собственный фильтр Wordfast TXML, у которого такой проблемы не было. Таким образом, если вы привыкли использовать фильтр Okapi, то также извлечете пользу из данного улучшения. Для того чтобы использовать фильтр Okapi, есть по меньшей мере одна причина — в отличие от «родного» фильтра он не скрывает теги в начале сегмента, что делает невозможным их перемещение в переводе. Вот пример:
Wordfast: {ut1}XYZ{ut2} support staff are well mannered.
«Родной» фильтр: XYZ<u0/> support staff are well-mannered.
Фильтр Okapi: <x1/>XYZ<x2/> support staff are well-mannered.
В этом сегменте прямой порядок слов в русском языке требует, чтобы мы поставили слова «персонал службы поддержки» перед «XYZ», следовательно, нам обязательно нужна возможность переместить открывающий тег. Фильтр Okapi ее обеспечивает, показывая как открывающий, так и закрывающий теги, а «родной» фильтр OmegaT — нет.
Изменение интервала сохранения
Теперь в параметрах можно изменять автоматический интервал сохранения: «Параметры» > «Save». Раньше он всегда составлял 10 минут, но теперь можно задать более короткий интервал. Например, короткий интервал поможет сохранить больше переводов в случае сбоя OmegaT или компьютера. Кроме того, в случае одновременной работы нескольких переводчиков над одним проектом и частого копирования файла project_save.tmx в сетевую папку для создания общей памяти более короткий интервал позволит быстрее передавать новые переводы остальной команде.
С учетом всех значительных улучшений, произошедших с OmegaT в последнее время, удивлюсь, если вы до сих пор ее не попробовали. Загрузить последнюю версию OmegaT можно на этой странице. А дополнительные сведения можно найти на сайте сообщества OmegaT на Yahoo, который является центром поддержки и содержит огромное количество информации обо всех нюансах использования программы.
Метки:OmegaT, оборудование и ПО, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
27.04.2012, Roman Mironov

Сейчас последняя версия OmegaT поддерживает файлы SDL Trados TTX благодаря расширению Okapi. Хотя это отличный способ работать с файлами TTX в замечательной программе для перевода, он сопряжен с парой проблем. Одним из возможных решений является использование Okapi Rainbow для создания проекта перевода для OmegaT и последующее обратное преобразование по завершении перевода. Если такой способ вам не подходит и переводить файлы TTX приходится в OmegaT напрямую, то существует другое простое решение, чтобы обойти текущие ограничения. Какое? Ответ в этой записи. Однако прежде всего предлагаю рассмотреть сами проблемы.
Сегментированный файл TTX
При открытии сегментированного файла TTX в OmegaT все повторяющие сегменты (внутренние совпадения) помечаются как альтернативные переводы, т. е. идентичные сегменты, переведенные по-разному. Это можно легко проверить, посмотрев на вкладку Multiple Translations, в которой для подобных сегментов будет отображаться по несколько переводов. В этой ситуации автоподстановка переводов в идентичные сегменты невозможна. В случае редактирования такого внутреннего совпадения изменению подвергнется только этот конкретный сегмент, в то время как остальные идентичные сегменты останутся прежними. Таким образом, каждый идентичный сегмент придется редактировать вручную. Функция Multiple Translations появилась только в OmegaT 2.5, поэтому подобного неудобства можно избежать, воспользовавшись более старой версией 2.3. Однако мне это не подходит, поскольку в последних версиях программы появилось очень много полезных функций.
Несегментированный файл TTX
Проблема, описанная выше, не распространяется на несегментированные файлы TTX. Однако в настоящее время OmegaT создает в окончательных файлах TTX сегментацию по абзацам, а не по предложениям, что обычно неудобно. К примеру, клиент может требовать сегментацию TTX на основе его собственных правил сегментации для SDL Trados. Если же сегментация по абзацам устраивает вас и вашего клиента, то можно просто переводить несегментированный файл TTX в последней версии OmegaT. Если же нет, то единственный выход — работа с сегментированным TTX.
Возможное решение
Теперь перейдем к самому способу. Это решение придумал мой коллега Владимир, и пока оно нас не подводило. Мы заметили, что если в сегментированном файле TTX заменить часть перевода одним пробелом, OmegaT воспринимает такой сегмент как непереведенный — проблема ненужных альтернативных переводов решена. В то же время OmegaT сохраняет сегментацию (поскольку файл сегментирован), а это значит, что разбивать его программа будет согласно сегментации исходного файла, а не по абзацам. Применяя этот способ, можно переводить сегментированные файлы TTX в последней версии OmegaT напрямую.
- Для начала необходим полностью сегментированный файл TTX. Его можно попросить у клиента. Также можно сегментировать файл TTX самостоятельно в пробной версии Wordfast Pro или в SDL Trados. Если в файле присутствуют 100%-ные совпадения, то перевод в них можно оставить или заменить на оригинал. Мы их оставляем, если клиент не требует их проверять. В этом случае они помечаются как альтернативные переводы в OmegaT, однако в этом нет ничего страшного, поскольку их менять не требуется. Если же они требуют проверки, мы заменяем в них перевод на оригинал.
- Откройте файл TTX в любом текстовом редакторе, который поддерживает регулярные выражения, например в Notepad++.
- Откройте окно поиска и замены, включите использование регулярных выражений и произведите следующие замены:
<Tuv Lang="EN-US"> => ‰
Чтобы ввести «‰», наберите Alt+0137. На самом деле можно использовать любой редкий символ по своему усмотрению. Просто убедитесь, что он не встречается в файле TTX изначально.
<Tuv Lang="RU-RU">[^‰\r\n]*</Tuv> => <Tuv Lang="RU-RU"> </Tuv>
Обратите внимание на пробел между тегами в строке замены. В качестве примера я привожу теги в файле для перевода с английского на русский, для других комбинаций необходимо подставлять соответствующие языковые коды.
‰ => <Tuv Lang="EN-US">
Эта замена является обратной для замены, выполненной на первом этапе.
- Сохраните файл TTX и откройте его в TagEditor или Wordfast Pro. Просмотрите файл, чтобы проверить, все ли части перевода были правильно заменены на пробелы. Если вы не заменяли существующие переводы (100%-ные совпадения) на оригиналы при сегментировании, то эти подставленные переводы останутся в файле.
- Теперь можно переводить файл TTX в OmegaT.
Заключение
Этот простой способ позволит вам работать с сегментированными файлами TTX в последней версии OmegaT напрямую. Прежде чем его пробовать, учтите: мы опробовали его на ограниченном числе файлов TTX. Шансы того, что у вас возникнут проблемы, чрезвычайно высоки. Перед тем как приступать непосредственно к переводу, всегда проверяйте файл TTX после осуществления замены, а также проверяйте, правильно ли OmegaT сохраняет готовый файл TTX. Кроме того, я не слишком подкован в области регулярных выражений, поэтому вам, возможно, удастся улучшить правила замены.
Если вы решите пользоваться этим способом, пока текущие ограничения по работе с файлами TTX в OmegaT 2.5 не будут разрешены, нам бы хотелось увидеть ваши комментарии.
Метки:OmegaT, оборудование и ПО, перевод с английского на русский, переводческая среда Рубрика: Технологии перевода, Это интересно |
Нет комментариев »
03.04.2012, Roman Mironov

Недавно я установил 64-битную демонстрационную версию Windows 8 на ПК, на котором планировалось обновить операционную систему. В основном меня интересовало, поддерживает ли новая ОС программу OmegaT и предлагает ли какие-либо дополнительные преимущества для переводчиков по сравнению с последней официальной версией Windows. Использование пробных версий программного обеспечения всегда связано с определенным риском. Но, несмотря на то что бета-версия все еще находится в разработке, Windows 8 продемонстрировала достаточно стабильную работу. Если вы рассматриваете возможность обновления до Windows 8, то, на мой взгляд, вполне можно попробовать бета-версию.
Запуск OmegaT в Windows 8
OmegaT я не устанавливал, а просто скопировал ее папку установки с другого ПК. Для нас это наиболее предпочтительный способ обновления программы, поскольку в этом случае можно быть уверенным, что вы не забудете установить все самые последние плагины и скрипты. Помимо этого, я скопировал папку конфигурации OmegaT в папку, находящуюся по адресу c:\Users\user name\AppData\Roaming\OmegaT\. Однако поначалу программа не запустилась. В командной строке отобразилось следующее сообщение об ошибке:
«Java is not recognized as an internal or external command» (Java не является внутренней или внешней командой)
Привожу далее способ исправления этой проблемы:
- На панели, которая появляется при наведении курсора на правый нижний угол меню Start, выберите Settings > Control Panel > System > Advanced system settings.
- Перейдите на вкладку Advanced и нажмите Environment Variables
- В окне System Variables найдите Path и нажмите Edit.
- Добавьте точку с запятой и укажите путь к папке bin, находящейся в вашей папке установки Java. Например, в моем случае это c:\Program Files (x86)\Java\jre6\bin\.
- Три раза нажмите OK.
Кроме этой, других проблем с работой OmegaT в Windows 8 у меня не возникало.
Другие программы для переводчиков
Все другие постоянно используемые нами программы, незаменимые в плане поддержки работы переводчика, прекрасно работают в Windows 8. Это, например, следующие программы:
- Abbyy Lingvo x3. Мы отметили, что быстродействие этой программы по сравнению с Windows 7 даже улучшилось.
- QA Distiller
- ApSIC Xbench
- LibreOffice
- Foxit Reader
- Punto Switcher
- Встроенная функция удаленного рабочего стола
Единственная программа, которую пока не удалось запустить в Windows 8, — это Okapi.
Переводчикам на русский на заметку
Профессиональных переводчиков на русский язык, безусловно, порадует тот факт, что, хотя Windows 8 еще недоступна на русском языке, проблем с русским текстом у нее, похоже, нет. Однако в некоторых программах, возможно, потребуется вручную переключить графический интерфейс пользователя на русский (если такая необходимость возникнет).
Заключение
Поскольку срок действия тестовой версии Windows 8 установлен до 2012 года, это отличная возможность обновить Windows XP для тех переводчиков, которые давно планировали это сделать. Этой версией можно бесплатно пользоваться почти целый год, а затем приобрести новую. До конца не уверен, имеет ли такое обновление смысл для переводчиков, использующих Windows 7, поскольку каких-то значительных преимуществ, которые могли бы оправдать вложенные в обновление системы средства, мы не заметили.
Метки:OmegaT, оборудование и ПО, переводческая среда Рубрика: События «Велиора», Технологии перевода |
Нет комментариев »
23.03.2012, Roman Mironov
Несколько дней назад вышла новая версия OmegaT — OmegaT 2.5.2_1. С каждой новой версией эта бесплатная программа для перевода становится все более удобной для пользования — не стала исключением и последняя версия. Кратко остановимся на тех улучшениях, пользу от которых мы уже ощутили в нашем переводческом процессе.
Глоссарий
Это улучшение понравится тем, кто ценит эффективность и предпочитает содержать в порядке свои глоссарии переводов. Теперь можно указать файл глоссария, куда по ходу перевода будут добавляться новые термины. Местоположение этого файла задается в окне «Настройка проекта». Ранее программа создавала этот файл автоматически и называла его по схеме «название проекта-glossary.txt». Наше бюро переводов создает и поддерживает отдельный глоссарий для каждого заказчика, например «глоссарий клиента-английский-русский.txt». Раньше после завершения перевода мы должны были вручную переносить записи из «название проекта-glossary.txt» в основной глоссарий, а первый из вышеупомянутых удалять. Теперь же достаточно в начале работы указать основной глоссарий. Больше не нужно объединять два глоссария в один.
Примечания
Начиная с версии 2.5.1_1 пользователи могут переходить между сегментами с примечаниями с помощью команд «Next Note» и «Previous Note» в меню «Переход». Для двух этих команд также можно настроить свои собственные комбинации клавиш. В последней версии эта функция получила дальнейшее развитие — теперь программа может выделять все сегменты с примечаниями. Для этого достаточно выбрать меню «Вид» и установить флажок напротив пункта «Mark Segments with Notes». Данное выделение имеет приоритет над выделением сегментов, которое задается с помощью флажков «Выделить переведенные сегменты» и «Выделить непереведенные сегменты». Пункты меню «Вид» теперь также имеют цветные значки, цвета которых соответствуют фактическим цветам, применяющимся для выделения сегментов.
Неразрывные пробелы
Новая версия позволяет отображать неразрывные пробелы: выберите меню «Вид» > «Mark Non-breakable Spaces». В предыдущих версиях тоже можно было вставлять неразрывные пробелы, пользуясь обычным способом (Alt+1060 в Windows), однако в окне редактора они не отображались. Теперь пробелы отображаются серым цветом, и их намного легче вставлять и проверять.
Вставить теги оригинала
Доступная через меню «Правка» или при нажатии комбинации клавиш Ctrl+Shift+T, эта команда выполняет действие, в точности соответствующее ее названию. Она полезна в том случае, когда один или несколько тегов были удалены из строки перевода и требуется быстро их вставить, чтобы не копировать вручную из строки оригинала. Ранее при использовании этой команды перед первым вставленным тегом ошибочно добавлялся пробел. Теперь этот недостаток исправлен.
Заголовок окна «Поиск»
В заголовке окна «Поиск» теперь отображается критерий поиска. Это улучшение может пригодиться, когда переводчик открыл несколько окон «Поиск» и переключается между ними с помощью панели задач или переключателя задач Alt+Tab операционной системы.
Заключение
OmegaT выгодно отличается не только мощным набором функций, но и тем, что команда ее разработчиков нацелена на регулярный выпуск новых версий и прислушивается к запросам пользователей. Раз от раза OmegaT становится значительно лучше, постоянно радуя своих пользователей. Раньше, когда мы пользовались другими программами для перевода, обновления приходилось порой ждать годами. Благодаря OmegaT эти времена канули в прошлое. Лично для меня постоянные усовершенствования являются мотивирующим фактором в переводческом процессе, поскольку мне нравится применять в работе новые функции и повышать за счет них эффективность. Настоятельно рекомендую всем переводчикам хотя бы попробовать новую версию. Последняя версия OmegaT доступна на странице загрузки на сайте SourceForge. Дополнительные сведения можно получить на сайте сообщества разработчиков и пользователей OmegaT в Yahoo.
А вы уже протестировали самую последнюю версию? Можете поделиться своими впечатлениями?
Метки:OmegaT, оборудование и ПО, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
11.02.2012, Roman Mironov

OmegaT — это бесплатная, но вместе с тем очень мощная переводческая среда с открытым исходным кодом, помогающая повысить качество и производительность работы как независимым переводчикам, так и бюро переводов. Одним из наиболее приятных аспектов этой программы является ее постоянное совершенствование. Команда разработчиков регулярно выпускает новые версии, и сегодня я как раз предлагаю рассмотреть очередной блок улучшений, появившихся в последней версии — 2.5.1. Как и в предыдущих записях об OmegaT, я остановлюсь только на тех новых функциях, которые мы уже постоянно используем в переводах с английского на русский.
1. Новая версия имеет множество улучшений, связанных с тегами. Основное нововведение — отображение тегов серым, чтобы визуально отделить их от остального текста; очень напоминает Wordfast Pro. Эту функцию ждали давно, поскольку часто в сегменте содержится очень много тегов, что мешает сосредотачиваться на подлежащем переводу тексте. Однако с затенением тегов эта проблема практически отпала. Благодаря ей также гораздо проще выявляются лишние или отсутствующие пробелы по сторонам тегов, тем самым предотвращаются двойные пробелы или «склеенные» слова в окончательных документах. Но новая функция пока не применяется к панели «Нечеткие совпадения», где теги по-прежнему отображаются как обычный текст.
2. Появилась возможность удалять все внутренние (отображаемые в сегментах) теги из исходного файла — достаточно выбрать «Сервис» > «Remove Tags». Удаление тегов полезно, когда сегменты содержат слишком много тегов, особенно ничего не значащих. Такая проблема очень характерна для файлов DOCX (Microsoft Word). Чтобы обходить ее, мы предварительно обрабатываем файлы DOCX макросом CodeZapper. Теперь же есть альтернативный вариант, позволяющий убрать теги, не прибегая к внешним решениям. Однако пользоваться им следует осторожно, поскольку наряду с бесполезными тегами удаляются и нужные, например означающие полужирный шрифт или гиперссылки. В настоящее время на ум приходят по крайней мере два варианта использования этой функции:
- Если текст содержит много ненужных тегов и мало нужных, то можно удалить теги и переводить без них. После завершения перевода создаем окончательный документ и сравниваем его с исходным вручную, чтобы проверить, не было ли повреждено форматирование из-за удаления нужных тегов.
- Если текст содержит много ненужных тегов и порядочное количество нужных, то теги тоже можно удалить. Но после завершения перевода придется включить теги. Те сегменты, в которых есть теги, отобразятся как непереведенные. Далее просто подставляем переводы, оставляя в них только нужные теги.
3. Зачастую при локализации программного обеспечения приходится иметь дело с Java-подобными тегами, в частности т. н. заполнителями, например: «{0} пользователям это нравится». OmegaT теперь упрощает работу с ними, распознавая их как обычные собственные теги: затеняет, позволяет проверять и вставлять с помощью сочетания Ctrl + T. Эту функцию можно включить, выбрав «Параметры» > «Проверка тегов» и установив флажок «Check simple Java…». Более того, программа позволяет настроить произвольные теги с помощью регулярных выражений. К примеру, в одном из наших постоянных проектов часто встречаются Java-подобные заполнители, содержащие одно или несколько слов. Теперь можно создать регулярное выражение, чтобы весь заполнитель распознавался как тег. Для этого выбираем «Параметры» > «Проверка тегов» и вводим в поле «Custom tag(s) regular expression» соответствующее выражение. Рассмотрим следующий пример:
Так сегмент выглядит до использования этой функции:
More \{0 [product name]\} reviews
Возможный вариант регулярного выражения, позволяющего распознать \{0 [product name]\} как тег: \\\{[^\r\n\}]*\}
В итоге сегмент выглядит так:
More <тег> reviews
Новые усовершенствования делают OmegaT еще более привлекательным решением для профессиональных переводчиков. Последнюю версию можно загрузить на этой странице. Или же загрузите OmegaT 2.5.1 для Windows напрямую с помощью этой ссылки. И не забудьте поблагодарить разработчиков за их добровольный труд на благо коллег, написав сообщение в группе Yahoo!
Метки:OmegaT, оборудование и ПО, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
08.11.2011, Roman Mironov

В OmegaT имеется очень удобная функция фильтрации сегментов в окне редактора. Сама по себе эта функция не новая, она присутствует и в других переводческих средах, например Wordfast, и позволяет быстро переходить между 100-процентными и частичными совпадениями. Однако, по-моему, в OmegaT она реализована интереснее и имеет очень серьезный потенциал. В этой записи рассматриваются некоторые области ее применения. Основная цель использования фильтра — сэкономить время, оставив в проекте только те сегменты, которые требуют внимания, и сделав более удобным переход между ними. Для применения фильтра нужно открыть окно «Поиск текста» (Ctrl+F), найти нужные сегменты, затем в правом нижнем углу нажать кнопку «Фильтр». В результате в панели редактора OmegaT отобразятся только найденные сегменты. Для отключения фильтра достаточно снова выполнить любой поиск, нажать кнопку «Фильтр», затем сразу «Убрать фильтр».
- Пожалуй, наибольшая польза этой функции для нашего бюро переводов — возможность удалять неоплачиваемые 100-процентные совпадения из объема работы. Без нее не обойтись, когда клиент просит подставить 100-процентные совпадения в текущий перевод автоматически без проверки, чтобы сэкономить на стоимости такой проверки. В этом случае имеет смысл убрать 100-процентные совпадения из технологического процесса в разумных пределах. При собственно переводе 100-процентные совпадения можно пропускать, просто переходя к следующему непереведенному сегменту (Ctrl+U). Однако при редактировании это, естественно, невозможно. Как раз здесь приходит на выручку фильтр. От вас требуется лишь сообразить, какие критерии поиска позволят найти только те сегменты, которые были изменены в ходе перевода. Например, можно выполнить поиск сегментов по имени переводчика данного проекта. После их нахождения и применения фильтра вы сможете работать только над теми сегментами, которые требуют редактирования.
- При переводе часто приходится вносить «глобальные» правки терминов, особенно в крупных проектах. По умолчанию для этого открывают окно «Поиск текста», находят сегменты и поочередно щелкают их, чтобы открыть их в редакторе и затем поправить. Это не очень эффективно, и с увеличением количества вхождений скорость снижается чуть ли не в геометрической прогрессии. В таких случаях, чтобы сэкономить время и терпение, приходится «идти на хитрость»: открывать память переводов проекта в текстовом редакторе, например Notepad++, и вносить правки непосредственно в память. Фильтр позволяет работать в таких случаях более элегантно: с его помощью можно «извлечь» в редактор только нужные сегменты и переходить по ним очень быстро.
- Для перевода файлов TTX, содержащих сегменты Context TM (Perfect Match, XU), мы пользуемся замечательной утилитой Toxic, которая преобразует их в формат, понятный OmegaT. Недостатком преобразования является то, что в таких сегментах OmegaT подставляет на место оригинала перевод (как будто он является исходным текстом, это обусловлено принципом работы Toxic). Как и в случае с неоплачиваемыми 100-процентными совпадениями, наличие таких сегментов замедляет работу. Чтобы обойти эту проблему, можно исключить их из объема работ с помощью фильтра.
- Недавно я писал про появление в OmegaT функции примечаний. Фильтр позволяет оптимизировать использование и этой функции. Найдя все сегменты с примечаниями в окне «Поиск текста», вы можете с помощью фильтра «извлечь» их в окно редактора, где работать с ними будет гораздо приятнее, чем последовательно щелкать каждый сегмент в окне «Поиск текста» и каждый раз переключаться в панель редактора. Опять же, чем больше сегментов с примечаниями, тем больше пользы от применения фильтра.
Метки:OmegaT, качественный перевод, оборудование и ПО, память переводов, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Комментарии (2) »
03.11.2011, Roman Mironov

Создание и ведение глоссариев для отдельных клиентов — стандарт переводческой отрасли. В глоссарии содержится терминология, используемая клиентом, что облегчает доступ к утвержденным переводам и обеспечивает единство терминологии во всех проектах, выполняемых для клиента. Однако существует ряд подводных камней, которые могут осложнить использование глоссария или сделать его недостоверным. В этой записи содержится ряд советов о том, как избежать их и получить максимальную отдачу от создаваемых глоссариев.
Проблема. Многие глоссарии создаются до начала собственно перевода — путем извлечения и перевода списка часто встречающихся слов. Предположительно, такие глоссарии должны упрощать переводчикам доступ к правильному переводу терминов и обеспечивать единство перевода на всем протяжении проекта. Идея создания глоссария перед переводом, несомненно, разумна, однако ее воплощение не всегда идеально. Термины в таком списке переводятся без учета контекста, что неизбежно приводит к значительному объему слишком общих переводов или даже смысловых ошибок. В итоге глоссарий вводит в заблуждение и может привести к ошибкам в будущих переводах. Если же глоссарий утвержден клиентом, то возникнет задержка в работе, поскольку переводчику придется создавать список предлагаемых исправлений и ждать, когда эти исправления будут одобрены клиентом.
Решение. Рекомендую создавать глоссарий по ходу перевода проекта. Так в него с большой вероятностью попадут правильные переводы, основанные на понимании текста, а не на догадках переводчика.
Проблема. В глоссарии зачастую содержатся лишние термины, противоречащие его назначению. К таким «терминам» относятся глаголы, названия стран, общеупотребительные существительные и т. д. Очевидно, что такие глоссарии скорее запутывают переводчика, чем помогают ему. Каждый раз, когда глагол или общеупотребительное существительное требуют перевода, отличного от перевода в глоссарии (что случается крайне часто!), перед переводчиком возникает дилемма: использовать ли более точный перевод, который не соответствует глоссарию, или же взять перевод из глоссария, несмотря на то что он не вписывается в данный контекст. Чем больше лишних слов содержит глоссарий, тем меньше от него пользы.
Решение. В идеале в глоссарий нужно вносить только настоящие термины, специфичные именно для этого клиента, и не записывать в него общеупотребительные слова.
Проблема. Часто глоссарий воспринимают как «истину в последней инстанции» и следуют ему неукоснительно, несмотря на то что перевод в нем может противоречить здравому смыслу. К примеру, переводчик, следующий этому принципу, может намеренно использовать перевод из глоссария, даже если он не соответствует текущему контексту или явно неправильный. Редактор, который выявил несоответствующий глоссарию перевод, может поспешить исправить его, не задумываясь о том, почему переводчик отошел от глоссария. А клиент, в свою очередь, может отказаться от предложения изменить глоссарий, сославшись на то, что он уже утвержден.
Решение. К глоссарию нужно относиться с известной долей гибкости, поскольку это все-таки не «истина в последней инстанции». Мы годами ведем и последовательно оптимизируем наши англо-русские глоссарии и до сих пор не можем добиться того, чтобы переводы в них подходили ко всем контекстам. Письменная речь уникальна и порождает многообразие контекстов, так что уместить все варианты перевода в один глоссарий едва ли возможно (да и нецелесообразно).
Метки:деятельность «Велиора», качественный перевод, переводческая среда, редактирование Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
27.10.2011, Roman Mironov

Несмотря на то что на рынке представлено множество бесплатных и платных переводческих сред (ПС), заказчики услуг по переводу, в том числе переводческие агентства и прямые заказчики, иногда решают создавать и использовать собственные среды. В этой ситуации, типичной в основном для крупных компаний, заказчик просит, чтобы поставщик перевода работал в переводческой среде компании, а не в той, которую он предпочитает. Широко известным примером является Translation Workspace, в которой работает переводческое агентство Lionbridge. Мы неоднократно работали с подобными переводческими средами, и мне хотелось бы рассказать о собственном опыте.
Положительные моменты
- Возможно, самым большим преимуществом применения подобных переводческих сред является удобство заказчика за счет интеграции процесса перевода в его систему управления контентом. Поставщик услуг перевода напрямую подключается к процессу создания контента, что повышает производительность и снижает зависимость заказчика от конкретного поставщика.
- Многие переводческие среды такого типа являются веб-системами, что обеспечивает им соответствующие преимущества. Обычно веб-системы интуитивно понятны и нетребовательны: чтобы начать перевод, необходимы только веб-браузер и учетная запись. Кроме того, они упрощают управление и коммуникацию, устраняя необходимость обмена файлами по электронной почте. Текст на перевод, память переводов и глоссарий находятся в системе.
Сложности
- С точки зрения поставщика перевода работа в среде заказчика не позволяет полностью использовать преимущества стандартного рабочего процесса. К примеру, при работе в веб-системе заказчика зачастую невозможно использовать привычные средства автоматического контроля качества или задействовать процесс проверки и утверждения правок редактора переводчиком.
- Разрешить какую-либо техническую неисправность, возникшую во время перевода, переводчик может, только обратившись за помощью к заказчику. Это может отнять больше времени, чем при использовании средств сторонних разработчиков. Например, по тем программам, в которых мы регулярно работаем, у нас накоплен значительный опыт. Это позволяет нам самостоятельно разрешать практически любые проблемы немедленно и без обращений к заказчику.
- Системы некоторых заказчиков могут отставать по производительности от последних версий переводческих сред, например от OmegaT. Одной из причин этого является то, что заказчики иногда не считают необходимым совершенствовать свои системы так же активно, как разработчики ПС. Заказчик мог разработать свою переводческую среду много лет назад, и мотивация к ее обновлению у него уже отсутствует, потому что все базовые функции в нее включены, а сотрудники заказчика к ней привыкли.
Резюмируя все вышеизложенное, можно сказать, что переводческие системы заказчика могут упрощать работу над переводом и экономить время, затрачиваемое на него, как для самого заказчика, так и для поставщиков перевода. Мы, как правило, с готовностью беремся за перевод с английского на русский в подобных ПС, при условии что в них хотя бы частично осуществим наш процесс контроля качества.
Метки:OmegaT, Интернет и перевод, качественный перевод, оборудование и ПО, память переводов, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
19.10.2011, Roman Mironov

Несколько месяцев назад я приступил к тестированию Ubuntu 10.10, чтобы проверить, насколько существенна экономия от замены Microsoft Windows на бесплатную операционную систему (ОС) в рамках переводческой деятельности. В течение шести месяцев я выполнил в Ubuntu множество переводческих проектов. В этой записи я хочу рассказать о некоторых сделанных выводах.
Порадовало то, что Ubuntu определенно можно использовать переводчикам. Впечатления от этой ОС оказались даже значительно лучше, чем я ожидал. Ubuntu поддерживает по меньшей мере три переводческих среды: OmegaT (тоже бесплатную), Wordfast Pro и Swordfish. Кроме того, в ней есть большая часть программ, необходимых для переводческой деятельности: OpenOffice.org (конкурент Microsoft Office), Adobe Reader, веб-браузер, почтовый клиент, программы мгновенных сообщений (включая Skype) и ряд других.
«Так где же подвох?» — спросите вы.
Недостаток популярности и интуитивной понятности значительно снижают удобство использования Ubuntu по сравнению с Windows. Вот три наиболее серьезных проблемы, с которыми я столкнулся при работе в этой ОС:
- Чтобы все программы начали работать как следует, может потребоваться много времени, при этом нужны знания ПК выше средних. В случае внедрения Ubuntu в переводческом агентстве потребуется значительное время на обучение персонала основам работы в ней.
- Многие программы, которые необходимы переводчику, совместимы с Ubuntu или имеют аналоги для Ubuntu. Однако велика вероятность того, что по меньшей мере несколько нужных вам программ окажутся несовместимы с этой ОС. В моем случае к таким программам относятся:
• Abbyy Lingvo (словарь)
• Abbyy FineReader (программа для OCR)
• Punto Switcher (автоматический переключатель раскладки клавиатуры, который также может служить для быстрого ввода часто используемых фраз)
• Foxit Reader (в момент тестирования у программы была версия для Ubuntu, однако в ней невозможно было редактировать файлы PDF, в отличие от версии для Windows)
• QA Distiller (средство автоматического контроля качества)
- Другим существенным препятствием для применения Ubuntu в качестве ОС для переводческой деятельности являются проблемы с совместимостью. Вместо Microsoft Office, который использует большинство компаний и обычных пользователей, придется перейти на OpenOffice.org (OOO). Несомненно, что OOO — это отличная программа, которая даже поддерживает файлы Office без преобразования. Однако на поверку выходит, что эта поддержка только «на бумаге». Да, с небольшими и простыми файлами Office она справляется успешно. Однако если файлы большие и сложные, то файл Office, сохраненный в OOO, при последующем открытии в Office зачастую имеет нарушенное форматирование. Таким образом, если вы часто переводите файлы DOCX или PPTX, то вам, скорее всего, все равно придется использовать Office для проверки и исправления форматирования после перевода, поскольку в OOO трудно создать файл, который бы корректно отображался в Office. Поэтому работать с такими файлами будет очень сложно, если у вас нет отдельного ПК, где установлены Windows и Microsoft Office.
Основываясь на опыте тестирования, я пришел к выводу, что переводить в Ubuntu вместо Windows, конечно, можно, однако это может быть невыгодно. Основной причиной, по которой имеет смысл пользоваться бесплатной, но менее популярной ОС, является экономия на дорогой лицензии. Однако полученная экономия практически сходит на нет из-за того, что много времени и усилий придется потратить на настройку программ и решение проблем совместимости. И хотя Ubuntu — прекрасная операционная система, я не думаю, что для переводчиков она имеет какие-либо экономические преимущества перед Windows.
Метки:OmegaT, Интернет и перевод, качественный перевод, оборудование и ПО, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода, Это интересно |
Нет комментариев »
04.10.2011, Roman Mironov

В этой записи я рассмотрю некоторые из изменений, осуществленных в последней (2.5.0) версии OmegaT, которая вышла на прошлой неделе. Список новых функций, представленных в последней версии, выглядит довольно внушительно. Однако в этот раз я остановлюсь только на тех из них, которые мы уже каждодневно используем в переводах с английского на русский.
- Новая версия OmegaT поддерживает возможность уникальных переводов повторов (внутренних совпадений). Ранее всякий раз, когда повторы должны были переводиться по-разному, мы были вынуждены специально помечать такие сегменты. Затем в уже созданных переведенных документах мы находили эти пометки и вносили требующиеся изменения в перевод. Такой подход нельзя назвать слишком эффективным, и теперь, к нашей радости, необходимость в нем отпала. Теперь перевести повторы по-разному можно непосредственно в самой программе, выбрав команду Create Alternative Translation в контекстном меню панели «Редактор».
- В новой версии появилась также функция примечаний. Прежде нам приходилось вставлять примечания непосредственно в сегменты, помечая их определенным образом. Теперь оставить или отредактировать примечание для любого сегмента можно с помощью специальной панели. Когда вы повторно открываете сегмент, содержащий примечание, оно отображается в этой панели. Чтобы найти все сегменты с примечаниями, достаточно нажать Ctrl+F для открытия окна поиска, снять флажки всех параметров, кроме In notes, и выполнить поиск с пустой строкой. Не стоит и говорить о том, что это чрезвычайно полезная и долгожданная функция, в особенности для такого рабочего процесса бюро переводов, где переводчик и редактор взаимодействуют через примечания, например чтобы что-то уточнить или разъяснить.
- Другим усовершенствованием является возможность использовать фильтры и правила сегментации отдельно по проектам. В предыдущих версиях существовал только один общий набор фильтров и правил сегментации для всех проектов, хранящийся локально на вашем ПК. Если переводчик добавлял новое правило с целью исправить некорректную сегментацию, то каждый раз при этом мы сталкивались с определенными трудностями. Поскольку новое правило сохранялось локально на компьютере переводчика, то при открытии этого же проекта на другом ПК, например для редактирования, сегментация имела другой вид. Каждый раз редактор должен был или добавлять то же самое правило вручную у себя, или просить у переводчика файл правил сегментации, хранящийся локально на ПК переводчика. Теперь же можно добавлять отдельные правила для каждого проекта, для этого достаточно нажать Ctrl+E, выбрать параметр «Сегментация», затем Project-specific segmentation rules. Файл правил сегментации сохранится в папку omegat этого проекта. Любой, кто в дальнейшем откроет этот проект, будет иметь абсолютно такую же сегментацию, базирующуюся на правилах в этом файле. Дополнительным преимуществом этого нововведения является возможность избежать другой проблемы одного файла правил: автоматического применения правил, настроенных в предыдущих проектах, ко всем новым проектам. Ранее все когда-либо настроенные правила (которые, однако, могли быть довольно индивидуальными) продолжали применяться ко всем новым проектам, что часто приводило к нарушению сегментации.
- И наконец, еще одна новая функция, о которой хотелось бы рассказать, — усовершенствование процесса, позволяющего обнаруживать изменения во внешних памятях переводов. В предшествующих 2.5.0 версиях, если вы вносили какие-то изменения или добавляли какой-либо файл TMX в папку памяти переводов проекта, приходилось перезагружать проект, чтобы увидеть изменения. Особенно много времени это отнимало при загрузке нескольких больших файлов TMX. Теперь любые изменения или добавления в папке tm обнаруживаются программой автоматически. Одним из преимуществ, которое мы уже получили от этого улучшения, является оптимизация процесса совместного использования памяти переводов двумя или более переводчиками, работающими над одним проектом одновременно. Раньше, если один переводчик подкладывал свою текущую память переводов в папку tm, он должен был попросить коллегу перезагрузить проект, чтобы ему тоже стали видны новые переводы. Теперь вы просто помещаете память переводов в папку tm, и другие переводчики сразу же видят это без уведомления или перезагрузки.
В заключение можно отметить, что мы нашли новую версию крайне полезной для себя. Мы искренне признательны разработчикам OmegaT за их постоянные усилия в усовершенствовании этой чрезвычайно удачной бесплатной программы. Настоятельно рекомендую попробовать эту новую версию всем переводчикам, заинтересованным в повышении производительности и качества работы с помощью высокоэффективной переводческой среды. Дополнительную информацию об OmegaT можно найти в этой записи блога. Об остальных нововведениях OmegaT мы расскажем в последующих записях.
OmegaT 2.5.0: качественный скачок вперед
Метки:OmegaT, оборудование и ПО, память переводов, перевод с английского на русский, переводческая среда Рубрика: Технологии перевода |
Нет комментариев »
|