Корпоративный блог «Велиора» о бюро переводов и переводческой отрасли


Архив рубрики «Технологии перевода»

Контроль качества в OmegaT

31.08.2011, Roman Mironov

В отличие от популярных переводческих сред, OmegaT изначально не обладает полным набором встроенных функций контроля качества. Однако автоматический контроль качества играет огромную роль для достижения высоких результатов в нашей работе, поэтому переводчикам или переводческим агентствам, работающим с OmegaT, придется прибегать главным образом к решениям сторонних разработчиков. В этой записи я кратко расскажу о наиболее важных инструментах контроля качества, доступных пользователям OmegaT.

Программа для проверки правописания и грамматики

Проверять правописание, а также выявлять различные стилистические или грамматические ошибки можно непосредственно в OmegaT. Дополнительную информацию о том, как активировать различные типы проверок, можно найти в предыдущей записи. Эти проверки выполняются только в ходе непосредственной работы над файлом, потенциальные ошибки подчеркиваются в самом файле. Тем не менее выполнить проверку всего файла (как, например, в Microsoft Word или Wordfast по нажатии F7) невозможно. Для этого можно воспользоваться инструментами контроля качества сторонних разработчиков, рассмотренными ниже. Их использование обычно обязательно, поскольку риск пропустить выделенную ошибку при работе над файлом очень высок. Целенаправленное же рассмотрение потенциальных ошибок в рамках отдельной проверки сводит этот риск к минимуму.

Проверка тегов

В OmegaT имеется встроенная функция проверки тегов. Для ее запуска необходимо нажать Ctrl+T. Этот этап чрезвычайно важен для контроля качества, поскольку защита тегов в OmegaT отсутствует. Риск частично или полностью удалить тег и пропустить эту ошибку при редактировании очень высок, поэтому выполнение этой проверки в проектах, где имеются теги, обязательно.

Программа контроля качества

Существует по меньшей мере три надежных инструмента, которые можно применять для выявления различных типов ошибок, например непоследовательных переводов, непереведенных сегментов, неправильных чисел, единства терминологии и т. д.: QA Distiller, ApSIC Xbench и CheckMate. Последние две программы бесплатны. Чаще всего мы пользуемся QA Distiller, тем не менее бесплатные ApSIC Xbench и CheckMate обладают в целом той же функциональностью. Работая с любой из этих программ, вы должны загрузить в нее файл TMX. Это может быть либо файл project_save.tmx, который содержит все переводы, записанные в память переводов текущего проекта, либо один из файлов TMX, созданных при сохранении переведенных документов в OmegaT. После загрузки в инструмент контроля качества с таким файлом TMX можно работать как с любым другим двуязычным файлом. Если при контроле качества будут выявлены ошибки, можно переключиться на проект в OmegaT, найти соответствующий сегмент, воспользовавшись функцией поиска, и внести правку. В QA Distiller встроен редактор TMX, позволяющий вносить правки в загруженный файл непосредственно из программы, т. е. без переключения в OmegaT. Вы закрываете проект в OmegaT, загружаете project_save.tmx в QA Distiller и вносите изменения непосредственно в project_save.tmx, щелкая ошибку и исправляя перевод в редакторе. После завершения контроля качества вы открываете проект в OmegaT, где уже отображается исправленный перевод. Итак, для контроля качества в проектах OmegaT подходят различные инструменты сторонних разработчиков. Наш опыт ежедневного использования OmegaT перевода с английского на русский показывает, что результаты контроля качества в этих проектах не уступают результатам, получаемым с помощью переводческих сред, где эти функции являются встроенными. При возникновении вопросов по этой теме наше бюро переводов с готовностью окажет вам помощь.

Управление памятью перевода в OmegaT

13.08.2011, Roman Mironov

Этой публикацией продолжается серия советов по использованию OmegaT в качестве профессиональной переводческой среды для перевода с английского на русский или других языковых пар. Сегодня речь пойдет о памяти переводов (TM — translation memory).

Мы храним все памяти переводов централизованно на файловом сервере, что облегчает управление TM и доступ к ним. Такой подход очень важен для нашей компании, поскольку постоянные проекты от одних и тех же конечных клиентов составляют значительную часть заказов. Структура проекта в OmegaT по умолчанию предполагает размещение подпапки «tm» в папке проекта. Если необходимо использовать дополнительные памяти, необходимо переносить их в эту папку (в виде файлов TMX). Таким образом, каждый раз при создании нового проекта для постоянного конечного клиента необходимо копировать все памяти от предыдущих проектов в эту подпапку. Это неэффективно и чревато тем, что вы забудете про какую-нибудь память. Всего этого можно избежать, если хранить все памяти конкретного клиента централизованно в одном месте. Если планируется хранить памяти на том же ПК, где выполняется перевод, для этого подойдет любая папка на нем. Если вы предпочитаете хранить их на устройстве, находящемся в общем доступе в сети, то такую папку необходимо подключить как сетевой диск (OmegaT не поддерживает сетевые пути Windows, начинающиеся с «\\»). При создании следующего проекта для этого клиента необходимо сменить путь к памяти, установленный по умолчанию, на путь к папке централизованного хранения. После этого можно просто копировать данный файл настроек (omegat.project) в каждый новый проект, поскольку в нем всегда будут прописаны правильные пути к папке централизованного хранения.

Если в проекте много 100%-ных совпадений, многие предпочитают их автоматическую подстановку в перевод. Сделать это в самой OmegaT невозможно, поскольку в настоящее время в этой среде поддерживается только вставка в каждый отдельный сегмент по мере продвижения по файлу. Это ведет к снижению производительности. Кроме того, эти 100%-ные совпадения записываются в память под вашим именем, что не позволяет отличить от ваших собственных переводов в случае необходимости (например, если клиент их не оплачивает и необходимо пропустить их во время редактирования). Чтобы обойти эту проблему, можно создать подпапку «auto» в папке с памятью данного проекта (локальной или централизованной папке «tm», описанной выше) и поместить в нее соответствующую память. При следующем запуске проекта все 100%-ные совпадения из памяти автоматически подставятся в перевод.

При создании переведенных файлов OmegaT создает три файла памяти, которые содержат в себе только текущий перевод. Это предоставляет несколько полезных возможностей. Память создается в трех форматах: уровня 1 (TMX 1.1), уровня 2 (TMX 1.4) и OmegaT (формат TMX 1.1, с которым работает OmegaT).

1. Формат TMX 1.4 предполагает некоторую степень совместимости между OmegaT и другими переводческими средами, поэтому удобен в случаях, когда необходимо передать память переводческому агентству, которое сможет использовать ее в другой переводческой среде, например SDL Trados.

2. Иногда по ходу перевода требуется изменить сегментацию или исправить ошибки в оригинале. Зачастую после этого в памяти остаются два перевода: один — текущий (после внесения изменений), а другой — старый (до внесения изменений). Можно выделить по меньшей мере две причины, почему такая ситуация нежелательна. Во-первых, при проверке памяти с помощью программы проверки орфографии или контроля качества старые сегменты тоже попадают в результаты, внося путаницу. Во-вторых, при использовании этой памяти в последующих проектах для того же конечного клиента эти старые переводы могут также запутать. В таких ситуациях полезен файл памяти в формате OmegaT, поскольку он содержит только текущий перевод. Его можно использовать вместо основной памяти проекта (project_save.tmx). Кроме того, если необходимо удалить из основной памяти все старые переводы, можно переименовать этот файл в project_save.tmx и заменить им текущий project_save.tmx в подпапке «omegat».

При возникновении вопросов относительно представленных советов буду рад помочь. Информацию об установке и настройке OmegaT можно найти в этой записи.

Как сэкономить и повысить качество перевода за счет оптического распознавания символов

02.03.2011, Ekaterina Ilyushina

Файл PDF на перевод, требующий OCRНесмотря на рост популярности систем управления контентом/переводом, объем переводимых нередактируемых оригиналов по-прежнему значителен. Одной из основных причин этого является банальная недоступность исходных редактируемых файлов. Например, заказчику может потребоваться перевести с русского на английский советский патент 1980-х годов. Другой клиент может заказать перевод документации, которая в свое время была предоставлена ему субподрядчиком в виде PDF, но теперь связь с субподрядчиком утрачена. Поскольку переводить такие файлы сложнее, чем редактируемые, обычно бывает полезно предварительно подготовить их к переводу.

Оптимальный способ подготовки нередактируемых файлов к переводу

Практика показывает, что наилучшим способом такой подготовки является оптическое распознавание символов (OCR). Аналогичного мнения придерживаются многие коллеги по профессии. Однако клиенты не всегда заинтересованы в возмещении затрат на OCR, часто предпочитая, чтобы переводчик просто набирал перевод в файл DOCX, параллельно смотря в оригинал. Разумеется, нежелание платить за OCR вполне обоснованно, прежде всего в случае небольших проектов. Но давайте посмотрим на этот вопрос с другой стороны: есть ли у OCR преимущества перед переводом «в файл»?

Косвенные преимущества OCR для клиентов

  1. Обычно переводить редактируемый файл быстрее и проще, чем нередактируемый. Переводчику не приходится отвлекаться на форматирование, которое в противном случае отнимает много сил и оставляет меньше времени на главную задачу — собственно перевод. При переводе редактируемого файла не требуется вручную набирать цифры, названия компаний, наименования продукции, адреса и т. п. При наборе перевода в чистый файл DOCX нужно тщательно перепроверять, все ли содержимое оригинала в него перенесено, тогда как файл после OCR требует минимальной проверки.
  2. В случае редактируемого файла можно применить переводческую среду. Это дает по меньшей мере два преимущества с точки зрения качества: а) упрощает задачу редактирования для переводчика и особенно редактора, б) позволяет использовать средства автоматического контроля качества.
  3. Переводческая среда также обеспечивает удобную функцию резервного копирования: каждый переведенный сегмент сохраняется в память переводов, что позволяет легко восстановить перевод в случае сбоя. Мы убедились в пользе этой функции давно и с тех пор зареклись переводить серьезные файлы без OCR: однажды мы случайно удалили документ с переводом, как раз выполненным «в файл», потеряв в результате целый день работы одного переводчика.

Все эти улучшения дают косвенные преимущества для клиентов, выражающиеся в повышении скорости и качества перевода.

Прямые преимущества OCR для клиентов

  1. OCR позволяет проанализировать исходный файл на памяти переводов, в результате чего выявляются изначально скрытые внутренние совпадения. Таким образом, клиент может получить значительные скидки. В одном нашем проекте в результате OCR «образовалось» 25 000 повторов (при всего лишь 10 000 уникальных слов). Если бы клиент тогда отказался от OCR и заплатил за перевод всех слов по полной ставке, то финансовые потери были бы весьма существенными.
  2. С точки зрения клиентов одной из основных проблем, связанных с нередактируемыми файлами, является отсутствие четкого понимания объема и примерного срока сдачи. OCR позволяет устранить эту неясность: как только файл распознан, клиент получает точный расчет стоимости и срока. Менеджеру проектов в бюро переводов или переводческом агентстве эта информация пригодится для того, чтобы составить более конкретное и наглядное предложение для своего заказчика. Используя OCR, агентство может выделиться среди конкурентов, не озаботившихся точным расчетом при составлении своей заявки.
  3. Иногда из-за сжатого срока переводимый файл приходится делить между несколькими переводчиками. Если отдать каждому из них на откуп форматирование своей части, то на выходе получится весьма разнородный в плане внешнего вида файл. В этом случае либо потребуется переделка, либо проблема вовсе останется незамеченной и в итоге повредит вашей репутации, когда ее увидят ваши клиенты.

Каким образом вы предпочитаете готовить нередактируемые файлы к переводу?

Расширение базовой функциональности OmegaT в Windows и Linux

16.02.2011, Roman Mironov

OmegaT with spell checking, language tool, and tokenizerВ этой записи предлагаются инструкции по настройке OmegaT. Несмотря на то что программа вполне готова к использованию в своем первоначальном виде, ее можно существенно улучшить, выполнив несколько простых действий. Запись составлена с целью свести воедино эти основные инструкции, чтобы вы уже с первых шагов могли пользоваться расширенной функциональностью, вместо того чтобы идти к ней методом проб и ошибок. Поскольку инструкции носят общий характер, даны также ссылки на более подробные описания на английском языке. Запись пригодится, например, переводчикам, желающим оценить OmegaT, или редакторам, которые получают заказы в формате OmegaT от бюро переводов.

  1. Загрузите OmegaT с сайта SourceForge. Вам нужна последняя бета-версия в разделе Files > Latest. Загружать устаревшую стабильную версию едва ли имеет смысл, тем более бета-версии обычно полностью работоспособны. Выберите версию, соответствующую вашей операционной системе, обычно без Java (кроме случаев, когда Java у вас не установлена). В Windows установка и запуск OmegaT выполняются стандартным образом. В Linux достаточно распаковать загруженный архив и запустить скрипт OmegaT.
  2. Далее необходимо включить проверку орфографии. Для этого выберите «Параметры» > «Проверка орфографии». Установите флажок «Автоматически проверять орфографию». Создайте папку словарей и укажите путь к ней в этом окне. Затем установите словари для ваших языков перевода. В отличие от некоторых других переводческих сред OmegaT проверяет орфографию непосредственно при наборе текста, что позволяет сразу же вводить слова правильно, вместо того чтобы возвращаться к замеченным впоследствии ошибкам.
  3. Теперь установите Language Tool — средство проверки стиля и грамматики. Откройте страницу подключаемых модулей OmegaT на сайте SourceForge. Выберите Language Tool и загрузите последнюю версию. Language Tool является кроссплатформенной программой, следовательно, одни и те же файлы подходят как для Windows, так и для Linux. Создайте подпапку «plugins» в папке установки OmegaT и распакуйте в нее загруженный архив. Перезапустите OmegaT, выберите «Параметры» и установите флажок «Проверка языка». Замечания от Language Tool будут подчеркиваться синим по ходу перевода. Подробная инструкция содержится в идущем в комплекте файле Readme.
  4. Далее аналогичную процедуру нужно проделать для подключаемого модуля Tokenizer (морфологии). Она улучшает функцию поиска нечетких совпадений и терминов в глоссарии, находя разные формы слова (множественное число и т. д). Загрузить ее можно с той же страницы подключаемых модулей OmegaT на сайте SourceForge. После распаковки все файлы опять же помещают в подпапку «plugins» в папке установки OmegaT. Если какие-то файлы там уже существуют, то их можно перезаписать. Запуск OmegaT с функцией морфологии требует создания и редактирования скрипта, что, впрочем, не представляет сложности. Необходимо создать отдельный скрипт для каждого языка оригинала. Например, если вы специализируетесь на переводе с английского на русский и переводе с немецкого на русский, то создадите скрипты для английского и немецкого. Для выполнения нижеуказанной инструкции понадобится прочитать эту страницу, содержащую все необходимые подробности.
  • В Windows нужно загрузить скрипт BAT с вышеуказанной страницы, предоставляемый разработчиком OmegaT Марком Прайором (или создать его самостоятельно). Создайте его копию и назовите ее, например, «OmegaT_EN.bat». Откройте ее любым текстовым редактором и добавьте строку Tokenizer после «OmegaT.jar». В итоге содержимое скрипта должно выглядеть следующим образом:
  • java -jar OmegaT.jar %* –Itokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer.

  • Запускайте программу с помощью этого скрипта вместо обычного файла EXE. Повторите эту процедуру для немецкого, создав скрипт «OmegaT_DE.bat» и добавив в него соответствующую строку немецкого Tokenizer.
  • В Linux достаточно создать копию скрипта OmegaT, добавить в имя название языка оригинала и добавить строку Tokenizer после «… OmegaT.jar». В итоге получится:
  • … OmegaT.jar” $* –Itokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer

    Расширив базовую функциональность OmegaT вышеуказанным образом, вы сможете более эффективно работать в этой программе. При возникновении вопросов относительно этих инструкций или других аспектов OmegaT приглашаем задавать их в комментариях. «Велиор» будет рад помочь.

    Со второго захода: меняю мнение о профессиональном использовании OmegaT

    19.01.2011, Roman Mironov

    Я в целом ратую за использование бесплатного и свободного программного обеспечения, где это возможно, поскольку мне симпатичны его удобство и демократичность. Бесплатная альтернатива коммерческому продукту может быть крайне полезна как отдельным пользователям, так и компаниям, особенно малому бизнесу наподобие нашего бюро переводов, где нужно сводить расходы к минимуму, чтобы сохранять конкурентоспособный уровень цен, зарплат и т. д. Поэтому я считаю наличие в отдельно взятой отрасли бесплатной программы, подходящей для использования в качестве основного средства производства, большим преимуществом для многих ее участников. В переводческой отрасли одним из таких средств является OmegaT.

    Встречают по одежке

    Впервые я познакомился с OmegaT в 2009 г., и, честно говоря, она не произвела на меня впечатления. Найдя интерфейс простоватым, а подход к организации рабочего процесса перевода текста — непривычным для себя, я поспешил сделать вывод, что программа мне не подходит из-за ограниченных возможностей.

    Год спустя я вернулся к OmegaT и на этот раз открыл ее для себя заново, испытав при этом стыд за поспешность предыдущего вывода. В этой записи я хочу высказать несколько общих соображений о работе в ней. Упомянутые здесь моменты — лишь верхушка айсберга. По мере дальнейшего использования OmegaT «Велиором» в наших переводческих проектах я планирую писать о ней более подробно.

    Какую пользу можно извлечь из OmegaT

    1. OmegaT содержит все основные функции полноценной переводческой среды, включая управление проектами, память переводов и терминологические глоссарии, тем самым являясь жизнеспособной альтернативой платным аналогам.
    2. Для переводчика-фрилансера, только начинающего карьеру в переводческой отрасли и не имеющего опыта и/или средств для того, чтобы подобрать себе коммерческую программу, OmegaT будет большим подспорьем. Например, она подойдет переводчикам с английского на русский, которые начинают с нуля или уже достигли определенных высот и теперь ищут экономичный способ дальнейшего повышения производительности и качества перевода.
    3. Для штатного переводчика OmegaT удобна тем, что позволяет продолжить работу над переводом дома или в дороге (на ноутбуке) с такой же легкостью, как и в офисе.
    4. Хотя компания SDL, по сути, прекратила развитие и поддержку формата TTX , он остается одним из самых популярных в отрасли. Для работы с файлами TTX требуется коммерческое ПО SDL Trados. Без него переводчик не сможет работать с довольно большим кругом переводческих агентств, у которых технологический процесс построен вокруг этого формата. Однако OmegaT позволяет обойти это препятствие, поскольку поддерживает работу с TTX, а также многочисленными другими форматами.
    5. Мне также симпатичен тот факт, что разработка OmegaT ведется усилиями сообщества программистов, которое открыто по отношению к просьбам исправить ошибки и добавить новые функции. Таким образом, можно наблюдать за «кухней» и даже приложить руку к развитию программы при желании.

    Какие ограничения нужно учесть

    Как и многие другие программы с открытым исходным кодом, OmegaT не лишена некоторых недостатков. Похожим образом OpenOffice.org уступает пакету Microsoft Office, а Ubuntu уступает операционной системе Windows. Эти ограничения можно считать неотъемлемой частью свободного ПО, и обычно они являются незначительными в том смысле, что при условии соответствующего настроя с ними можно мириться. Проще говоря, если вы ставите своей целью максимальную экономию или в принципе предпочитаете свободное ПО, то с большой долей вероятности смиритесь с такими ограничениями и будете пользоваться временным решением, пока у разработчиков не дойдут руки до исправления.

    При этом я не призываю всех поголовно переходить на использование OmegaT. Нужно понимать, что это лишь одна из многочисленных переводческих программ подобного рода, представленных на рынке. Этой записью я прежде всего хочу подчеркнуть, что OmegaT — жизнеспособная альтернатива коммерческим продуктам, которая многими может рассматриваться в качестве рабочей среды, и мне приятно, что таким образом она расширяет доступный переводчикам выбор. Снимаю шляпу перед разработчиками за их энтузиазм!

    Какие бесплатные программы вы используете в своей работе? Есть ли среди них OmegaT?

    Преимущества и недостатки извлечения внутренних совпадений

    12.01.2011, Roman Mironov

    В недавнем проекте мы переводили с английского на русский файл без внутренних совпадений (повторов), изначально полученный в таком виде от заказчика. Поскольку такой подход к подготовке файлов встречается не часто, я решил воспользоваться этим случаем, чтобы сформулировать свои соображения по данному поводу.

    Пример повтора

    Основную сложность, связанную с удалением повторов, можно продемонстрировать на следующем примере:
    «Note:» может использоваться по меньшей мере в трех разных контекстах и, несмотря на кажущуюся простоту, может вызывать проблемы:

    1. Под абзацем. Двоеточие часто заменяют точкой. (Примечание. Обратите…)
    2. В середине абзаца. Я предпочитаю сохранять двоеточие и начинать собственно примечание со строчной буквы. (… кнопку. Примечание: обратите…)
    3. Подзаголовок. Двоеточие часто удаляют. (Примечание)

    Таким образом, в данном примере на один оригинал приходится три разных перевода. Представьте, что будет, если во всех трех случаях подставится одинаковый перевод «Примечание.». В середине абзаца предложение «Примечание.» в данном виде будет выглядеть по меньшей мере странно. В подзаголовке такая пунктуация будет смотреться в целом приемлемо, но, скорее всего, разойдется с пунктуацией в других подзаголовках, где точки не будет, — следовательно, и этого случая желательно избежать.

    Означает ли это, что извлекать повторы нельзя? Вовсе нет. Иногда преимущества от извлечения перевешивают недостатки. Возможность применения этого метода подготовки нужно оценивать исходя из специфики проекта, при этом вы должны понимать потенциальные «побочные эффекты».

    За

    1. Значительным, если не самым главным, преимуществом является экономия. Это особенно актуально, когда речь идет об извлечении десятков тысяч повторов. Желание клиента в таких случаях сэкономить вполне закономерно и оправданно.
    2. Извлечение повторов может быть крайне полезно при параллельной работе двух и более переводчиков над проектом. В противном случае они могут перевести повторы по-разному. Такая двойная работа по сути бесполезна и означает пустую трату денег. Более правильным решением может быть извлечение повторов в отдельный файл с последующим переводом одним из переводчиков и редактированием другим и/или редактором.
    3. Извлечение также сокращает количество непоследовательных переводов повторов. Многие переводческие среды могут автоматически изменять сразу все повторы при редактировании одного из них (функция auto-propagation), но риск человеческой ошибки тем не менее не исключен.

    Против

    1. При извлечении повторов клиент получает от переводчика не окончательный, а промежуточный файл. Окончательный нужно сделать на его основе, например создав память переводов и применив ее к исходному файлу. Эти трудозатраты рекомендуется учесть перед извлечением: овчинка может не стоить выделки.
    2. Лично я предпочитаю переводить текст в его первозданном виде, «без купюр». Отсутствие повторов порой не дает увидеть полную картину проекта, что отрицательно сказывается на понимании оригинала и ощущении ответственности за свою работу. В некоторой степени эта проблема решается, если под рукой есть оригинальный файл для справки (со всеми повторами). По этой причине я считаю предоставление такого файла обязательным в случае извлечения повторов. Он не только освобождает переводчика от необходимости гадать из-за отсутствия контекста, но и упрощает понимание тегов и прочих деталей.
    3. В случае извлечения повторов желательна дополнительная проверка окончательного переведенного файла. Однако, как показывает практика, этим иногда пренебрегают, не видя в дополнительной проверке особой пользы. В результате пропускаются ошибки разной степени серьезности: от простительных до грубых смысловых. Если вам важно качество, то я рекомендую не выпускать этот этап и проводить его хотя бы в формате беглой корректуры.

    Кстати, «Велиор» предоставляет скидки на повторы, поэтому заказывать у нас переводы с большим их количеством относительно недорого. А как вы относитесь к извлечению повторов? Принимаете ли вы проекты с неоплачиваемыми повторами?

    Нередактируемый исходный текст

    11.08.2010, Ekaterina Ilyushina

    В этой записи мы рассмотрим проверенные на практике принципы работы с нередактируемым исходным текстом, предназначенным на перевод. Подход к обработке такого типа текста зависит от исходных файлов.

    1. Большая часть нередактируемых текстов представляет собой отсканированные копии крайне низкого качества. Примером их могут служить медицинские документы, написанные на русском языке. Российские врачи нередко обладают очень неразборчивым почерком, в силу того что ежедневно им приходится много писать, заполняя большое количество различных документов. Наверное, поэтому их написанные от руки заключения или предписания часто, кроме них самих, никто разобрать не может, в том числе и переводчики. В идеале для «расшифровки» таких записей мы предпочитаем сразу обратиться за помощью к медицинским работникам, а не выполнять перевод непосредственно с отсканированной копии. Таким образом экономится время, которое в ином случае переводчик потратил бы на догадки и предположения.
    2. Другой часто встречающийся тип нередактируемого текста — файлы PDF, распечатанные из издательских программ, MS Word и т. д. В таких случаях мы просим заказчика предоставить нам нижележащий редактируемый файл, например в формате INDD (Adobe InDesign), потому что обработка такого редактируемого файла требует гораздо меньше усилий, чем перевод нередактируемого PDF. Как правило, у заказчика имеется такой нижележащий файл и он без труда может его предоставить. Частой причиной предоставления заказчиками файлов PDF вместо файлов INDD является простое незнание того факта, что перевод последних выполнять намного легче, что в конечном итоге ведет к сокращению затрат.
    3. Если пункты 1 и 2 выше неприменимы, мы прибегаем к оптическому распознаванию текста (OCR), воспроизводя нередактируемый текст с исходным форматированием в отдельном файле. Создание редактируемого файла позволяет применить наш стандартный процесс перевода, построенный на обработке двуязычных файлов. Если при этом требуется какое-либо сложное форматирование, мы вносим затраты на OCR в общую сумму выставляемого заказчику счета: эта услуга называется «восстановлением форматирования». В случае с небольшими или более простыми файлами компания выполняет OCR бесплатно либо игнорирует этот этап, выполняя перевод путем непосредственного набора перевода в отдельном файле. Часто OCR также приходится выпускать и в срочных проектах, когда времени на него просто-напросто не хватает. В этих случаях расчет стоимости обычно осуществляется по количеству слов в переводе.
    4. Иногда заказчик делает автоматическое OCR самостоятельно и затем требует перевод полученного в результате этого редактируемого файла. Однако на файлах, содержащих сложное форматирование, например таблицы или рисунки, автоматическое OCR дает плохие результаты и распознанный файл требует дополнительной ручной корректировки. В таких случаях мы можем попросить заказчика все равно оплатить «восстановление форматирования», несмотря на то что теоретически исходный файл является редактируемым.

    О проблемах поиска справочной информации для перевода в Интернете

    23.04.2010, Olga Yakushina

    Как и многие другие современные профессии, перевод текста тесно связан с Интернетом. В частности, переводчики пользуются сетью в повседневной работе для поиска информации по тематике переводимого текста, чтобы лучше разобраться в нем, а также ищут общепринятые термины. Но насколько можно полагаться на сведения, представленные в изобилии в Интернете? Недавно я переводила с английского на русский текст об инновационных методиках лечения и постоянно искала в Интернете термины, которые еще не закреплены в словарях. Однако эффективность поиска была крайне низкой — практически каждый раз в результатах поиска содержалось слишком много бесполезных материалов. В этой записи я привожу некоторые свои наблюдения по данному поводу.

    Качество контента, с которым я сталкиваюсь при поиске справочной информации в Интернете, в среднем снижается. Качество как бы «разбавляется» в результате того, что полезный контент добавляется в гораздо меньшем объеме, чем бесполезный. Можно выделить две причины этого явления:

    1. При поиске русских терминов постоянно попадаются многочисленные автоматически сгенерированные тексты. Одним из основным источников такого контента является машинный перевод: текст на английском (или любом другом) языке пропускают через машинный переводчик и полученный русский текст вставляют на сайты без какого-либо редактирования. Другим источником является ПО, генерирующее «уникальный» контент путем замены максимального количества слов в тексте синонимами. С точки зрения ботов поисковых систем такой текст, видимо, действительно выглядит уникальным, однако для нормальных пользователей и особенно переводчиков, ищущих общепринятые выражения и терминологию, он бесполезен и только отнимает время.
    2. «Разбавлению» качества также способствуют многочисленные переводы, выполненные как непрофессиональными, так и профессиональными переводчиками. Бесспорно, в Интернете встречается много прекрасных переводов, однако несомненно и то, что значительная часть переводного контента далека от идеала, особенно в плане терминологии. Поэтому я практически не пользуюсь чужими переводами для справки — слишком высок риск дословного перевода или банальной ошибки. Предпочитаю поискать чуть дольше, но все-таки найти текст, написанный специалистом в данной области на родном для него языке.

    В свете вышесказанного я всегда удивляюсь критике в адрес Википедии. Да, в силу разношерстности авторов и бесплатности этот ресурс неидеален. Но, по-моему, в целом он является лучшим источником информации в сети хотя бы потому, что это единственный крупный сайт, где в одном месте собрано такой большой объем достоверной информации. Немаловажную роль в этом играет удобный, четко структурированный интерфейс. Конечно же, переводчик не должен полагаться исключительно на Википедию. Я рассматриваю ее в большей степени как исходную точку поиска: прочитав статью, можно получить общее представление об искомой теме и затем продолжить поиск с помощью ссылок и ключевых слов статьи.

    Дополнительные сведения о том, как Интернет помогает работе переводчика, можно прочитать в этой записи.

    100%-ные и внутренние совпадения. Часть 2

    01.04.2010, Roman Mironov

    Это 2-я часть записи. 1-я часть.

    Причины для невзимания полной оплаты

    3. Переводчики, предпочитающие получать полную оплату, также утверждают, что возможность обрабатывать 100%-ные совпадения и повторы с меньшими затратами требует вложения средств и времени в покупку и освоение соответствующего ПО. И поскольку они вкладывают свои личные средства и время, то именно они, а не заказчики должны получать выгоду. Как переводчик, я склонен согласиться с этой мыслью, но считаю, что она далека от реальности.

    • Эти рассуждения были бы актуальны, если бы технология памяти переводов (Translation Memory) только что появилась на рынке. В данный же момент она является его неотъемлемой частью. Наличие такого ПО является обязательным входным условием для участия во многих типах проектов. По этой причине я не рассматриваю его покупку как вложение средств, направленное на оптимизацию собственного труда, а считаю лишь насущной необходимостью, такой же как компьютер или телефон. Слишком поздно пытаться единолично пользоваться преимуществами этого ПО — многие коллеги и заказчики давно делают то же самое. На сегодняшний день это общедоступная технология, преимуществами которой, как и в случае других достижений прогресса, должны пользоваться все. Например, многие заказчики прикладывают усилия к единообразному написанию текстов, и экономия послужит им компенсацией за эти усилия. (При этом я понимаю, что многие переводчики будут продолжать требовать полной оплаты, на что у них могут быть свои личные и вполне обоснованные причины.)
    • Многие заказчики перевода осведомлены и о совпадениях в текстах документов, и о возможностях переводческой памяти, поэтому рассчитывают на скидку, так как вполне обоснованно не хотят два раза платить за один и тот же текст. По-моему, это совершенно справедливо, так как преимуществами технологического прогресса должны пользоваться все.

    Что делать, если заказчик предпочитает не платить

    1. Как правило, «Велиор» берет оплату за 100%-ные совпадения и повторы. Когда заказчик просит подставлять их автоматически, без проверки, высок риск неправильных переводов. Мы со своей стороны не хотим, чтобы наш перевод содержал ошибки, даже если они происходят не по нашей вине. Поэтому такие заказы выполняются только в порядке исключения.
    2. В таких ситуациях мы просим заказчика извлечь 100%-ные совпадения и повторы в отдельный файл, который включает в себя только одно вхождение каждого совпадения/повтора. После перевода заказчик может подставить перевод из этого файла в окончательный документ. Повторюсь, что риск неправильных переводов при этом высок. Обычно такие «сборные» переводы требуется проверять, иначе гарантировать качество невозможно.
    3. Переводческие агентства для подстановки 100%-ных совпадений также пользуются функцией «Perfect Match» (Абсолютное совпадение), которая подставляет совпадения только в такой контекст, который полностью идентичен контексту первоначального перевода. Для заказчика эта технология действительно эффективна и выгодна, однако с точки зрения переводчика она имеет ряд недостатков. Обыкновенно переводчик имеет перед глазами весь текст, в этом же случае он работает только с его отдельными частями. У него не складывается общая картина перевода, нет возможности изменить существующий перевод (или потому что текст заблокирован, или из-за отсутствия мотивации, так как данные правки не оплачиваются). Это снижает эффективность и качество работы.

    Примечания

    1. В большинстве случаев «Велиор» не предоставляет скидку на любые совпадения с чужой памятью переводов, потому что нет возможности быстро и бесплатно проверить ее качество в момент принятия заказа. Существующие переводы могут содержать ошибки, которые затем перекочуют в наш перевод, и в итоге отвечать за них будем мы. Поэтому такие проекты обсуждаются в индивидуальном порядке.
    2. Скидки на совпадения и повторы не применяются к услугам редактирования и корректуры, поскольку они предполагают проверку всего текста, при которой совпадения и повторы практически не дают или дают очень небольшую экономию времени.
    3. Интересно отметить, что наша основная языковая комбинация — с английского на русский — обычно дает гораздо больше повторов, чем перевод с русского на английский. Видимо, это главным образом обусловлено большим количеством и разнообразием грамматических и пунктуационных правил русского языка.

    100%-ные и внутренние совпадения. Часть 1

    29.03.2010, Roman Mironov

    В этой записи рассматривается подход «Велиора» к оценке стоимости 100%-ных совпадений c памятью переводов и внутренних совпадений. В целом на этот счет существует три мнения. Два из них прямо противоположны: одни полагают, что такие совпадения и повторы должны оплачиваться полностью, так же как и любые другие слова, в то время как другие утверждают, что не должны, поскольку на обработку этих слов не тратится никаких усилий. Третье мнение, которого придерживается и «Велиор», более нейтральное: к таким словам должны применяться сниженные расценки.

    Причины для взимания оплаты за 100%-ные совпадения и повторы

    1. Контекст, в котором встречаются 100%-ные совпадения или повторы, может отличаться от контекста первоначального перевода. Поэтому необходимо проверять, соответствуют ли все такие слова новому контексту. Время, затрачиваемое на проверку, должно оплачиваться. Обработка 100%-ных совпадений и повторов без оплаты и, следовательно, без проверки оправдана, только когда заказчик абсолютно уверен, что контекст всегда идентичен, например в спецификации или каталоге деталей. Однако, исходя из нашего опыта, такие тексты скорее исключение, чем правило: они составляют приблизительно 3 % от всего объема наших переводов (перевод с русского на английский, с английского на русский, с немецкого на русский).
    2. 100%-ные совпадения и повторы часто требуют такого же объема работы при верстке, как и любые другие слова. Даже когда 90 % текста — это повторы, на их форматирование может потребоваться столько же времени, как если бы все они были новыми словами. И если данный вид работы не оплачивается отдельно, то его необходимо включать в стоимость повторов.

    Причины для невзимания полной оплаты

    1. Поскольку объем работы по переводу 100%-ных совпадений и повторов обычно меньше по сравнению с обработкой новых слов, взимание за них полной оплаты видится мне экономически необоснованным. Ведь переводчик не выполняет перевод с нуля, а только проверяет, вписывается ли переведенный ранее текст в новый контекст (в большинстве случаев вписывается). Разумеется, некоторые совпадения и повторы все-таки приходится переводить заново. К примеру, переводчик с английского на русский переведет слово «position» как «должность», если речь идет о работе. При этом подставленный в качестве 100%-ного совпадения в контекст, где «position» должно быть переведено как «положение», этот перевод будет бесполезен и потребует переделки. Однако в конечном итоге, как уже упоминалось выше, доля таких 100%-ных совпадений и повторов крайне низка, поэтому скидка выглядит вполне оправданной.
    2. Переводчики, предпочитающие получать полную оплату за 100%-ные совпадения и повторы, обычно приводят различные примеры из других отраслей, желая доказать, что скидка за повторную работу является противоестественной. Возьмем, например, строительство: мастера, отделывающие вам квартиру, не сделают скидку на том основании, что одна комната отделывается теми же обоями, линолеумом и т. д., что и другая. Да, теоретически такое мнение имеет право на существование, но на практике исходить нужно из фактического объема работ — времени, затраченного на повторяющиеся действия. Сколь бы одинаковы ни были комнаты, вторая комната потребует ровно столько же времени, сколько и первая, поэтому и скидку давать не за что. В отличие от строительства, время, затрачиваемое на обработку 100%-ных совпадений и повторов, как правило, значительно меньше по сравнению с переводом новых слов. Обычно память переводов позволяет подставлять их автоматически, и необходимо только проверять, соответствует ли сделанный ранее перевод новому контексту. Поэтому я считаю справедливым взимать за данные типы совпадений меньшую цену, которая таким образом отражает фактически затрачиваемое на них время, вместо того чтобы просить полную цену, как если бы они требовали столько же усилий, как новые слова.

    Продолжение записи см. здесь.

    Контакты

    Телефоны

    +7 (962) 155-89-07
    +7 (4932) 23-87-23

    info@velior.ru
    velior@list.ru