Корпоративный блог «Велиора» о бюро переводов и переводческой отрасли
Архив рубрики «Технологии перевода»
08.11.2011, Roman Mironov

В OmegaT имеется очень удобная функция фильтрации сегментов в окне редактора. Сама по себе эта функция не новая, она присутствует и в других переводческих средах, например Wordfast, и позволяет быстро переходить между 100-процентными и частичными совпадениями. Однако, по-моему, в OmegaT она реализована интереснее и имеет очень серьезный потенциал. В этой записи рассматриваются некоторые области ее применения. Основная цель использования фильтра — сэкономить время, оставив в проекте только те сегменты, которые требуют внимания, и сделав более удобным переход между ними. Для применения фильтра нужно открыть окно «Поиск текста» (Ctrl+F), найти нужные сегменты, затем в правом нижнем углу нажать кнопку «Фильтр». В результате в панели редактора OmegaT отобразятся только найденные сегменты. Для отключения фильтра достаточно снова выполнить любой поиск, нажать кнопку «Фильтр», затем сразу «Убрать фильтр».
- Пожалуй, наибольшая польза этой функции для нашего бюро переводов — возможность удалять неоплачиваемые 100-процентные совпадения из объема работы. Без нее не обойтись, когда клиент просит подставить 100-процентные совпадения в текущий перевод автоматически без проверки, чтобы сэкономить на стоимости такой проверки. В этом случае имеет смысл убрать 100-процентные совпадения из технологического процесса в разумных пределах. При собственно переводе 100-процентные совпадения можно пропускать, просто переходя к следующему непереведенному сегменту (Ctrl+U). Однако при редактировании это, естественно, невозможно. Как раз здесь приходит на выручку фильтр. От вас требуется лишь сообразить, какие критерии поиска позволят найти только те сегменты, которые были изменены в ходе перевода. Например, можно выполнить поиск сегментов по имени переводчика данного проекта. После их нахождения и применения фильтра вы сможете работать только над теми сегментами, которые требуют редактирования.
- При переводе часто приходится вносить «глобальные» правки терминов, особенно в крупных проектах. По умолчанию для этого открывают окно «Поиск текста», находят сегменты и поочередно щелкают их, чтобы открыть их в редакторе и затем поправить. Это не очень эффективно, и с увеличением количества вхождений скорость снижается чуть ли не в геометрической прогрессии. В таких случаях, чтобы сэкономить время и терпение, приходится «идти на хитрость»: открывать память переводов проекта в текстовом редакторе, например Notepad++, и вносить правки непосредственно в память. Фильтр позволяет работать в таких случаях более элегантно: с его помощью можно «извлечь» в редактор только нужные сегменты и переходить по ним очень быстро.
- Для перевода файлов TTX, содержащих сегменты Context TM (Perfect Match, XU), мы пользуемся замечательной утилитой Toxic, которая преобразует их в формат, понятный OmegaT. Недостатком преобразования является то, что в таких сегментах OmegaT подставляет на место оригинала перевод (как будто он является исходным текстом, это обусловлено принципом работы Toxic). Как и в случае с неоплачиваемыми 100-процентными совпадениями, наличие таких сегментов замедляет работу. Чтобы обойти эту проблему, можно исключить их из объема работ с помощью фильтра.
- Недавно я писал про появление в OmegaT функции примечаний. Фильтр позволяет оптимизировать использование и этой функции. Найдя все сегменты с примечаниями в окне «Поиск текста», вы можете с помощью фильтра «извлечь» их в окно редактора, где работать с ними будет гораздо приятнее, чем последовательно щелкать каждый сегмент в окне «Поиск текста» и каждый раз переключаться в панель редактора. Опять же, чем больше сегментов с примечаниями, тем больше пользы от применения фильтра.
Метки:OmegaT, качественный перевод, оборудование и ПО, память переводов, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Комментарии (2) »
03.11.2011, Roman Mironov

Создание и ведение глоссариев для отдельных клиентов — стандарт переводческой отрасли. В глоссарии содержится терминология, используемая клиентом, что облегчает доступ к утвержденным переводам и обеспечивает единство терминологии во всех проектах, выполняемых для клиента. Однако существует ряд подводных камней, которые могут осложнить использование глоссария или сделать его недостоверным. В этой записи содержится ряд советов о том, как избежать их и получить максимальную отдачу от создаваемых глоссариев.
Проблема. Многие глоссарии создаются до начала собственно перевода — путем извлечения и перевода списка часто встречающихся слов. Предположительно, такие глоссарии должны упрощать переводчикам доступ к правильному переводу терминов и обеспечивать единство перевода на всем протяжении проекта. Идея создания глоссария перед переводом, несомненно, разумна, однако ее воплощение не всегда идеально. Термины в таком списке переводятся без учета контекста, что неизбежно приводит к значительному объему слишком общих переводов или даже смысловых ошибок. В итоге глоссарий вводит в заблуждение и может привести к ошибкам в будущих переводах. Если же глоссарий утвержден клиентом, то возникнет задержка в работе, поскольку переводчику придется создавать список предлагаемых исправлений и ждать, когда эти исправления будут одобрены клиентом.
Решение. Рекомендую создавать глоссарий по ходу перевода проекта. Так в него с большой вероятностью попадут правильные переводы, основанные на понимании текста, а не на догадках переводчика.
Проблема. В глоссарии зачастую содержатся лишние термины, противоречащие его назначению. К таким «терминам» относятся глаголы, названия стран, общеупотребительные существительные и т. д. Очевидно, что такие глоссарии скорее запутывают переводчика, чем помогают ему. Каждый раз, когда глагол или общеупотребительное существительное требуют перевода, отличного от перевода в глоссарии (что случается крайне часто!), перед переводчиком возникает дилемма: использовать ли более точный перевод, который не соответствует глоссарию, или же взять перевод из глоссария, несмотря на то что он не вписывается в данный контекст. Чем больше лишних слов содержит глоссарий, тем меньше от него пользы.
Решение. В идеале в глоссарий нужно вносить только настоящие термины, специфичные именно для этого клиента, и не записывать в него общеупотребительные слова.
Проблема. Часто глоссарий воспринимают как «истину в последней инстанции» и следуют ему неукоснительно, несмотря на то что перевод в нем может противоречить здравому смыслу. К примеру, переводчик, следующий этому принципу, может намеренно использовать перевод из глоссария, даже если он не соответствует текущему контексту или явно неправильный. Редактор, который выявил несоответствующий глоссарию перевод, может поспешить исправить его, не задумываясь о том, почему переводчик отошел от глоссария. А клиент, в свою очередь, может отказаться от предложения изменить глоссарий, сославшись на то, что он уже утвержден.
Решение. К глоссарию нужно относиться с известной долей гибкости, поскольку это все-таки не «истина в последней инстанции». Мы годами ведем и последовательно оптимизируем наши англо-русские глоссарии, и до сих пор не можем добиться того, чтобы переводы в них подходили ко всем контекстам. Письменная речь уникальна и порождает многообразие контекстов, так что уместить все варианты перевода в один глоссарии едва ли возможно (да и нецелесообразно).
Метки:деятельность «Велиора», качественный перевод, переводческая среда, редактирование Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
27.10.2011, Roman Mironov

Несмотря на то что на рынке представлено множество бесплатных и платных переводческих сред (ПС), заказчики услуг по переводу, в том числе переводческие агентства и прямые заказчики, иногда решают создавать и использовать собственные среды. В этой ситуации, типичной в основном для крупных компаний, заказчик просит, чтобы поставщик перевода работал в переводческой среде компании, а не в той, которую он предпочитает. Широко известным примером является Translation Workspace, в которой работает переводческое агентство Lionbridge. Мы неоднократно работали с подобными переводческими средами, и мне хотелось бы рассказать о собственном опыте.
Положительные моменты
- Возможно, самым большим преимуществом применения подобных переводческих сред является удобство заказчика за счет интеграции процесса перевода в его систему управления контентом. Поставщик услуг перевода напрямую подключается к процессу создания контента, что повышает производительность и снижает зависимость заказчика от конкретного поставщика.
- Многие переводческие среды такого типа являются веб-системами, что обеспечивает им соответствующие преимущества. Обычно веб-системы интуитивно понятны и нетребовательны: чтобы начать перевод, необходимы только веб-браузер и учетная запись. Кроме того, они упрощают управление и коммуникацию, устраняя необходимость обмена файлами по электронной почте. Текст на перевод, память переводов и глоссарий находятся в системе.
Сложности
- С точки зрения поставщика перевода работа в среде заказчика не позволяет полностью использовать преимущества стандартного рабочего процесса. К примеру, при работе в веб-системе заказчика зачастую невозможно использовать привычные средства автоматического контроля качества или задействовать процесс проверки и утверждения правок редактора переводчиком.
- Разрешить какую-либо техническую неисправность, возникшую во время перевода, переводчик может, только обратившись за помощью к заказчику. Это может отнять больше времени, чем при использовании средств сторонних разработчиков. Например, по тем программам, в которых мы регулярно работаем, у нас накоплен значительный опыт. Это позволяет нам самостоятельно разрешать практически любые проблемы немедленно и без обращений к заказчику.
- Системы некоторых заказчиков могут отставать по производительности от последних версий переводческих сред, например от OmegaT. Одной из причин этого является то, что заказчики иногда не считают необходимым совершенствовать свои системы так же активно, как разработчики ПС. Заказчик мог разработать свою переводческую среду много лет назад, и мотивация к ее обновлению у него уже отсутствует, потому что все базовые функции в нее уже включены, а сотрудники заказчика уже к ней привыкли.
Резюмируя все вышеизложенное, можно сказать, что переводческие системы заказчика могут упрощать работу над переводом и экономить время, затрачиваемое на него, как для самого заказчика, так и для поставщиков перевода. Мы, как правило, с готовностью беремся за перевод с английского на русский в подобных ПС, при условии что в них хотя бы частично осуществим наш процесс контроля качества.
Метки:OmegaT, Интернет и перевод, качественный перевод, оборудование и ПО, память переводов, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
19.10.2011, Roman Mironov

Несколько месяцев назад я приступил к тестированию Ubuntu 10.10, чтобы проверить, насколько существенна экономия от замены Microsoft Windows на бесплатную операционную систему (ОС) в рамках переводческой деятельности. В течение шести месяцев я выполнил в Ubuntu множество переводческих проектов. В этой записи я хочу рассказать о некоторых сделанных выводах.
Порадовало то, что Ubuntu определенно можно использовать переводчикам. Впечатления от этой ОС оказались даже значительно лучше, чем я ожидал. Ubuntu поддерживает по меньшей мере три переводческих среды: OmegaT (тоже бесплатную), Wordfast Pro и Swordfish. Кроме того, в ней есть большая часть программ, необходимых для переводческой деятельности: OpenOffice.org (конкурент Microsoft Office), Adobe Reader, веб-браузер, почтовый клиент, программы мгновенных сообщений (включая Skype) и ряд других.
«Так где же подвох?» — спросите вы.
Недостаток популярности и интуитивной понятности значительно снижают удобство использования Ubuntu по сравнению Windows. Вот три наиболее серьезных проблемы, с которыми я столкнулся при работе в этой ОС:
- Чтобы все программы начали работать как следует, может потребоваться много времени, при этом нужны знания ПК выше средних. В случае внедрения Ubuntu в переводческом агентстве потребуется значительное время на обучение персонала основам работы в ней.
- Многие программы, которые необходимы переводчику, совместимы с Ubuntu или имеют аналоги для Ubuntu. Однако велика вероятность того, что по меньшей мере несколько нужных вам программ окажутся несовместимы с этой ОС. В моем случае к таким программам относятся:
• Abbyy Lingvo (словарь)
• Abbyy FineReader (программа для OCR)
• Punto Switcher (автоматический переключатель раскладки клавиатуры, который также может служить для быстрого ввода часто используемых фраз)
• Foxit Reader (в момент тестирования у программы была версия для Ubuntu, однако в ней невозможно было редактировать файлы PDF, в отличие от версии для Windows)
• QA Distiller (средство автоматического контроля качества)
- Другим существенным препятствием для применения Ubuntu в качестве ОС для переводческой деятельности являются проблемы с совместимостью. Вместо Microsoft Office, который использует большинство компаний и обычных пользователей, придется перейти на OpenOffice.org (OOO). Несомненно, что OOO — это отличная программа, которая даже поддерживает файлы Office без преобразования. Однако на поверку выходит, что эта поддержка только «на бумаге». Да, с небольшими и простыми файлами Office она справляется успешно. Однако если файлы большие и сложные, то файл Office, сохраненный в OOO, при последующем открытии в Office зачастую имеет нарушенное форматирование. Таким образом, если вы часто переводите файлы DOCX или PPTX, то вам, скорее всего, все равно придется использовать Office для проверки и исправления форматирования после перевода, поскольку в OOO трудно создать файл, который бы корректно отображался в Office. Поэтому работать с такими файлами будет очень сложно, если у вас нет отдельного ПК, где установлены Windows и Microsoft Office.
Основываясь на опыте тестирования, я пришел к выводу, что переводить в Ubuntu вместо Windows, конечно, можно, однако это может быть невыгодно. Основной причиной, по которой имеет смысл пользоваться бесплатной, но менее популярной ОС, является экономия на дорогой лицензии. Однако полученная экономия практически сходит на нет из-за того, что много времени и усилий придется потратить на настройку программ и решение проблем совместимости. И хотя Ubuntu — прекрасная операционная система, я не думаю, что для переводчиков она имеет какие-либо экономические преимущества перед Windows.
Метки:OmegaT, Интернет и перевод, качественный перевод, оборудование и ПО, переводческая среда Рубрика: Переводческая отрасль, Технологии перевода, Это интересно |
Нет комментариев »
04.10.2011, Roman Mironov

В этой записи я рассмотрю некоторые из изменений, осуществленных в последней (2.5.0) версии OmegaT, которая вышла на прошлой неделе. Список новых функций, представленных в последней версии, выглядит довольно внушительно. Однако в этот раз я остановлюсь только на тех из них, которые мы уже каждодневно используем в переводах с английского на русский.
- Новая версия OmegaT поддерживает возможность уникальных переводов повторов (внутренних совпадений). Ранее всякий раз, когда повторы должны были переводиться по-разному, мы были вынуждены специально помечать такие сегменты. Затем в уже созданных переведенных документах мы находили эти пометки и вносили требующиеся изменения в перевод. Такой подход нельзя назвать слишком эффективным, и теперь, к нашей радости, необходимость в нем отпала. Теперь перевести повторы по-разному можно непосредственно в самой программе, выбрав команду Create Alternative Translation в контекстном меню панели «Редактор».
- В новой версии появилась также функция примечаний. Прежде нам приходилось вставлять примечания непосредственно в сегменты, помечая их определенным образом. Теперь оставить или отредактировать примечание для любого сегмента можно с помощью специальной панели. Когда вы повторно открываете сегмент, содержащий примечание, оно отображается в этой панели. Чтобы найти все сегменты с примечаниями, достаточно нажать Ctrl+F для открытия окна поиска, снять флажки всех параметров, кроме In notes, и выполнить поиск с пустой строкой. Не стоит и говорить о том, что это чрезвычайно полезная и долгожданная функция, в особенности для такого рабочего процесса бюро переводов, где переводчик и редактор взаимодействуют через примечания, например чтобы что-то уточнить или разъяснить.
- Другим усовершенствованием является возможность использовать фильтры и правила сегментации отдельно по проектам. В предыдущих версиях существовал только один общий набор фильтров и правил сегментации для всех проектов, хранящийся локально на вашем ПК. Если переводчик добавлял новое правило с целью исправить некорректную сегментацию, то каждый раз при этом мы сталкивались с определенными трудностями. Поскольку новое правило сохранялось локально на компьютере переводчика, то при открытии этого же проекта на другом ПК, например для редактирования, сегментация имела другой вид. Каждый раз редактор должен был или добавлять то же самое правило вручную у себя, или просить у переводчика файл правил сегментации, хранящийся локально на ПК переводчика. Теперь же можно добавлять отдельные правила для каждого проекта, для этого достаточно нажать Ctrl+E, выбрать параметр «Сегментация», затем Project-specific segmentation rules. Файл правил сегментации сохранится в папку omegat этого проекта. Любой, кто в дальнейшем откроет этот проект, будет иметь абсолютно такую же сегментацию, базирующуюся на правилах в этом файле. Дополнительным преимуществом этого нововведения является возможность избежать другой проблемы одного файла правил: автоматического применения правил, настроенных в предыдущих проектах, ко всем новым проектам. Ранее все когда-либо настроенные правила (которые, однако, могли быть довольно индивидуальными) продолжали применяться ко всем новым проектам, что часто приводило к нарушению сегментации.
- И наконец, еще одна новая функция, о которой хотелось бы рассказать, — усовершенствование процесса, позволяющего обнаруживать изменения во внешних памятях переводов. В предшествующих 2.5.0 версиях, если вы вносили какие-то изменения или добавляли какой-либо файл TMX в папку памяти переводов проекта, приходилось перезагружать проект, чтобы увидеть изменения. Особенно много времени это отнимало при загрузке нескольких больших файлов TMX. Теперь любые изменения или добавления в папке tm обнаруживаются программой автоматически. Одним из преимуществ, которое мы уже получили от этого улучшения, является оптимизация процесса совместного использования памяти переводов двумя или более переводчиками, работающими над одним проектом одновременно. Раньше, если один переводчик подкладывал свою текущую память переводов в папку tm, он должен был попросить коллегу перезагрузить проект, чтобы ему тоже стали видны новые переводы. Теперь вы просто помещаете память переводов в папку tm, и другие переводчики сразу же видят это без уведомления или перезагрузки.
В заключение можно отметить, что мы нашли новую версию крайне полезной для себя. Мы искренне признательны разработчикам OmegaT за их постоянные усилия в усовершенствовании этой чрезвычайно удачной бесплатной программы. Настоятельно рекомендую попробовать эту новую версию всем переводчикам, заинтересованным в повышении производительности и качества работы с помощью высокоэффективной переводческой среды. Дополнительную информацию об OmegaT можно найти в этой записи блога. Об остальных нововведениях OmegaT мы расскажем в последующих записях.
OmegaT 2.5.0: качественный скачок вперед
Метки:OmegaT, оборудование и ПО, память переводов, перевод с английского на русский, переводческая среда Рубрика: Технологии перевода |
Нет комментариев »
31.08.2011, Roman Mironov

В отличие от популярных переводческих сред, OmegaT изначально не обладает полным набором встроенных функций контроля качества. Однако автоматический контроль качества играет огромную роль для достижения высоких результатов в нашей работе, поэтому переводчикам или переводческим агентствам, работающим с OmegaT, придется прибегать главным образом к решениям сторонних разработчиков. В этой записи я кратко расскажу о наиболее важных инструментах контроля качества, доступных пользователям OmegaT.
Программа для проверки правописания и грамматики
Проверять правописание, а также выявлять различные стилистические или грамматические ошибки можно непосредственно в OmegaT. Дополнительную информацию о том, как активировать различные типы проверок, можно найти в предыдущей записи. Эти проверки выполняются только в ходе непосредственной работы над файлом, потенциальные ошибки подчеркиваются в самом файле. Тем не менее выполнить проверку всего файла (как, например, в Microsoft Word или Wordfast по нажатии F7) невозможно. Для этого можно воспользоваться инструментами контроля качества сторонних разработчиков, рассмотренными ниже. Их использование обычно обязательно, поскольку риск пропустить выделенную ошибку при работе над файлом очень высок. Целенаправленное же рассмотрение потенциальных ошибок в рамках отдельной проверки сводит этот риск к минимуму.
Проверка тегов
В OmegaT имеется встроенная функция проверки тегов. Для ее запуска необходимо нажать Ctrl+T. Этот этап чрезвычайно важен для контроля качества, поскольку защита тегов в OmegaT отсутствует. Риск частично или полностью удалить тег и пропустить эту ошибку при редактировании очень высок, поэтому выполнение этой проверки в проектах, где имеются теги, обязательно.
Программа контроля качества
Существует по меньшей мере три надежных инструмента, которые можно применять для выявления различных типов ошибок, например непоследовательных переводов, непереведенных сегментов, неправильных чисел, единства терминологии и т. д.: QA Distiller, ApSIC Xbench и CheckMate. Последние две программы бесплатны. Чаще всего мы пользуемся QA Distiller, тем не менее бесплатные ApSIC Xbench и CheckMate обладают в целом той же функциональностью. Работая с любой из этих программ, вы должны загрузить в нее файл TMX. Это может быть либо файл project_save.tmx, который содержит все переводы, записанные в память переводов текущего проекта, либо один из файлов TMX, созданных при сохранении переведенных документов в OmegaT. После загрузки в инструмент контроля качества с таким файлом TMX можно работать как с любым другим двуязычным файлом. Если при контроле качества будут выявлены ошибки, можно переключиться на проект в OmegaT, найти соответствующий сегмент, воспользовавшись функцией поиска, и внести правку. В QA Distiller встроен редактор TMX, позволяющий вносить правки в загруженный файл непосредственно из программы, т. е. без переключения в OmegaT. Вы закрываете проект в OmegaT, загружаете project_save.tmx в QA Distiller и вносите изменения непосредственно в project_save.tmx, щелкая ошибку и исправляя перевод в редакторе. После завершения контроля качества вы открываете проект в OmegaT, где уже отображается исправленный перевод. Итак, для контроля качества в проектах OmegaT подходят различные инструменты сторонних разработчиков. Наш опыт ежедневного использования OmegaT перевода с английского на русский показывает, что результаты контроля качества в этих проектах не уступают результатам, получаемым с помощью переводческих сред, где эти функции являются встроенными. При возникновении вопросов по этой теме наше бюро переводов с готовностью окажет вам помощь.
Метки:OmegaT, качественный перевод, оборудование и ПО, переводческая среда Рубрика: Технологии перевода |
Нет комментариев »
13.08.2011, Roman Mironov

Этой публикацией продолжается серия советов по использованию OmegaT в качестве профессиональной переводческой среды для перевода с английского на русский или других языковых пар. Сегодня речь пойдет о памяти переводов (TM — translation memory).
Мы храним все памяти переводов централизованно на файловом сервере, что облегчает управление TM и доступ к ним. Такой подход очень важен для нашей компании, поскольку постоянные проекты от одних и тех же конечных клиентов составляют значительную часть заказов. Структура проекта в OmegaT по умолчанию предполагает размещение подпапки «tm» в папке проекта. Если необходимо использовать дополнительные памяти, необходимо переносить их в эту папку (в виде файлов TMX). Таким образом, каждый раз при создании нового проекта для постоянного конечного клиента необходимо копировать все памяти от предыдущих проектов в эту подпапку. Это неэффективно и чревато тем, что вы забудете про какую-нибудь память. Всего этого можно избежать, если хранить все памяти конкретного клиента централизованно в одном месте. Если планируется хранить памяти на том же ПК, где выполняется перевод, для этого подойдет любая папка на нем. Если вы предпочитаете хранить их на устройстве, находящемся в общем доступе в сети, то такую папку необходимо подключить как сетевой диск (OmegaT не поддерживает сетевые пути Windows, начинающиеся с «\\»). При создании следующего проекта для этого клиента необходимо сменить путь к памяти, установленный по умолчанию, на путь к папке централизованного хранения. После этого можно просто копировать данный файл настроек (omegat.project) в каждый новый проект, поскольку в нем всегда будут прописаны правильные пути к папке централизованного хранения.
Если в проекте много 100%-ных совпадений, многие предпочитают их автоматическую подстановку в перевод. Сделать это в самой OmegaT невозможно, поскольку в настоящее время в этой среде поддерживается только вставка в каждый отдельный сегмент по мере продвижения по файлу. Это ведет к снижению производительности. Кроме того, эти 100%-ные совпадения записываются в память под вашим именем, что не позволяет отличить от ваших собственных переводов в случае необходимости (например, если клиент их не оплачивает и необходимо пропустить их во время редактирования). Чтобы обойти эту проблему, можно создать подпапку «auto» в папке с памятью данного проекта (локальной или централизованной папке «tm», описанной выше) и поместить в нее соответствующую память. При следующем запуске проекта все 100%-ные совпадения из памяти автоматически подставятся в перевод.
При создании переведенных файлов OmegaT создает три файла памяти, которые содержат в себе только текущий перевод. Это предоставляет несколько полезных возможностей. Память создается в трех форматах: уровня 1 (TMX 1.1), уровня 2 (TMX 1.4) и OmegaT (формат TMX 1.1, с которым работает OmegaT).
1. Формат TMX 1.4 предполагает некоторую степень совместимости между OmegaT и другими переводческими средами, поэтому удобен в случаях, когда необходимо передать память переводческому агентству, которое сможет использовать ее в другой переводческой среде, например SDL Trados.
2. Иногда по ходу перевода требуется изменить сегментацию или исправить ошибки в оригинале. Зачастую после этого в памяти остаются два перевода: один — текущий (после внесения изменений), а другой — старый (до внесения изменений). Можно выделить по меньшей мере две причины, почему такая ситуация нежелательна. Во-первых, при проверке памяти с помощью программы проверки орфографии или контроля качества старые сегменты тоже попадают в результаты, внося путаницу. Во-вторых, при использовании этой памяти в последующих проектах для того же конечного клиента эти старые переводы могут также запутать. В таких ситуациях полезен файл памяти в формате OmegaT, поскольку он содержит только текущий перевод. Его можно использовать вместо основной памяти проекта (project_save.tmx). Кроме того, если необходимо удалить из основной памяти все старые переводы, можно переименовать этот файл в project_save.tmx и заменить им текущий project_save.tmx в подпапке «omegat».
При возникновении вопросов относительно представленных советов буду рад помочь. Информацию об установке и настройке OmegaT можно найти в этой записи.
Метки:OmegaT, оборудование и ПО, память переводов, переводческая среда Рубрика: Технологии перевода |
Нет комментариев »
02.03.2011, Ekaterina Ilyushina
Несмотря на рост популярности систем управления контентом/переводом, объем переводимых нередактируемых оригиналов по-прежнему значителен. Одной из основных причин этого является банальная недоступность исходных редактируемых файлов. Например, заказчику может потребоваться перевести с русского на английский советский патент 1980-х годов. Другой клиент может заказать перевод документации, которая в свое время была предоставлена ему субподрядчиком в виде PDF, но теперь связь с субподрядчиком утрачена. Поскольку переводить такие файлы сложнее, чем редактируемые, обычно бывает полезно предварительно подготовить их к переводу.
Оптимальный способ подготовки нередактируемых файлов к переводу
Практика показывает, что наилучшим способом такой подготовки является оптическое распознавание символов (OCR). Аналогичного мнения придерживаются многие коллеги по профессии. Однако клиенты не всегда заинтересованы в возмещении затрат на OCR, часто предпочитая, чтобы переводчик просто набирал перевод в файл DOCX, параллельно смотря в оригинал. Разумеется, нежелание платить за OCR вполне обоснованно, прежде всего в случае небольших проектов. Но давайте посмотрим на этот вопрос с другой стороны: есть ли у OCR преимущества перед переводом «в файл»?
Косвенные преимущества OCR для клиентов
- Обычно переводить редактируемый файл быстрее и проще, чем нередактируемый. Переводчику не приходится отвлекаться на форматирование, которое в противном случае отнимает много сил и оставляет меньше времени на главную задачу — собственно перевод. При переводе редактируемого файла не требуется вручную набирать цифры, названия компаний, наименования продукции, адреса и т. п. При наборе перевода в чистый файл DOCX нужно тщательно перепроверять, все ли содержимое оригинала в него перенесено, тогда как файл после OCR требует минимальной проверки.
- В случае редактируемого файла можно применить переводческую среду. Это дает по меньшей мере два преимущества с точки зрения качества: а) упрощает задачу редактирования для переводчика и особенно редактора, б) позволяет использовать средства автоматического контроля качества.
- Переводческая среда также обеспечивает удобную функцию резервного копирования: каждый переведенный сегмент сохраняется в память переводов, что позволяет легко восстановить перевод в случае сбоя. Мы убедились в пользе этой функции давно и с тех пор зареклись переводить серьезные файлы без OCR: однажды мы случайно удалили документ с переводом, как раз выполненным «в файл», потеряв в результате целый день работы одного переводчика.
Все эти улучшения дают косвенные преимущества для клиентов, выражающиеся в повышении скорости и качества перевода.
Прямые преимущества OCR для клиентов
- OCR позволяет проанализировать исходный файл на памяти переводов, в результате чего выявляются изначально скрытые внутренние совпадения. Таким образом, клиент может получить значительные скидки. В одном нашем проекте в результате OCR «образовалось» 25 000 повторов (при всего лишь 10 000 уникальных слов). Если бы клиент тогда отказался от OCR и заплатил за перевод всех слов по полной ставке, то финансовые потери были бы весьма существенными.
- С точки зрения клиентов одной из основных проблем, связанных с нередактируемыми файлами, является отсутствие четкого понимания объема и примерного срока сдачи. OCR позволяет устранить эту неясность: как только файл распознан, клиент получает точный расчет стоимости и срока. Менеджеру проектов в бюро переводов или переводческом агентстве эта информация пригодится для того, чтобы составить более конкретное и наглядное предложение для своего заказчика. Используя OCR, агентство может выделиться среди конкурентов, не озаботившихся точным расчетом при составлении своей заявки.
- Иногда из-за сжатого срока переводимый файл приходится делить между несколькими переводчиками. Если отдать каждому из них на откуп форматирование своей части, то на выходе получится весьма разнородный в плане внешнего вида файл. В этом случае либо потребуется переделка, либо проблема вовсе останется незамеченной и в итоге повредит вашей репутации, когда ее увидят ваши клиенты.
Каким образом вы предпочитаете готовить нередактируемые файлы к переводу?
Метки:верстка, качественный перевод, оптическое распознавание символов Рубрика: Технологии перевода |
1 комментарий »
16.02.2011, Roman Mironov
В этой записи предлагаются инструкции по настройке OmegaT. Несмотря на то что программа вполне готова к использованию в своем первоначальном виде, ее можно существенно улучшить, выполнив несколько простых действий. Запись составлена с целью свести воедино эти основные инструкции, чтобы вы уже с первых шагов могли пользоваться расширенной функциональностью, вместо того чтобы идти к ней методом проб и ошибок. Поскольку инструкции носят общий характер, даны также ссылки на более подробные описания на английском языке. Запись пригодится, например, переводчикам, желающим оценить OmegaT, или редакторам, которые получают заказы в формате OmegaT от бюро переводов.
- Загрузите OmegaT с сайта SourceForge. Вам нужна последняя бета-версия в разделе Files > Latest. Загружать устаревшую стабильную версию едва ли имеет смысл, тем более бета-версии обычно полностью работоспособны. Выберите версию, соответствующую вашей операционной системе, обычно без Java (кроме случаев, когда Java у вас не установлена). В Windows установка и запуск OmegaT выполняются стандартным образом. В Linux достаточно распаковать загруженный архив и запустить скрипт OmegaT.
- Далее необходимо включить проверку орфографии. Для этого выберите «Параметры» > «Проверка орфографии». Установите флажок «Автоматически проверять орфографию». Создайте папку словарей и укажите путь к ней в этом окне. Затем установите словари для ваших языков перевода. В отличие от некоторых других переводческих сред OmegaT проверяет орфографию непосредственно при наборе текста, что позволяет сразу же вводить слова правильно, вместо того чтобы возвращаться к замеченным впоследствии ошибкам.
- Теперь установите Language Tool — средство проверки стиля и грамматики. Откройте страницу подключаемых модулей OmegaT на сайте SourceForge. Выберите Language Tool и загрузите последнюю версию. Language Tool является кроссплатформенной программой, следовательно, одни и те же файлы подходят как для Windows, так и для Linux. Создайте подпапку «plugins» в папке установки OmegaT и распакуйте в нее загруженный архив. Перезапустите OmegaT, выберите «Параметры» и установите флажок «Проверка языка». Замечания от Language Tool будут подчеркиваться синим по ходу перевода. Подробная инструкция содержится в идущем в комплекте файле Readme.
- Далее аналогичную процедуру нужно проделать для подключаемого модуля Tokenizer (морфологии). Она улучшает функцию поиска нечетких совпадений и терминов в глоссарии, находя разные формы слова (множественное число и т. д). Загрузить ее можно с той же страницы подключаемых модулей OmegaT на сайте SourceForge. После распаковки все файлы опять же помещают в подпапку «plugins» в папке установки OmegaT. Если какие-то файлы там уже существуют, то их можно перезаписать. Запуск OmegaT с функцией морфологии требует создания и редактирования скрипта, что, впрочем, не представляет сложности. Необходимо создать отдельный скрипт для каждого языка оригинала. Например, если вы специализируетесь на переводе с английского на русский и переводе с немецкого на русский, то создадите скрипты для английского и немецкого. Для выполнения нижеуказанной инструкции понадобится прочитать эту страницу, содержащую все необходимые подробности.
В Windows нужно загрузить скрипт BAT с вышеуказанной страницы, предоставляемый разработчиком OmegaT Марком Прайором (или создать его самостоятельно). Создайте его копию и назовите ее, например, «OmegaT_EN.bat». Откройте ее любым текстовым редактором и добавьте строку Tokenizer после «OmegaT.jar». В итоге содержимое скрипта должно выглядеть следующим образом:
java -jar OmegaT.jar %* –Itokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer.
Запускайте программу с помощью этого скрипта вместо обычного файла EXE. Повторите эту процедуру для немецкого, создав скрипт «OmegaT_DE.bat» и добавив в него соответствующую строку немецкого Tokenizer.
В Linux достаточно создать копию скрипта OmegaT, добавить в имя название языка оригинала и добавить строку Tokenizer после «… OmegaT.jar». В итоге получится:
… OmegaT.jar» $* –Itokenizer=org.omegat.plugins.tokenizer.SnowballEnglishTokenizer
Расширив базовую функциональность OmegaT вышеуказанным образом, вы сможете более эффективно работать в этой программе. При возникновении вопросов относительно этих инструкций или других аспектов OmegaT приглашаем задавать их в комментариях. «Велиор» будет рад помочь.
Метки:OmegaT, оборудование и ПО, память переводов, переводческая среда Рубрика: Технологии перевода |
Нет комментариев »
19.01.2011, Roman Mironov
Я в целом ратую за использование бесплатного и свободного программного обеспечения, где это возможно, поскольку мне симпатичны его удобство и демократичность. Бесплатная альтернатива коммерческому продукту может быть крайне полезна как отдельным пользователям, так и компаниям, особенно малому бизнесу наподобие нашего бюро переводов, где нужно сводить расходы к минимуму, чтобы сохранять конкурентоспособный уровень цен, зарплат и т. д. Поэтому я считаю наличие в отдельно взятой отрасли бесплатной программы, подходящей для использования в качестве основного средства производства, большим преимуществом для многих ее участников. В переводческой отрасли одним из таких средств является OmegaT.
Встречают по одежке
Впервые я познакомился с OmegaT в 2009 г., и, честно говоря, она не произвела на меня впечатления. Найдя интерфейс простоватым, а подход к организации рабочего процесса перевода текста — непривычным для себя, я поспешил сделать вывод, что программа мне не подходит из-за ограниченных возможностей.
Год спустя я вернулся к OmegaT и на этот раз открыл ее для себя заново, испытав при этом стыд за поспешность предыдущего вывода. В этой записи я хочу высказать несколько общих соображений о работе в ней. Упомянутые здесь моменты — лишь верхушка айсберга. По мере дальнейшего использования OmegaT «Велиором» в наших переводческих проектах я планирую писать о ней более подробно.
Какую пользу можно извлечь из OmegaT
- OmegaT содержит все основные функции полноценной переводческой среды, включая управление проектами, память переводов и терминологические глоссарии, тем самым являясь жизнеспособной альтернативой платным аналогам.
- Для переводчика-фрилансера, только начинающего карьеру в переводческой отрасли и не имеющего опыта и/или средств для того, чтобы подобрать себе коммерческую программу, OmegaT будет большим подспорьем. Например, она подойдет переводчикам с английского на русский, которые начинают с нуля или уже достигли определенных высот и теперь ищут экономичный способ дальнейшего повышения производительности и качества перевода.
- Для штатного переводчика OmegaT удобна тем, что позволяет продолжить работу над переводом дома или в дороге (на ноутбуке) с такой же легкостью, как и в офисе.
- Хотя компания SDL, по сути, прекратила развитие и поддержку формата TTX , он остается одним из самых популярных в отрасли. Для работы с файлами TTX требуется коммерческое ПО SDL Trados. Без него переводчик не сможет работать с довольно большим кругом переводческих агентств, у которых технологический процесс построен вокруг этого формата. Однако OmegaT позволяет обойти это препятствие, поскольку поддерживает работу с TTX, а также многочисленными другими форматами.
- Мне также симпатичен тот факт, что разработка OmegaT ведется усилиями сообщества программистов, которое открыто по отношению к просьбам исправить ошибки и добавить новые функции. Таким образом, можно наблюдать за «кухней» и даже приложить руку к развитию программы при желании.
Какие ограничения нужно учесть
Как и многие другие программы с открытым исходным кодом, OmegaT не лишена некоторых недостатков. Похожим образом OpenOffice.org уступает пакету Microsoft Office, а Ubuntu уступает операционной системе Windows. Эти ограничения можно считать неотъемлемой частью свободного ПО, и обычно они являются незначительными в том смысле, что при условии соответствующего настроя с ними можно мириться. Проще говоря, если вы ставите своей целью максимальную экономию или в принципе предпочитаете свободное ПО, то с большой долей вероятности смиритесь с такими ограничениями и будете пользоваться временным решением, пока у разработчиков не дойдут руки до исправления.
При этом я не призываю всех поголовно переходить на использование OmegaT. Нужно понимать, что это лишь одна из многочисленных переводческих программ подобного рода, представленных на рынке. Этой записью я прежде всего хочу подчеркнуть, что OmegaT — жизнеспособная альтернатива коммерческим продуктам, которая многими может рассматриваться в качестве рабочей среды, и мне приятно, что таким образом она расширяет доступный переводчикам выбор. Снимаю шляпу перед разработчиками за их энтузиазм!
Какие бесплатные программы вы используете в своей работе? Есть ли среди них OmegaT?
Метки:OmegaT, память переводов, переводческая среда, профессия переводчика Рубрика: Переводческая отрасль, Технологии перевода |
Нет комментариев »
|