ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ИЛИ ПРОБНЫЙ ПЕРЕВОД.

Yes, I want my consultaion

QA Distiller: смотря в будущее с надеждой

Контроль качества с помощью QA DistillerПредыдущей записью про сильные стороны QA Distiller я начал небольшую серию статей о сравнении этой программы, которой мы в настоящее время пользуемся для контроля качества перевода, с альтернативами. Сегодня я хочу подробно рассмотреть некоторые недостатки QAD с точки зрения нашего процесса перевода. Это не проблемы в полном смысле слова, а скорее пожелания, обусловленные некоторыми особенностями нашего технологического процесса.

Формат глоссария

Наши глоссарии представляют собой файлы в формате TXT и кодировке UTF-8 с табуляцией в качестве разделителя (создаются в OmegaT). QAD же использует собственный формат, который называется DICT, где разделителем служит вертикальная черта. Кроме того, DICT содержит дополнительный заголовок из двух строк и имеет кодировку UCS-2 Little Endian. Вот пример:

Вот так выглядят первые строки глоссария TXT из OmegaT в случае с переводом с английского на русский язык:

катетер катетер

А вот как выглядит этот же термин в начале файла DICT:

DICTFILE V1.1

EN-US|RU-RU

catheter|катетер

В результате перед контролем качества нам каждый раз приходится преобразовывать глоссарии TXT в DICT. Это весьма неэффективно.

Различные варианты перевода терминов

Файлы DICT не поддерживают ввод нескольких вариантов перевода термина в одной строке. Не поддерживаются и регулярные выражения, которые могли бы помочь решить эту проблему. В итоге приходится вводить каждый вариант перевода отдельной строкой, каждый раз дублируя оригинал. В результате глоссарии разрастаются в размерах и управлять ими со временем становится трудновато.

Проверка орфографии

QAD не имеет встроенной функции проверки орфографии, поэтому всякий раз проверять ее приходится отдельно в отдельной программе. Это тоже неэффективно.

Параметр «Слово целиком»

Мы вынуждены проверять ошибки терминологии в два захода. В первый раз проверяем на предмет соответствия глоссарию проекта, содержащему собственно термины. Во второй проверяем по списку общих, т. н. критических слов, с которыми сопряжен высокий риск ошибок. Поскольку глоссарий проекта включает в себя термины в истинном значении этого слова, мы можем смело выполнять первую проверку без включения параметра «Слово целиком» (Whole words only). Обычно пи этом бывает немного ложноположительных срабатываний, потому что такие термины редко входят в состав совершенно посторонних слов. Вот пример:

Оригинальный термин: catheter

Перевод термина: катетер

С чем совпадает: катетер, катетеры, катетеризация

Решение QAD: правильно

Пускай этот термин встретился в составе двух других слов, это нестрашно, поскольку оба случая на самом деле требуют проверки. Ведь на каждый «catheter… в оригинале должен приходиться один «катетер…» в переводе. Если его там нет, то вполне возможно, что слово пропущено по ошибке.

Лишь в редких случаях по таким терминам QAD находит ложноположительные ошибки. Вот пример:

Оригинальный термин: hose

Перевод термина: шланг

С чем совпадает: whose. (Перевод в этом случае, очевидно, будет отличаться от «шланг».)

Решение QAD: неправильно, ожидалось: «шланг»

Поскольку эти ложноположительные ошибки возникают редко, при проверке по глоссарию терминов можно со спокойной душой выключить параметр «Слово целиком». Благодаря этому проще вести глоссарий: практически по каждому термину удается обходиться одной словоформой — словарной.

С другой стороны, если без этого параметра проверять перевод по списку критических слов, то ложноположительных ошибок получается слишком много. Дело в том, что в силу своего назначения этот список содержит множество коротких слов и аббревиатур, которые часто встречаются в составе других слов с совершенно иными корнями. Вот пример:

Оригинальный термин: east

Перевод термина: восто

С чем совпадает: feast, Easter, at least . (Переводы в этом случае, очевидно, будут отличаться от «восто».)

Решение QAD: неправильно, ожидалось: «восто»

С точки зрения проверки правильности перевода слова «east» эти ложноположительные ошибки бесполезны. В результатах поиска они не должны появляться вообще. Нет проблем: включаем параметр «Слово целиком» и выполняем вторую проверку (по списку критических слов) в виде отдельного захода. Это неэффективно, но в целом терпимо.

Но не все так просто, как хотелось бы. Когда проверяешь перевод по списку критических слов, включив этот параметр, QAD автоматически игнорирует все словоформы, отличающиеся от введенной в глоссарий. Вот пример:

Оригинальный термин: east

Перевод термина: вост

Оригинал: I went east.

Перевод: Я отправился на восток.

Решение QAD: правильно

Оригинал: Eastern people are nice.

Перевод: Западные люди приветливые.

Решение QAD: Эта ошибка банально игнорируется, поскольку теперь для QAD «east» и «Eastern» — два разных слова, из которых мы ищем только первое.

В результате в приведенном выше примере QAD игнорирует смысловую ошибку, что недопустимо. Чтобы избежать этого, включать параметр «Слово целиком» нужно только после того, как в список критических слов были введены все возможные словоформы, чтобы QAD проверял их все, а не пропускал. Вот пример:

Параметр «Слово целиком» выключен

Оригинальный термин: east

Перевод термина: вост

Параметр «Слово целиком» включен

Оригинальный термин: east

Перевод термина: вост

Оригинальный термин: eastern

Перевод термина: вост

Таким образом, мы оказываемся между двух огней:

  1. Либо нужно выключить этот параметр и потом мужественно сидеть и проверять кучу ложноположительных результатов, выданных по списку критических слов. При этом совершенно невозможно сосредоточиться, так что проверка теряет смысл, ведь ее первоначальная задача — как раз сосредоточиться на проверке только высокорисковых случаев.
  2. Либо нужно включить этот параметр и мучиться с ведением большого списка критических слов, содержащего огромное количество словоформ. Это, мягко говоря, неудобно.

Пока мы остановились на втором варианте.

Непереведенные сегменты

QAD может находить сегменты, которые остались без перевода. Программа генерирует ошибку, если оригинал равен переводу. Большинство ошибок этого плана обычно являются ложноположительными, но с этим приходится мириться, поскольку обойтись без этой проверки нельзя.

Но вот незадача: в проекте мы некоторые сегменты изначально оставляем непереведенными и переводим только в самый последний момент, когда его финализируем, так сказать. Речь идет про внутренние частичные совпадения. Это позволяет избежать их проверки в процессе редактирования и, как следствие, двойной работы по исправлению одних и тех же ошибок. Снижается и риск непоследовательного перевода. Подробнее об этом можно прочитать в статье про параллельную работу переводчиков над проектом.

Если оставлять их без перевода в OmegaT, то возможны два варианта:

Параметр Allow translation to be equal to source (Разрешить перевод, равный оригиналу) включен

Все непереведенные сегменты записываются в память проекта. Это весьма полезно, по крайней мере потому что они отображаются как переведенные в панели Editor, считаются как переведенные в статистике; плюс, натуральные непереводимости сохраняются в памяти для использования в будущих проектах. Вот только при загрузке этой памяти проекта в QAD все они находятся как ложноположительные результаты. Это неэффективно, но в целом терпимо. Но QAD к тому же усматривает в них еще и ошибки терминологии! Разумеется, раз перевод равен оригиналу, QAD не может найти в переводе соответствующие термины. Вот пример:

Оригинальный термин: anchor

Перевод термина: якор

Оригинал: For scrubbing, protect the head with a piece of soft material and anchor it in the drain hole of the sink.

Перевод: For scrubbing, protect the head with a piece of soft material and anchor it in the drain hole of the sink.

Решение QAD: в оригинале найдено слово «anchor», но в переводе соответствующий термин не найден.

Параметр Allow translation to be equal to source выключен

Непереведенные сегменты не записываются в память вообще, так что вышеописанной проблемы не возникает. Но при этом мы теряем все вышеперечисленные преимущества от записи непереведенных сегментов в память.

Альтернативой этому является выполнение контроля качества только один раз, на финализированной версии перевода. Но этого маловато.

Еще один вариант: переводить, выключив этот параметр, а, финализации уже его включать. В целом неплохая идея, но она неидеальна в плане эффективности, так как придется постоянно то включать, то выключать этот параметр в разных проектах. При открытии проекта нужно будет первым делом проверять статус этого флажка.

На самом деле в идеале нужна возможность всего-навсего не проверять непереведенные сегменты по остальным типам ошибок, в частности терминологическим.

X-Editor

Когда мне нужно внести правки в перевод, я могу дважды щелкнуть ошибку или нажать Enter. В результате перевод откроется в X-Editor. Внеся правку, я нажимаю Ctrl + S, и правка сохраняется в двуязычный файл, что очень удобно. Вот только X-Editor пока еще слабоват в плане функций редактирования. Перемещаться с помощью Ctrl + клавиш со стрелками нельзя. Выделять слова с помощью Ctrl + Shift + клавиш со стрелками тоже, естественно, нельзя. При первом открытии X-Editor не сразу срабатывает на переключение раскладки клавиатуры. Это по большому счету все незначительные проблемы, пока количество правок насчитывает несколько штук. А что делать, когда их десятки, а то и сотни? В этом случае приходится, стиснув зубы, выполнять все манипуляции мышью, что отнимает слишком много времени.

Заключение

Все вышеперечисленные недостатки по отдельности невелики. Но поскольку на контроль качества перевода у нас уходит по несколько часов в день, улучшение во всех этих областях могло бы дать существенный прирост производительности. Другими словами, хотелось бы иметь программу, сочетающую в себе сильные стороны QAD с рядом других мощных настраиваемых функций.

Если эта статья о контроле качества перевода оказалась для вас полезной, то приглашаю вас подписаться на нашу RSS-ленту.

Оставить комментарий


About the Author

Roman Mironov
Roman Mironov
CEO & Founder

As the founder of Velior, Roman has had the privilege of being able to turn his passion for languages into a business. He has over 15 years of experience in the translation industry. Roman has helped dozens of clients increase sales by making their products appealing for speakers of other languages.