Два приятных преимущества Verifika с точки зрения проверки терминов

Настройки проверки терминологии в VerifikaВ статье про QA Distiller я подробно описал проблемы, сопряженные с проверкой по глоссариям. Сейчас из-за параметра «Слово целиком» мы вынуждены каждый раз выполнять КК в два захода. Первый раз (без параметра «Слово целиком») выполняем проверку по глоссарию проекта с собственно терминами. Этот глоссарий вызывает минимум ложных срабатываний, поэтому параметр «Слово целиком» не нужен. Второй раз (уже с параметром «Слово целиком») проверяем по списку общих критических слов. Здесь уже без параметра «Слово целиком» не обойтись, так как в противном случае количество ложноположительных результатов зашкаливает (например, «east» находит также «at least» и «Easter»).

Платой за пользование параметром «Слово целиком» является необходимость вводить все словоформы оригинала в список критических слов. Иначе все отсутствующие формы не будут проверены.

Решение Verifika

Вся эта статья посвящена очень удобному параметру в Verifika — Whole words shorter than (Считать целыми словами только слова короче), — который, помимо прочего, имеет потенциал несколько облегчить вышеописанные проблемы. Он заставляет программу считать слова короче заданного ограничения целыми. Вот пример из перевода с английского на русский

В глоссарии у меня два слова:

HR — управление персоналом
benefit — льгот

Проверяя без параметра «Слово целиком», я в ответ на «HR» получаю несколько ложноположительных результатов, например «through». Невесело, так что явно нужно проверять «HR» как целое слово.

Начинаю проверять с параметром «Слово целиком», и тут уже возникает другая проблема. «Benefit» не совпадает с «benefits». То есть чтобы проверять все слова только целиком и при этом ухитриться проверить еще и все словоформы, нужно вводить в глоссарий не только «benefit», но и «benefits» отдельной строкой. В результате глоссарием труднее управлять. Но такова плата за использование параметра «Слово целиком».

Первое преимущество

Первое преимущество, которое дает параметр «Считать целыми словами только слова короче» в Verifika, это как раз сокращение количества словоформ, которые приходится добавлять в глоссарий. Я могу использовать параметр «Слово целиком», не вводя все возможные словоформы оригинала для длинных слов, которые в целом представляют незначительный риск ложноположительных ошибок и не требуют проверки как слова целиком. Добавлять все словоформы нужно только для коротких терминов (до заданного ограничения длины). Хотя Verifika и не решает проблему разрастающегося глоссария полностью, потому что коротких терминов все равно много, я считаю, что в этом плане данный параметр — большой прорыв.

Второе преимущество

Вторым преимуществом является возможность, пускай и не совсем однозначная, организовать проверку по двум разным глоссариям за один заход, а не за два, как приходится делать из-за различий в параметре «Слово целиком». Допустим, я проверяю сразу по двум глоссариям с параметром «Считать целыми словами только слова короче», установив 5 знаков в качестве ограничения длины. В результате Verifika считает слова длиной менее 5 знаков целыми, так что процент ложных срабатываний резко падает и при таком раскладе в общем-то вполне себе можно проверять по списку критических слов (конечно, не столь эффективно, как если установить параметр «Слово целиком», но в целом терпимо). С другой стороны, я могу проверять и по глоссарию с собственно терминами, получая практически тот же результат, что и без параметра «Слово целиком». К сожалению, ключевое слово здесь — «почти», потому что если в глоссарии будут слова менее 5 знаков, то их альтернативные словоформы Verifika проигнорирует. И в этих проигнорированных случаях как раз могут быть ошибки. Получается, что для выполнения проверки за один заход нужно сначала должны добавить в глоссарий с собственно терминами все словоформы оригинала. Но мы в настоящее время этим не занимаемся. И в целом считаю, что словоформам там не место.

Идеальное решение

Оптимальным решением было бы, конечно, загружать в Verifika два разных глоссария и иметь возможность установить/снять флажок «Слово целиком» для каждого отдельного глоссария. Нельзя отрицать, что у параметра «Считать целыми словами только слова короче» есть потенциал в этом плане, но сейчас в возможности его использования для решения вышеозначенной проблемы я не уверен. Так или иначе это большой шаг на пути к более эффективной проверке, по крайней мере потому что он увеличивает степень свободы при организации контроля качества перевода. Итог: экономия времени и потенциал для создания более эффективного способа проверки по глоссариям.

Заключение

Спасибо за чтение этого материала. Ждите в скором времени следующей статьи из этой серии, посвященной сравнению QAD и Verifika.

А как вы проверяете перевод по глоссарию с собственно терминами? Если вы также проверяете и по списку критических слов, то как вы совмещаете две проверки?

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *