В этой записи мы рассмотрим проверенные на практике принципы работы с нередактируемым исходным текстом, предназначенным на перевод. Подход к обработке такого типа текста зависит от исходных файлов.
- Большая часть нередактируемых текстов представляет собой отсканированные копии крайне низкого качества. Примером их могут служить медицинские документы, написанные на русском языке. Российские врачи нередко обладают очень неразборчивым почерком, в силу того что ежедневно им приходится много писать, заполняя большое количество различных документов. Наверное, поэтому их написанные от руки заключения или предписания часто, кроме них самих, никто разобрать не может, в том числе и переводчики. В идеале для «расшифровки» таких записей мы предпочитаем сразу обратиться за помощью к медицинским работникам, а не выполнять перевод непосредственно с отсканированной копии. Таким образом экономится время, которое в ином случае переводчик потратил бы на догадки и предположения.
- Другой часто встречающийся тип нередактируемого текста — файлы PDF, распечатанные из издательских программ, MS Word и т. д. В таких случаях мы просим заказчика предоставить нам нижележащий редактируемый файл, например в формате INDD (Adobe InDesign), потому что обработка такого редактируемого файла требует гораздо меньше усилий, чем перевод нередактируемого PDF. Как правило, у заказчика имеется такой нижележащий файл и он без труда может его предоставить. Частой причиной предоставления заказчиками файлов PDF вместо файлов INDD является простое незнание того факта, что перевод последних выполнять намного легче, что в конечном итоге ведет к сокращению затрат.
- Если пункты 1 и 2 выше неприменимы, мы прибегаем к оптическому распознаванию текста (OCR), воспроизводя нередактируемый текст с исходным форматированием в отдельном файле. Создание редактируемого файла позволяет применить наш стандартный процесс перевода, построенный на обработке двуязычных файлов. Если при этом требуется какое-либо сложное форматирование, мы вносим затраты на OCR в общую сумму выставляемого заказчику счета: эта услуга называется «восстановлением форматирования». В случае с небольшими или более простыми файлами компания выполняет OCR бесплатно либо игнорирует этот этап, выполняя перевод путем непосредственного набора перевода в отдельном файле. Часто OCR также приходится выпускать и в срочных проектах, когда времени на него просто-напросто не хватает. В этих случаях расчет стоимости обычно осуществляется по количеству слов в переводе.
- Иногда заказчик делает автоматическое OCR самостоятельно и затем требует перевод полученного в результате этого редактируемого файла. Однако на файлах, содержащих сложное форматирование, например таблицы или рисунки, автоматическое OCR дает плохие результаты и распознанный файл требует дополнительной ручной корректировки. В таких случаях мы можем попросить заказчика все равно оплатить «восстановление форматирования», несмотря на то что теоретически исходный файл является редактируемым.