ПОЛУЧИТЕ КОНСУЛЬТАЦИЮ ИЛИ ПРОБНЫЙ ПЕРЕВОД.

Yes, I want my consultation

Перевод файлов PDF влетает в копеечку

Перевод файлов PDF представляет повышенную сложность по сравнению с другими распространенными форматами, поскольку PDF обычно нередактируемы и поэтому малопригодны для перевода. Прежде чем приступать к такому переводу, нужно остановиться на одном из возможных вариантов действий, рассмотренных в этой статье. Основной смысл в том, чтобы минимизировать дополнительные работы по воссозданию форматирования. В статье используются следующие термины:

  • Файлы PDF: предназначенные для перевода файлы в нередактируемом формате.
  • Редактируемые исходные (оригинальные) документы: файлы, из которых сгенерированы («распечатаны») эти файлы PDF.
  • Воссоздание форматирования: процесс воссоздания исходного форматирования документов PDF в пустых файлах с нуля вручную.

Найдите редактируемые исходные документы и переведите именно их.

Здесь важно понять, что PDF не берутся из ниоткуда. Всегда есть редактируемые оригинальные документы, из которых они созданы. PDF практически всегда представляют собой файлы, полученные из других форматов путем создания версии для печати. Например, это PDF, сгенерированные из программ Adobe InDesign (INDD или IDML files), Microsoft Word (DOCX), Microsoft PowerPoint (PPTX) или браузеров (HTML).

Итак, при переводе PDF важно избежать бесполезной работы по воссозданию исходного форматирования в пустых файлах с нуля. Для этого достаточно отправить на перевод редактируемый исходный документ, из которого данный файл PDF создан. Исполнитель переведет непосредственно этот исходный документ, а форматирование будет воспроизведено переводческой программой (CAT-программой). В выигрыше останутся все: и переводчику будет меньше работы, и вы сэкономите, да и качество перевода будет выше.

Если вы забудете отправить редактируемый исходный документ на перевод и переводчик его у вас попросит, не спешите отнекиваться «на автомате». Вместо этого попробуйте вспомнить, откуда взялся этот файл PDF, и найти его исходник. Оно того стоит.

PDF_file_to_Editable_source_documentТеперь разберемся, как оптимально переводить собственно файлы PDF.

Редактируемый исходный документ у вас есть: самостоятельная вставка переведенного текста.

Когда переводчик работает над редактируемыми исходными документами, он подставляет в эти же файлы вместо оригинального текста переведенный (на самом деле эту подстановку за него выполняет CAT-программа). Некоторые клиенты предпочитают делать это сами. Наиболее часто это бывает, когда переводится документ, созданный дизайнером клиента, и клиент вполне оправданно хочет, чтобы именно этот дизайнер вставлял переводы в окончательный документ. В этом случае поступают следующим образом:

  1. Извлекают весь переводимый текст из редактируемого исходного документа в отдельный файл DOCX.
  2. Переводчик переводит этот файл в формате двуязычной таблицы, из которой даже человеку, не являющемуся носителем языка перевода, понятно, что и куда нужно вставлять обратно в исходный документ.
  3. Дизайнер вставляет переводы обратно в исходный документ.

Этот вариант намного практичнее, чем заставлять переводчика воссоздавать форматирование исходного документа с нуля, скажем, в файлах Microsoft Word. Тем не менее он не оптимален по сравнению с переводом непосредственно редактируемого исходного документа, потому что вместо автоматической подстановки переводов их приходится подставлять вручную, а это дорогостоящий процесс и к тому же небезопасный с точки зрения ошибок из-за невнимательности.

PDF_file_to_Bilingual_table

Редактируемого исходного документа у вас нет: минималистичное форматирование.

Иногда редактируемые исходные документы действительно недоступны. Скажем, вы хотите перевести документ, который получили по факсу, или вы являетесь дистрибьютором и желаете перевести руководство к реализуемой продукции, но доступа к редактируемому исходному документу у вас нет, поскольку руководство изначально составлял производитель.

В таком случае переводчику не остается ничего другого, кроме как буквально начать «с чистого листа», то есть воссоздать форматирование в файле Microsoft Word. Здесь любопытно то, что по-настоящему профессиональный переводчик сначала воссоздает исходный документ и только затем переводит его, а не начинает переводить в пустой файл и форматировать его по ходу работы. Для экономии вы можете проконтролировать объем форматирования, которое воссоздаст исполнитель. Как правило, чем меньше форматирования, тем для вас дешевле. Поэтому вы можете дать исполнителю соответствующую команду: минималистичное форматирование.

Важно понимать, что воссоздание форматирования сопряжено с риском внесения текстовых ошибок. Например, из-за невнимательности исполнителя цифра 5 в оригинале может легко превратиться в цифру 3 в переводе. Все дело в том, что, какой бы мощной ни была программа OCR и как бы тщательно ни сравнивался воссозданный документ с исходным PDF, этот процесс в значительной степени является ручным, т. е. априори ненадежным по сравнению с переводом редактируемого исходного документа, где риск подобных ошибок минимален. Таким образом, мы опять приходим к тому, с чего начали: оптимальная стратегия — переводить именно редактируемый исходный документ.

Нужно также понимать, что при таком подходе вы по умолчанию получаете перевод в виде файла Microsoft Word. Если вам нужен другой формат, например Microsoft Excel или PowerPoint, то нужно предупредить исполнителя об этом заранее.

PDF_file_to_Microsoft_Word_file_keeping_the_formatting_to_the_bare_minimum

Редактируемого исходного документа у вас нет: полное воссоздание исходного форматирования.

Минималистичное форматирование не всегда подходит. В некоторых случаях форматирование приходится воссоздавать «по полной программе». К ним, например, относятся:

  1. Случаи, когда вы ожидаете получить на сто процентов готовый к использованию переведенный документ. Понятно, что без форматирования тут не обойтись.
  2. Случаи, когда вы планируете представить переведенные документы в контролирующий орган или в суд. В таких случаях бывает даже так, что форматирование должно быть не просто идентичным оригиналу, но страницы должны совпадать один к одному.

Эта ситуация сопряжена с наибольшими затратами для заказчика, потому что приходится оплачивать воссоздание форматирования по максимуму.

PDF_file_to_Microsoft_Word_file_fully_mirroring_the_orignal_formatting

В заключение

Итак, помните, что файлы PDF не могут быть переведены напрямую: их приходится воссоздавать в другом приложении, что чревато дополнительными расходами. Заказчики перевода могут сократить их двумя способами:

  1. Найти редактируемые исходные документы и перевести их вместо файлов PDF: это не только сэкономит ваши деньги, но и поможет снизить риск ошибок.
  2. По крайней мере попросить исполнителя свести воссоздаваемое форматирование к минимуму, если для заказчика это приемлемо.

Воссоздание форматирования не следует путать с версткой (DTP), которая происходит после перевода независимо от того, что было на входе: файлы PDF или редактируемые документы.

5 comments

  • Андрей:

    Роман, к вышесказанному могу добавить, что если верстать документ с учетом форматирования под кошку, то возможны ошибки (ошибки в формулах, таблицах (бывает, что Excel перестраивает значения в ячейках под свой формат, когда документ открывают на другом компьютере)), которые будут попадать в перевод. Проблема еще и в том, что если текст для перевода сверстан с ошибками, то их можно будет устранить только после окончательной правки, а это значит, что в ТМ вносить изменения уже нельзя, потому что это лишит возможности создать переведенные документы через программу. Здесь нужна тактика быстрой и эффективной верстки.

    • Мое личное правило — минимизировать внесение правок в окончательные файлы. Вечно получается так, что внесешь в них кучу правок, а потом приходится их снова генерировать по какой-нибудь причине. Поэтому мне проще поправить оригинал (находящийся в source в OmegaT), если там есть ошибки.

      • Андрей:

        Если править оригинал в Source, то нарушатся теги и некоторые сегменты слетят. Хоть их и можно вытащить из нечетких совпадений, однако таких сегментов может быть много и надо перепроверять весь текст

  • Андрей:

    Роман, а в чем верстаете текст из PDF? В Open office или Word?

    • Только в Microsoft Word. OpenOffice воообще не использую. Только один раз заказчик присылал текст на перевод в его формате. Всем остальным нужен только Microsoft Word.

Оставить комментарий


About the Author

Roman Mironov
Roman Mironov
CEO & Founder

As the founder of Velior, Roman has had the privilege of being able to turn his passion for languages into a business. He has over 15 years of experience in the translation industry. Roman has helped dozens of clients increase sales by making their products appealing for speakers of other languages.