Китайский PDF

Почему китайский PDF плохо переводится онлайн

Что ломается при онлайн-переводе китайского PDF: сканы, таблицы, подписи на схемах, маркировка, коды деталей и смешанный текст.

Короткий ответ

Онлайн-сервис чаще всего справляется только с текстовым слоем PDF. В китайских инструкциях и каталогах много текста в картинках, таблицах, шильдиках и схемах. Эти места приходится разбирать вручную: извлекать текст, сверять коды, смотреть изображение и возвращать перевод в понятный формат.

Кратко

  • Редактируемый PDF и сканированный PDF ведут себя по-разному: первый можно извлечь, второй сначала распознают.
  • Подписи на схемах, шильдики, маркировка и мелкие таблицы часто не попадают в автоматический перевод.
  • Для закупки, сервиса или продажи товара китайский PDF лучше переводить с проверкой кодов, единиц измерения и обозначений.

Что подготовить

  • Сам китайский PDF полностью, а не только отдельные страницы
  • Фото оборудования, шильдика или упаковки, если они есть
  • Ссылку на модель или страницу поставщика
  • Список разделов, которые точно нужны в переводе
  • Формат результата: Word, Excel или PDF с оформлением
  • Пометки, какие коды, бренды и артикулы не переводить

Где онлайн-перевод обычно ломается

Китайский PDF от поставщика редко бывает чистым текстовым документом. Внутри могут быть отсканированные страницы, таблицы из картинок, скриншоты интерфейса, схемы подключения, предупреждения на плашках и мелкие подписи около стрелок. Онлайн-переводчик видит только часть такого файла.

Типичная картина: основной абзац перевёлся, а возле схемы остались иероглифы; таблица с характеристиками превратилась в набор строк; код модели был принят за слово; единица измерения оказалась оторвана от числа. Для ознакомления этого может хватить. Для инструкции, каталога или комплекта поставки — нет.

Скан без текстового слоя сначала нужно распознать

Если текст не выделяется мышкой, PDF фактически является изображением. Перед переводом его распознают через OCR. Но OCR не гарантирует чистый результат: похожие иероглифы, мелкие цифры, слабый контраст, размытые печати и наклон страницы дают ошибки.

После распознавания китайский текст нужно сверить по изображению. Особенно это касается номеров моделей, размеров, напряжения, предупреждений, параметров температуры и давления. Одна неверная цифра в таблице может быть заметнее любого стилистического недочёта.

Подписи на схемах переводятся отдельно

В инструкциях к оборудованию много текста живёт не в абзацах, а прямо на картинках: возле кнопок, разъёмов, стрелок, элементов панели, блоков схемы. Автоматический перевод часто пропускает эти подписи или выносит их в конец страницы без связи с изображением.

При ручной подготовке такие подписи выписываются отдельно, переводятся с учётом изображения и возвращаются в понятный вид: таблицей, сносками, подписью к рисунку или макетом, если нужен финальный PDF.

Маркировка и коды не всегда переводятся

Код детали, артикул, обозначение серии, типоразмер, стандарт, модель и бренд обычно не переводятся дословно. Их нужно оставить как идентификатор и перевести пояснение рядом. Например, строка может содержать код модели, материал корпуса и предупреждение — это три разных типа информации.

Поэтому перед переводом фиксируется правило: что оставляем как есть, что транслитерируем, что переводим, а что переносим в глоссарий. Иначе один и тот же узел может получить два разных названия в инструкции и каталоге.

Как получить результат, которым можно пользоваться

Для внутреннего понимания часто достаточно Word-файла с переводом и комментариями к спорным местам. Для передачи сервисной службе удобнее таблица: номер страницы, исходная подпись, перевод, примечание. Для каталога или инструкции клиенту может понадобиться PDF с восстановленным оформлением.

До старта лучше показать 2–3 проблемные страницы: схему, таблицу характеристик и страницу со сканом. По ним сразу видно, нужен ли OCR, сколько ручной сверки понадобится и какой формат результата разумнее выбрать.

Вопросы по теме

Почему онлайн-переводчик пропускает китайские подписи на картинках?

Потому что для сервиса это не текст, а часть изображения. Такие подписи сначала извлекают или выписывают вручную, затем переводят и связывают с нужным элементом схемы.

Можно ли перевести только нужные страницы китайского PDF?

Да. Для оценки нужно указать диапазоны страниц или разделы: инструкция по монтажу, таблица характеристик, предупреждения, схема подключения. Так не придётся переводить весь файл целиком.

Что делать, если поставщик прислал плохой скан?

Попросить исходный PDF, Word-версию или хотя бы более чёткий файл. Если другого варианта нет, перевод начинается с распознавания и ручной сверки рискованных мест.

Нужно ли переводить артикулы и коды моделей?

Обычно нет. Артикулы и коды сохраняют, а переводят пояснение рядом: тип детали, назначение, материал, предупреждение или характеристику.

Что делать дальше

Пришлите сам PDF, ссылку на товар или фото модели. По нескольким страницам можно быстро понять, где обычный перевод, где OCR, а где нужна ручная разборка схем и маркировки.

Связанная услуга: Перевод PDF с китайского