Короткий ответ
Онлайн-сервис чаще всего справляется только с текстовым слоем PDF. В китайских инструкциях и каталогах много текста в картинках, таблицах, шильдиках и схемах. Эти места приходится разбирать вручную: извлекать текст, сверять коды, смотреть изображение и возвращать перевод в понятный формат.
Кратко
- Редактируемый PDF и сканированный PDF ведут себя по-разному: первый можно извлечь, второй сначала распознают.
- Подписи на схемах, шильдики, маркировка и мелкие таблицы часто не попадают в автоматический перевод.
- Для закупки, сервиса или продажи товара китайский PDF лучше переводить с проверкой кодов, единиц измерения и обозначений.
Что подготовить
- Сам китайский PDF полностью, а не только отдельные страницы
- Фото оборудования, шильдика или упаковки, если они есть
- Ссылку на модель или страницу поставщика
- Список разделов, которые точно нужны в переводе
- Формат результата: Word, Excel или PDF с оформлением
- Пометки, какие коды, бренды и артикулы не переводить
Где онлайн-перевод обычно ломается
Китайский PDF от поставщика редко бывает чистым текстовым документом. Внутри могут быть отсканированные страницы, таблицы из картинок, скриншоты интерфейса, схемы подключения, предупреждения на плашках и мелкие подписи около стрелок. Онлайн-переводчик видит только часть такого файла.
Типичная картина: основной абзац перевёлся, а возле схемы остались иероглифы; таблица с характеристиками превратилась в набор строк; код модели был принят за слово; единица измерения оказалась оторвана от числа. Для ознакомления этого может хватить. Для инструкции, каталога или комплекта поставки — нет.
Скан без текстового слоя сначала нужно распознать
Если текст не выделяется мышкой, PDF фактически является изображением. Перед переводом его распознают через OCR. Но OCR не гарантирует чистый результат: похожие иероглифы, мелкие цифры, слабый контраст, размытые печати и наклон страницы дают ошибки.
После распознавания китайский текст нужно сверить по изображению. Особенно это касается номеров моделей, размеров, напряжения, предупреждений, параметров температуры и давления. Одна неверная цифра в таблице может быть заметнее любого стилистического недочёта.
Подписи на схемах переводятся отдельно
В инструкциях к оборудованию много текста живёт не в абзацах, а прямо на картинках: возле кнопок, разъёмов, стрелок, элементов панели, блоков схемы. Автоматический перевод часто пропускает эти подписи или выносит их в конец страницы без связи с изображением.
При ручной подготовке такие подписи выписываются отдельно, переводятся с учётом изображения и возвращаются в понятный вид: таблицей, сносками, подписью к рисунку или макетом, если нужен финальный PDF.
Маркировка и коды не всегда переводятся
Код детали, артикул, обозначение серии, типоразмер, стандарт, модель и бренд обычно не переводятся дословно. Их нужно оставить как идентификатор и перевести пояснение рядом. Например, строка может содержать код модели, материал корпуса и предупреждение — это три разных типа информации.
Поэтому перед переводом фиксируется правило: что оставляем как есть, что транслитерируем, что переводим, а что переносим в глоссарий. Иначе один и тот же узел может получить два разных названия в инструкции и каталоге.
Как получить результат, которым можно пользоваться
Для внутреннего понимания часто достаточно Word-файла с переводом и комментариями к спорным местам. Для передачи сервисной службе удобнее таблица: номер страницы, исходная подпись, перевод, примечание. Для каталога или инструкции клиенту может понадобиться PDF с восстановленным оформлением.
До старта лучше показать 2–3 проблемные страницы: схему, таблицу характеристик и страницу со сканом. По ним сразу видно, нужен ли OCR, сколько ручной сверки понадобится и какой формат результата разумнее выбрать.
Вопросы по теме
Почему онлайн-переводчик пропускает китайские подписи на картинках?
Потому что для сервиса это не текст, а часть изображения. Такие подписи сначала извлекают или выписывают вручную, затем переводят и связывают с нужным элементом схемы.
Можно ли перевести только нужные страницы китайского PDF?
Да. Для оценки нужно указать диапазоны страниц или разделы: инструкция по монтажу, таблица характеристик, предупреждения, схема подключения. Так не придётся переводить весь файл целиком.
Что делать, если поставщик прислал плохой скан?
Попросить исходный PDF, Word-версию или хотя бы более чёткий файл. Если другого варианта нет, перевод начинается с распознавания и ручной сверки рискованных мест.
Нужно ли переводить артикулы и коды моделей?
Обычно нет. Артикулы и коды сохраняют, а переводят пояснение рядом: тип детали, назначение, материал, предупреждение или характеристику.
Что делать дальше
Пришлите сам PDF, ссылку на товар или фото модели. По нескольким страницам можно быстро понять, где обычный перевод, где OCR, а где нужна ручная разборка схем и маркировки.