Короткий ответ
Скан перед переводом нужно проверить на читаемость: видны ли мелкие символы, не закрыт ли текст переплётом, не размыты ли таблицы, печати, подписи и иероглифы. Чем хуже исходник, тем больше ручной проверки после OCR и тем выше риск ошибки в цифрах, кодах и обозначениях.
Кратко
- Скан — это изображение, а не текст. Перед переводом его распознают и проверяют.
- Самые проблемные места: тени от переплёта, перекос, мелкий шрифт, таблицы, печати, подписи и текст на схемах.
- Если можно получить исходный Word, PDF или InDesign у поставщика, это почти всегда быстрее, чем восстанавливать плохой скан.
Что подготовить
- скан в максимальном доступном качестве, без сильного сжатия
- все страницы документа, включая приложения, таблицы и оборотные стороны
- понимание, нужен ли перевод текста только в Word или восстановление внешнего вида
- отдельные крупные фото страниц со схемами, если в основном PDF они плохо читаются
- исходник от поставщика, если его можно запросить
Плохой скан не становится хорошим после OCR
OCR распознаёт то, что видно на изображении. Если строка размазана, часть таблицы ушла в тень, а текст возле переплёта согнут дугой, программа не восстановит смысл сама. Она может перепутать цифры, латинские буквы, индексы, единицы измерения и короткие коды.
Перед отправкой скана откройте несколько страниц в увеличении 150–200%. Если вы сами не можете уверенно прочитать мелкий текст, переводчик тоже будет работать не с текстом, а с догадками.
Как сканировать технический документ
Лучше использовать сканер, а не фотографию с телефона. Страница должна лежать ровно, без пальцев, бликов, теней и сильного перекоса. Развороты лучше сканировать по одной странице, особенно если рядом с переплётом есть таблицы или подписи к рисункам.
Для документов с мелким шрифтом выбирайте высокое разрешение и не сжимайте файл повторно через мессенджер. Мессенджеры часто портят именно те детали, которые потом нужны: индексы, обозначения, мелкие китайские иероглифы, номера позиций.
Таблицы и схемы лучше фотографировать отдельно
Если в документе есть большая таблица, электрическая схема или лист с мелкими подписями, полезно приложить отдельный крупный снимок этой страницы. Общий PDF может быть пригоден для текста, но слаб для схемы.
Для чертежей и схем желательно присылать исходный DWG, PDF в хорошем качестве или хотя бы отдельный фрагмент с читаемыми позициями. Подписи на картинках редко распознаются без ручной проверки.
Когда стоит запросить исходник у поставщика
Если документ пришёл как скан китайской инструкции, каталога или паспорта оборудования, сначала стоит попросить у поставщика оригинальный PDF, Word, Excel или InDesign. Даже если поставщик пришлёт неидеальный файл, он часто окажется лучше фотографии печатной копии.
Исходник особенно нужен для каталогов, инструкций с большим количеством рисунков, сертификатов, прайс-листов и документов, где важны таблицы. Это сокращает время на распознавание и уменьшает риск ручных ошибок.
Что будет на выходе после перевода скана
Вариант результата зависит от задачи. Для внутреннего понимания можно сдать Word с переводом по страницам. Для клиента или сертификации часто нужен аккуратно оформленный PDF. Для таблиц лучше восстановить структуру в Excel, если она влияет на работу с данными.
Если исходник плохой, в готовом переводе могут остаться пометки для проверки: неразборчивое место, сомнительный символ, неполная подпись. Лучше увидеть такую пометку, чем получить уверенно написанную ошибку.
Вопросы по теме
Можно ли прислать фото вместо скана?
Можно, если текст резкий, страница ровная и нет бликов. Для технической документации фото часто хуже скана, особенно на таблицах, схемах и мелких обозначениях.
Какой формат скана лучше?
PDF удобен для комплекта страниц. Для отдельных проблемных страниц можно приложить PNG или JPG в высоком качестве. Не стоит отправлять только сжатые изображения из мессенджера.
Что делать, если часть текста не читается?
Лучше запросить исходник или переснять страницу крупнее. Если это невозможно, неразборчивые места отмечаются отдельно и не переводятся “по догадке”.
Нужно ли распознавать скан самостоятельно?
Не обязательно. Часто лучше прислать исходный скан: при самостоятельном OCR можно потерять таблицы, подписи и порядок блоков.
Что делать дальше
Для предварительной оценки скана достаточно прислать весь файл и 2–3 самые сложные страницы отдельно: таблицу, схему, страницу с мелким текстом или разворот возле переплёта.