Сканы и OCR

Перевод сканов и распознанных документов

Скан сначала нужно превратить в пригодный текст: распознать, проверить ошибки OCR, вернуть таблицы и только после этого переводить.

Короткий ответ

Коротко: Перевод сканов и распознанных документов. Работа начинается с просмотра исходника: сканированные PDF, фотографии документов, старые инструкции, архивы технических документов. В результате нужен перевод, где сохранены термины, числа, таблицы, обозначения и структура файла. Для расчёта укажите языковую пару, срок, формат сдачи и назначение документа. Ключевые задачи: перевод сканов, перевод отсканированного документа, перевод скана pdf.

Сканы и фотографии документов нельзя корректно перевести как обычный редактируемый текст. Сначала нужно распознать содержание, проверить результат OCR, восстановить структуру и только после этого переводить материал.

Мы работаем со сканами технических, товарных, юридических, проектных и коммерческих документов, включая таблицы, подписи, печати, схемы и приложения.

Кратко об услуге

Тип услугиСканы и OCR
Кому подходиткомпании со сканами старой документации, импортёры и сервисные компании, производственные предприятия, юридические и технические отделы
Документысканированные PDF, фотографии документов, старые инструкции, архивы технических документов, таблицы и приложения, чертежи с подписями
ФорматыPDF, Word, Excel, PowerPoint, InDesign, сканы, архивы документов
Результатпереведённые файлы с сохранением структуры, терминологии и согласованных требований

Что переводим

Перевод сканов и распознанных документов: OCR, PDF, изображения, таблицы, инструкции и архивы с проверкой текста после распознавания.

  • сканированные PDF
  • фотографии документов
  • старые инструкции
  • архивы технических документов
  • таблицы и приложения
  • чертежи с подписями
  • сертификаты и акты
  • многостраничные сканы

Для кого подходит услуга

Типичная ситуация — есть PDF или скан, который нельзя просто скопировать в переводчик. Сначала оцениваем, извлекается ли текст, какие страницы требуют распознавания и насколько нужно сохранять исходную вёрстку.

  • компании со сканами старой документации
  • импортёры и сервисные компании
  • производственные предприятия
  • юридические и технические отделы
  • проектные и тендерные команды

Почему OCR требует проверки

Распознавание может ошибаться в цифрах, единицах измерения, индексах, артиклах, коротких обозначениях и текстах на изображениях. В технических документах такие ошибки критичны, поэтому после OCR нужна проверка исходного текста.

  • оцениваем качество скана и читаемость
  • распознаём текст и структуру документа
  • проверяем цифры, обозначения и таблицы
  • переводим и передаём результат в согласованном формате

Excel перед запуском: перевод сканов и распознанных документов

На входеДля задачи “перевод сканов и распознанных документов” обычно присылают Excel-файл с тысячами строк: артикулы, характеристики, названия товаров, скрытые листы, формулы и колонки, которые нельзя менять.
Где рискДля “перевод сканов и распознанных документов” риск такой: если перевести всё подряд, можно сломать формулы, изменить коды моделей, затереть справочные значения или нарушить порядок строк
Что делаемВ задаче “перевод сканов и распознанных документов” фиксируем переводимые колонки, защищаем формулы и коды, проверяем повторы, делаем тестовый фрагмент и сдаём таблицу партиями
Что сдаёмНа выходе по задаче “перевод сканов и распознанных документов”: excel в исходной структуре: перевод в нужных колонках, непереводимые поля без изменений, формулы и порядок строк сохранены

Как проходит работа

  • предварительная оценка исходников и объёма
  • согласование языковой пары, сроков и формата результата
  • работа с терминологией, единицами измерения, таблицами и обозначениями
  • редактура и проверка чисел, подписей, ссылок и структуры документа
  • передача результата в согласованном формате

Что прислать вместе с файлом

Для точной оценки и аккуратного результата лучше приложить редактируемые исходники, старые переводы, глоссарий, список непереводимых названий, требования к единицам измерения и комментарий, где будет использоваться готовый документ. Это особенно помогает в больших комплектах, где одни и те же термины повторяются в инструкциях, каталогах, спецификациях и таблицах.

Частые вопросы

Что делать, если текст в PDF не выделяется?

Такой файл обычно является сканом. Сначала нужно распознавание текста, затем перевод и проверка результата после OCR.

Можно ли перевести фото документа?

Да, если качество изображения позволяет распознать текст. Перед расчётом оцениваем читаемость, язык, объём и формат результата.

Расчёт стоимости

Получите оценку перевода по файлу

Пришлите документ, архив или ссылку на материалы. Мы оценим объём, формат, тематику, срочность, необходимость распознавания, редактуры и сохранения вёрстки.

Предварительный калькулятор · Бриф для заявки · Чек-лист файлов · Формат результата