Программы для ПК
Десктопные PDF-редакторы многофункциональны, пригодятся для решения других задач. Можно создать файл с нуля, отредактировать его, конвертировать в любой формат.
PDF Commander
Доступные языки: русский, английский
Программа от российского разработчика выполняет OCR в PDF и картинках. Вы можете преобразовать все или только отдельные страницы и сохранить их в двух форматах — редактируемый ПДФ и TXT. В первом случае будет удобно продолжать работу в программе. Можно вносить правки в предложения, добавить картинки и надписи, рисовать. Доступно копирование для переноса в другой файл, экспорт в DOCX, RTF, XLS, HTML.
Плюсы:
- есть версии для Windows и Linux;
- совместим со сканерами разных моделей — можно сканировать напрямую из софта;
- доступно распознавание в фоновом режиме;
- выполняет автоматический перевод на/с английского.
Минусы:
- не работает на macOS.
PDFelement
Доступные языки: русский, английский, немецкий, испанский и др (всего 20).
Кроссплатформенный PDF-редактор с расширенным функционалом. Вы сможете не только сделать правки, но и проверить содержимое на ошибки или сравнить отредактированную версию с оригиналом. Оснащен AI-модулем на базе Chat GPT, с помощью которого можно генерировать и переводить статьи.
Плюсы:
- можно создавать и заполнять формы со штрих-кодами для захвата данных;
- поддерживает ЭЦП;
- может устанавливать защиту от копирования;
- есть функция пакетной обработки.
Минусы:
- OCR-модуль не входит в базовый пакет, требуется дополнительная установка;
- в триал-версии на выходе ставится водяной знак;
- нельзя установить на слабые ПК ранних поколений, нужна ОС 64-бит.
Полезное для работы:
О том, как сканировать печатные и рукописные документы, читайте в статье.
ПодробнееFreeOCR
Доступные языки: финский, английский, датский и др. (всего 11)
Простой инструмент для ПК с Windows для преобразования изображений, сканов, скриншотов в текст. Результат можно сохранить в формате TXT-документа.
Плюсы:
- полностью бесплатный;
- можно настраивать стиль шрифта;
- совместим со сканерами.
Минусы:
- очень редко выходят обновления;
- нельзя сохранить редактируемый PDF-файл.
ABBYY FineReader
Доступные языки: русский, английский, немецкий, испанский
Кроссплатформенное ПО может значительно облегчить работу с данными. После распознавания вы можете внести правки в извлеченный текст, а потом сравнить результат с оригиналом с помощью специального алгоритма.
Плюсы:
- интегрируется с офисными программами;
- определяются таблицы;
- работает в цветном и ч/б-режиме.
Минусы:
- тестовый период всего 7 дней;
- для скачивания триал-версии нужно отправить заявку с указанием своего имени, контактных данных, места работы;
- высокая стоимость подписки — от 69$ в год на macOS и от 99$ в год для Windows;
- оплата картами российских банков не предусмотрена.
LightPDF
Доступные языки: русский, английский, испанский, немецкий (всего 20+).
Мультиплатформенное приложение для ПК и мобильных устройств. Вы сможете конвертировать текст с картинки в DOC или PDF, изменить содержание, вырезать страницы, поставить пароль.
Плюсы:
- можно установить на ПК и смартфоны с разными ОС и работать онлайн;
- в платной версии есть пакетная обработка;
- результат можно сохранить как DOC, PPT, XLS, TXT, HTML.
Минусы:
- для сканирования требуется установка отдельного приложения;
- меню не русифицировано;
- в триал-версии много ограничений — нет пакетной обработки, можно отредактировать только один PDF-файл в сутки.
PDF24 tools
Доступные языки: русский, английский, арабский (всего 30+).
Представляет собой комплект из 45+ утилит для работы с PDF. Оснащен хорошим OCR, он может сразу удалить на изображении фон, выровнять листы или настроить автоповорот.
Плюсы:
- доступен полностью бесплатно без лимитов и ограничений;
- сохраняет абзацы, заголовки, таблицы как в исходном материале.
Минусы:
- если скан плохого качества, часто выдает ошибки;
- для каждой операции нужно заново открывать Tool Box — нельзя просто перейти в новое окно;
- чтобы получить полный доступ к опциям, требуется установка приложения Launcher.
Онлайн-сервисы
Для решения разовых задач можно не устанавливать софт на ПК. Расскажем, какие программы предназначены для оптического распознавания сканированного текста онлайн.
i2OCR
Доступные языки: русский, английский, немецкий, французский (всего 100+)
Бесплатная онлайн-программа для OCR-распознавания содержания сканов. Поддерживает импорт данных с жесткого диска и по ссылке из сети. Сохранять можно в PDF, DOC, TXT и HTML.
Плюсы:
- не требует регистрации;
- позволяет преобразовывать документы любого объема;
- нет лимита на количество загрузок.
Минусы:
- для работы с русскоязычными данными требуется включить VPN;
- не сохраняются заголовки, таблицы, иллюстрации на странице;
- не поддерживает PDF-файлы и картинки с разрешением выше 200 dpi.
GO4Convert
Доступные языки: английский, русский, болгарский, арабский (всего 30+)
Простой онлайн-сервис для преобразования PDF, BMP, GIF, JPEG, TIFF, PNG в редактируемую версию. Кроме этого оснащен файловым конвертером.
Плюсы:
- безлимитный бесплатный доступ без регистрации;
- есть разбивка ПДФ на страницы, объединение, сжатие;
- возможен импорт по ссылке.
Минусы:
- нельзя править результат на сайте;
- экспорт возможен только в TXT.
OnlineOCR.net
Доступные языки: русский, английский, португальский (всего 30+)
Онлайн-сервис для определения символов на изображениях. Зарегистрированным пользователям предоставляется большой выбор вариантов экспорта, остальным доступны только форматы DOCX, XLSX, TXT.
Плюсы:
- для доступа не обязательно создавать аккаунт и оформлять подписку;
- можно получить дополнительные лимиты, поделившись ссылкой на ресурс.
Минусы:
- в триал-версии доступно до 15 операций в час;
- экспорт в PDF возможен только платно.
NewOCR
Доступные языки: русский, английский, немецкий, польский (всего 122)
Онлайн-сервис позволяет быстро перевести отсканированные изображения в редактируемый вид. На платформе предусмотрена возможность изменить ориентацию листа, кадрировать поля или вырезать фрагмент с картинки.
Плюсы:
- не нужна подписка и регистрация;
- высокая скорость обработки;
- можно выполнить перевод с помощью Google Translate или Bing Translator.
Минусы:
- можно только повернуть страницу или обрезать поля;
- интерфейс не русифицирован.
Полезное для работы:
Узнайте, как конвертировать PDF-документ в DOCX 12 способами из нашей статьи.
ПодробнееImg2txt
Доступные языки: русский, английский, немецкий, китайский, японский (всего 35+)
Бесплатный онлайн-программа c OCR для перевода и распознавания текста на изображении. Поддерживает многостраничные документы. Экспорт возможен в виде TXT, а также адаптированных файлов для Adobe Acrobat, MS Word и Open Office.
Плюсы:
- доступен без регистрации и оплаты;
- не установлены лимиты на количество операций;
- есть русская локализация;
- интегрируется с сервисами Google.
Минусы:
- пропускает символы на языке, отличном от выбранного;
- нельзя загрузить файлы больше 8 МБ;
- если буквы мелкие или плохо пропечатаны, возникают ошибки;
- в многостраничных материалах каждый лист скачивается отдельно.
Convertio.co
Доступные языки: русский, английский, немецкий, датский (всего более 50)
Онлайн-преобразователь сканов определяет символы в PDF-документах и на картинках, затем конвертирует результат в различные форматы. Позволяет работать с двуязычными материалами. Можно настроить диапазон страниц.
Плюсы:
- возможен бесплатный доступ без авторизации;
- поддерживает импорт из облачных хранилищ;
- позволяет настраивать форматы экспорта, в том числе выбор версий DOC.
Минусы:
- без подписки очень низкая скорость;
- в триал-версии можно загрузить всего 10 страниц;
- нет предпросмотра результата.
CamScanner
Доступные языки: русский, английский, немецкий, французский, китайский (всего 60)
Представлен в виде веб-сервиса, десктопной программы для Windows и macOS, приложения для Android и Windows. Экспорт возможен в форматы MS Office, RTF, PDF, TXT.
Плюсы:
- поддерживает экспорт в Google Drive, Dropbox, сохранение на сервере;
- позволяет работать с ZIP-архивами;
- находит таблицы и преобразовывает их в XLS.
Минусы:
- сканирование возможно только в мобильной версии;
- десктопная и онлайн-программы не русифицированы;
- требуется регистрация по e-mail или номеру телефона.
OCRconvert
Доступные языки: русский, английский, французский (всего 30)
Сервис определяет текстовое содержимое на изображениях, загруженных с диска или через URL. Поддерживает 30 языков, но с двуязычным содержанием работает некорректно.
Плюсы:
- обрабатывает картинки в низком разрешении;
- не установлены лимиты на количество действий;
- при регистрации можно настроить рассылку уведомлений о завершении конвертации.
Минусы:
- максимальный размер изображения — 5 МБ;
- хотя в описании заявлена поддержка PDF-формата, в реальности загрузить его нельзя;
- нет русской локализации.
OCRgeek
Доступные языки: русский, английский, китайский (всего 30)
Разработчики позиционируют сервис как простой и эффективный инструмент. Но при тестировании OCRgeek показал себя не лучшим образом. Сложные технические тексты, где встречаются разноязычные символы, распознаются неточно.
Плюсы:
- доступен бесплатно и без регистрации.
Минусы:
- некорректно определяет буквы даже на сканах и фото высокого качества;
- нельзя указать язык;
- много рекламы.
Для тех, кто торопится: какую выбрать бесплатную OCR-программу для распознавания текста PDF?
По результатам тестирования наши эксперты создали собственный рейтинг софта с OCR:
- 1. PDF Commander — полнофункциональная программа позволяет распознавать текст на сканах и фотографиях, вносить правки, форматировать, делать закладки. Подходит для решения бизнес-задач, учебы и дома.
- 2. PDF24 Tools — бесплатный сервис располагает инструментами для определения надписей. Представлен в двух версиях — десктопной и онлайн.
- 3. Img2txt — онлайн-приложение для быстрого конвертирования картинок в текстовый формат. Позволяет работать без регистрации.
Ответы на часто задаваемые вопросы
Текст преобразуется в растровое изображение, состоящее из множества точек. Программа анализирует их последовательность с помощью машинных алгоритмов — проверяет комбинации пикселей на совпадение с буквами определяемого языка. Затем переводит нарисованные символы в удобный вам формат.
Некоторые редакторы способны преобразовать рукописные материалы в электронные. Например, такая функция есть в ABBYY FineReader, правда определение происходит не всегда корректно, особенно при неразборчивом почерке, нестандартном написании букв.
Число форматов зависит от софта. Так, PDF Commander позволяет распознать символы в ПДФ-сканах, картинках JPG, JPEG, BMP, GIF, PNG, TIFF. Сохранить результат можно в DOC, RTF, TXT, WMF — всего 15+ форматов.