Тестирование 15 программ для распознавания текста:
советы и результаты

AltВремя чтения — 7 минут AltИрина Журавлева
календарь
опубликовано
07.06.2024
star star star star star 4.7 Оценок: 87

Выбор эксперта: программа для распознавания текста

1 PDF Commander — многофункциональная программа для создания и редактирования файлов формата PDF.
Скачать Alt
2 PDF24 Tools — приложение на ПК и веб-сервис с инструментами для работы с ПДФ.
3 Img2txt — онлайн-приложение для преобразования картинок в текст.
Программы для распознавания текста

Программы для ПК

Десктопные PDF-редакторы многофункциональны, пригодятся для решения других задач. Можно создать файл с нуля, отредактировать его, конвертировать в любой формат.

PDF Commander

Доступные языки: русский, английский

Программа для распознавания текста

Текст определился точно, сохранилась вся первоначальная структура, иллюстрации. Термины на английском распознаны правильно, без псевдографики. После завершения процесса работает поиск по словам, можно вносить правки.

Программа от российского разработчика выполняет OCR в PDF и картинках. Вы можете преобразовать все или только отдельные страницы и сохранить их в двух форматах — редактируемый ПДФ и TXT. В первом случае будет удобно продолжать работу в программе. Можно вносить правки в предложения, добавить картинки и надписи, рисовать. Доступно копирование для переноса в другой файл, экспорт в DOCX, RTF, XLS, HTML.

Плюсы:

  • есть версии для Windows и Linux;
  • совместим со сканерами разных моделей — можно сканировать напрямую из софта;
  • доступно распознавание в фоновом режиме;
  • выполняет автоматический перевод на/с английского.

Минусы:

  • не работает на macOS.
Один из лучших PDF-редакторов для бизнеса. Позволяет шифровать информацию, менять метаданные, ставить штампы, подписывать документы с помощью факсимиле или ЭЦП. Можно проверить цифровую подпись.
Скачать бесплатно load-icon
Подходит для Windows 11, 10, 8 и 7

PDFelement

Доступные языки: русский, английский, немецкий, испанский и др (всего 20).

PDFelement

Можно выбирать формат сканирования — поиск текста на изображении
или преобразования документа в редактируемый вид.

Кроссплатформенный PDF-редактор с расширенным функционалом. Вы сможете не только сделать правки, но и проверить содержимое на ошибки или сравнить отредактированную версию с оригиналом. Оснащен AI-модулем на базе Chat GPT, с помощью которого можно генерировать и переводить статьи.

Плюсы:

  • можно создавать и заполнять формы со штрих-кодами для захвата данных;
  • поддерживает ЭЦП;
  • может устанавливать защиту от копирования;
  • есть функция пакетной обработки.

Минусы:

  • OCR-модуль не входит в базовый пакет, требуется дополнительная установка;
  • в триал-версии на выходе ставится водяной знак;
  • нельзя установить на слабые ПК ранних поколений, нужна ОС 64-бит.

Полезное для работы:

О том, как сканировать печатные и рукописные документы, читайте в статье.

Подробнее
Как сканировать документы

FreeOCR

Доступные языки: финский, английский, датский и др. (всего 11)

FreeOCR

При обработке не сохраняются иллюстрации, не распознаются таблицы, не сохраняется структура. Нет поддержки русского языка, так что перевод придется делать с помощью другого софта.

Простой инструмент для ПК с Windows для преобразования изображений, сканов, скриншотов в текст. Результат можно сохранить в формате TXT-документа.

Плюсы:

  • полностью бесплатный;
  • можно настраивать стиль шрифта;
  • совместим со сканерами.

Минусы:

  • очень редко выходят обновления;
  • нельзя сохранить редактируемый PDF-файл.

ABBYY FineReader

Доступные языки: русский, английский, немецкий, испанский

ABBYY FineReader

Инструмент достаточно эффективен в работе, но не очень удачно реализована функция последующей работы с распознанным файлом. Необходимо его сохранить и перейти из окна с OCR в основной редактор.

Кроссплатформенное ПО может значительно облегчить работу с данными. После распознавания вы можете внести правки в извлеченный текст, а потом сравнить результат с оригиналом с помощью специального алгоритма.

Плюсы:

  • интегрируется с офисными программами;
  • определяются таблицы;
  • работает в цветном и ч/б-режиме.

Минусы:

  • тестовый период всего 7 дней;
  • для скачивания триал-версии нужно отправить заявку с указанием своего имени, контактных данных, места работы;
  • высокая стоимость подписки — от 69$ в год на macOS и от 99$ в год для Windows;
  • оплата картами российских банков не предусмотрена.

LightPDF

Доступные языки: русский, английский, испанский, немецкий (всего 20+).

LightPDF

Софт точно определяет символы даже на нечетких изображениях. Но неудобно, что для дальнейших действий нужно каждый раз заново загружать ПДФ-файл.

Мультиплатформенное приложение для ПК и мобильных устройств. Вы сможете конвертировать текст с картинки в DOC или PDF, изменить содержание, вырезать страницы, поставить пароль.

Плюсы:

  • можно установить на ПК и смартфоны с разными ОС и работать онлайн;
  • в платной версии есть пакетная обработка;
  • результат можно сохранить как DOC, PPT, XLS, TXT, HTML.

Минусы:

  • для сканирования требуется установка отдельного приложения;
  • меню не русифицировано;
  • в триал-версии много ограничений — нет пакетной обработки, можно отредактировать только один PDF-файл в сутки.
При оформлении подписки пользователи получают доступ к AI-инструментам. С их помощью можно генерировать таблицы на основе загруженных данных, составлять конспекты, анализировать информацию.

PDF24 tools

Доступные языки: русский, английский, арабский (всего 30+).

PDF24 tools

В приложении можно обрабатывать сразу несколько файлов разного формата. Просмотр результата возможен только в новой вкладке либо с помощью стороннего софта.

Представляет собой комплект из 45+ утилит для работы с PDF. Оснащен хорошим OCR, он может сразу удалить на изображении фон, выровнять листы или настроить автоповорот.

Плюсы:

  • доступен полностью бесплатно без лимитов и ограничений;
  • сохраняет абзацы, заголовки, таблицы как в исходном материале.

Минусы:

  • если скан плохого качества, часто выдает ошибки;
  • для каждой операции нужно заново открывать Tool Box — нельзя просто перейти в новое окно;
  • чтобы получить полный доступ к опциям, требуется установка приложения Launcher.
Помимо десктопного приложения у PDF24 есть онлайн-версия, практически не отличающаяся по функциональности от версии для ПК.

Онлайн-сервисы

Для решения разовых задач можно не устанавливать софт на ПК. Расскажем, какие программы предназначены для оптического распознавания сканированного текста онлайн.

i2OCR

Доступные языки: русский, английский, немецкий, французский (всего 100+)

i2OCR

Обработка выполнена практически без ошибок. Структура сохранена.
Правда содержащиеся на других листах картинки не определились.

Бесплатная онлайн-программа для OCR-распознавания содержания сканов. Поддерживает импорт данных с жесткого диска и по ссылке из сети. Сохранять можно в PDF, DOC, TXT и HTML.

Плюсы:

  • не требует регистрации;
  • позволяет преобразовывать документы любого объема;
  • нет лимита на количество загрузок.

Минусы:

  • для работы с русскоязычными данными требуется включить VPN;
  • не сохраняются заголовки, таблицы, иллюстрации на странице;
  • не поддерживает PDF-файлы и картинки с разрешением выше 200 dpi.

GO4Convert

Доступные языки: английский, русский, болгарский, арабский (всего 30+)

GO4Convert

Не всегда точно определяются англоязычные слова.
Если скан нечеткий, результат не считывается — в содержании пропуски.

Простой онлайн-сервис для преобразования PDF, BMP, GIF, JPEG, TIFF, PNG в редактируемую версию. Кроме этого оснащен файловым конвертером.

Плюсы:

  • безлимитный бесплатный доступ без регистрации;
  • есть разбивка ПДФ на страницы, объединение, сжатие;
  • возможен импорт по ссылке.

Минусы:

  • нельзя править результат на сайте;
  • экспорт возможен только в TXT.

OnlineOCR.net

Доступные языки: русский, английский, португальский (всего 30+)

OnlineOCR.net

При определении возникли проблемы со словами, написанными латиницей. Но в целом результат удовлетворительный.

Онлайн-сервис для определения символов на изображениях. Зарегистрированным пользователям предоставляется большой выбор вариантов экспорта, остальным доступны только форматы DOCX, XLSX, TXT.

Плюсы:

  • для доступа не обязательно создавать аккаунт и оформлять подписку;
  • можно получить дополнительные лимиты, поделившись ссылкой на ресурс.

Минусы:

  • в триал-версии доступно до 15 операций в час;
  • экспорт в PDF возможен только платно.

NewOCR

Доступные языки: русский, английский, немецкий, польский (всего 122)

NewOCR

Сохранились структурные особенности. Для правок потребуется дополнительный софт.

Онлайн-сервис позволяет быстро перевести отсканированные изображения в редактируемый вид. На платформе предусмотрена возможность изменить ориентацию листа, кадрировать поля или вырезать фрагмент с картинки.

Плюсы:

  • не нужна подписка и регистрация;
  • высокая скорость обработки;
  • можно выполнить перевод с помощью Google Translate или Bing Translator.

Минусы:

  • можно только повернуть страницу или обрезать поля;
  • интерфейс не русифицирован.

Полезное для работы:

Узнайте, как конвертировать PDF-документ в DOCX 12 способами из нашей статьи.

Подробнее
Как конвертировать PDF в DOCX

Img2txt

Доступные языки: русский, английский, немецкий, китайский, японский (всего 35+)

Img2txt

Структура не сохраняется. Зато можно внести правки на платформе или перейти в Google Docs. Удобно, что сразу подсвечиваются грамматические ошибки и опечатки.

Бесплатный онлайн-программа c OCR для перевода и распознавания текста на изображении. Поддерживает многостраничные документы. Экспорт возможен в виде TXT, а также адаптированных файлов для Adobe Acrobat, MS Word и Open Office.

Плюсы:

  • доступен без регистрации и оплаты;
  • не установлены лимиты на количество операций;
  • есть русская локализация;
  • интегрируется с сервисами Google.

Минусы:

  • пропускает символы на языке, отличном от выбранного;
  • нельзя загрузить файлы больше 8 МБ;
  • если буквы мелкие или плохо пропечатаны, возникают ошибки;
  • в многостраничных материалах каждый лист скачивается отдельно.
У сервиса несколько неудобный рабочий алгоритм — если на фотографии текст ищется сразу, то в случае ПДФ после загрузки нужно снова устанавливать настройки языка.

Convertio.co

Доступные языки: русский, английский, немецкий, датский (всего более 50)

Convertio.co

Распознание выполнено довольно точно. Стоит отметить, что при разборчивом почерке
ПО способно обрабатывать рукописные сканы.

Онлайн-преобразователь сканов определяет символы в PDF-документах и на картинках, затем конвертирует результат в различные форматы. Позволяет работать с двуязычными материалами. Можно настроить диапазон страниц.

Плюсы:

  • возможен бесплатный доступ без авторизации;
  • поддерживает импорт из облачных хранилищ;
  • позволяет настраивать форматы экспорта, в том числе выбор версий DOC.

Минусы:

  • без подписки очень низкая скорость;
  • в триал-версии можно загрузить всего 10 страниц;
  • нет предпросмотра результата.

CamScanner

Доступные языки: русский, английский, немецкий, французский, китайский (всего 60)

CamScanner

Инструмент правильно извлекает содержание. Но для дальнейшей корректуры требуется другие ПДФ-редакторы.

Представлен в виде веб-сервиса, десктопной программы для Windows и macOS, приложения для Android и Windows. Экспорт возможен в форматы MS Office, RTF, PDF, TXT.

Плюсы:

  • поддерживает экспорт в Google Drive, Dropbox, сохранение на сервере;
  • позволяет работать с ZIP-архивами;
  • находит таблицы и преобразовывает их в XLS.

Минусы:

  • сканирование возможно только в мобильной версии;
  • десктопная и онлайн-программы не русифицированы;
  • требуется регистрация по e-mail или номеру телефона.

OCRconvert

Доступные языки: русский, английский, французский (всего 30)

OCRconvert

Латинские буквы заменены на русские, в результате получилась абракадабра.

Сервис определяет текстовое содержимое на изображениях, загруженных с диска или через URL. Поддерживает 30 языков, но с двуязычным содержанием работает некорректно.

Плюсы:

  • обрабатывает картинки в низком разрешении;
  • не установлены лимиты на количество действий;
  • при регистрации можно настроить рассылку уведомлений о завершении конвертации.

Минусы:

  • максимальный размер изображения — 5 МБ;
  • хотя в описании заявлена поддержка PDF-формата, в реальности загрузить его нельзя;
  • нет русской локализации.

OCRgeek

Доступные языки: русский, английский, китайский (всего 30)

OCRgeek

Процесс занял более 1,5 минут. При этом результат неудовлетворительный — выдан бессмысленный набор кириллических и латинских символов.

Разработчики позиционируют сервис как простой и эффективный инструмент. Но при тестировании OCRgeek показал себя не лучшим образом. Сложные технические тексты, где встречаются разноязычные символы, распознаются неточно.

Плюсы:

  • доступен бесплатно и без регистрации.

Минусы:

  • некорректно определяет буквы даже на сканах и фото высокого качества;
  • нельзя указать язык;
  • много рекламы.
Даже если вы загружаете PDF-файл, сохранить его в том же формате не получится. Сохранение возможно только в TXT или DOCS.

Для тех, кто торопится: какую выбрать бесплатную OCR-программу для распознавания текста PDF?

По результатам тестирования наши эксперты создали собственный рейтинг софта с OCR:

  1. 1. PDF Commander — полнофункциональная программа позволяет распознавать текст на сканах и фотографиях, вносить правки, форматировать, делать закладки. Подходит для решения бизнес-задач, учебы и дома.
  2. 2. PDF24 Tools — бесплатный сервис располагает инструментами для определения надписей. Представлен в двух версиях — десктопной и онлайн.
  3. 3. Img2txt — онлайн-приложение для быстрого конвертирования картинок в текстовый формат. Позволяет работать без регистрации.

Ответы на часто задаваемые вопросы

Как работает OCR?

Текст преобразуется в растровое изображение, состоящее из множества точек. Программа анализирует их последовательность с помощью машинных алгоритмов — проверяет комбинации пикселей на совпадение с буквами определяемого языка. Затем переводит нарисованные символы в удобный вам формат.

Распознают ли программы рукописный текст?

Некоторые редакторы способны преобразовать рукописные материалы в электронные. Например, такая функция есть в ABBYY FineReader, правда определение происходит не всегда корректно, особенно при неразборчивом почерке, нестандартном написании букв.

Какие форматы файлов поддерживает программа для ввода и вывода данных?

Число форматов зависит от софта. Так, PDF Commander позволяет распознать символы в ПДФ-сканах, картинках JPG, JPEG, BMP, GIF, PNG, TIFF. Сохранить результат можно в DOC, RTF, TXT, WMF — всего 15+ форматов.

Alt

Установите PDF Commander

PDF Commander – это русскоязычная программа для работы с документами в формате PDF. С её помощью вы сможете:

  • Масштабировать листы, как вам удобно;
  • Извлечь текст и картинки из ПДФ-файлов;
  • Добавить заметки и закладки на страницах;
  • Установить подпись и штамп;
  • Защитить текст с помощью пароля;
Скачать бесплатно Alt
Подходит для Windows 11, 10, 8 и 7