Как эксперты PDF Commander проверяют софт для обзора?
- Изучают тарифы и политику разработчиков
- Тестируют программы на разных ПК
- Исследуют отзывы реальных пользователей
- Проверяют доступность и качество поддержки
- Исключают софт, который не обновляется
Формат PDF сегодня используют повсюду: в бухгалтерских отчетах, договорах, учебных пособиях и научных публикациях. Нередко нужно скопировать цитату, перенести данные в другой документ или взять реквизиты из соглашения. Однако сделать это удается не всегда — файл может быть защищен от копирования или прислан в виде скан-копии. В статье расскажу, как скопировать текст из ПДФ файла на компьютере и телефоне, и дам подробные инструкции со скриншотами для каждого шага.
От чего зависит возможность копирования
Возможность сохранить и перенести данные из ПДФ-документа зависит от особенностей файла.
- Если PDF создан на основе текстового документа TXT или DOC, электронной таблицы XLS, то он содержит буквенные и числовые символы, которые можно без труда скопировать.
- Когда страницы файла получены со сканера или камеры, внутри находится не текст, а изображения с буквами. Внешне PDF-документ выглядит как текстовый, но при попытке выделения ничего не происходит.
- Если установлен пароль на редактирование или копирование текста, строки визуально выделяются, но «вытащить» их не получается.
Если документ содержит обычный текстовый слой, достаточно открыть его в специальном редакторе и воспользоваться инструментом выделения. Ниже рассмотрим процесс копирования на примере программы PDF Commander.
Выделение фрагмента и перенос в другой документ
Когда документ создан в ПДФ-редакторе или переконвертирован из Word или Excel-файлов, проблемы, как в PDF выделить фрагмент и скопировать его, не возникает. Показываю, как перенести отдельный раздел текста в новый ПДФ.
- 1. Запустите программу. В стартовом окне нажмите «Выберите файл».
- 2. Когда документ откроется, найдите нужный фрагмент и кликните на «Редактировать».
- 3. Выделите текст мышкой. Вызовите правым кликом окошко меню и щелкните «Копировать».
- 4. Зайдите в меню «Файл» и кликните на «Создать» — «Пустой PDF».
- 5. Когда новый файл откроется в соседней вкладке, кликните на иконку с буквой «Т»
- 6. Укажите курсором на начальную точку ввода и вставьте скопированный текст на страницу.
- 7. Настройте свойства текста: тип и размер шрифта, цвет заливки, а также межстрочный интервал и способ выравнивания.
- 8. Сохраните результат в ПДФ или экспортируйте в другие форматы для дальнейшей работы в текстовом или табличном редакторе.
Копирование всего содержимого документа
В «Блокноте» или любом текстовом редакторе можно воспользоваться комбинацией клавиш:
- «Ctrl+A» выделяет данные на всех страницах,
- «Ctrl+C» сохраняет информацию в буфере памяти,
- «Ctrl+V» используется для вставки.
Но у PDF-документа своя структура: он состоит из отдельных блоков: абзацев, таблиц и картинок, поэтому выделение «всего текста» не срабатывает — захватывается только часть содержимого.
Переносить данные по кускам неудобно, особенно если файл большой. В такой ситуации практичнее преобразовать его в TXT или RTF. После конвертации содержимое становится сплошным, и вопрос, как скопировать сразу весь текст в ПДФ, легко решается.
- 1. Щелкните на левой панели «Конвертировать PDF» и вставьте файл.
- 2. Задайте выходной формат.
- 3. Настройте параметры экспорта. Вы можете оставить структуру файла неизменной или просто извлечь текст. Укажите, нужно ли сохранять изображения или распознавать символы в таблице, оставить оригинальный размер и стиль шрифта.
- 4. Дождитесь завершения конвертации. Если файл содержит большое количество страниц, переключитесь на фоновый режим — пока программа будет преобразовывать PDF, вы сможете работать с другими документами.
- 5. Теперь вы можете перейти в текстовое приложение — нажмите кнопку «Открыть файл» , обведенную красной рамкой.
- 6. Используйте стандартные комбинации горячих клавиш для выделения содержимого, копирования и вставки данных.
Перевод документа в редактируемый формат
Скан не содержит текста — это просто цифровой слепок страниц, выделять слова и фразы и копировать их не получится. Расскажу, что нужно сделать, чтобы можно было копировать текст из отсканированного PDF, и покажу, как действовать пошагово, чтобы превратить файл в редактируемый. Нам поможет функция оптического распознавания текста (OCR).
- 1. Когда вы открываете PDF-скан, программа определяет это автоматически, и сама предлагает перевести его в редактируемый вид.
- 2. Укажите диапазон страниц — все, текущая или отдельные листы. Выберите один или более языков, а если базового набора словарей не хватает, загрузите дополнительные (всего доступно 100+ языков, что очень удобно для переводчиков). Установите режим распознавания — для более точного результата лучше выберите «Интеллектуальный» модуль, а не «Быстрый».
- 3. Пропишите, что делать после завершения процесса: вы можете извлечь содержимое документа в TXT-файл, добавить невидимый редактируемый слой поверх скана или заменить изображение буквами. Также поставьте галочки напротив дополнительных параметров. Для PDF-документов со сложной структурой укажите, что требуется распознавать страницу целиком. А чтобы фразы не разбивались при переносе, воспользуйтесь функцией объединения слов и строк. Также рекомендую сохранять результат в отдельный файл.
- 4. Распознанный PDF-документ откроется в новой вкладке. Включите инструмент редактирования — теперь текст на странице определяется.
- 5. Выделите строки курсором и действуйте так же, как было описано выше в разделе, как скопировать часть текста в ПДФ файле.
Использование Google Диска
Этот способ подходит для PDF, полученных из электронного источника. Я использую его как обходной вариант, когда под рукой нет компьютера с установленной программой.
- 1. Откройте Гугл Диск в браузере и войдите в свою учетную запись. Нажмите «Создать».
- 2. Кликните «Загрузить файлы».
- 3. После загрузки щелкните на 3 точки в строке с названием ПДФ правой кнопкой мыши. Выберите «Открыть с помощью» → «Google Документы».
- 4. Дождитесь пока сервис закончит обработку данных, и скопируйте содержимое документа целиком или по частям.
Извлечение текста без скачивания софта
Более действенный способ превратить ПДФ-файл в текст — использовать специальные сервисы. Покажу два простых способа, как выделить и скопировать текст в PDF файле в PDF Maestro. Это бесплатный российский онлайн-редактор, который работает в любом браузере: Google Chrome, Microsoft Edge, Яндекс или Mozilla Firefox.
Вариант 1 — для стандартного ПДФ-файла
- 1. Откройте главную страницу сервиса. В списке инструментов выберите раздел «Конвертация из PDF» — «В текст».
- 2. Загрузите ПДФ-файл с вашего ПК.
- 3. Укажите формат на выходе и кликните «Продолжить».
- 4. Скачайте результат.
Вариант 2 — для сканов в PDF-формате
- 1. В перечне инструментов найдите «Распознать текст».
- 2. Импортируйте ПДФ с диска.
- 3. Настройте язык, метод распознавания и параметры сохранения.
- 4. Результат будет представлен в виде ZIP-архива, содержащего исходный PDF и TXT-файл. Нажмите на выделенную кнопку для скачивания.
Варианты для телефона
Работать с PDF можно и без компьютера — современные смартфоны позволяют открывать документы и извлекать из них данные прямо на устройстве. Вот две инструкции, как можно скопировать текст с ПДФ файла на iPhone и Android.
На устройствах Apple вам не придется устанавливать дополнительный софт. Воспользуйтесь приложением «Книги» (Apple Books).
- 1. Откройте PDF-файл, нажмите кнопку «Поделиться» и выберите «Книги», чтобы импортировать его в библиотеку.
- 2. Выберите фрагмент для сохранения. Нажмите на слово и удерживайте палец, затем расширьте выделение маркерами.
- 3. В появившемся меню выберите «Скопировать».
В Android встроенных инструментов для извлечения текста из PDF нет, поэтому понадобится сторонняя программа. Один из самых распространенных вариантов — мобильная версия Adobe Acrobat Reader.
- 1. Установите и запустите софт. Откройте нужный PDF-файл из памяти устройства или облака.
- 2. Найдите место, которое хотите скопировать. Коснитесь слова и потяните маркеры, чтобы отметить нужный участок.
- 3. Нажмите «Копировать» в контекстном меню.
Распространенные сложности
Иногда стандартные способы не работают. Как правило, это связано с техническими особенностями самого файла. Вот несколько вариантов решений, как копировать из ПДФ данные, если вы столкнулись с типовыми проблемами.
- Текст не распознается. Обычно это означает, что PDF-файл состоит из сканов. В такой ситуации нужно выполнить OCR-распознавание.
- Установлена защита от копирования или правок. Попросите сообщить вам пароль или изменить настройки безопасности: например, оставить запрет на изменения, но разрешить извлечение данных из файла.
- Ошибка при скачивании. При ошибках структуры страницы могут отображаться некорректно, а данные — не извлекаться. Скачайте ПДФ повторно, пересохраните или попробуйте преобразовать в другой формат. Также помогает функция восстановления частично поврежденных файлов — такой инструмент есть в сервисе PDF Maestro.
и не копируется?
Инструкции, как легко устранить любые проблемы, читайте в статье.
Подробнее
Подведем итоги
Выбор способа зависит от типа документа. Незащищенные PDF-файлы, изначально существовавшие в электронном виде, можно просто открыть в PDF-редакторе, сервисе от Google или мобильном приложении. Но если автор заблокировал данные от несанкционированного копирования, потребуется снять защиту. Не пытайтесь «взломать» пароль, обратитесь к владельцу, чтобы он сообщил вам код.
Если же нужно преобразовать отсканированный ПДФ в копируемый формат, лучше всего с этим справится PDF Commander. Это надежная программа для ПК с Windows и Linux поможет решить любые задачи, связанные с редактированием PDF-файлов.
Ответы на часто задаваемые вопросы
PDF фиксирует макет страницы, поэтому конец каждой строки сохраняется как отдельный абзац. При переносе в стандартные редакторы текста форматирование теряется, и появляются дополнительные разрывы и переносы.
В PDF Commander есть инструмент сегментации текста. Он распознает строки и колонки, поэтому при распознавании элементы не будут наползать друг на друга.
Да, вы можете сразу выбрать нужный формат при конвертации. Вы также можете указать формат Excel, если есть много таблиц.
Текст может не выделяться, если PDF-документ состоит из нередактируемых сканов или установлен запрет на копирование.

