Извлечь и скопировать текст из PDF с A-PDF Text Extractor

a-pdf

Бесспорно, формат PDF — это отличный способ оцифровать информацию с бумажных носителей в цифровой вид. С помощью PDF можно быстро получить сканы книг, журналов, документов и получить их первоначальный вид на своем компьютере.

Однако, копирование и последующие форматирование информации из PDF крайне затруднительно, ведь здесь играет роль даже угол положения страницы при сканировании. Выход конечно из этой ситуации конечно же есть. Об одном из них я уже писал в посте про интернет-сервис, но вскоре я получил абсолютно логичный вопрос, а что делать тем людям, у которых на работе нет интернета, или же он по каким либо причинам отключен???

Тут конечно же ответ будет один — пользоваться программами для конвертации pdf файлов, благо сейчас этих программ великое множество. Об одной из таких программ сегодня и пойдет речь. Встречайте — A-PDF’s Text Extractor

A-PDF’s Text Extractor

Главным критерием моего сегодняшнего выбора было — Легкость программы и скорость конвертации, и наш сегодняшний участник этим требованиям соответствует на все 100 процентов. Давайте ка с ним разберемся. Запускаем программу и открываем файл в формате pdf, который нам необходимо перегнать в текстовый файл.

a-pdf

Я нашел у себя какой-то скан на 170 страниц и выбрал его. Выбранный файл отобразится у вас в списочке. Дальше у нас действия два:

  1. Если мы хотим перегнать всю книгу в текстовый формат, то смело жмем на кнопку Extract text
  2. Если же мы хотим редактировать только некоторые страницы, то мы пойдем в Options и выставим там диапазон страниц для конвертирования.

a-pdf

Мне нужно узнать скорость работы, поэтому я буду конвертировать всю книгу целиком, поэтому я жму на Extract, после чего мне предложать выбрать место расположения нового файла и его имя.

a-pdf

И пошла конвертация. На мой мою книгу в 168 листов ушло порядка 20 секунд, это я думаю просто замечательный результат. По завершению, программа поинтересовалась — хочу ли открыть новый текстовый файл???

a-pdf

Мой ответ был естественно — ДА. И открылся мне мой файл.

конвертированный файл

Текст из pdf файла был аккуратненько скопирован в текстовый файл, где вы его можете подвергнуть редактированию или же отправить в другой текстовый редактор, например MS Word.

Ну вот, собственно, и все.

Вердикт>

A-PDF’s Text — удобная программа для извлечения текста из файлов формата PDF. Отличительные черты программы: Скорость работы и простота программы. Прога бесплатна и рекомендована для скачки. Пользуйтесь в радость!

Обсуждение (38)
  1. Kryashen:

    Да, 20 секунд на конвертацию впечатлили!:) Надо бы скачать прогу.

  2. ItSlam:

    я сам был приятно удивлен, качайте)))

  3. Упорный Барсук:

    Спасибо, искал нечто подобное. Работает нормально.

  4. ItSlam:

    Отлично, я бы сказал, работает.

  5. Артур:

    А у меня вообще PDF файлы почему-то толком не работают.

    Открываю. Минуты 2 я могу смотреть файл, а потом выскакивает какая-то ошибка, и все. Отключается.

    Давно что-то такое искал,ничего хорошего не попадалось.

    Благодарю за пост, ItSlam!

  6. ItSlam:

    Всегда рад стараться, но с глюком вашим надо как-то бороться….

  7. Ильдар Тимербаев:

    Класс! Давно искал что-нибудь похожее. У многих спрашивал, никто не знает.
    Программу скачал. Сейчас буду тестировать.
    С меня ретвит.
    Артур, а Вам лучше открывать файлы в Foxit Reader. Она в разы быстрее, чем Акробат, или как она там называется? Уже забыл 😉 давно не пользуюсь.

  8. ItSlam:

    пасиб за твит.
    Все верно говорите, Foxit завется программка… пошустрее в разы будет Акробата….

  9. Артур:

    Блин, точно 🙂 Как же я раньше то не догодался? Знаю про Foxit, но вот чтобы воспользоваться, что-то и не подумал 🙂 Благодарю за наводку, Ильдар!

  10. Vladimir:

    Не встречал раньше, попробую. А то VeruPDF и FineReader не всегда удобны.

  11. salnsg:

    Вот здесь «http://www.anypdftools.com/pdf-to-word.html» взял бесплатную прогу для преобразования из PDF в DOC и … уже полгода не парюсь с этим вопросом. Всё делает на 5+

  12. ItSlam:

    Файнридер слишком тяжел, если нужно вырывать текст из пдф не часто.

  13. ItSlam:

    Отлично… и до нее руки дойдут )

  14. Rusfetische:

    надо бы попробовать, вот только если текст не наложен на картинку в пдф?

  15. salnsg:

    Если в PDF зашита картинка, тогда можно попробовать распознавалку, например, вот эту «http://newocr.com/» или эту «http://www.onlineocr.net/»

  16. ItSlam:

    отлично.. спасибо за наводки… надо будет о каждом расписать )))

  17. salnsg:

    да не за что, пишите 🙂

  18. vitaly:

    Фиговая программа. Если есть колонки, она их не понимает, получается бредовые текст тоже как бы в колонках

  19. ItSlam:

    хммм…. у меня текст был без колонок…

  20. vegas:

    Я скачал программу, она с PDF файла только номера страниц вытащила и все!В чем может быть причина??!

  21. vegas:

    А если файл PDF отсканированный может текст не вытащить?!!

  22. ItSlam:

    vegas: Я думаю если качественно отсканировано (без перекосов и артефактов), то прога должна все цеплять. Даже пока на ум ничего не приходит, в чем может быть проблема.

    Если проблема не решится, а текст вытащить нужно, то можете попробовать читалку Нитро. У нее тоже есть функции вырезания текста и картинок из PDF.

  23. juka:

    Блин,у меня такая же проблема как у vegas!!!!!!прога вытащила из из pdf только номера страниц. скачала нитро,ожидала хорошего результата,а нет.после конвертации открылся пустой файл.прога не вытащила ничего

  24. ItSlam:

    juka: Похоже программка не оправдала возложенных на нее надежд. Если текста выдирать не много надо, то попробуйте nitro pdf.

  25. azm:

    работает, но текст с табличными данными перемешивает

  26. ItSlam:

    azm: Да…таблицы — это вообще бич многих программ 🙁

  27. litlspawn:

    у меня не работает вместо текста вылезаю страницы

  28. ItSlam:

    litlspawn: программа подрастеряла свой авторитет…ищем замену.

  29. K_E_V_in:

    Файлы больше 3 мегов онлайн не конвертятся. Плохо!

  30. ItSlam:

    K_E_V_in: ТАких подробностей не знал. Спасибо за подсказку.

  31. ItSlam:

    sarra:Thx.
    Ну вот и настал момент, когда уже начали иностранцы читать мой блог. Для тех у кого плохо с английским, а узнать все же хочет, то возможно я опишу парочку статей с блога Сарры.

  32. Ши:

    Скажите,нет такой программы для Айфона ????

  33. ItSlam:

    Ши: К сожалению, мне такие проги для айфон не попадались.

  34. Eva:

    что-то кажется хорошим.

  35. Ko6ka:

    Спасибо ))) Прога успешно прожевала PDF, у которого при простой пометке-копировании текст получался без пробелов между словами… Adobe Acrobat экспортировал текст только последних 5 страниц из 66… а эта выдала текст без форматирования, с некоторыми недочётами — зато С ПРОБЕЛАМИ между словами, и ВСЕ страницы )))) Спасибище!

  36. ItSlam:

    Ko6ka Пжл!

  37. jey:

    прога не справилась. очень быстро сконвертировал номера страничек немного символов и все. качаю другую.

  38. ItSlam:

    jey: судя по статистике прога работает 50/50 (((

Поделитесь своим мнением
Для оформления сообщений Вы можете использовать следующие тэги:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>