Извлечь и скопировать текст из PDF с A-PDF Text Extractor
Бесспорно, формат PDF — это отличный способ оцифровать информацию с бумажных носителей в цифровой вид. С помощью PDF можно быстро получить сканы книг, журналов, документов и получить их первоначальный вид на своем компьютере.
Однако, копирование и последующие форматирование информации из PDF крайне затруднительно, ведь здесь играет роль даже угол положения страницы при сканировании. Выход конечно из этой ситуации конечно же есть. Об одном из них я уже писал в посте про интернет-сервис, но вскоре я получил абсолютно логичный вопрос, а что делать тем людям, у которых на работе нет интернета, или же он по каким либо причинам отключен???
Тут конечно же ответ будет один — пользоваться программами для конвертации pdf файлов, благо сейчас этих программ великое множество. Об одной из таких программ сегодня и пойдет речь. Встречайте — A-PDF’s Text Extractor
A-PDF’s Text Extractor
Главным критерием моего сегодняшнего выбора было — Легкость программы и скорость конвертации, и наш сегодняшний участник этим требованиям соответствует на все 100 процентов. Давайте ка с ним разберемся. Запускаем программу и открываем файл в формате pdf, который нам необходимо перегнать в текстовый файл.
Я нашел у себя какой-то скан на 170 страниц и выбрал его. Выбранный файл отобразится у вас в списочке. Дальше у нас действия два:
- Если мы хотим перегнать всю книгу в текстовый формат, то смело жмем на кнопку Extract text
- Если же мы хотим редактировать только некоторые страницы, то мы пойдем в Options и выставим там диапазон страниц для конвертирования.
Мне нужно узнать скорость работы, поэтому я буду конвертировать всю книгу целиком, поэтому я жму на Extract, после чего мне предложать выбрать место расположения нового файла и его имя.
И пошла конвертация. На мой мою книгу в 168 листов ушло порядка 20 секунд, это я думаю просто замечательный результат. По завершению, программа поинтересовалась — хочу ли открыть новый текстовый файл???
Мой ответ был естественно — ДА. И открылся мне мой файл.
Текст из pdf файла был аккуратненько скопирован в текстовый файл, где вы его можете подвергнуть редактированию или же отправить в другой текстовый редактор, например MS Word.
Ну вот, собственно, и все.
Вердикт>
A-PDF’s Text — удобная программа для извлечения текста из файлов формата PDF. Отличительные черты программы: Скорость работы и простота программы. Прога бесплатна и рекомендована для скачки. Пользуйтесь в радость!
Да, 20 секунд на конвертацию впечатлили!:) Надо бы скачать прогу.
я сам был приятно удивлен, качайте)))
Спасибо, искал нечто подобное. Работает нормально.
Отлично, я бы сказал, работает.
А у меня вообще PDF файлы почему-то толком не работают.
Открываю. Минуты 2 я могу смотреть файл, а потом выскакивает какая-то ошибка, и все. Отключается.
Давно что-то такое искал,ничего хорошего не попадалось.
Благодарю за пост, ItSlam!
Всегда рад стараться, но с глюком вашим надо как-то бороться….
Класс! Давно искал что-нибудь похожее. У многих спрашивал, никто не знает.
Программу скачал. Сейчас буду тестировать.
С меня ретвит.
Артур, а Вам лучше открывать файлы в Foxit Reader. Она в разы быстрее, чем Акробат, или как она там называется? Уже забыл 😉 давно не пользуюсь.
пасиб за твит.
Все верно говорите, Foxit завется программка… пошустрее в разы будет Акробата….
Блин, точно 🙂 Как же я раньше то не догодался? Знаю про Foxit, но вот чтобы воспользоваться, что-то и не подумал 🙂 Благодарю за наводку, Ильдар!
Не встречал раньше, попробую. А то VeruPDF и FineReader не всегда удобны.
Вот здесь «http://www.anypdftools.com/pdf-to-word.html» взял бесплатную прогу для преобразования из PDF в DOC и … уже полгода не парюсь с этим вопросом. Всё делает на 5+
Файнридер слишком тяжел, если нужно вырывать текст из пдф не часто.
Отлично… и до нее руки дойдут )
надо бы попробовать, вот только если текст не наложен на картинку в пдф?
Если в PDF зашита картинка, тогда можно попробовать распознавалку, например, вот эту «http://newocr.com/» или эту «http://www.onlineocr.net/»
отлично.. спасибо за наводки… надо будет о каждом расписать )))
да не за что, пишите 🙂
Фиговая программа. Если есть колонки, она их не понимает, получается бредовые текст тоже как бы в колонках
хммм…. у меня текст был без колонок…
Я скачал программу, она с PDF файла только номера страниц вытащила и все!В чем может быть причина??!
А если файл PDF отсканированный может текст не вытащить?!!
vegas: Я думаю если качественно отсканировано (без перекосов и артефактов), то прога должна все цеплять. Даже пока на ум ничего не приходит, в чем может быть проблема.
Если проблема не решится, а текст вытащить нужно, то можете попробовать читалку Нитро. У нее тоже есть функции вырезания текста и картинок из PDF.
Блин,у меня такая же проблема как у vegas!!!!!!прога вытащила из из pdf только номера страниц. скачала нитро,ожидала хорошего результата,а нет.после конвертации открылся пустой файл.прога не вытащила ничего
juka: Похоже программка не оправдала возложенных на нее надежд. Если текста выдирать не много надо, то попробуйте nitro pdf.
работает, но текст с табличными данными перемешивает
azm: Да…таблицы — это вообще бич многих программ 🙁
у меня не работает вместо текста вылезаю страницы
litlspawn: программа подрастеряла свой авторитет…ищем замену.
Файлы больше 3 мегов онлайн не конвертятся. Плохо!
K_E_V_in: ТАких подробностей не знал. Спасибо за подсказку.
sarra:Thx.
Ну вот и настал момент, когда уже начали иностранцы читать мой блог. Для тех у кого плохо с английским, а узнать все же хочет, то возможно я опишу парочку статей с блога Сарры.
Скажите,нет такой программы для Айфона ????
Ши: К сожалению, мне такие проги для айфон не попадались.
что-то кажется хорошим.
Спасибо ))) Прога успешно прожевала PDF, у которого при простой пометке-копировании текст получался без пробелов между словами… Adobe Acrobat экспортировал текст только последних 5 страниц из 66… а эта выдала текст без форматирования, с некоторыми недочётами — зато С ПРОБЕЛАМИ между словами, и ВСЕ страницы )))) Спасибище!
Ko6ka Пжл!
прога не справилась. очень быстро сконвертировал номера страничек немного символов и все. качаю другую.
jey: судя по статистике прога работает 50/50 (((