Распознать текст онлайн с картинки бесплатно и регистрации
Очень часто в нашей рутинной работе возникает необходимость распознать текст с картинки или pdf файла. Конечно, можно заставить себя набить текст ручками, но мы же существа ленивые и хотим по-максимуму автоматизировать повседневные задачи, к тому же это значительно экономит время.
С программами то же все не очень просто. Найти бесплатный программный продукт для распознавания текста достаточно сложно, а покупать тот же FineReader имеет смысл лишь в том случае, если объем документов большой и есть острая необходимость в срочности и скорости распознавания такого большого объема документов.
Однако, если распознаете вы раз в неделю небольшие документы, то Вам в помощь придут бесплатные онлайн-сервисы для распознавания текста с картинки или файлов PDF. Сегодня я сделаю небольшой обзор таких сервисов. Главными критериями при выборе были:
- Бесплатность.
- Адаптация к русскому языку.
- Не требующие регистрации.
Увы, последний пункт пришлось опустить, так как парочка хороших сервисов все же потребует от вас регистрации. Надо так же понимать, что распознавание картинки в текст онлайн не заменит профессиональных настольных продуктов, так как имеют ряд ограничений как по весу документа, количеству листов в документе, формате на выходе и т.д. Данные онлайн инструменты рассчитаны на разовые небольшие объемы. Но хватит лирики, приступим.
Online OCR — Онлайн сервис распознавания текста
С первый сервисом Online OCR произошел, однако, конфуз. Во время обзора он попросту не работал. Зайдя на сайт, я увидел такую картину:
Надеюсь создатели скоро поправят данный сервис, ведь он реально был хорош, если не лучший. Очень хороший функционал и не требовал регистрации. Большой набор форматов на выходе позволял переводить картинки как в документы Word, Excel, rtf, pdf и другие. Насколько я помню ограничение было по объему документа в 20 мегабайт, что вполне хватало для работы.
Google Docs
Для многих может стать открытие тот факт, что и документы гугл умеют преобразовывать картинки в текст. Но это и первый наш сервис, который потребует регистрации, но думаю сейчас и не встретить человека без аккаунта в Google.
Для распознавания картинки или пдфки в текст вам надо:
- Загрузить исходный файл в хранилище Google Drive (можно просто перетащить документ мышкой в окно браузера).
- Нажмите по загруженному документу правой кнопкой мыши и выбирайте «Открыть с помощью» Google Документы.
- В документах у вас откроется как исходное изображение, так и его распознанная текстовая версия.
- Готово!
Качество распознавания текста с картинки у Гугл просто чудесное, конечно при условии, что картинка нормального читаемого качества. После распознавания картинки вы сможете ее скачать в любом популярном формате: Word, RTF, PDF. ODT или TXT.
А вот про ограничения я информацию не нашел. Раньше знаю было, что размер документа должен был быть не более 10 мб и не более 10 страниц в документа. Но вроде бы эти ограничения были сняты, хотя могу ошибаться. Но точно знаю, что Google Docs является одним из самых удобных способов онлайн распознавания картинки в текст.
ABBYY FineReader Online
Ну кто не слышал о самой популярной программе для распознавания текста — ABBYY FineReader? Да я уверен, что таких почти нет. А вот про его онлайн версию слышали не многие. А зря. Ведь зачем платить 5 тыс. рублей, если онлайн версия практически не уступает своей десктопной версии, да и ограничение в 100 мб делает его куда более привлекательным, чем конкуренты с куда более меньшим разрешенным объемом.
Единственное неудобство — придется зарегистрироваться. Процедура не сложная и не займет у вас и больше 2-х минут. А если у вас есть аккаунты в том же Гугл, Фейсбук или Майкрософт, то можете зайти с помощью их и даже регистрации не потребуется.
- Авторизируемся в ABBYY FineReader Online.
- Загружаем исходный документ, объем которого не должен превышать 100 мб и иметь не более 10 страниц.
- Выбираем язык документа. В моем случае это русский.
- И выбираем формат документа на выходе, а их тут аж 9 форматов.
- Жмем кнопку «Распознать»
- По окончанию процесса распознавания вам будет предоставлена ссылка для скачивания документа или же его можно экспортировать в популярные облачные хранилища, такие как Google Drive, DropBox и Microsoft OneDrive.
- Готово!
Что сказать о качестве распознавания? Это ABBYY и этим все сказано. Мое коммерческое предложение он распознал практически идеально, вплоть до правильной таблицы и всех списков. Да, шрифт не тот, но он у меня в документе специфический. Со стандартными шрифтами такой беды не будет.
Увы, но в сутки вам разрешается распознавать не более 10 листов. Если ваш дневной объем укладывается в этот лимит, то это определенно то, что вы ищите.
img2txt.com
Сколько наблюдаю за данным сервисом, он все никак не выйдет из стадии бета-тестирования. Однако если Вам нужно быстро распознать текст с картинки, то img2txt.com вам может в этом помочь. Картинка должна быть хорошего качества, ибо ошибок будет слишком много.
- Заходим на img2txt.com.
- Нажимаем «Выбрать файл», выбираем и загружаем.
- На следующем шаге нужно выбрать язык документа и отправить на распознавание.
- Ваш файл поставят в какую то мифическую очередь на распознавание, однако я всегда был первым, поэтому особо ждать не придется.
- По окончанию прям на сайт мы получаем распознанный результат, который можно скопировать в любой документ.
- Готово!
Увы, но даже при хорошем качестве картинки, сервис допускает ошибки при распознавании. Так что придется немного править текст, а это лишние телодвижения.
FREE OCR
Это последний на сегодня наш обозреваемый пациент и первый англоязычный, хоть и не хотел их трогать. Тут все просто:
- Заходим на сайт сервиса.
- Выбираем файл, выбираем язык документа и, в теории, выбираем формат на выходе, хотя он тут один — txt.
Жмем «Process». - Ждем недолго и получаем окно с ссылкой на наш текстовый документ.
- Скачиваем.
- Готово!
Увы, но зарубежный пациент справился не лучше нашего img2txt. Очень много ошибок, буквы Л он распознает как символы /\ и так далее и тому подобное.
Пожалуй пришло время подводить итоги обзора сервисов по распознаванию картинок и файлов PDF онлайн. Как бы не старались независимые программисты, но соперничать с Google и ABBYY им не под силу, а те в свою очередь требуют регистрации и наличие аккаунта.
Хорошим им подспорьем был Online OCR, однако на момент обзора он не работал, надеюсь скоро его поправят. Ну а если вы хотите реально качество, то остановите свой выбор на Google Docs и ABBYY FineReader Online.
У меня все. Удачи.