SEO, заработок в Интернете, блоггинг, работа в компьютерных программах

Распознавание текста с помощью онлайн сервисов и программ

DocumentsПеред каждым кто работает с текстами, да и перед обычными пользователями нередко встаёт необходимость распознать текст с картинки, фотографии, из книги, напечатанный на сканированном документе и прочее. Существуют программы, которые могут распознавать текст, но, во-первых, большинство из них платные, а, во-вторых, для работы такую программу надо устанавливать на компьютер.

А что делать тем, у кого нет постоянной потребности в распознавании или если такая необходимость она возникла разово и достаточно неожиданно или не хочется держать лишний, редко используемый софт. В этом случае помогут сервисы распознавания текста которых в интернете много.

Эти проблемы отлично решат сервисы, способные распознать текст онлайн. Причем каждый такой сервис распознает текст бесплатно (существуют и те, которые делают это за символические суммы). Их не так мало в интернете, каждый отличается своими положительными или отрицательными сторонами, но в данной статье мы рассмотрим только те из них, которые удовлетворяют условиям:

  • бесплатны (или почти бесплатны)
  • работают с русским языком
  • неограниченны по объему распознаваемых документов
  • распознают тексты различных форматов

Каким сервисом пользоваться выбираете вы сами. Многие из них отличаются по качеству распознавания и другим параметрам. С другой стороны многое зависит от качества распознаваемого документа.

Сервисы распознавания текстов:

Drive Google

drive.googleНачнем с Drive Google, его можно найти в Google Документах. Он нам подходит прежде всего из-за того, что полностью русифицирован. Не слишком удобно то, что для тех, у кого собственного аккаунта в Google нет, потребуется регистрация. Обойдутся без этого те, у кого на blogspot уже существует свой блог. Кроме русского распознает тексты еще на 28 языках. Поддерживаются документы до 10 Mb и форматы JPG, PNG, GIF, PDF (в PDF распознаются первые 10 страниц). Файлы, в которых текст сохраняются: DOC, PDF, TXT, PRT, ODT.

Порядок работы в Drive Google

  • 1. Заходим в Google Документы;
  • 2. PDF-файл или картинку перетаскиваете в окно браузера;
  • 3. В появившемся окошке с меню проставляете флажки у 2 нижних пунктов (рис 2)
  • 4. Закрываем окошко и снова грузим картинку;
  • 5. При загрузке указываете язык;
  • 6. Картинка сохраняется как картинка, но открываться будет в текстовом редакторе в виде текста.

Это один из самых используемых онлайн сервисов распознавания, не с самыми широкими функциями, но достаточно хорошо работающий и довольно удобный. Если же вам необходимо больше функций (большее количество языков, выделение областей, другие форматы), то придется воспользоваться и другими сайтами.

Drive Google загрузка

OCRconvert

Сервис Ocr convert

 

Регистрации на сайте не требуется, поддерживаются и распознаются файлы JPEG, PDF, BMP, GIF, PNG.

Очень простой в использовании:

  • выбираем файл
  • указываем язык текста
  • нажимаем «process»

При необходимости могут быть загружены несколько файлов (до пяти), но только если язык исходника один и тот же. Общий объем загрузки – 5 Мб. В результате получите текстовый файл (формат TXT) в виде ссылки, с которой сам текст копируется и сохраняется в компьютере. (рис.4)

 

Online OCR

Сайт Online OCR

 

 

Регистрации не требуется, поддержка 32 языков, максимальный размер изображений — 4 МБ. За час может распознать текст с 15 изображений. Преобразуемые файлы: JPG, GIF, BMP, JPEG, TIFF. Если исходник многостраничный, можно выбрать страницы для распознавания. Распознанные онлайн тексты извлекаются из виртуального рабочего документа и сохраняются в памяти компьютера как документы с расширением не только в формате TXT, но и XLS (для MS Excel) или DOC (для MS Word). В созданных файлах будет точно повторена структура исходных документов (шрифт, колонки, таблицы и т.д.)

Существуют некоторые ограничения: размер файла не более 20 Mb, для качественного результата разрешение картинки не меньше 200 DPI.

 

ABBYY FineReader Online

Сервис ABBYY FineReader

 

 

ABBYY FineReader – отличная программа, распознающая цифровые фотографии и отсканированные документы. Для работы нужна установка программы на компьютер. Устанавливается так же как любая другая программа. Пробные версии можно скачать здесь.

По ссылке выше показана онлайн версия. Но она не бесплатна, так 10 страниц распознанного текста обойдутся в $3,0, но зато формат файлов очень большой.

ABBYY функционал

Количество распознаваемых языков – 37, распознаваемые файлы – bmp, jpg (jpeg), png, dcx, pcx, tif, pdf, Djvu. Конвертирование в doc, txt, xls, pdf, rtf. После распознания файл скачивается в истории задания.

Работает очень просто – в обработке необходимо дождаться распознавания и можно скачивать результат, а можно получить ссылку и на e-mail. Полученный документ остается доступен 72 часа. Кстати, если программка признает, что распознание произошло с большим количеством ошибок, задание выполняется бесплатно.

 

Free OCR 

Сервис Free-ocr

 

 

Регистрации не требуется, бесплатный. Неудобство – при распознавании текста необходимо вводить капчу. Распознает изображения BMP, GIF, JPG, TIFF, PDF-формат. С3ществуют ограничения на использование: картинки – не больше 2 МБ и 5000 пикселей. Больше 10 картинок за час загружать нельзя. Готовый результат копируется.

 

Free Online OCR

Сайт Free-online-ocr

Free Online OCR один из самых серьезных по функционалу онлайн сайтов для распознавания. Регистрации нет, бесплатен. Работает со многими форматами, кроме привычных JPEG, GIF или BMP, распознает, к примеру, DjVu.

Загружается необходимый для распознания файл, а затем может быть изменена область распознавания, перемещена или перевернута картинка. Можно выбрать для распознавания и отдельную область картинки.

OCR

i2OCR

Онлайн сервис i2OCR

Регистрация нужна, все бесплатно, распознает тексты с форматов JPEG, GIF, TIF, PNG, PGM, BMP, PPM, PBM. А вот PDF формат не поддерживается. Скачивается в расширении DOC. Онлайн распознавание текста происходит в три этапа:

 

i2OCR

 

OCRonline

Функционал Ocr online

OCRonline не очень удобный в интерфейсе, требует высокого качество изображений, причем, желательно, в формате JPG (другие форматы все-таки принимаются). Можно назвать его относительно бесплатным: в неделю разрешается распознать всего пять страниц за одну неделю. Для того чтобы пользоваться услугами дольше, необходима регистрация и дальнейшая оплата. Сохраняются тексты в форматах TXT, RTF, PDF и DOC.

Тестирование всех вышеперечисленных онлайн сервисов распознавания текстов показало почти мгновенный результат при небольших объемах. Естественно, и скорость, и качество получаемого текста во многом зависело от качества исходной картинки или фотографии, но особых нареканий не вызывало. Если вы собираетесь воспользоваться одним из них, то можно проверить все и увидеть результаты. В любом случае, онлайн сервисы распознавания текста перечисленные в статье, так и те которые не упомянуты здесь могут оказать неоценимую помощь и освободить от ручного трудоемкого набора вручную.

Подписка на новые статьи. Введите e-mail:

Понравилась статья? Следи за новостями блога по Лента RSS RSS или в Обновления блога на Twitter Twitter !
Вернуться на Главную страницу
Ваш комментарий