среда, 23 августа 2017 г.

Сервис NewOCR для распознавания текста онлайн

хранение информации
Моя знакомая недавно поинтересовалась, знаю ли я хорошую программу для сканера, которая может распознавать текст.
Знаю и пользуюсь FineReader ABBYY, но она платная.
А что делать тем, кому эта функция нужна очень редко?
Покупать программу на пару раз - глупо.
Полезла я по своим сусекам и нашла прекрасный онлайн распознаватель текста сервис NewOCR и к нему простую программку для сканирования - ScanLite настолько она проста. Скачать ее можно в интернете бесплатно. Установка стандартная. Программа на русском языке.
Очень порадовал меня сервис для распознавания текста. Неделю поработала с этой парочкой и скажу, что никакой FineReader не нужен.
Как вставлять на сайт документ PDF я уже рассказывала. А вот если у вас есть такой документ, но он нуждается в редакции, тут Вам и придет на помощь сервис онлайн распознавания текста
Итак, сервис NewOCR.
Сервис распознает 58 языков и следующие форматы
JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM, PCX
Сжатые файлы: Unix компресс, bzip2, BZIP, GZIP
Нескольких документов, страниц: TIFF, PDF, DjVu
DOC, DOCX, RTF, ODT файлов с изображениями
Несколько изображений в архиве ZIP
Сканируете документ, сохраняете его на компьютер. Затем выбираете этот файл через сервис, выбираете язык и нажимаете на предварительный просмотр, потом подбираете настройки
Поворот изображения
Анализ страницы - разбивка на колонки
Подбираете контрастность изображения
Удаляете серые тени из образа. Это полезно для отсканированных страниц книги.
Нажимаете на распознавание и ждете
Вот что у меня получилось при распознавании PDF документа
Этот документ был у меня на компьютере, но можно подцепить ссылкой почти любой документ из интернета.
Сохраняете в нужном формате на компьютер и делаете с ним все, что хотите.