Если вы искали бесплатную альтернативу ABBYY FineReader с открытым кодом, то я вас разочарую. Их нет. Но есть что-то где-то рядом.
SimpleOCR
Это полезный инструмент, который умеет распознавать текст на английском и французском языках. Если в документах у вас имеется разметка с колонками, необычный шрифт, цветные картинки или графика низкого качества, в этих случаях придётся скачивать платное приложение для распознавания контента.
Программа поддерживает работу на английском и французском языках, однако не может идентифицировать символы с подстрочными, надстрочными элементами.
OnlineOCR.net
Ещё один бесплатный инструмент для распознавания текста с последующим сохранением результата в таких форматах, как docx, xlsx, txt. Программа распознаёт максимум 15 изображений в течение часа, регистрироваться при этом не требуется. Сервис поддерживает большое количество языков, в том числе славянские. Процесс распознавания не занимает много времени. Текст с хорошо отсканированного изображения получается хорошего качества. Если в тексте есть картинки, он недостаточно хорошо отсканирован, качество ухудшается. У сервиса есть лимит по размеру одного файла, максимальный размер — 5 Мб.
img2txt
Это онлайн-программа по идентификации текста со сканов. Сервис поддерживает украинский, английский и русский язык. Обратите внимание, что в отсканированном изображении не должно быть таблиц и диаграмм. Максимальный размер — 4 Мб. Поддерживаются только строго определённые форматы: jpg, jpeg, png.
Soda
Ещё одна бесплатный сервис, в которую можно загружать файлы размером до 2 Мб. Сервис распознаёт достаточно большое количество языков, в том числе русский. Лучше всего загружать изображения, на которых текст набирался с компьютера. Сканированные книги он распознаёт не так хорошо.
Free Online OCR
Это инструмент для бесплатного использования, который имеет множество достоинств, а именно — быстрое и качественное распознавание, отсутствие лимита загрузок, поддержка 70-ти языков, распознавание данных сразу на нескольких языках в одном документе. Для использования программы не нужно регистрироваться. Вы можете выделять текст, разворачивать определённую часть файла, которую вы собираетесь редактировать.
Программа поддерживает большое количество форматов, в том числе JPEG, PNG, BMP, PPM и PCX. Вы можете работать с различными форматами сжатия документов и мультистраничными материалами. Ещё одна функция — распознавание DOCX и ODT с графическими материалами, поддержка ZIP-архивов. Результаты можно загружать в форматах TXT, DOC, PDF.
Это основные бесплатные программы, которые отличаются быстрой работой, многофункциональностью и понятным интерфейсом. Работать в большинстве из них можно онлайн, для выполнения базовых функций необязательно регистрироваться.