Программа сканер-распознователь для документов Цели проекта (по уровням сложности):
1 Уровень: Написать обработчик скана документа (любой формат), который находит на нем ключевые слова и посылает их в бд (MongoDB, sql и т.п.). Для распознования используем готовый инструмент Tesseract от Google (https://ru.wikipedia.org/wiki/Tesseract)
2 Уровень: Добавляем много документов при помощи парсинга какого-нить ресурса, например резюме c hh. Добавляем графическую оболочку для программы или делаем из нее веб ресурс.
3 Уровень: Разрабатываем свой собственный алгоритм для распознования символов и прикручиваем к программе (используя теорию распознования образов и собственные идеи-велосипеды)