Skip to content

So1itarius/Text-Scanner_prototype

Repository files navigation

Программа сканер-распознователь для документов Цели проекта (по уровням сложности):

1 Уровень: Написать обработчик скана документа (любой формат), который находит на нем ключевые слова и посылает их в бд (MongoDB, sql и т.п.). Для распознования используем готовый инструмент Tesseract от Google (https://ru.wikipedia.org/wiki/Tesseract)

2 Уровень: Добавляем много документов при помощи парсинга какого-нить ресурса, например резюме c hh. Добавляем графическую оболочку для программы или делаем из нее веб ресурс.

3 Уровень: Разрабатываем свой собственный алгоритм для распознования символов и прикручиваем к программе (используя теорию распознования образов и собственные идеи-велосипеды)

About

Будет распознавать сканы документов

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages