Распознование геометрии с изображений плана квартир

Цель: показать, как вы решаете задачу извлечения архитектурной геометрии из изображения и превращаете её в пригодный для 2D/3D формат.

Что нужно сделать: собрать небольшой прототип, который принимает 3–5 изображений планов (JPG/PNG) и возвращает JSON с базовой структурой.

Описание решения

Решение тестового задания. Для прототипа я выбрал классический пайплайн на основе OpenCV.

Почему выбран этот стек:

OpenCV: Планы этажей имеют четкую геометрическую структуру и контрастные стены (черный/серый на белом). Для выделения таких объектов классические методы работают быстрее нейросетей и не требуют обучения на специфичных данных для этапа MVP.
Скелетизация (Scikit-image): Стены на чертежах имеют толщину. Чтобы превратить их в линии (векторный формат), нужно найти "осевую линию". Скелетизация идеально сводит массив пикселей к графу толщиной в 1 пиксель.
Поиск контуров (преобразование Хафа): Позволяет превратить растровый скелет в набор отрезков $(x1, y1, x2, y2)$, что и требуется в JSON.

Этапы пайплайна:

Бинаризация: Перевод изображения в ч/б. Стены обычно являются самыми массивными темными объектами.
Морфологическая фильтрация: Применение операции OPEN (эрозия + дилатация). Это позволяет "растворить" мелкие детали (размерные линии, текст, стулья) и оставить только толстые монолитные блоки стен.
Скелетизация: Математическое уточнение структуры. Превращает "толстые" стены в линии толщиной в 1 пиксель, сохраняя топологию (перекрестки и углы).
Преобразование Хафа: Аппроксимация пиксельных линий в векторные отрезки.

Модели и инструменты:

OpenCV: Основной инструмент для работы с геометрией и матрицами пикселей.
Scikit-image: Содержит эффективную реализацию алгоритма скелетизации, которая работает лучше стандартных методов OpenCV.

Слабые места:

Слипшиеся объекты: Если мебель (например, кухонный гарнитур на чертеже 2) примыкает вплотную к стене и имеет ту же заливку, алгоритм может посчитать её частью стены.
Дверные проемы: В классическом CV проемы — это просто "дырки". Для их детекции как "дверей" (дуги) нужны специфические шаблоны или нейросеть.
Масштаб: Без OCR размеров мы получаем координаты в пикселях, а не в метрах.

Что бы я улучшил в следующей итерации:

Использование Deep Learning (YOLOv8-seg / SAM):
- Обучил бы модель сегментации специально на классах wall, window, door. Это решило бы проблему отделения мебели от стен.
- Использовал бы Segment Anything Model (SAM) для уточнения масок сложных архитектурных элементов.
Графовая оптимизация: После извлечения векторов нужно "склеивать" близлежащие точки, чтобы стены образовывали замкнутые контуры комнат, а не набор разрозненных палок.
OCR: Добавил бы модуль распознавания цифр. Найденные числа можно сопоставлять с площадями полигонов для автоматической калибровки масштаба (пиксель -> мм).
CubiCasa5k: Это лучший датасет для данной задачи. Обучение на нем позволит распознавать даже "грязные" сканы и наброски от руки.

Использовалась python 3.11

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
images		images
output		output
LICENSE		LICENSE
README.MD		README.MD
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Распознование геометрии с изображений плана квартир

Описание решения

Почему выбран этот стек:

Этапы пайплайна:

Модели и инструменты:

Слабые места:

Что бы я улучшил в следующей итерации:

About

Uh oh!

Releases

Packages

Languages

License

Lannix/Floor-parser

Folders and files

Latest commit

History

Repository files navigation

Распознование геометрии с изображений плана квартир

Описание решения

Почему выбран этот стек:

Этапы пайплайна:

Модели и инструменты:

Слабые места:

Что бы я улучшил в следующей итерации:

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages