Скачиваем с гитхаба
git clone https://github.com/VL1507/book-data-integration.gitЗаходим в папку с проектом
cd book-data-integrationЗапускаем сайт
docker compose --profile site up --build -dПроходит по страницам с книгами, переходит на страницы книг, собирает информацию о них и сохраняет в json
Технологии
- Python 3.13
- Scrapy 2.13.4
Сайты
Берет собранные парсером данные данные из json и загружает в БД
Технологии
- Python 3.11
- SQLAlchemy 2.0.41
Запуск
docker compose --profile data-loader up --build -dРаботает в три этапа
- очистка
- постройка метафонов
- дедупликация
Технологии
- Python 3.11
- SQLAlchemy 2.0.41
- fonetika 1.5.0
Запуск
docker compose --profile deduplicator up --build -dОбраз: mysql:8.0.16
Ручки
- /ping - проверка работоспособности
- /books/{publication_id} - данные книги по ее publication_id
- /books/ - список книг, принимает параметры для фильтрации
Технологии
- Python 3.11
- FastAPI 0.116.1
- SQLAlchemy 2.0.41
Особенности
- доступ открыт только для докер сети (самому отправить запросы не получится)
Работает через nginx
Технологии
- axios 1.13.2
- pinia 3.0.4
- vue 3.5.22
- vue-router 4.6.3



