Цель проекта — проанализировать эффективность двух вариантов посадочной страницы турагентства по ключевым метрикам: конверсии покупки и ежедневному среднему чеку.
Основные задачи:
- убедиться, что A/B-тестирование было проведено корректно (чистка данных, проверка длительности теста, исключение пересечений пользователей),
- проверить факт стабилизации метрик во времени,
- провести статистический анализ (t-тесты, Z-тесты, доверительные интервалы),
- дать бизнес-ответ: какой вариант страницы более предпочтителен.
Проект выполнялся в виртуальной среде venv.
Перед запуском установите необходимые библиотеки:
pip install -r requirements.txt- проверка формата данных, типов столбцов, пропусков и дублей
- исключение пользователей, попавших в обе группы
- проверка равенства длительности эксперимента
- расчет вспомогательных показателей (визиты, покупки, выручка)
- расчет ключевых метрик: конверсия и средний чек
- сравнение покупательской способности по ценам туров
- расчет ежедневных и кумулятивных показателей
- построение графиков динамики конверсии и среднего чека
- проверка стабильности метрик во времени
- проверка нормальности распределений (Шапиро-Уилк)
- проверка равенства дисперсий (тест Левена)
- t-тест для сравнения ежедневных средних чеков
- Z-тест для сравнения конверсий
- конверсий в каждой из групп
- разницы конверсий
- среднего чека в каждой из групп
- по конверсии значимой разницы между A и B нет
- по среднему чеку вариант B значимо выше -> суммарная выручка больше
- рекомендация для бизнеса: использовать дизайн варианта B
- Python 3.12+
- Pandas, NumPy
- Matplotlib, Seaborn
- SciPy (статистические тесты)
- Statsmodels (z-тест для пропорций)
| Метрика | Подход | Вывод |
|---|---|---|
| Конверсия | Z-тест для пропорций, 95% CI | Разницы нет (p=0.238, CI включает 0) |
| Средний чек (ежедневный) | t-тест (после Шапиро и Левена), 95% CI | Разница значима, B > A (CI не пересекаются) |
| Стабильность метрик | Кумулятивные графики | Метрики стабилизировались → тест завершён |
- Конверсии у A и B одинаковы, статистически значимой разницы нет.
- Средний чек у группы B значимо выше → больше суммарная выручка при той же конверсии.
- Рекомендация: выбрать дизайн варианта B, так как он экономически эффективнее.
