diff --git a/docs/project/README.md b/docs/project/README.md index 1aed2b71..79967bf1 100755 --- a/docs/project/README.md +++ b/docs/project/README.md @@ -24,3 +24,4 @@ | [comment-emotionality-classification](./comment-emotionality-classification/) | Проскурин Глеб, Мангараков Александр | | [face-emotion-recognition](./face-emotion-recognition) | Якушев Алексей | | [movie-recomender](./movie-recomender) | Филиппенко Илья | +| [restaurant-review-prediction](./restaurant-review-prediction) | Расковалова Алёна | \ No newline at end of file diff --git a/docs/project/restaurant-review-prediction/README.md b/docs/project/restaurant-review-prediction/README.md new file mode 100644 index 00000000..8ac0444b --- /dev/null +++ b/docs/project/restaurant-review-prediction/README.md @@ -0,0 +1,50 @@ +# restaurant-review-prediction + +### Студент - Расковалова Алёна +### Группа - P4141 + +#### Цель +Повышение точности предсказания при оценке настроения в отзывах на рестораны. + +#### Задачи +1. Сбор данных +2. Спроектировать архитектуру системы +2. Обучить модели на основе обучающей выборки +3. Выполнить оценку моделей на тестовой выборке +4. Выбрать оптимальную модель +5. Развернуть лучшую модель + + +#### Датасет + +Ссылка на датасет: https://www.kaggle.com/datasets/joebeachcapital/restaurant-reviews?datasetId=3697155&sortBy=voteCount + +Ссылка на репозиторий с проектом: https://github.com/ResedentSleeper/restaurant-review-prediction + +Оценка содержимого исходного датасета: + +№ | Column | Non-Null Count | Dtype +---|------------|----------------|------- + 0 | Restaurant | 10000 non-null | object + 1 | Reviewer | 9962 non-null | object + 2 | Review | 9955 non-null | object + 3 | Rating | 9962 non-null | object + 4 | Metadata | 9962 non-null | object + 5 | Time | 9962 non-null | object + 6 | Pictures | 10000 non-null | int64 + 7 | 7514 | 1 non-null | float64 + +dtypes: float64(1), int64(1), object(6) + +Доля позитивных и негативных отзывов +![img](img/review_count.png) + +Необходимо будет удалить строки с нулевыми значениями и повторяющимися данными. Получится 9955 записей + +#### Диаграмма активности + +![img](img/activity.png) + +#### Диаграмма компонентов + +![img](img/comp.png) diff --git a/docs/project/restaurant-review-prediction/img/activity.png b/docs/project/restaurant-review-prediction/img/activity.png new file mode 100644 index 00000000..755216be Binary files /dev/null and b/docs/project/restaurant-review-prediction/img/activity.png differ diff --git a/docs/project/restaurant-review-prediction/img/comp.png b/docs/project/restaurant-review-prediction/img/comp.png new file mode 100644 index 00000000..56690715 Binary files /dev/null and b/docs/project/restaurant-review-prediction/img/comp.png differ diff --git a/docs/project/restaurant-review-prediction/img/review_count.png b/docs/project/restaurant-review-prediction/img/review_count.png new file mode 100644 index 00000000..21e7e7aa Binary files /dev/null and b/docs/project/restaurant-review-prediction/img/review_count.png differ