База:
- Списки, словари, множества -
Lists_dicts_sets.ipynb - Numpy, Scipy, Matplotlib -
Numpy_Scipy_Matplotlib.ipynb - Pandas -
Pandas.ipynb - Seaborn -
Seaborn.ipynb
- Кросс-валидация -
cross-validation.ipynb - Линейные модели -
Linear_model.ipynb
Задача bike sharing -bike_sharing.ipynb - Решающие деревья -
Decision_trees_coursera.ipynb - Случайный лес -
RandomForest.ipynb
Отбор и синтезирование признаков (PCA) - задача imdb -imdb.ipynb
- Кластеризация текстов. Метод k-средних. Сингулярное разложение.
text_clusterisation.ipynb
Решения:
- (Спец.) Аппроксимация функций -
approximation.ipynb - (ШАД) Решающие деревья -
decision_trees.py - (Спец.) Линейная регрессия и стохастический градиентный спуск -
Linear_regression.ipynb - (ШАД) Метод ближайших соседей -
knn.ipynb - (ШАД) Стохастический градиентный спуск и нормализация признаков -
Stohast_and_norm_features.ipynb - (ШАД) Случайный лес -
Random_Forest_Task.ipynb - (ШАД) Метод опорных векторов, анализ текстов на основе SVM -
svm.ipynb - (ШАД) Логистическая регрессия. Реализация градиентного спуска -
Logistic_regression.ipynb - (ODS) Первичный анализ и визуализация данных -
1_Analysis_and_visualisation.ipynb - (Спец.) Вычисление меры сходства текстов при помощи косинусного расстояния -
text_similarity.py - (cs231n) Метод ближайших соседей [прототип] -
knn.py