Вашему вниманию предлагается три набора данных разной сложности. Можно решать несколько сразу, чтобы получить больше баллов (в сумме максимум 100). Для каждого из наборов решение представляет собой Python Notebook (Google Colab) с последовательной обработкой данных. Ключевые шаги обработки, анализа и визуализации должны сопровождаться пояснениями на русском языке. Выбор методов решения, используемых признаков для построения модели должен быть обоснован и описан.
- Классический датасет Ирисы (20 баллов) https://archive.ics.uci.edu/dataset/53/iris:
- понимание задачи/данных (понимание того, какие методы для понижения размерности и обучения классификатора можно использовать): 4 балла
- понижение размерности: 7 баллов
- обучение классификатора: 7 баллов
- оценка модели с использованием метрик (точность, полнота, F1-мера): 2 балла