З циклу домашніх завдань Python Data Science.
Завдання, що пропонуються, необхідно оформити у вигляді одного jupyter ноутбука.
У цьому завданні вам потрібно завантажити ось цей датасет. Тут ви знайдете 2 файли - з двовимірним датасетом та датасетом mnist
. Для кожного з них застосуйте алгоритм K-means
для кластеризації. Щоб знайти оптимальну кількість кластерів, скористайтесь ліктевим методом.
Візуалізуйте результат роботи кластеризації. Для випадку з mnist
датасетом, вам потрібно ще скористатись алгоримтом PCA
щоб зменшити розмірність вашим даних до 2-вимірного варіанту.