В задаче категоризации методом KMeans огромное количество графиков. Вот способ вывести их в сетке 4 х Х. (Количество окошек в строке можете изменять сами ,грамотно заменяя цифру 4 на нужную Вам.
Вывод графиков в сетке я уже не один раз делал.
На в этом задаче машинного обучения это особенно пригодилось.
Вообще, задача категоризации относится к задачам машинного обучения “без учителя”.
Это означает то ,что мы заранее не знаем, какой получится результат.
Сколько и какие категории в выборке данных сформируются.
Сегодня закончил последнюю теоретическую часть в программе обучения Анализ данных на Яндекс.Практикуме.
Эта часть далась мне нелегко. Было очень много непонятных слов и действий.
Но, зато, очень интересно. Ведь это были Начала машинного обучения.
Нам рассказали и на практике показали, как устроено обучение машинного моделирования на основе накопленных данных для прогнозирования результатов будущих периодов.
Например
Есть фитнес-центр. Администраторы этого предприятия ведут учёт того, как клиенты его посещают.
Как часто приходят
Посещают ли дополнительные группы
Покупают ли индивидуальные консультации
Живут или работают рядом
Когда заканчивается срок действия абонемента
И … когда перестали пользоваться услугами компании.
Аналитик данных:
проводит подготовку собранной статистики методами pandas на python
выбирает методы прогнозирования из библиотеки sklearn
обучает компьютер методом scaler.fit
выбирает самый точный алгоритм прогнозирования по результату сравнения параметров оценки точности предсказания из sklearn.metrics
помогает настроить систему, которая на основе новых данных за месяц, строит прогноз оттока
Администрация:
На основе полученного прогноза активно стимулирует клиентов из рисковой группы. Чтобы они не бросали занятия )))