Кластерный анализ (cluster analysis) – совокупность многомерных статистических методов классификации объектов по характеризующим их признакам, разделение совокупности объектов на однородные группы, близкие по определяющим критериям, выделение объектов определенной группы.
Кластер – это группы объектов, выделенные в результате кластерного анализа на основе заданной меры сходства или различий между объектами. Объект – это конкретные предметы исследования, которые необходимо классифицировать. Объектами при классификации выступают, как правило, наблюдения. Например, потребители продукции, страны или регионы, товары и т.п. Хотя можно проводить кластерный анализ и по переменным. Классификация объектов в многомерном кластерном анализе происходит по нескольким признакам одновременно. Это могут быть как количественные, так и категориальные переменные в зависимости от метода кластерного анализа. Итак, главная цель кластерного анализа – нахождение групп схожих объектов в выборке.
Совокупность многомерных статистических методов кластерного анализа можно разделить на иерархические методы (агломеративные и дивизимные) и неиерархические (метод k-средних, двухэтапный кластерный анализ, метод ближайших соседей). Однако общепринятой классификации методов кластерного анализа не существует, и к ним относят множество алгоритмов машинного обучения, решающих задачу разделения совокупности на однородные группы.
Сфера использования кластерного анализа, из-за его универсальности, очень широка. Кластерный анализ применяют в экономике, маркетинге, археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, социологии и других областях.
Вот несколько примеров применения кластерного анализа:
- медицина – классификация заболеваний, их симптомов, способов лечения, классификация групп пациентов;
- маркетинг – задачи оптимизации ассортиментной линейки компании, сегментация рынка по группам товаров или потребителей, определение потенциального потребителя;
- социология – разбиение респондентов на однородные группы;
- психиатрия – корректная диагностика групп симптомов является решающей для успешной терапии;
- биология – кластеризация организмов по группе;
- экономика – кластеризация субъектов РФ по инвестиционной привлекательности.
Вам может быть интересно ...
Онлайн курс "Многомерные методы классификации в IBM SPSS Statistics"