Click here to print.

Дискриминантный анализ

Дискриминантный анализ (discriminant analysis) – метод многомерного статистического анализа. Он включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков. В отличие от кластерного анализа новые кластеры не образуются, а являются правилом, по которому объекты относятся к определенной группе. Задачи дискриминантного анализа во многом схожи с задачами логистической регрессии – классификация наблюдений на группы на основе прогностической модели. Несмотря на некоторые сходства дискриминантный анализ и логистическая регрессия обладают существенными различиями. Идеи дискриминантного анализа тесно связаны с дисперсионным, регрессионным анализом.

Смысл дискриминантного анализа – на основании обучающих выборок преобразовать многомерный массив в одномерный показатель для прогнозирования принадлежности наблюдений к группам, т. е. построить новый обобщенный показатель, значения которого максимально различаются для объектов, отнесенных к разным группам. Обучающая выборка – это множество объектов, заданных значениями признаков и принадлежность которых к тому или иному классу достоверно известна.

Исследование различий между группами – основа концепции дискриминантного анализа. Например, зависимая переменная может быть выбором торговой марки товара (А, В или С), а независимыми переменными могут быть характеристики этих товаров. При проведении дискриминантного анализа – находят дискриминантную функцию (линейную комбинацию независимых переменных), которая наилучшим образом различает категории или группы зависимой переменной.

В медицине дискриминантный анализ, например, поможет оценить состояние пациента по переменным состояния больного: выздоровел полностью, частично или совсем не выздоровел. В биологии, например, можно записать различные характеристики сходных сортов растений, чтобы потом провести анализ дискриминантной функции, наилучшим образом разделяющий типы или группы сортов. В маркетинге, например, можно получить ответы на вопросы: какими демографическими характеристиками обладают приверженцы бренда, как различаются между собой сегменты рынка, какими характеристиками обладают потребители, реагирующие на прямую почтовую рассылку и др.


Многомерные методы классификации в SPSSВам может быть интересно ...

Онлайн курс "Многомерные методы классификации в IBM SPSS Statistics"