Click here to print.

Логистическая регрессия

Логистическая регрессия или логит-регрессия (logit model) – это статистическая модель, используемая для предсказания вероятности возникновения интересующего события с помощью логистической функции.

Логистическую регрессию относят к моделям бинарного выбора. Регрессионная модель бинарного выбора – это регрессионная модель, в которой зависимая переменная дихотомическая (бинарная). Зависимая переменная может принимать лишь два значения и означать, например, принадлежность к определенной группе (надежный клиент или ненадежный клиент банка), предпринимаемое действие (покупка товара), варианты ответа  «да» или «нет» (нравится реклама или не нравится). Строить обычную линейную регрессионную модель с бинарными зависимыми переменными нельзя. В этом случае невозможно будет интерпретировать предсказанные по регрессии в непрерывной количественной шкале значения зависимой переменной.

Значения факторов в моделях бинарного выбора должны быть измерены в количественной шкале. Также в модели бинарного выбора можно включать в качестве факторов категориальные переменные. Итак, в моделях бинарного выбора строится регрессионная модель зависимости вероятности того, что результативная дихотомическая переменная примет значение 0 или 1 при заданном значении факторов.

Для моделирования вероятности дихотомической зависимой переменной подбирают специальную монотонно возрастающую функцию, которая может принимать значения только от 0 до 1.

В качестве специальной функции в моделях бинарного выбора обычно используют:

Модели бинарного выбора на основе логистической функции называются логистической регрессией или логит-моделью.

Модели бинарного выбора на основе функции стандартного нормального распределения называют пробит-моделями.

С помощью логистической регрессии прогнозируется вероятность отклика для зависимой переменной от включенных в модель независимых переменных. На основе прогнозных значений вероятности можно произвести классификацию всех наблюдений на две группы. Отдельным анализом при построении модели логистической регрессии является анализ ROC-кривых (Receiver Operator Characteristic).  ROC-анализ позволяет выбрать оптимальное значение порогового значения вероятности для классификации. ROC-кривая – кривая, которая используется для представления результатов бинарной классификации и оценки эффективности классификации.

В прикладном статистическом анализе логистическая регрессия используется для решения двух задач: моделирования взаимосвязи и классификации наблюдений. Логистическую регрессию применяют при проведение клинических исследований в медицине, в банковском скоринге для построения рейтинга заемщиков и управления кредитными рисками, в потребительском скоринге для моделирование поведения покупателей и других сферах.


Углубленные методы статистического анализа в SPSSВам может быть интересно ...

Онлайн курс "Углубленные методы статистического анализа данных в IBM SPSS Statistics"