Практика разработки скоринговых моделей на базе логистической регрессии
Тренинг «Практика разработки скоринговых моделей на базе логистической регрессии» разработан для менеджеров по кредитным рискам, менеджеров по кредитному скорингу, руководителей управлений рисками, аналитиков в сфере финансов, банковской сфере, розничной торговле, страховании, телекоммуникациях.
Цель тренинга: получить необходимые знания для планирования, разработки, внедрения и поддержки скоринговых карт внутри организации.
Продолжительность тренинга: 3 дня (с 10:00 до 17:00) или 24 ак.ч.
Прохождение тренинга позволит Вам:
- получить знания о пошаговом алгоритме построения скоринговых моделей, включая этапы подготовки данных, их диагностики и валидации;
- самостоятельно строить и применять собственные, ориентированные под специфику Ваших клиентов, скоринговые модели;
- минимизировать затраты на приобретение готовых скоринговых систем;
- снизить риски, связанные с раскрытием конфиденциальных данных заемщиков, которые возникают при внедрении готовых систем.
Бизнес-тренер
Cорокин Александр Сергеевич – кандидат экономических наук, руководитель компании «Центр Статистического Анализа», доцент кафедры Математические методы в экономике РЭУ им. Г.В. Плеханова. Читал тренинги по построению скоринговых моделей в десятках компаниях. Имеет опыт участия в проектах по разработке скоринговых моделей с нуля для банков, микрофинансовых компаний, телекоммуникационных компаний и их поддержки в дальнейшем. Автор более 50 научных и методических работ по применению статистических методов в практической деятельности, в том числе по построению скоринговых моделей. Сайт-портфолио: www.alsorokin.ru.
Тренинг практический, все темы изучаются на примерах и кейсах на реальных данных с расчетами на компьютере. Программное обеспечение, на базе которого может проводиться тренинг: SPSS Statistics, SPSS Modeler, R, Statistica, SAS, Loginom и др.
После прохождения ваша компания получает:
- комплект методических материалов, в том числе авторское пошаговое руководство-пособие по скорингу объемом около 200 стр.;
- фирменный сертификат о прохождении тренинга для каждого участника;
- бесплатную консалтинговую поддержку по вопросам тренинга на 6 месяцев.
Программа тренинга может быть отредактирована под задачи клиента с использованием данных вашей компании.
Программа тренинга:
Тема 1. Введение в построение скоринговых моделей – 2 ак.ч.
- Понятие скоринга
- Области применения скоринга
- Особенности банковского скоринга
- Задачи построения скоринговых моделей
- Классификация скоринговых моделей
- Понятие скоринговой карты
- Статистические методы для построения скоринговых карт
- Машинное обучение в кредитном скоринге
- Инструменты для построения скоринговых моделей
- Предпосылки построения скоринговых моделей
Тема 2. Подготовка данных для построения скоринговой модели – 4 ак.ч.
- Определение генеральной и выборочной совокупности
- Признаки и переменные
- Шкалы измерения переменных
- Определение целевой переменной
- Определение показательного периода и окна выборки
- Проверка правильности выбора целевой переменной
- Выбор независимых переменных
- Поиск логических несоответствий и ошибок в данных
- Работа с пропущенными значениями
- Перекодировка значений переменных
- Задание условий отбора наблюдений
- Выбор оптимального количества предикторов и наблюдений
- Проблема соотношения положительных и отрицательных исходов целевой переменной
- Прореживание и взвешивание данных
- Вычисление новых переменных
- Обучающая и тестовая выборка
- Задание сегментов
- Определение объема и ошибки выборки
Тема 3. Проверка и исследование данных для построения скоринговой модели – 4 ак.ч.
- Исследование категориальных переменных
- Таблицы сопряженности для анализа категориальных переменных
- Двумерные таблицы сопряженности
- Анализ процентов в таблице сопряженности
- Анализ ожидаемых частот и остатков в таблицах сопряженности
- Статистическая гипотеза
- Нулевая и альтернативная гипотеза
- Виды статистических ошибок
- Статистический критерий
- Критерий независимости хи-квадрат
- Меры связи для категориальных шкал
- Показатели риска для таблиц сопряженности
- Статистики центральной тенденции
- Статистики разброса
- Оценка однородности данных
- Процентные точки и их анализ
- Гистограммы
- Ящичковые диаграммы
- Оценка распределения переменных
- Преобразования количественных переменных
- Графический анализ взаимосвязи
- Коэффициент корреляции Пирсона
- Ранговые коэффициенты корреляции
- Расчет коэффициентов корреляции
- Категоризация количественных предикторов
- Информационное значение и вес категорий предикторов
- Визуальная категоризация предикторов по процентным точкам
- Оптимальная категоризация предикторов на основе меры энтропии
- Настройка параметров оптимальной категоризации
Тема 4. Модель логистической регрессии – 4 ак.ч.
- Линейная модель регрессии
- Предпосылки линейного регрессионного анализа
- Оценка и интерпретация коэффициентов линейной регрессии
- Понятие модели бинарного выбора
- Шансы и их соотношение
- Модель логистической регрессии
- Оценка и интерпретация коэффициентов логистической регрессии
- Достоинства и недостатки логистической регрессии
- Алгоритм построения логистической регрессии
- Задание категориальных предикторов
- Задание взаимодействия предикторов
- Методы отбора предикторов
- Проблема мультиколлинеарности и способы ее устранения
- Прогноз зависимой переменной
- Децили риска
Тема 5. Построение и анализ качества модели логистической регрессии – 4 ак.ч.
- Процедура Логистическая регрессия
- Проверка обоснованности модели логистической регрессии
- Логарифм правдоподобия
- Проверка значимости уравнения
- Оценки коэффициента детерминации
- Критерий Хосмера-Лемешева
- Настройка категориальных предикторов в модели
- Настройка автоматического отбора предикторов
- Проверка значимости коэффициентов и их интервальные оценки
- Анализ остатков
- Анализ статистик влияния
- Диагностика мультиколлинеарности
Тема 6. Валидация модели логистической регрессии – 4 ак.ч.
- Стратегии валидации
- Корректировка на априорные вероятности
- Расчет скоринговых баллов на основе коэффициентов логистической регрессии
- Дискриминирующая способность модели
- График классификации
- Чувствительность и специфичность модели
- ROC-анализ
- Анализ и интерпретация ROC-кривой
- Показатель площади под ROC-кривой и его интервальная оценка
- Индекс Джини и его интервальная оценка
- Задание оптимального порога классификации
- Проблемы переобучения и недостаточной подгонки модели
- Анализ распределения скоринговых баллов
- Статистика Колмогорова-Смирнова
- Коэффициент дивергенции
- Коэффициент разделения
- Диаграмма выигрыша
Лабораторная работа, разбор кейсов, анализ данных клиента, ответы на вопросы – от 2 ак.ч.