Тренинг «Практика разработки скоринговых моделей на базе логистической регрессии» разработан для менеджеров по кредитным рискам, менеджеров по кредитному скорингу, руководителей управлений рисками, аналитиков в сфере финансов, банковской сфере, розничной торговле, страховании, телекоммуникациях.
Цель тренинга: получить необходимые знания для планирования, разработки, внедрения и поддержки скоринговых карт внутри организации.
Продолжительность тренинга: 3 дня (с 10:00 до 17:00) или 24 ак.ч.
Прохождение тренинга позволит Вам:
- получить знания о пошаговом алгоритме построения скоринговых моделей, включая этапы подготовки данных, их диагностики и валидации;
- самостоятельно строить и применять собственные, ориентированные под специфику Ваших клиентов, скоринговые модели;
- минимизировать затраты на приобретение готовых скоринговых систем;
- снизить риски, связанные с раскрытием конфиденциальных данных заемщиков, которые возникают при внедрении готовых систем.
Бизнес-тренер
Cорокин Александр Сергеевич – кандидат экономических наук, руководитель компании «Центр Статистического Анализа», доцент кафедры Математические методы в экономике РЭУ им. Г.В. Плеханова. Читал тренинги по построению скоринговых моделей в десятках компаниях. Имеет опыт участия в проектах по разработке скоринговых моделей с нуля для банков, микрофинансовых компаний, телекоммуникационных компаний и их поддержки в дальнейшем. Автор более 50 научных и методических работ по применению статистических методов в практической деятельности, в том числе по построению скоринговых моделей. Сайт-портфолио: www.alsorokin.ru.
Тренинг практический, все темы изучаются на примерах и кейсах на реальных данных с расчетами на компьютере. Программное обеспечение, на базе которого может проводиться тренинг: SPSS Statistics, SPSS Modeler, R, Statistica, SAS, Loginom и др.
После прохождения ваша компания получает:
- комплект методических материалов, в том числе авторское пошаговое руководство-пособие по скорингу объемом около 200 стр.;
- фирменный сертификат о прохождении тренинга для каждого участника;
- бесплатную консалтинговую поддержку по вопросам тренинга на 6 месяцев.
Программа тренинга может быть отредактирована под задачи клиента с использованием данных вашей компании.
Программа тренинга:
Тема 1. Введение в построение скоринговых моделей – 2 ак.ч.
- Понятие скоринга
- Области применения скоринга
- Особенности банковского скоринга
- Задачи построения скоринговых моделей
- Классификация скоринговых моделей
- Понятие скоринговой карты
- Статистические методы для построения скоринговых карт
- Машинное обучение в кредитном скоринге
- Инструменты для построения скоринговых моделей
- Предпосылки построения скоринговых моделей
Тема 2. Подготовка данных для построения скоринговой модели – 4 ак.ч.
- Определение генеральной и выборочной совокупности
- Признаки и переменные
- Шкалы измерения переменных
- Определение целевой переменной
- Определение показательного периода и окна выборки
- Проверка правильности выбора целевой переменной
- Выбор независимых переменных
- Поиск логических несоответствий и ошибок в данных
- Работа с пропущенными значениями
- Перекодировка значений переменных
- Задание условий отбора наблюдений
- Выбор оптимального количества предикторов и наблюдений
- Проблема соотношения положительных и отрицательных исходов целевой переменной
- Прореживание и взвешивание данных
- Вычисление новых переменных
- Обучающая и тестовая выборка
- Задание сегментов
- Определение объема и ошибки выборки
Тема 3. Проверка и исследование данных для построения скоринговой модели – 4 ак.ч.
- Исследование категориальных переменных
- Таблицы сопряженности для анализа категориальных переменных
- Двумерные таблицы сопряженности
- Анализ процентов в таблице сопряженности
- Анализ ожидаемых частот и остатков в таблицах сопряженности
- Статистическая гипотеза
- Нулевая и альтернативная гипотеза
- Виды статистических ошибок
- Статистический критерий
- Критерий независимости хи-квадрат
- Меры связи для категориальных шкал
- Показатели риска для таблиц сопряженности
- Статистики центральной тенденции
- Статистики разброса
- Оценка однородности данных
- Процентные точки и их анализ
- Гистограммы
- Ящичковые диаграммы
- Оценка распределения переменных
- Преобразования количественных переменных
- Графический анализ взаимосвязи
- Коэффициент корреляции Пирсона
- Ранговые коэффициенты корреляции
- Расчет коэффициентов корреляции
- Категоризация количественных предикторов
- Информационное значение и вес категорий предикторов
- Визуальная категоризация предикторов по процентным точкам
- Оптимальная категоризация предикторов на основе меры энтропии
- Настройка параметров оптимальной категоризации
Тема 4. Модель логистической регрессии – 4 ак.ч.
- Линейная модель регрессии
- Предпосылки линейного регрессионного анализа
- Оценка и интерпретация коэффициентов линейной регрессии
- Понятие модели бинарного выбора
- Шансы и их соотношение
- Модель логистической регрессии
- Оценка и интерпретация коэффициентов логистической регрессии
- Достоинства и недостатки логистической регрессии
- Алгоритм построения логистической регрессии
- Задание категориальных предикторов
- Задание взаимодействия предикторов
- Методы отбора предикторов
- Проблема мультиколлинеарности и способы ее устранения
- Прогноз зависимой переменной
- Децили риска
Тема 5. Построение и анализ качества модели логистической регрессии – 4 ак.ч.
- Процедура Логистическая регрессия
- Проверка обоснованности модели логистической регрессии
- Логарифм правдоподобия
- Проверка значимости уравнения
- Оценки коэффициента детерминации
- Критерий Хосмера-Лемешева
- Настройка категориальных предикторов в модели
- Настройка автоматического отбора предикторов
- Проверка значимости коэффициентов и их интервальные оценки
- Анализ остатков
- Анализ статистик влияния
- Диагностика мультиколлинеарности
Тема 6. Валидация модели логистической регрессии – 4 ак.ч.
- Стратегии валидации
- Корректировка на априорные вероятности
- Расчет скоринговых баллов на основе коэффициентов логистической регрессии
- Дискриминирующая способность модели
- График классификации
- Чувствительность и специфичность модели
- ROC-анализ
- Анализ и интерпретация ROC-кривой
- Показатель площади под ROC-кривой и его интервальная оценка
- Индекс Джини и его интервальная оценка
- Задание оптимального порога классификации
- Проблемы переобучения и недостаточной подгонки модели
- Анализ распределения скоринговых баллов
- Статистика Колмогорова-Смирнова
- Коэффициент дивергенции
- Коэффициент разделения
- Диаграмма выигрыша
Лабораторная работа, разбор кейсов, анализ данных клиента, ответы на вопросы – от 2 ак.ч.