Описание
Целевая аудитория: курс «Практика разработки скоринговых моделей» рассчитан для менеджеров по кредитным рискам, менеджеров по кредитному скорингу, руководителей управлений рисками в сфере финансов, банковской сфере, розничной торговле, страховании, телекоммуникациях.
Цель обучения: получить необходимые знания для планирования, разработки, внедрения и поддержки скоринговых карт внутри организации.
Объем курса: 24 ак. часа (общая продолжительность видео лекций около 12 часов + практическая работа). Общий объем времени для освоения курса соответствует очному обучению 3 дня с 10:00 до 17:00.
Прохождение курса позволит Вам:
- получить знания о пошаговом алгоритме построения скоринговых моделей, включая этапы подготовки данных, их диагностики и валидации;
- самостоятельно строить и применять собственные, ориентированные под специфику Ваших клиентов, скоринговые модели;
- минимизировать затраты на приобретение готовых скоринговых систем;
- снизить риски, связанные с раскрытием конфиденциальных данных заемщиков, которые возникают при внедрении готовых систем.
Ссылка на портал курса (доступ к видеолекциям и учебным пособиям открывается после оплаты курса)
Программа курса
Тема 1. Введение в построение скоринговых моделей – 2 ак.ч.
- Понятие скоринга
- Области применения скоринга
- Особенности банковского скоринга
- Задачи построения скоринговых моделей
- Классификация скоринговых моделей
- Понятие скоринговой карты
- Статистические методы для построения скоринговых карт
- Инструменты для построения скоринговых моделей
- Предпосылки построения скоринговых моделей
Тема 2. Подготовка данных для построения скоринговой модели – 4 ак.ч.
- Определение генеральной и выборочной совокупности
- Признаки и переменные
- Шкалы измерения переменных
- Определение целевой переменной
- Определение показательного периода и окна выборки
- Проверка правильности выбора целевой переменной
- Выбор независимых переменных
- Поиск логических несоответствий и ошибок в данных
- Работа с пропущенными значениями
- Перекодировка значений переменных
- Задание условий отбора наблюдений
- Выбор оптимального количества предикторов и наблюдений
- Проблема соотношения положительных и отрицательных исходов целевой переменной
- Прореживание и взвешивание данных
- Вычисление новых переменных
- Обучающая и тестовая выборка
- Задание сегментов
- Определение объема и ошибки выборки
Тема 3. Проверка и исследование данных для построения скоринговой модели – 4 ак.ч.
- Исследование категориальных переменных
- Таблицы сопряженности для анализа категориальных переменных
- Двумерные таблицы сопряженности
- Анализ процентов в таблице сопряженности
- Анализ ожидаемых частот и остатков в таблицах сопряженности
- Статистическая гипотеза
- Нулевая и альтернативная гипотеза
- Виды статистических ошибок
- Статистический критерий
- Критерий независимости хи-квадрат
- Меры связи для категориальных шкал
- Показатели риска для таблиц сопряженности
- Статистики центральной тенденции
- Статистики разброса
- Оценка однородности данных
- Процентные точки и их анализ
- Гистограммы
- Ящичковые диаграммы
- Оценка распределения переменных
- Преобразования количественных переменых
- Графический анализ взаимосвязи
- Коэффициент корреляции Пирсона
- Ранговые коэффициенты корреляции
- Расчет коэффициентов корреляции
- Категоризация количественных предикторов
- Информационное значение и вес категорий предикторов
- Визуальная категоризация предикторов по процентным точкам
- Оптимальная категоризация предикторов на основе меры энтропии
- Настройка параметров оптимальной категоризации
Тема 4. Модель логистической регрессии – 4 ак.ч.
- Линейная модель регрессии
- Предпосылки линейного регрессионного анализа
- Оценка и интерпретация коэффициентов линейной регрессии
- Понятие модели бинарного выбора
- Шансы и их соотношение
- Модель логистической регрессии
- Оценка и интерпретация коэффициентов логистической регрессии
- Достоинства и недостатки логистической регрессии
- Алгоритм построения логистической регрессии
- Задание категориальных предикторов
- Задание взаимодействия предикторов
- Методы отбора предикторов
- Проблема мультиколлинеарности и способы ее устранения
- Прогноз зависимой переменной
Тема 5. Построение и анализ качества модели логистической регрессии – 4 ак.ч.
- Процедура Логистическая регрессия
- Проверка обоснованности модели логистической регрессии
- Логарифм правдоподобия
- Проверка значимости уравнения
- Оценки коэффициента детерминации
- Критерий Хосмера-Лемешева
- Настройка категориальных предикторов в модели
- Настройка автоматического отбора предикторов
- Проверка значимости коэффициентов и их интервальные оценки
- Анализ остатков
- Анализ статистик влияния
- Диагностика мультиколлинеарности
Тема 6. Валидация модели логистической регрессии – 4 ак.ч.
- Стратегии валидации
- Корректировка на априорные вероятности
- Расчет скоринговых баллов на основе коэффициентов логистической регрессии
- Дискриминирующая способность модели
- График классификации
- Чувствительность и специфичность модели
- ROC-анализ
- Анализ и интерпретация ROC-кривой
- Показатель площади под ROC-кривой и его интервальная оценка
- Индекс Джини и его интервальная оценка
- Задание оптимального порога классификации
- Проблемы переобучения и недостаточной подгонки модели
- Анализ распределения скоринговых баллов
- Статистика Колмогорова-Смирнова
- Коэффициент дивергенции
- Коэффициент разделения
- Диаграмма выигрыша
Дополнительная практическая работа, разбор кейсов, ответы на вопросы – 2 ак.ч.
Отзывы
Столкнувшись с проблемой низкой прогностической способности скоринговой модели (выявление потенциальных мошенников), решил пройти дополнительное обучение. Знакомые посоветовали обратиться в "Центр Статистического Анализа" , т.к. после прохождения обучения по другим темам были очень довольны, что я и сделал. Само обучение могу охарактеризовать 3 словами - ёмко, качественно и доступно. В общем, если вы ищете качественное обучение по построению скоринговых моделей, а времени у вас на обучение не так много - крайне рекомендую обратить внимание на данный курс.
Сазонов Павел, риск-аналитик Sentinel Credit Management
Читать все отзывы на онлайн-курсы
Преподаватель курса
Сорокин Александр Сергеевич – создатель и генеральный директор компании Центр Статистического Анализа. В 2001 году окончил с отличием Московский Государственный Университет Экономики, Статистики и Информатики (МЭСИ) по специальности «Статистика». В 2005 году защитил кандидатскую диссертацию по специальности 08.00.12 – «Бухгалтерский учет, статистика», на тему «Эконометрическое моделирование конъюнктуры мирового рынка нефти». В 2012 году присвоено учёное звание доцента. Работает в должности доцента на кафедре Математические методы в экономике РЭУ им. Г.В. Плеханова. Направления научных исследований: статистическая обработка и вероятностный анализ больших массивов данных, интеллектуальный анализ данных. Читает следующие дисциплины: «Теория вероятностей и математическая статистика», «Статистические методы прогнозирования», «Эконометрика», «Эконометрика и моделирование в менеджменте», «Актуарные расчеты» и др. В 2013-2014 приглашенный ассоциированный профессор Казахстано-Британского Технического Университета (г. Алматы, РК). Автор более 50 научных и методических работ по применению статистических методов в практической деятельности. Преподаватель-практик и тренер-консультант. Создатель авторских курсов по статистическому анализу данных на базе пакета SPSS, читаемых в ведущих учебных центрах России. Автор и ведущий десятков тренингов по анализу данных, в том числе в 2009-2010 гг. исполнитель по федеральным контрактам на разработку и обучение сотрудников Федеральной службы государственной статистики РФ. Эксперт по построению скоринговых моделей для банков и МФО. В качестве научного руководителя и участника принимал участие в 5 грантах в области анализа больших данных и моделирования. Личный сайт www.alsorokin.ru.