Центр статистического анализа - Статистический анализ данных: консалтинг, тренинги, обучение

Многомерные статистические методы классификации в SPSS

Описание тренинга: в курсе "Многомерные статистические методы классификации в IBM SPSS Statistics" разбираются методы классификации, которые также относят к методам добычи знаний (data mining), позволяющим находить скрытые и неочевидные закономерности в больших массивах данных и принимать на основе этих закономерностей управленческие решения.

По окончании тренинга Вы будете уметь:

  • Проводить кластерный анализ различными методами
  • Использовать факторный и компонентный анализ в задачах классификации
  • Проводить дискриминантный анализ и классификацию на его основе
  • Строить деревья решений и уметь анализировать их 

Продолжительность тренинга: 4 дня (с 10:00 до 17:00)

Программа тренинга:

Тема 1. Кластерный анализ и его применение

  • Многомерные методы классификации
  • Понятие и области применения кластерного анализа
  • Задачи кластерного анализа
  • Методы кластерного анализа
  • Преимущества и недостатки кластерного анализа
  • Этапы кластерного анализа
  • Исходные данные для кластерного анализа
  • Меры расстояния между объектами
  • Анализ качества классификации

Тема 2. Иерархический кластерный анализ

  • Особенности иерархического кластерного анализа
  • Алгоритм иерархических методов кластерного анализа
  • Меры расстояния между кластерами
  • Процедура Расстояния
  • Меры различия
  • Меры сходства
  • Процедура Иерархический кластерный анализ
  • Выбор метода иерархического кластерного анализа
  • Результаты процедуры Иерархический кластерный анализ
  • Графическое представление результатов иерархического кластерного анализа
  • Настройка статистик процедуры Иерархический кластерный анализ
  • Сохранение новых переменных

Тема 3.  Классификация методом k-средних

  • Сущность и особенности метода k-средних
  • Алгоритм метода k-средних
  • Процедура Кластерный анализ методом k-средних
  • Результаты процедуры Кластерный анализ методом k-средних
  • Настройка количества итераций
  • Настройка дополнительных параметров
  • Результаты вывода дополнительных настроек
  • Сохранение новых переменных
  • Графическое представление результатов

Тема 4. Двухэтапный кластерный анализ

  • Особенности двухэтапного кластерного анализа
  • Предпосылки двухэтапного кластерного анализа
  • Алгоритм двухэтапного кластерного анализа
  • Процедура Двухэтапный кластерный анализ
  • Сводка результатов модели
  • Оценка кластерной структуры
  • Просмотр информации о кластерах
  • Вывод информации по кластерам
  • Управление выводом
  • Вывод процедуры Двухэтапный кластерный анализ
  • Дополнительная панель средства просмотра кластеров
  • Отбор наблюдений по кластерам
  • Параметры процедуры Двухэтапный кластерный анализ

Тема 5. Методы снижения размерности: факторный и компонентный анализ

  • Понятие факторного анализа
  • Цель и задачи факторного анализа
  • Этапы факторного анализа
  • Предпосылки применения факторного анализа
  • Алгоритм компонентного анализа
  • Алгоритм факторного анализа
  • Сравнение факторного и компонентного анализов
  • Предпосылки применения факторного и компонентного анализов
  • Процедура Факторный анализ
  • Результаты процедуры Факторный анализ
  • Правила отбора факторов
  • Выбор метода факторного анализа
  • Проблема вращения факторов
  • Настройка вращения факторов
  • Параметры процедуры Факторной анализ
  • Вывод описательных статистик
  • Сохранение значений факторов

Тема 6. Классификация на основе откликов: дискриминантный анализ

  • Сегментация на основе откликов
  • Методы сегментации на основе откликов
  • Исходные данные для дискриминантного анализа
  • Сходства дискриминантного анализа и логистической регрессии
  • Различия дискриминантного анализа и логистической регрессии
  • Цель и задачи дискриминантного анализа
  • Предпосылки дискриминантного анализа
  • Этапы дискриминантного анализа
  • Методы дискриминантного анализа
  • Исходные данные
  • Линейная модель дискриминантного анализа
  • Процедура Дискриминантный анализ
  • Результаты процедуры Дискриминантный анализ
  • Статистики процедуры Дискриминантный анализ
  • Метод пошагового отбора процедуры Дискриминантный анализ
  • Классификация на основе результатов дискриминантного анализа
  • Классификационные статистики
  • Сохранение новых переменных

Тема 7. Модели классификации на основе деревьев решений

  • Термины, применяемые в деревьях решений
  • Методология деревьев решений
  • Задачи и области применения деревьев решений
  • Преимущества и недостатки деревьев решений
  • Методы деревьев решений
  • Процедура Деревья классификации
  • Настройка Вывода модели
  • Сохранение результатов
  • Результаты процедуры Деревья классификации
  • Проверка модели

Тема 8. Построение деревьев решений методом CHAID

  • Описание метода CHAID
  • Запуск и настройка процедуры Деревья классификации для метода CHAID
  • Построение модели CHAID
  • Построение модели CHAID по данным с пропусками
  • Задание стоимостей ошибочной классификации
  • Задание прибылей
  • Задание значений
  • Построение более надежных моделей с помощью метода Исчерпывающий CHAID

 Тема 9. Построение деревьев решений методом CRT

  • Описание метода CRT
  • Запуск и настройка процедуры Деревья классификации для метода CRT
  • Построение модели CRT
  • Построение модели CRT по данным с пропусками
  • Задание априорных вероятностей

 Тема 10. Построение деревьев решений методом QUEST

  • Описание метода QUEST
  • Запуск и настройка процедуры Деревья классификации для метода QUEST
  • Построение модели QUEST
  • Построение модели QUEST по данным с пропусками
  • Задание априорных вероятностей

Тема 11. Редактор деревьев

  • Просмотр диаграммы дерева в Редакторе
  • Просмотр содержимого узла
  • Настройка внешнего вида диаграммы
  • Изменение ориентации диаграммы
  • Настройка содержимого узла
  • Отбор наблюдений в Редакторе