Центр статистического анализа - Статистический анализ данных: консалтинг, тренинги, обучение

Программирование в SPSS

Цель прохождение тренинга «Программирование в IBM SPSS Statistics» освоить возможности программирования в SPSS с использованием синтаксиса, макросов и скриптов SPSS. Тренинг рассчитан для опытных пользователей программы SPSS. Пройдя тренинг, Вы в десятки раз повысите свою производительность и эффективность работы с программой SPSS и научитесь автоматизировать рабочие процессы, связанные с управлением, анализом и визуализацией данных.

По окончании обучения Вы будете уметь:

  • Создавать синтаксис команд различными способами
  • Выполнять операции по управлению данными, недоступными из диалоговых окон SPSS
  • Писать и использовать макросы
  • Писать и использовать сценарии обработки данных
  • Запускать внешние сценарии обработки данных на языке программирования Python и R

Продолжительность тренинга: 5 дней (с 10:00 до 17:00), тренинг состоит из двух модулей, которые можно изучать поэтапно

Программа тренинга:

ЧАСТЬ 1. Управление данными с помощью синтаксиса SPSS - 16 ак.ч. (2 дня)

Тема 1. Основы работы с синтаксисом в SPSS – 2 ак.ч.

  • Возможности программирования в SPSS (синтаксис, макросы, скрипты)
  • Понятие синтаксиса
  • Необходимость работы с синтаксисом
  • Окно Редактора синтаксиса и его элементы
  • Вставка команд синтаксиса из диалоговых окон
  • Копирование команд из окна Вывода
  • Копирование команд из журнала сеанса
  • Ввод команд в Редакторе синтаксиса
  • Возможности работы с Редактором синтаксиса
  • Автозаполнение при наборе команд
  • Цветовое кодирование структуры команды
  • Задание закладок
  • Использование контрольных точек
  • Комментирование текста
  • Сохранение синтаксиса
  • Способы запуска синтаксиса
  • Интерактивный запуск синтаксиса
  • Типы команд синтаксиса
  • Справка и руководство по синтаксису

Тема 2. Получение данных с помощью синтаксиса SPSS – 2 ак.ч.

  • Возможности чтение файлов данных (команда GET DATA)
  • Чтение данных из одной и множества таблиц баз данных
  • Чтение данных с помощью языка запросов Structured Query Language (SQL)
  • Чтение данных из MS Excel (из одной и множества рабочих книг)
  • Чтение списка текстовых данных (команда DATA LIST)
  • Чтение текстовых файлов с разделителями (команда DATA LIST FREE)
  • Чтение текстовых файлов фиксированной длины (команда DATA LIST FIXED)
  • Чтение текстовых файлов большой длинны (команда FILE HANDLE)
  • Дополнительные возможности чтения текстовых файлов (команда BEGIN DATA … END DATA)
  • Чтение смешанных текстовых файлов
  • Чтение файлов с группировкой
  • Чтение вложенных файлов с множественной группировкой
  • Чтение файлов с повторяющейся структурой данных
  • Изменение кодировки данных (команда SET UNICODE)

Тема 3. Настройка свойств данных с помощью синтаксиса SPSS – 2 ак.ч.

  • Основные свойства данных
  • Задание меток переменных (команда VARIABLE LABELS)
  • Задание меток значений (команда VALUE LABELS)
  • Задание пропущенных значений (команда MISSING VALUES)
  • Задание шкал измерения переменных (команда VARIABLE LEVEL)
  • Настраиваемые свойства переменных (команда VARIABLE ATTRIBUTE)
  • Использование шаблонов свойств данных (команда APPLY DICTIONARY)
  • Задание свойств файла данных (команды FILE LABEL, ADD DOCUMENT, DATAFILE ATTRIBUTE)

Тема 4. Чистка и проверка достоверности данных с помощью синтаксиса SPSS – 2 ак.ч.

  • Поиск недопустимых значений
  • Исключение недопустимых данных из анализа
  • Поиск и фильтрация одинаковых наблюдений
  • Задание правил проверки данных (команда VALIDATEDATA)
  • Поиск необычных наблюдений (команда DETECTANOMALY)

Тема 5. Изменение значений данных с помощью синтаксиса SPSS – 2 ак.ч.

  • Перекодировка значений категориальной переменной (команда RECODE)
  • Категоризация количественных переменных
  • Вычисление переменных (команда COMPUTE)
  • Использование арифметических и статистических функций при вычислении переменных
  • Генерация случайных значений и заданного распределения
  • Вычисление переменной фильтра и отбор наблюдений
  • Изменение текстовых переменных
  • Объединение текстовых переменных
  • Выделение части значений текстовых переменных
  • Изменение типа измерения, ширины текстовых переменных
  • Форматы дат и времени
  • Задание переменных дат и времени
  • Функции дат и времени
  • Операции над переменными дат и времени

Тема 6. Операции с файлами данных с помощью синтаксиса SPSS – 2 ак.ч.

  • Использование несколько источников данных (команды DATASET)
  • Методы слияния фалов данных
  • Добавление в файл данных переменных (команда MATCH FILES)
  • Добавление в файл данных наблюдений (команда ADD FILES)
  • Агрегирование данных (команда AGGREGATE)
  • Взвешивание данных (команда WEIGHT)
  • Транспонирование данных (команда FLIP)
  • Реструктуризация наблюдений в переменные (команда CASESTOVARS)
  • Реструктуризация переменных в наблюдения (команда VARSTOCASES)

Тема 7. Экспорт данных и результатов анализа с помощью синтаксиса SPSS – 2 ак.ч.

  • Экспорт данных в различные форматы (команда SAVE TRANSLATE)
  • Экспорт данных в формат программ SAS, STATA
  • Экспорт данных в базу данных
  • Экспорт данных в текстовый формат
  • Экспорт данных в MS Excel
  • Экспорт результатов анализа в различные форматы (команда OUTPUT EXPORT)
  • Экспорт вывода в формат Word/RTF
  • Экспорт вывода в формат MS Excel
  • Система управления выводом (команда OMS)
  • Экспорт вывода в формат XML
  • Управление файлами вывода (команды OUTPUT)

Тема 8. Основы программирования и обработки файла команд синтаксиса – 2 ак.ч.

  • Правила создания синтаксиса команд
  • Отступы команд
  • Команда EXECUTE и ее использование
  • Связывание несколько файлов синтаксиса (команда INSERT)
  • Определение общих параметров (команда FILE HANDLE)
  • Задание условий обработки синтаксиса команд (команды IF, DO IF, END IF)
  • Повторение команд синтаксиса (команда DO REPEAT)
  • Пакетный запуск синтаксиса (команда INCLUDE)
  • Производственный режим SPSS
  • Создание и использование векторных переменных (VECTOR)
  • Создание циклов (команда LOOP-END LOOP)
  • Задание количества итераций в структуре цикла
  • Использование вложенных циклов
  • Задание условий выполнения циклов
  • Использование циклов для создания нескольких файлов данных

Часть 2. Программирование с помощью макросов и скриптов в IMB SPSS Statistics – 24 ак.ч. (3 дня)

Тема 1. Основы работы с макросами в SPSS – 4 ак.ч.

  • Понятие макроса
  • Сравнение макроса и синтаксиса команд
  • Структура макроса команд
  • Задание макроса
  • Задание аргументов (параметров) макроса
  • Просмотр встроенных команд макроса
  • Макропеременные в макросе
  • Ключевые слова макроса
  • Использование изменяющихся макропеременных
  • Отладка макроса
  • Распространенные ошибки написания макросов
  • Вызов макроса
  • Пример макроса

Тема 2. Расширенные возможности работы с макросами в SPSS – 4 ак.ч.

  • Задание циклов в макросах
  • Задание вложенных циклов в макросах
  • Прямое назначение макропеременной
  • Задание условий вычисления
  • Замена символов в нескольких строковых переменных
  • Изменение формата данных множества переменных
  • Арифметические действия с макропеременными
  • Пример макроса для построения нескольких диаграмм
  • Создание таблиц с помощью макросов
  • Пример макроса для создания файла данных
  • Пример макроса для создании таблицы и диаграммы по выборке
  • Создание отчетов с помощью макросов

Тема 3. Основы работы со скриптами в SPSS – 4 ак.ч.

  • Понятие скрипта
  • Возможности скриптов, отличие скрипта от синтаксиса и макроса
  • Сравнение скриптом управления выводом (OMS)
  • Задачи, решаемы скриптами
  • Классы объектов в SPSS при работе со скриптами
  • Типы скриптов
  • Редактор скриптов
  • Глобальные скрипты
  • Вызов скриптов
  • Создание скрипта
  • Редактирование скрипта
  • Отладка скриптов в интерактивном режиме
  • Примеры скриптов

Тема 4. Работа со скриптами в SPSS – 4 ак.ч.

  • Использование диалоговых окон
  • Создание и заполнение диалоговых окон
  • Выполнение скрипотов с параметрами в диалоговых окнах
  • Добавление даты к имени файла
  • Запуск вычислений статистик по всем переменным
  • Использование параметров в скриптах
  • Автоматически исполняемые скрипты
  • Изменение результатов окна вывода с помощи скриптов
  • Установка длины текстовых переменных по данным
  • Изменение меню панели содержания в окне Вывода
  • Скрипт передачи результатов в текстовый файл
  • Скрипт передачи результатов в Power Point
  • Cкрипт назначения окна Вывода
  • Скрипт подсчета числа ошибок
  • Поиск нужного текста в окне Вывода
  • Проверка содержания окна Вывод на наличие ошибок
  • Проблема асинхронности выполнения скриптов

Тема 5. Работа со скриптами языка Python в SPSS – 4 ак.ч.

  • Язык программирования Python
  • Модуль интеграции Python с SPSS
  • Запуск скрипта Python в SPSS
  • Подкоманды языка Python для отправки в SPSS
  • Динамически создаваемый синтаксис
  • Доступ к информации в окне вывода для выполнения скрипотов Python
  • Изменение содержания настраиваемых таблиц
  • Основные правила написания скриптов Python
  • Использование сочетаний синтаксиса и скриптов Python
  • Использование вложенных скриптов
  • Обработка ошибок скриптов Python
  • Создание графического интерфейса пользователя
  • Получения справки по списку подкоманд Python
  • Примеры скриптов Python

Тема 6. Работа со скриптами языка R в SPSS – 4 ак.ч.

  • Язык программирования R
  • Модуль интеграции R с SPSS
  • Основные правила языка R
  • Чтение данных из SPSS для обработки в R
  • Запись результатов обработки R в SPSS
  • Создание настраиваемых таблиц с помощью R
  • Создание графического интерфейса в R
  • Изменение содержания файла вывода
  • Использование сочетаний синтаксиса R и других скриптов
  • Справка по основным функциям и объектам R
  • Примеры скриптов R