Цель проведения тренинга "Управление данными в IBM SPSS Statistics" – научиться управлять данными для подготовки их статистическому анализу, а также производить операции над файлами данных SPSS. На тренинге рассматривается весь функционал программы SPSS по управлению данными и файлами. Курс рассчитан для специалистов, которые не только работают с готовыми базами данных для анализа, а сами подготавливают их.
После обучения на тренинге Вы будете уметь:
- Импортировать и экспортировать файлы данных различных форматов
- Контролировать правильность ввода данных для анализа
- Отбирать данные для анализа
- Преобразовывать данные, вычислять новые переменные
- Изменять структуру файлов данных
- Объединять файлы
- Агрегировать данные
- Изучать данные с помощью отчетов
- Работать с данными с пропущенными значениями
Продолжительность тренинга: 2 дня с 10:00 до 17:00
Программа тренинга:
Тема 1. Импорт и экспорт файлов данных
- Открытие файлов данных разных форматов
- Импорт данных из электронных таблиц
- Конструктор чтения баз данных
- Выбор полей базы данных
- Выбор записей базы данных
- Задание переменных в запросе к базе данных
- Результаты запроса к базе данных
- Конструктор импорта текстовых файлов
- Параметры Конструктора импорта текстовых файлов
- Экспорт данных в другие приложения
- Кэширование данных
Тема 2. Поверка корректности ввода данных
- Процедуры настройки свойств переменных
- Процедура Задать свойства переменных
- Процедура Задать тип измерений для полей с неизвестным типом данных
- Конструктор копирования свойств данных
- Создание свойств переменных
- Поиск дублирующихся наблюдений
- Процедура Поиск необычных наблюдений
- Параметры процедуры Поиск необычных наблюдений
- Результаты процедуры Поиск необычных наблюдений
- Задание правил проверки данных
- Проверка данных на ошибки
Тема 3. Отбор данных для анализа
- Способы отбора данных
- Процедура Отобрать наблюдения
- Задание условий отбора
- Извлечение случайной выборки
- Расщепление файла данных
- Использование наборов переменных
Тема 4. Объединение и реструктуризация файлов данных
- Процедуры объединения файлов данных
- Добавление наблюдений
- Добавление переменных
- Структура файла данных
- Реструктуризация файлов
- Реструктуризация переменных в наблюдения
- Реструктуризация наблюдений в переменные
- Транспонирование данных
Тема 5. Преобразование данных
- Процедуры преобразования данных
- Агрегирование данных
- Процедура Агрегировать данные
- Подсчет частоты появления значений
- Ранговые преобразования
- Взвешивание данных
- Оптимальная категоризация
- Параметры процедуры Оптимальная категоризация
Тема 6. Представление и изучение данных
- Процедуры для представления данных
- Получение информации о данных
- Построение OLAP-кубов
- Подытоживание наблюдений
- Отчеты с итогами по строкам
- Отчеты с итогами по столбцам
Тема 7. Анализ и восстановление пропусков данных
- Процедуры работы с пропусками в данных
- Процедура Анализ пропущенных значений
- Настройки статистик процедуры Анализ пропущенных значений
- Анализ структуры пропущенных значений
- Оценка пропущенных значений
- Множественная импутация
- Процедура Анализ структур пропущенных значений
- Результаты процедуры Анализ структур пропущенных значений
- Процедура Импутировать пропущенные значения
- Выбор метода импутации данных
- Задание ограничений при импутации данных
- Настройка вывода модели импутации
- Работа с импутированными данными