Статистические методы
Статистические методы анализа данных применяются практически во всех областях деятельности человека. Одни методы являются универсальными, другие специфичными для конкретной отрасли или сферы деятельности. Ниже дается обзор основных статистическим методов, а на соответствующих страницах возможные направления их применения. Вам не нужно оплачивать рабочее место дорогостоящего аналитика, владеющего всеми методами. Центр Статистического Анализа оказывает услуги услуги по аутсорсингу в области анализа и обработки первичных данных опросов, маркетинговых исследований, построению статистических моделей.
Деревья решений
Деревья решений (decision trees) – это статистический метод, позволяющий предсказывать принадлежность наблюдений или объектов к тому или иному классу категориальной зависимой переменной или среднее значение количественной переменной в зависимости от соответствующих значений одной или нескольких независимых переменных. Построение деревьев решений относят к методам интеллектуальной добычи знаний «data mining».
Дискриминантный анализ
Дискриминантный анализ (discriminant analysis) – метод многомерного статистического анализа. Он включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков. В отличие от кластерного анализа новые кластеры не образуются, а являются правилом, по которому объекты относятся к определенной группе. Задачи дискриминантного анализа во многом схожи с задачами логистической регрессии – классификация наблюдений на группы на основе прогностической модели. Несмотря на некоторые сходства дискриминантный анализ и логистическая регрессия обладают существенными различиями. Идеи дискриминантного анализа тесно связаны с дисперсионным, регрессионным анализом.
Дисперсионный анализ
Дисперсионный анализ (ANOVA – analysis of variance) – статистический метод изучения взаимосвязи. Применяется для исследования влияния одной или нескольких качественных переменных на одну зависимую количественную переменную. В основе дисперсионного анализа лежит предположение, что одни переменные могут рассматриваться как причины (независимые переменные), а другие как следствия (зависимые переменные или отклики). Независимые переменные в дисперсионном анализе называют факторами, поскольку в ходе эксперимента исследователь может изменять их значения и анализировать получаемый результат зависимой количественной переменной.
Карты контроля качества
Построение контрольных карт, карт технологического контроля (quality control chart) – статистический метод, позволяющий контролировать качество продукции или услуг в ходе производства или предоставления услуги. Данный метод относят к методам промышленной статистики или анализу производственных процессов, он является инструментом контроля качества продукции в управлении производством.
Категориальная регрессия
Категориальная регрессия (categorical regression) – статистический метод моделирования взаимосвязи между категориальной зависимой переменной и категориальными независимыми переменными. При построении модели категориальной регрессии происходит шкалирование или оцифровка категориальных переменных присвоением категориям числовых значений. После соответствующего шкалирования строят оптимальное уравнение линейной регрессии относительно новых преобразованных переменных.
Кластерный анализ
Кластерный анализ (cluster analysis) – совокупность многомерных статистических методов классификации объектов по характеризующим их признакам, разделение совокупности объектов на однородные группы, близкие по определяющим критериям, выделение объектов определенной группы.