Однофакторный дисперсионный анализ (One Way ANOVA)

Представьте сотрудников компании, работающих в магазине по продаже мобильных телефонов. Предположим, что этим сотрудникам предложили три вида оплаты труда – только комиссионные, фиксированный оклад или комбинацию фиксированного оклада и комиссионных. Менеджер отдела продаж хочет сравнить прибыль, полученную при различных видах оплаты труда, выяснив:

  • Есть ли разница в среднем доходе для всех трех видов оплаты труда?
  • Есть ли разница в прибыли при трех видах оплаты труда?
  • Влияет ли вид оплаты труда на полученный доход?

Чтобы ответить на все вопросы, мы используем описательные статистики (Descriptive Statistics), ящичные диаграммы (Boxplots), графики индивидуальных значений (Individual Value Plots) и однофакторный дисперсионный анализ (One Way ANOVA). К тому же, мы сможем определить наилучший вид оплаты труда сотрудников с целью получения максимальной прибыли для компании.

Что такое однофакторный дисперсионный анализ?

Процедура однофакторного дисперсионного анализа (One Way ANalysis Of VAriance) состоит в обобщении результатов двухвыборочных t-тестов для независимых выборок (2-Sample t Test). Однако, в отличие от t-теста, ANOVA позволяет проанализировать средние значения более чем двух выборочных групп.

Основная задача дисперсионного анализа заключается в сравнении средних арифметических значений групп:

  • Если совокупные средние арифметические значения групп одинаковы, дисперсия между группами, скорее всего, будет аналогична дисперсии внутри группы.
  • Если средние арифметические значения внутри групп разнятся, дисперсия между группами, скорее всего, будет больше, чем дисперсия внутри группы.

Рассмотрим более подробно порядок проведения анализа и необходимые действия. Для начала, рассчитаем описательные статистики и построим графики, используя пакет анализа Minitab:


Рисунок 1: пример набора данных

Для того, чтобы рассчитать описательные статистики для массива данных, выполните следующие действия:

  1. На панели инструментов выберите Stat > Basic Statistics > Display Descriptive Statistics.
  2. Введите в поля Variables (переменные) и By Variables (по переменным) выбранные столбцы данных, к примеру, доход (Revenue) и вид зарплаты (Salary Type) соответственно.
  3. Щелкните левой кнопкой мыши по кнопке Statistics и убедитесь в том, что выбраны среднее (Mean), стандартное отклонение (Standard deviation), медиана (Median), первый и третий квартили (First quartile, Third quartile), минимум и максимум (Minimum, Maximum).

  4. Рисунок 2: диалоговое окно выбора описательных статистик

  5. Результаты в окне Session:

    Descriptive Statistics: Revenue
    Variable  Salary Type   Mean  StDev  Minimum     Q1  Median    Q3   Maximum
    Revenue   Commission    4261    597     3385   3800    4203  4663      5562
              Fixed         3722    769     2236   3297    3569  4176      5536
              Mixed         3851    668     2032   3512    4009  4304      4955

Для построения ящичной диаграммы и графика индивидуальных значений выполните следующие действия:

  1. В меню Graph выберите Boxplot (для построения ящичной диаграммы) или Individual Value Plot (для построения графика индивидуальных значений).
  2. В появившемся окне выберите With Groups в категории One Y и щелкните OK.

  3. Рисунок 3: выбора типа ящичной диаграммы

  4. В поле Graph Variables (переменные диаграммы) внесите доход (Revenue), а в Categorical Variables for Grouping (категориальные переменные группирования) – вид зарплаты (Salary Type).

  5. Рисунок 4: диалоговое окно ввода данных

  6. Щелкните левой кнопкой мыши по OK.


Рисунок 5: ящичная диаграмма

На графике индивидуальных величин (Individual Value Plot) можно установить точки в виде отклонений или в виде разброса (см. рисунок 6). Щелкните правой кнопкой мыши по любой из точек на графике и выберите Edit Individual Symbols (либо нажмите Сtrl+T при активном окне диаграммы). В закладке Identical Points установите флажок напротив Jitter.


Рисунок 6: график индивидуальных значений

Результаты предварительных исследований показывают, что работник, заработная плата которого формируется на основании комиссионных, приносит несколько больший доход, чем в среднем работники, получающие зарплату других видов. Однако описательная статистика и диаграммы также показывают более высокую изменчивость для группы с фиксированным доходом, поскольку стандартная дисперсия для этой группы является наиболее высокой. Поскольку речь идет о прибыли, существует некоторое различие между группами. Таким образом, чтобы подтвердить это статистически, следует провести дополнительное исследование с помощью дисперсионного анализа.

Однофакторный дисперсионный анализ (One Way ANOVA) в Minitab

Для проведения однофакторного дисперсионного анализа, выполните следующие действия:

  1. Выберите Stat > ANOVA > One-Way…
  2. В строку Response (отклик) внесите доход (Revenue).
  3. В строку Factor (фактор/переменная) внесите вид зарплаты (Salary Type).

  4. Рисунок 7: диалоговое окно дисперсионного анализа

  5. Щелкните Comparisons и установите флажок напротив Tukey.

  6. Рисунок 8: выбор Tukey-метода

  7. Щелкните левой кнопкой мыши по OK и перейдите в окно Session:. Ниже приводится только часть результатов:

    Tukey Pairwise Comparisons

    Grouping Information Using the Tukey Method and 95% Confidence
    Salary Type   N   Mean  Grouping
    Commission   34   4261  A
    Mixed        41   3851    B
    Fixed        36   3722    B

    Means that do not share a letter are significantly different.

    Tukey Simultaneous Tests for Differences of Means
                          Difference       SE of                          Adjusted
    Difference of Levels    of Means  Difference      95% CI     T-Value   P-Value
    Fixed - Commission          -539         163   (-927; -152)    -3,31     0,004
    Mixed - Commission          -410         158   (-786;  -34)    -2,59     0,029
    Mixed - Fixed                130         156   (-241;  500)     0,83     0,684

    Individual confidence level = 98,07%

Наиболее информативной статистической величиной при изучении таблицы дисперсионного анализа, является p-value (вероятность): любое значение p, меньше 0.05, означает, что средние арифметические значения статистически значительно отличаются друг от друга. Из этого частного примера мы видим, что существует различие в среднем доходе групп с различной зарплатой.

В новой версии Minitab схематические графики, ранее отображаемые в окне Session, вынесены в отдельное окно:


Рисунок 9: результаты парных сравнений – Tukey-метод

Результаты парных сравнений методом Tukey показывают доверительные интервалы для разницы средних значений. Таким образом, на графике вы видите не средние значения, а разницу между парами средних значений: Fixed и Commission, Mixed и Commission, Mixed и Fixed. Это, в свою очередь, позволяет судить о различии средних значений.

Как написано в примечании к графику:

  • Если интервал не содержит нуль, существует статистически значимая разница между соответствующими средними значениями. Чем дальше результат от нуля, тем большая разница между средними значениями.
  • Если же интервал содержит нуль, разница между средними значениями не является статистически значимой.

Выводы

Проведено сравнение прибыли организации в зависимости от формы оплаты труда сотрудников: фиксированная ставка, комиссионные и смешанная форма оплаты. Можно заключить, что существуют статистически значимые различия между группой с выплатой только комиссионных и группой с фиксированной заработной платой, а также между группой с выплатой только комиссионных и группой со смешанной зарплатой. Однако сравнение между группой с выплатой только комиссионных и группой со смешанной зарплатой свидетельствует, что эта разница статистически не существенна.

Таким образом, мы можем ответить на вопросы, которые поставили в начале этой публикации:

  • Существует различие между средним доходом трех групп с различной формой оплаты труда, причем группа с выплатой только комиссионных приносит несколько более высокий доход.
  • Существует различие между работниками, получающими только комиссионные, и работниками с фиксированной заработной платой, а также между работниками, получающими только комиссионные, и работниками со смешанной формой оплаты труда.
  • Сотрудники, получающие заработную плату на основании комиссионных, скорее всего, работают над продажами более усердно, поскольку они не получают фиксированной заработной платы, тем самым принося больше прибыли компании.

Мудрый менеджер в дальнейшем будет принимать на работу сотрудников, получающих только комиссионные, что позволит достичь максимально высокого уровня прибыли.

11.03.2014 / 15188 / Загрузок: 55 / DMAgIC / Комментарии: 3
Всего комментариев: 3
avatar
0
1
Константин, прикрепленный файл при открытии оказывается пустой.
avatar
0
2
В смысле пустой? Не открывается?

В файле должны присутствовать данные. Возможно, вы ожидали найти там все графики и вычисления, описанные в статье, и потому посчитали его пустым, найдя только два столбца с данными.
avatar
0
3
я говорил как раз про столбцы с данными. но если у вас корректно открывается, возможно проблема в моем софте....
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb