Понятие о статистических гипотезах и методах их проверки. 1-Sample t

В статье Понятие о статистических гипотезах и методах их проверки мы использовали 1-Sample Z тест для проверки гипотезы о равенстве среднего значения выборки заданной величине. Условием выбора Z-теста послужило то, что нам наперед были известны стандартное отклонение и закон распределения переменной. В тех случаях, когда эти значения не известны наверняка проверку гипотезы о равенстве среднего значения заданному следует проводить при помощи 1-Sample t теста.

Как и 1-Sample Z тест, 1-Sample t дает возможность оценить долю вероятности равенства среднего значения выборки заданному числу. Несмотря на это, методы не являются взаимозаменяемыми. 1-Sample Z тест можно применять лишь в случаях, когда исследователь наверняка уверен как в нормальности распределения наблюдаемой величины так и в величине стандартного отклонения генеральной совокупности значений переменной. При этом, не следует использовать расчетный показатель стандартного отклонения, основанный на результатах выборочных наблюдений. В таком случае правильным выбором будет применение 1-Sample t теста.

Использование 1-Sample t теста тоже налагает определенные ограничения. Основным является подчинение переменной нормальному закону распределения. О некоторых методах оценки распределения величины читатель сможет узнать из статьи Определяем закон распределения “на глаз”. Также следует отметить, что данный тест все же дает надежный результат при отклонении от нормального закона распределения при выполнении некоторых условий:

  • исследование основано на результатах как минимум 30 наблюдений;
  • результаты наблюдений представляют непрерывный процесс;
  • распределение данных симметрично (распределение унимодальное).

Рассмотрим особенности проведения 1-Sample t теста на примере. В качестве результатов наблюдений используем данные предыдущей статьи. Рабочий файл, с набором значений и результатами анализа, прикреплен к статье и доступен для всех зарегистрированных пользователей. Файл можно открыть программой Minitab.

В меню Stat выберите Basic Statistics, а затем 1-Sample t… В появившемся окне внесите следующие настройки:

  1. В поле Samples in columns: укажите диапазон анализируемых данных (C1 в данном случае).
  2. Поставьте флажок напротив Perform hypothesis test и укажите Hypothezed mean (величина, с которой следует сравнить среднее арифметическое значение наблюдений) – 10

Нажав на Graphs… можно выбрать диаграммы, которые будут построены вместе с тестом гипотезы – установите флажок напротив любого из графиков:

В меню Options… можно установить доверительный интервал (по умолчанию установлено значение 95%) и альтернативную гипотезу. Доверительный интервал рассчитывается как разницы между единицей и α-уровнем. Значение α-уровня задается исследователем и определяет последующий ход анализа. Для проверки статистической гипотезы можно задать любое значение α-уровня от 0 до 1 (чаще всего используют величину 0,05).

После внесения всех настроек, нажмите OK и перейдите в окно Session:

Интерпретация полученных результатов:

  • Variable – столбец переменных
  • N – число наблюдаемых значений
  • Mean – среднее арифметическое значение
  • StDev – стандартное отклонение
  • SE Mean – средняя стандартизированная ошибка
  • 95% CI – доверительный интервал
  • T – расчетное значение нормированного нормального распределения
      T = (Mean – гипотетическое среднее значение) / SE Mean
  • P – вероятность

Наибольший интерес, из полученных результатов, представляет величина Р – вероятность того, что нулевая гипотеза может быть принята. Для постановки вывода следует сравнить величину Р с α-уровнем:

  • Если Р ≤ α, то нулевая гипотеза отвергается и принимается альтернативная.
  • Если Р > α, то альтернативная гипотеза отвергается. В таком случае говорят, что нулевая гипотеза не может быть отвергнута – несмотря на то, что альтернативная отвергнута, нулевую гипотезу никогда не принимают.

В рассмотренном случае значение Р составляет 0,391, при этом α-уровень – 0,05, соответственно, с большой долей вероятности нулевая гипотеза не может быть отвергнута: среднее арифметическое значение наблюдаемых результатов равно 10.

Значение P, полученное в результате проведения 1-Sample t теста несколько ниже, чем в случае проведения 1-Sample Z теста – 0,391 и 0,477 соответственно. Незначительная разница результатов связана с разницей в исходных данных: для 1-Sample Z теста стандартное отклонение задается исследователем, а в случае 1-Sample t теста используется расчетное значение, основанное на выборочных наблюдениях. Несмотря на это, результаты анализа и в первом и во втором случаях можно считать сходными.

В ходе анализа была упущена процедура оценки закона распределения наблюдаемой величины, что абсолютно не означает возможность проведения 1-Sample t теста без предварительного исследования распределения наблюдаемых значений.

Условно достаточным можно считать графический анализ диаграммы, построенной во время теста.

Диаграмма состоит из двух частей: гистограммы наблюдаемых значений и доверительного интервала для среднего значение (X), относительно которого указанно гипотетическое среднее значение (H0).

Исходя из анализа гистограммы можно заключить, что распределение наблюдений близко к нормальному и достаточно симметрично. Небольшой пик слева и несколько отдельно-стоящих значений в правой части диаграммы не могут служить достаточным доказательством наличия в выборке образцов из разных популяций или “удлинения хвостов”. Гипотетическое среднее значение находится в пределах доверительного интервала расчетного среднего значения.

04.11.2010 / 3427 / Загрузок: 22 / DMAgIC / Комментарии: 1
Всего комментариев: 1
avatar
1
1
Надо исправить противоречие в тексте:

Если Р > α, то принимается альтернативная гипотеза и отвергается альтернативная нулевая.
Если Р ≤ α, то альтернативная гипотеза отвергается. В таком случае говорят, что нулевая гипотеза не может быть отвергнута – несмотря на то, что альтернативная отвергнута, нулевую гипотезу никогда не принимают.
В рассмотренном случае значение Р составляет 0,391, при этом α-уровень – 0,05, соответственно, с большой долей вероятности нулевая гипотеза не может быть отвергнута: среднее арифметическое значение наблюдаемых результатов равно 10.
Ответ: Cпасибо, Георгий! Все поправил – оказалось, что этот абзац перекочевал еще в несколько материалов.
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb