Понятие о статистических гипотезах и методах их проверки. 1-Sample Z

Любое недоказанное утверждение или догадку можно считать гипотезой. Статистическая гипотеза является предположением об одном или нескольких параметрах функции распределения случайной величины. К примеру, можно предположить, что генеральная совокупность данных распределена согласно нормальному закону или две выборки принадлежат двум разным популяциям, или различие между дисперсиями двух выборок статистически незначимо и т.д.

Статистические гипотезы проверяются на основании выборочных опытов/наблюдений. Поэтому вероятность той или иной гипотезы никогда не может быть принята однозначно равной 0 или 1. Вместо этого используются допустимые уровни вероятности: α и 1-α (или β). В практике статистического анализа чаще всего имеют дело с двумя конкурирующими гипотезами: нулевой гипотезой, обозначаемой H0, и альтернативной гипотезой, обозначаемой Hα или H1.

Нулевая гипотеза – это утверждение, подлежащее проверке. Альтернативная гипотеза – это противоположное утверждение, которое мы пытаемся опровергнуть в ходе анализа. В зависимости от величины вероятности альтернативная гипотеза может быть принята либо отвергнута. Нулевая гипотеза может быть отвергнута, но не принята! В случае высокого уровня вероятности правдивости нулевой гипотезы, говорят, что гипотеза не может быть отвергнута.

Принятие решений о генеральной совокупности на основе выборочных данных приводит к возможности постановки неправильного вывода. Различают два вида ошибок, связанных с постановкой вывода на основе выборочных данных:

  • Ошибка первого рода – возникает, когда отвергается нулевая гипотеза, при этом являясь правильной.
  • Ошибка второго рода – возникает, когда принимается нулевая гипотеза, при этом являясь ложной.

Чем ниже показатель α (вероятность ошибки первого рода), тем больше уверенность в правдивости нулевой гипотезы и наоборот.

В качестве примера наблюдений для проверки статистических гипотез используем набор из 100 значений со средним 10 и стандартным отклонением 2, сгенерированных программой Minitab. Рабочий файл, содержащий набор значений и результаты анализа, прикреплен к статье и доступен для всех зарегистрированных пользователей.

В меню Stat выберите Basic Statistics, а затем тест, необходимый для проверки статистической гипотезы. Используем 1-Sample Z… так как и закон распределения и стандартное отклонение нам известны (оба параметра заданы при генерации данных).

В появившемся окне внесем следующие настройки:

  1. В поле Samples in columns: укажите диапазон анализируемых данных (C1 в данном случае).
  2. В строке Standard deviation: введите значение стандартного отклонения – 2.
  3. Поставьте флажок напротив Perform hypothesis test и укажите Hypothezed mean (величина, с которой будет сравнено среднее арифметическое значение наблюдений) – 10.
  4. В меню Options… можно установить доверительный интервал (1 – α, по умолчанию установлено значение 95%) и альтернативную гипотезу – выберите “not equal” (не равно):
  5. Нажав на Graphs… можно выбрать три вида диаграмм, которые будут построены вместе с проверкой гипотезы – установите флажок напротив каждой их них:
  6. После внесения всех настроек, нажмите OK и перейдите в окно Session:

Интерпретация полученных результатов:

  • Variable – столбец переменных.
  • N – число наблюдаемых значений.
  • Mean – среднее арифметическое значение.
  • StDev – стандартное отклонение.
  • SE Mean – средняя стандартизированная ошибка.
  • 95% CI – доверительный интервал.
  • Z – Z-значение, используется для расчета Р.
  • P – вероятность.

Наибольший интерес, из полученных результатов, представляет величина Р – вероятность того, что нулевая гипотеза может быть принята. Для постановки вывода следует сравнить величину Р с α-уровнем:

  • Если Р ≤ α, то нулевая гипотеза отвергается и принимается альтернативная.
  • Если Р > α, то альтернативная гипотеза отвергается. В таком случае говорят, что нулевая гипотеза не может быть отвергнута – несмотря на то, что альтернативная отвергнута, нулевую гипотезу никогда не принимают.

α-уровень задается исследователем при настройке доверительного интервала: доверительный интервал равен 1 – α. Следовательно, при значении доверительного интервала 95%, α-уровень равен 5%. Для проверки статистической гипотезы можно задать любое значение α-уровня от 0 до 1, на чаще всего используют величину 0,05 или 5%.

В рассмотренном случае значение Р составляет 0,477, при этом α-уровень – 0,05, соответственно с большой долей вероятности можно утверждать, что нулевая гипотеза не может быть отвергнута: среднее арифметическое значение наблюдаемых результатов равно 10.

Ниже представлены, полученные в ходе проверки гипотез, диаграммы:

Фактически показания диаграмм идентичны: расчетное значение попадает в пределы доверительного интервала и близко к 10. Разница между диаграммами состоит лишь в способе отображения распределения наблюдаемых значений: гистограмма, точечная или ящичная диаграммы.

26.10.2010 / 5729 / Загрузок: 33 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb