Понятие о статистических гипотезах и методах их проверки. 2-Sample t

Предположим, что заявленный разгон Вашего автомобиля от 0 до 100 километров в час составляет 10с. Вы заправили свой автомобиль 95 бензином на ближайшей заправке и решили проверить утверждение производителя. После нескольких попыток получаем результаты разгона. Проверить, насколько полученные результаты соответствуют утверждению производителя Вашего автомобиля, можно с помощью 1-Sample t теста. Проведение 1-Sample t теста, анализ результатов и постановка выводов с помощью программы Minitab были рассмотрены в статье Понятие о статистических гипотезах и методах их проверки. 1-Sample t.

Теперь представьте, что на следующий день Вы заправили свой автомобиль на другой заправке (более дорогим/дешевым бензином или бензином с иным октановым числом) и хотите сравнить, повлияло ли это на динамику машины. Для этого Вам необходимо провести несколько измерений разгона от 0 до 100 км/час и сравнить их с результатами предыдущих наблюдений, используя 2-Sample t тест.

    В качестве примера наблюдений используем два набора значений, каждый из которых подчиняется нормальному закону распределения и удовлетворяет следующим условиям: количество наблюдений – 100; стандартное отклонение – 1,0; среднее значение – 9,9 и 10,1 соответственно. Обратите внимание на то, что стандартное отклонение в 5 раз больше, чем разница между средними значениями двух наборов данных. Рабочий файл, содержащий исходные значения и результаты анализа, прикреплен к статье и доступен для всех зарегистрированных пользователей.

В меню Stat выберите Basic Statistics, а затем 2-Sample t… В появившемся окне будет доступно 3 варианта введения данных:

  • Samples in one column пригоден, если данные размещены в одном столбце. Для использования этой опции необходимо, чтобы напротив каждого значения был указан идентификатор – значение определяющее принадлежность к первому или второму набору наблюдений.
  • Samples in different columns позволяет сравнить значения разных колонок. Необходимым условием использования, как и в предыдущем случае, является одинаковое количество наблюдений.
  • Summarized data позволяет сравнить две выборки, используя базовые данные о выборке – количество наблюдений, среднее арифметическое и стандартное отклонение.

Выберите Samples in different columns и укажите колонки, в которых размещены результаты наблюдений в полях First и Second соответственно:

Нажав на Graphs… можно выбрать диаграммы, которые будут построены вместе с тестом гипотезы – установите флажок напротив всех графиков:

В меню Options… можно установить доверительный интервал (1 – α, по умолчанию установлено значение 95%) и альтернативную гипотезу – выберите "not equal” (не равно):

После внесения всех настроек, нажмите OK и перейдите в окно Session:

Интерпретация полученных результатов:

  • N – число наблюдаемых значений
  • Mean – среднее арифметическое значение
  • StDev – стандартное отклонение.
  • SE Mean – средняя стандартизированная ошибка
  • 95% CI – доверительный интервал
  • T – расчетное значение нормированного нормального распределения
  • P – вероятность
  • DF – число степеней свободы

Как и в случае применения 1-Sample t теста, для постановки вывода следует сравнить величину Р с α-уровнем:

  • Если Р > α, то отвергается альтернативная гипотеза. В таком случае говорят, что нулевая гипотеза не может быть отвергнута. Несмотря на то, что альтернативная гипотеза отвергнута, нулевую гипотезу никогда не принимают.
  • Если Р ≤ α, то нулевая гипотеза отвергается и принимается альтернативная.

В рассмотренном случае значение Р – 0,397, при этом α-уровень – 0,05, соответственно, с большой долей вероятности можно утверждать, что нулевая гипотеза не может быть отвергнута. Иными словами, динамика автомобиля не зависит от того, на какой из заправок куплено топливо. Тем не менее, на диаграммах отчетливо видна разницу между средними значениями двух выборок (соединяющая линия наклонена):

Чтобы оценить имеет ли эта разница статистическое значение, проверим еще одну гипотезу: время разгона машины от 0 до 100 км/час увеличится, если залить топливо на второй заправке или μ12 (альтернативная гипотеза).

В меню Stat выберите Basic Statistics, а затем 2-Sample t… В появившемся окне выберите Samples in different columns и укажите соответствующие колонки с результатами наблюдений. В меню Options… выберите альтернативную гипотезу –"greater than” (Больше чем):

После внесения всех настроек, нажмите OK и перейдите в окно Session:

Как видим, в этом случае вероятность составляет величину значительно выше, чем в предыдущем случае – 0,801. Соответственно, нам не удалось опровергнуть нулевую гипотезу. Вывод остается неизменным: время разгона не зависит от того, на какой заправке залито топливо.

05.12.2010 / 2746 / Загрузок: 25 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb