20.09.2017 | Добавил: dmagic | Просмотров: 407
Определяем закон распределения

В проектах шести сигм не хватает времени на “все эти ваши проверки, перепроверки и анализы”. Поэтому чаще всего нам не нужно знать распределение переменной, но достаточно удостовериться, что его можно с определенной вероятностью описать нормальным законом. Как только нам удастся подтвердить согласие, все последующие действия сводятся к работе с двумя параметрами: средним и стандартным отклонением.

Определить согласие с нормальным законом можно несколькими способами. Вы можете поискать процедуры на нашем сайте или просто заглянуть в заметку Проверка гипотез о нормальности распределения. Я рекомендую поиск, так как через поиск вам доступно несколько вариантов проведения этого анализа, а также видеоинструкция по работе в Minitab.

Еще раз: если согласие с нормальным законом подтверждено, дальше все сводится к работе со средним и стандартным отклонением. А что делать, если согласие с нормальным законом не подтверждено? В таком случае у вас есть два варианта действий, которые я рекомендую выполнять в той последовательности, в которой они указаны ниже:

  1. Определить причину отклонения распределения от нормального.
  2. Определить закон распределения переменной.

Часто бывает так, что попытавшись понять, почему распределение не подчиняется нормальному, вы обнаружите выбросы, смеси распределений (лептокуртозис и платикуртозис) и грануляцию, влияние систематических и специальных факторов… Одним словом то, что поможет вам найти решение в проекте. Следовательно, начав с первого пункта, вы получите многим больше, чем понимание закона распределения. Именно поэтому я рекомендую начинать с него.

Второй пункт выполнить очень просто. Для иллюстрации я сгенерирую набор данных, которые подчиняются нормальному распределению. 100 значений со средним 10 и стандартным отклонением 1. Обратите внимание, что в моей выборке практически исключена возможность появления отрицательных наблюдений. Я задал такие параметры, чтобы показать вам все возможности этого анализа. Но если вы используете свой набор данных, то будьте готовы к тому, что часть распределений программа может не принять во внимание. Об этом вы получите сообщение в окне Session.

Получив данные, можем приступать к анализу:

  1. В меню Stat > Quality Tools выберите Individual Distribution Identification.
  2. В диалоговом окне укажите колонку с данными (Single column) и размер подгрупп (Subgroup size). В данном примере я не использую подгруппы, поэтому укажу единицу:
  3. Нажмите ОК.

Обратите внимание на окно Session. Особенно на четвертую таблицу – Goodness of Fit Test:

Здесь вы найдете все результаты. Как их интерпретировать? В первую очередь обратите внимание на столбец P – там, где значение (p-value) выше установленного альфа-риска (по умолчанию 0,05), можно говорить о согласии с данным законом распределения. Еще бы неплохо обратить внимание на значение AD – чем оно ниже, тем ближе данные к теоретической кривой.

В моем примере, сразу несколько распределений превысили отметку 0,05. Кроме того, самые высокие показатели P достигнуты с применением трансформаций Джонсона и Бокса-Кокса. Что в таком случае делать?

Ответ на этот вопрос зависит от цели вашего анализа. К примеру, вы можете собрать больше наблюдений и повторить анализ. Вы можете остановиться и выбрать то распределение, которое обладает самым высоким показателем p-value и самым низким AD. Не исключен и третий вариант – принять согласие с нормальным законом распределения и продолжить работу над проектом.

Напоследок обратите внимание также на диаграммы:

Всего 4 окна по 4 вероятностных графика (Probability Plot) в каждом. Все данные из таблицы также доступны на вставке справа. Вы можете использовать их для отчета, чтобы пояснить свой выбор для последующего анализа.

Лин6Сигм / 20.09.2017 | Просмотров: 407 | Добавил: dmagic | Всего комментариев: 0 / Теги: Probability Plot, нормальное распределение, Minitab, статистика
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb