Подчиняется ли время переналадки станка нормальному распределению?

Одним из основополагающих инструментов и постулатов методологии шести сигм является предположение о том, что наблюдаемая популяция данных подчиняется нормальному закону распределения. Однако, на практике, далеко не все наблюдаемые данные подчиняются нормальному закону, что приводит к необходимости поиска первопричин их “ненормальности” или к необходимости трансформации данных.

В данной статье рассмотрен пример такого анализа данных на одном из практических случаев. Задачей автора являлось измерение времени переналадки станка с последующим анализом полученных данных.

Было проанализировано 60 случаев переналадок станка за период времени, равный неделе. Максимальным допустимым временем переналадки, согласно внутреннему регламенту компании, является 15 минут. Данные измерений были собраны в таблицу и обработаны при помощи инструмента Basic Statistics в программе Minitab. Полученные результаты представлены на рисунке ниже.

Тест Андерсона-Дарлинга показывает, что рассматриваемая популяция данных не подчиняется нормальному распределению. Следовательно, дальнейшая работа с данными потребует применения непараметрических методов анализа, так как применение классических инструментов, таких как расчет индексов способности, невозможно.

Что же может быть причиной “ненормальности” распределения?

Конечно же, распределение переменной может не подчиняться нормальному закону по своей природе, однако, такая операция как механическая переналадка станка не является неким особым случаем или областью техники, которым свойственны ненормальные распределения (например, химические реакции или значение пробивного напряжения и т.п.).

Еще одной вероятной причиной “ненормальности” данных является наложение нескольких популяций. Объединение популяций с различными средними, может привести к би- или полимодальному распределению. Каждая из таких популяций по-отдельности может подчиняться нормальному закону распределения, но вот их совокупность уже нет.

Как же найти такие би- и поли-модальные составляющие в исследуемом массиве данных?

Одним из удачных инструментов может стать построение Run Chart’a исследуемой популяции, так как именно с помощью отслеживания процесса во времени, можно найти от чего зависел результат операции в том или ином случае. Ниже приведён результат построения Run Chart’a времени переналадки станка.

На графике отчётливо видны “сезонные” изменения в процессе. Данные изменения были соотнесены с оперативным журналом производства. Было найдено, что каждый скачок советует окончанию/началу смены, а, следовательно, и смене оператора станка.

Для проверки полученной гипотезы о зависимости времени переналадки от оператора данные были сгруппированы соответственно операторам. Были построены гистограммы для каждой из получившихся популяций:

Из рисунка видно, что получившиеся для каждого из операторов распределения, с большой долей вероятности, подчиняются нормальному закону. Таким образом, визуально было подтверждено, что изначальный массив данных состоял из двух популяций. Для подтверждения данного утверждения было решено провести тест гипотезы о равенстве средних арифметических значений популяций при помощи 2 Sample-t теста. Его результаты представлены ниже:

  

Two-sample T for Оператор 1 vs Оператор 2

                    N    Mean  StDev  SE Mean
Оператор 1  30  12,407  0,162       0,030
Оператор 2  30  13,892  0,409       0,075

Difference = mu (Оператор 1) - mu (Оператор 2)
Estimate for difference:  -1,4857
95% CI for difference:  (-1,6485; -1,3228)
T-Test of difference = 0 (vs not =): T-Value = -18,49  P-Value = 0,000  DF = 37

Полученное значение P-Value, значительно ниже заданнго альфа уровня 0.05, следовательно нулевая гипотеза должа быть отвергнута и принята альтернативная – средние значения полученных выборок не равны.

Итак, в результате анализа данных было найденно, что исходный массив данных состоял из двух популяций данных, подчиняющихся нормальному закону. При помощи анализа Run Chart были найдены “сезонные” состовляюищие соответсвующие разным операторам станков. После разделения исходных данных на две поппуляции был проведён тест гипотезы, подтвердивший, что различие между временем переналадки разными операторами является статически значимым. На практическом примере был расмотрен возможный алгоритм работы с распределениями, не подчиняющимся нормальному закону.

19.11.2013 / 2114 / Загрузок: 0 / Бунин Роман Алексеевич / Комментарии: 1
Всего комментариев: 1
avatar
0
1
Уменьшите рисунок до 10%, в экран не влезает smile
Ответ: Алексей, в каком браузере возникла проблема?

Установлена "плавающая" ширина картинки, а не статичная. Поэтому в большинстве браузеров она будет занимать все доступное пространство, а не вылезать за пределы экрана.
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb